4D-JUG
Would you like to react to this message? Create an account in a few clicks or log in to continue.

【プラグイン】めかぶ v2

2 posters

Go down

【プラグイン】めかぶ v2 Empty 【プラグイン】めかぶ v2

投稿 by miyako 2018-12-19, 2:36 pm

要望があったので,プラグインをリニューアルしました。

形態素解析に加え,

システム辞書のコンパイル(コールバックメソッド付き)
ユーザー辞書のコンパイル(コールバックメソッド付き)
辞書の切り替え(システム辞書1+任意数のユーザー辞書)

・・・といったことができます。

https://github.com/miyako/4d-plugin-mecab-v2

miyako

投稿数 : 485
登録日 : 2016/07/05

トップに戻る Go down

【プラグイン】めかぶ v2 Empty Re: 【プラグイン】めかぶ v2

投稿 by hosaka 2018-12-20, 3:35 pm

とりあえずjumandicに固有名詞を登録してテストしてみました。
4DJapanと吉野家とこちら葛飾区亀有公園前派出所を登録してみました。
【プラグイン】めかぶ v2 Mecabo10

それとGET TEXT KEYWORDSにも影響でています。
おそらくこのプラグインで指定された辞書は参照している様なのですが分割の仕方が違う様で結果が違います。

もうひとつオリジナルの辞書では消えていた吉野家の'つちよし'が表示されているのでオリジナルの辞書の問題の様です。
hosaka
hosaka

投稿数 : 241
登録日 : 2016/07/04
所在地 : 大阪

トップに戻る Go down

【プラグイン】めかぶ v2 Empty Re: 【プラグイン】めかぶ v2

投稿 by miyako 2018-12-20, 5:45 pm

GET TEXT KEYWORDSの辞書は,4D本体の中にあるので影響はないはずなのですが,干渉してしまっているでしょうか。

GTKは,単純に品詞で分解せず,一定のヒューリスティックで品詞を連結してキーフレーズにしていますので,仮に同じ辞書でも結果は違います。

オリジナル辞書とは,サンプルのResourcesにある辞書のことでしょうか。
それとも,4D本体に収録されている辞書のことでしょうか。

miyako

投稿数 : 485
登録日 : 2016/07/05

トップに戻る Go down

【プラグイン】めかぶ v2 Empty Re: 【プラグイン】めかぶ v2

投稿 by hosaka 2018-12-20, 7:44 pm

オリジナルと言っているのは4D本体に収録されている辞書のことです。
デモのMecabストラクチャで「インストール」メソッドが通ったあとだと違う結果になっているのでおそらく間違いないです。

【プラグイン】めかぶ v2 Mecabc10

4Dのキーワード分割がこんな処理だと、せっかく辞書を賢くしてキーワードインデックスを有用なものにしようと考えたのですが意味がないですね。

「4DJapan」はいい感じなのに「定治」が一度、「定」と「治」に分割されているはずなのに結合されてます。
「吉野家」逆に分割されているのがよくわかりません。
「こちら葛飾区亀有公園前派出所」も分割されているのが解せないです。
残念な仕様としか言いようがないです。 Rolling Eyes
hosaka
hosaka

投稿数 : 241
登録日 : 2016/07/04
所在地 : 大阪

トップに戻る Go down

【プラグイン】めかぶ v2 Empty Re: 【プラグイン】めかぶ v2

投稿 by hosaka 2018-12-21, 12:51 pm

ごめんなさい。GTKには影響ないみたいです。
Mecabのストラクチャの環境設定の言語がフランス語になってました。これによる違いだった様です。
日本語の形態素解析のプラグインなので言語も日本語にしておいてください。 Crying or Very sad
hosaka
hosaka

投稿数 : 241
登録日 : 2016/07/04
所在地 : 大阪

トップに戻る Go down

【プラグイン】めかぶ v2 Empty Re: 【プラグイン】めかぶ v2

投稿 by hosaka 2018-12-21, 12:57 pm

改めて再テストしました。
今度は4Dに実装されている辞書を新しく変換した辞書と差し替えてみました。
これならOKです。

いらぬ誤解を産んで申し訳ないです。 Embarassed
【プラグイン】めかぶ v2 Iuu10

できれば「さん」は除外したいです。
hosaka
hosaka

投稿数 : 241
登録日 : 2016/07/04
所在地 : 大阪

トップに戻る Go down

【プラグイン】めかぶ v2 Empty Re: 【プラグイン】めかぶ v2

投稿 by hosaka 2018-12-21, 1:21 pm

メソッド:ユーザー辞書を作成する例②がうまくうごきません。
31行目で指定しているUUIDなファイル名のファイルが生成されない様です。
49行目で生成されるのだと思うのですが、ファイルがないので52行目でエラーになります。

環境は、OSX10.11.6 4Dv17R3_230768です。
hosaka
hosaka

投稿数 : 241
登録日 : 2016/07/04
所在地 : 大阪

トップに戻る Go down

【プラグイン】めかぶ v2 Empty Re: 【プラグイン】めかぶ v2

投稿 by hosaka 2018-12-21, 2:23 pm

4D本体の辞書はなんでjuman辞書なのでしょうか?ipa辞書の方が融通が効きそうなのですが。
hosaka
hosaka

投稿数 : 241
登録日 : 2016/07/04
所在地 : 大阪

トップに戻る Go down

【プラグイン】めかぶ v2 Empty Re: 【プラグイン】めかぶ v2

投稿 by miyako 2018-12-23, 5:16 pm

サンプルプログラム(https://github.com/miyako/4d-plugin-mecab-v2/releases/tag/0.1-db)ではなく,
リポジトリ全体をダウンロードされた,ということはないでしょうか。

サンプルプログラムのほうにはResourcesファイルがありますが,
リポジトリのほうはGitHubのサイズ制約の関係でResourcesフォルダーが空になっています。

個別ダウンロード

https://github.com/miyako/4d-plugin-mecab-v2/releases/download/mecab-ipadic-utf8-compiled/ipadic.zip

https://github.com/miyako/4d-plugin-mecab-v2/releases/download/mecab-jumandic-utf8-compiled/jumandic.zip

https://github.com/miyako/4d-plugin-mecab-v2/releases/download/mecab-ipadic-utf8-conf/ipadic.utf8.zip

https://github.com/miyako/4d-plugin-mecab-v2/releases/download/mecab-jumandic-utf8-conf/jumandic.utf8.zip

miyako

投稿数 : 485
登録日 : 2016/07/05

トップに戻る Go down

【プラグイン】めかぶ v2 Empty Re: 【プラグイン】めかぶ v2

投稿 by Sponsored content


Sponsored content


トップに戻る Go down

トップに戻る

- Similar topics

 
Permissions in this forum:
返信投稿: 不可