- 311 名前:login:Penguin mailto:sage [2010/06/02(水) 22:41:13 ID:408ZUOE4]
- >>309
詳しいやり方がわかりませんので、簡単にできるなら是非どうぞ。 とりあえず茶筅やメカブの辞書をgrepして眺めているだけですが、 IPAdicはあくまで形態素のコーパスで、熟語は音声処理用かなんかの逆変換で使いにくい 短い単語とかは結構足りないんじゃないかって気がします。 例えば宮城県で探しても大学の名前しかでてこなくて県名単体すら入ってない。 Mozcの辞書も傾向は似ていますが、unicodeな単語とかも入ってて 多少改善してる感じは気のせいでしょうか?
|

|