- 246 名前:デフォルトの名無しさん mailto:sage [2010/08/08(日) 10:47:10 ]
- MeCabってどういう仕組みなんですか?
文字列abcがあり、辞書に[a], [b], [c], [a, b], [b, c], [a, b, c]の形態素情報があった場合、 もっとも繋がりの高い形態素の連鎖状況を見てそれを出力するんですか? (例えば[a][b][c]よりも[a, b][c]となっている確率の方が高い場合、後者を選択) 品詞情報からp(x|y)を判断する方法もあると思いますが、特定の形態素に対してp(x|y)を算出するのに辞書情報を用いる方法が分かりません。
|

|