自然言語処理スレッド その2 at TECH
[2ch|▼Menu]
14:デフォルトの名無しさん
07/03/08 10:20:56
>>13 辞書でいいのでしょうね
Prologのプログラムでは何のオプションも付けずにjumanを使います。

?- sh('echo "第五世代コンピュータ" | juman',X).

X = [['第','(だい)','第','名詞接頭辞'],
['五','(ご)','五','数詞'],
['世','(せい)','世','名詞性名詞助数'],
['代','(だい)','代','名詞性名詞接尾'],
['コンピュータ(こんぴゅーたコンピュー','普通名詞'],
['技術','(ぎじゅつ)','技術','普通名詞']].
Prologインタプリタのトップレベルから呼ぶとこんな感じになります。これを

形態素解析(_文,_形態素ならび) :- concat_atom(['echo "',_文,'" | juman'],S),
sh(S,X),再膠着(X,_形態素ならび).

再膠着([],[]) :- !.
再膠着([[A,_,_,名詞接頭辞],[B,_,_,数詞]|R1],[C|R2]) :- concat_atom([A,B],C),
,再膠着(R1,R2).
再膠着([[A,_,_,_]|R1],[A|R2]) :- 再膠着(R1,R2).
のようなプログラム(述語)を定義しておいて(再膠着と品詞等付加情報の除去を
同時に行っている好ましくない定義です)
..., 仕様読み取り(_受信文), ... ,形態素解析(_受信文,_形態素ならび), ...
のように呼びだして処理します。要するに「本当にこれで澄むのか!」の問題ですね。


次ページ
続きを表示
1を表示
最新レス表示
スレッドの検索
類似スレ一覧
話題のニュース
おまかせリスト
▼オプションを表示
暇つぶし2ch

5505日前に更新/189 KB
担当:undef