自然言語処理スレッド その2 at TECH
[2ch|▼Menu]
8:6
07/03/06 23:30:16
>>5 C#が嫌いなので、つまらないコメントを書いてしまった。ごめんなさい。
でも、Jumanを使いこなすだけでも、大変なことなのですよ。
私は以下の手順でプログラム開発をしています。
1..仕様をpdfファイルでもらう。(文章か表)
2..これをtxtに変換。(文字情報を抜き取る)
3..形態素解析。
4..格判断、後置詞、接続詞などの整理、並べ直し。
5..Prologの述語として整形する。
1から3までは作業を制御するのはPrologのプログラムです。
4,5もPrologが候補を出してきますが、相当に人間の判断が必要です。
3のJumanがやはり問題です。数に関する情報が上手く処理できません。
Jumanの出してくる候補はバラバラです。これを繋ぎ合わせる必要がある
のですが、一つの名詞として繋ぐのか、部分的に独立した数値として
扱うのか、私の能力ではうまくコード化出来ないケースが多々あります。



次ページ
続きを表示
1を表示
最新レス表示
スレッドの検索
類似スレ一覧
話題のニュース
おまかせリスト
▼オプションを表示
暇つぶし2ch

5505日前に更新/189 KB
担当:undef