- 239 名前:デフォルトの名無しさん [2010/07/07(水) 21:10:21 ]
- >>237
二十年以上昔から 駄目っぽいことが判ってるらしい。 上側は用言や副詞や動名詞 下側は固有名詞と だいたい傾向が分かっていて、 類似度を計るときは、通称「百科語」と呼ばれる 単語を使うことになっているのだが、 ここんとこに漢語の合成語が入ってくるのが難物なのだ。 漢語の合成語を自動検出するシステムを作って ふるいに掛けてみたら、 二十万語を越しても一向に頭打ちになる様子がないので 怖くなってやめたと、たしか高橋秀俊先生が 書いていらっしゃった。 最近ではシソーラスを作るのが基本だが、 手間が半端じゃねぇというので あまり好かれない。 >>235 もたぶんそういった流れなんだろうと思う。
|

|