形態素解析と日本語処理 at TECH
[2ch|▼Menu]
231:デフォルトの名無しさん
06/04/27 18:42:23
>>230
圧縮ソフトのアルゴリズムが利用できるかも?
辞書式ってのは、よくでてくるビット列に短い符号を割り当てるんだから、
そのあたりを応用すれば、単語としてよくあるものが抽出されると思う。
ただし品詞タグ付は無理だろうけど。

このアイデアはどう?

で、めかぶや茶筌が動くコーパスはどの位の大きさが必要なのかなぁ?
だれか知ってる人いない?


次ページ
続きを表示
1を表示
最新レス表示
スレッドの検索
類似スレ一覧
話題のニュース
おまかせリスト
▼オプションを表示
暇つぶし2ch

5414日前に更新/68 KB
担当:undef