形態素解析と日本語処理
at TECH
231:デフォルトの名無しさん
06/04/27 18:42:23
>>230
圧縮ソフトのアルゴリズムが利用できるかも?
辞書式ってのは、よくでてくるビット列に短い符号を割り当てるんだから、
そのあたりを応用すれば、単語としてよくあるものが抽出されると思う。
ただし品詞タグ付は無理だろうけど。
このアイデアはどう?
で、めかぶや茶筌が動くコーパスはどの位の大きさが必要なのかなぁ?
だれか知ってる人いない?
次ページ続きを表示1を表示最新レス表示スレッドの検索類似スレ一覧話題のニュースおまかせリスト▼オプションを表示暇つぶし2ch
5414日前に更新/68 KB
担当:undef