- 123 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/12/03(木) 14:17:22 ID:/9H+rYSl0]
- グーグルはウェブ上の言語データのほかにGoogle Booksで集めた印刷媒体のデータも持ってるはずで、
コーパスの量としては業界一だろうから、アルゴリズムの改良次第では化けるだろうなあ たとえば理工書の文体、児童書の文体、にちゃんねらの文体、ケータイ小説の文体なんて感じに 分類して統計処理できれば、かなり変換精度あげられると思う あとは過去数年分の新聞記事読み込ませて、新聞記者用の辞書作ったりみたいな エンタープライズ向けの商売もできそうだよなあ
|

|