- 64 名前:Be名無しさん mailto:sage [2008/11/20(木) 04:04:25 .net]
- >>62
それは全く見当違いです 特定の人間が特定の分野のことしか変換しないのなら、後述の非文法文を考慮する必要すらないでしょう >>63 HMMが局所最適に陥りやすいことはご存知でしょう 「庭には二羽ニワトリ(鶏)がいる」という文が正確に変換できる場合、そこには矛盾が存在するでしょう 出現確率として埴輪ニワトリがありえないと言うなら、「N+ニワトリ」と「数量詞+ニワトリ」が出現する確率と、「庭に+N」と「庭には+N」が出現する確率は、どちらも前者が低く後者が高いと言い切れるでしょうか 実際には頻度データや文解析などを行う必要がありますが、頻度データは辞書を肥大化させる一因ですし、文解析は日常的な非文法的構文の変換精度を著しく低下させます 局所最適に陥れば、辞書が十分でない場合、埴輪ニワトリや庭ニワトリを生成しうるでしょう しかし出回ってるフリーの辞書にはそういったデータのあるものは見かけませんし、コーパスで自動的に生成する場合は日常文にとても弱い辞書ができます また日常文を正確に分解できるようなコーパスのエンジンの設計についても検討しなければなりません 実際にそれらは不完全で冗長なものです 辞書や理論的な面で話がしたいなら、この前提の下で話してください>< ただ車輪や既製品を再開発するのもどうかと思うので、この手の議論には興味がないです むしろエレガントな文法解析をするためのモデルをコードでも数式でもかまいませんから示してください><
|
|