[表示 : 全て 最新50 1-99 101- 2ch.scのread.cgiへ]
Update time : 06/24 16:36 / Filesize : 34 KB / Number-of Response : 129
[このスレッドの書き込みを削除する]
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

なんでお前ら自作OS作らないの?



64 名前:Be名無しさん mailto:sage [2008/11/20(木) 04:04:25 .net]
>>62
それは全く見当違いです
特定の人間が特定の分野のことしか変換しないのなら、後述の非文法文を考慮する必要すらないでしょう

>>63
HMMが局所最適に陥りやすいことはご存知でしょう

「庭には二羽ニワトリ(鶏)がいる」という文が正確に変換できる場合、そこには矛盾が存在するでしょう
出現確率として埴輪ニワトリがありえないと言うなら、「N+ニワトリ」と「数量詞+ニワトリ」が出現する確率と、「庭に+N」と「庭には+N」が出現する確率は、どちらも前者が低く後者が高いと言い切れるでしょうか
実際には頻度データや文解析などを行う必要がありますが、頻度データは辞書を肥大化させる一因ですし、文解析は日常的な非文法的構文の変換精度を著しく低下させます
局所最適に陥れば、辞書が十分でない場合、埴輪ニワトリや庭ニワトリを生成しうるでしょう
しかし出回ってるフリーの辞書にはそういったデータのあるものは見かけませんし、コーパスで自動的に生成する場合は日常文にとても弱い辞書ができます
また日常文を正確に分解できるようなコーパスのエンジンの設計についても検討しなければなりません
実際にそれらは不完全で冗長なものです
辞書や理論的な面で話がしたいなら、この前提の下で話してください><
ただ車輪や既製品を再開発するのもどうかと思うので、この手の議論には興味がないです

むしろエレガントな文法解析をするためのモデルをコードでも数式でもかまいませんから示してください><







[ 続きを読む ] / [ 携帯版 ]

全部読む 次100 最新50 [ このスレをブックマーク! 携帯に送る ] 2chのread.cgiへ
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧](*・∀・)<34KB

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef