- 65 名前:Be名無しさん mailto:sage [2008/11/20(木) 07:10:15 .net]
- >>64
全然わかってないじゃない。 >>63は、>>62について要するにと言ったわけで、これも一種の局所最適と言えそう。 ダブルミーングの場合はともかくとして解は一つでしょ? ただ、文脈等によって局所的に最適解が変動するだけ、表記ゆれも含めて。 だったら文脈毎に状態を持てばいい。つまりその数だけ小さな専門辞書を作る。 しかし、もし遷移具合が似通っていればそれを表現している辞書を統合できる。 まあ圧縮なんかはそれを利用する訳だし。 文節に相当する部分ではバラけた遷移分布になってわかるんじゃない? 日常文コーパスから辞書作ってなぜ日常文に弱くなるのさ? っていうか埴輪ニワトリや庭ニワトリがあるコーパスって何? それらがある遷移辞書が作られなければそういう変換にはならない。 逆に一度でも使われていればどこかの辞書には上位で存在するから、 その辞書を選択するかどうかで決まってくる。 っていうか、音声合成ならともかくIMになんでそんな正確なのが要るの? 選びたい候補がちゃんと出ればいいんだよ、基本的には。
|
|