- 399 名前:デフォルトの名無しさん mailto:sage [2008/08/07(木) 02:53:31 ]
- >>398
評価関数が正確なら1手読みで十分だけれど、 逆に、 局面が最後まで読めるのなら 評価関数は石数を数えるだけで良いと考えると 読みの深さを増やすほど強くなりそうなことがわかる だから、評価関数を正確にすることだけではなく 計算速度が速い評価関数が使われてるんだ。 >今はパターンの重みを決める時とかは、結果的にそのパターンが現れた時の >最終的な石差の平均値に収束するように決めてるでしょ? 評価にMinimaxが使われているのだから、 評価関数のスコアも平均値ではなくて、 自分、相手が共に評価関数の決める最善手を指したときのスコアに 近づくようになってると思う。 だから >パターンAは50%は大負けで50%は大勝だとすると >普通に学習させるとこのパターンは勝ち負けに影響しないと判断されて重みは0になる。 >10%は僅差負けで90%は大勝のパターンBと100%僅差勝ちのパターンCでは、 >10%は僅差で負けるパターンBの重みの方が大きくなるのが普通だよね? こんな風に勝率で評価関数を決めていないと思うんだが。 もし、そのやり方に沿って決めるなら Minimax法が使えなさそう。
|

|