- 398 名前:デフォルトの名無しさん mailto:sage [2008/08/05(火) 01:00:46 ]
- 思いつきとしては、安定度みたいなのがあっても良い気がする。
αβ探索で深読みすると浅読みで良手だったのが悪手になったりするでしょ? これって、その局面を進めていくとそういう局面を発見するからだって考えがちだけど、 単純に考えれば、浅読みの評価値が間違っているとも言える訳で。 評価関数が、局面の善悪を出力するのなら、1手読みで十分な筈でしょ? 俺としては、深読みが有効なのは評価値にはランダムな誤差があって、 何段ものミニマックス探索がその誤差をフィルタリングする結果、 安定度の高い(評価誤差が少ない)局面を選択できるからだと思ってるんだよね。 今はパターンの重みを決める時とかは、結果的にそのパターンが現れた時の 最終的な石差の平均値に収束するように決めてるでしょ? でも、実際にはそのパターンが現れた時に勝つこともあれば負けることもある。 勝てる局面で下手をして負けるってこともあるけど、 実はそうではなくて、そのパターンを含む局面は本質的に不安定なのかもしれない。 と、考えてみると安定度というパラメータが見えてくる。 パターンAは50%は大負けで50%は大勝だとすると 普通に学習させるとこのパターンは勝ち負けに影響しないと判断されて重みは0になる。 10%は僅差負けで90%は大勝のパターンBと100%僅差勝ちのパターンCでは、 10%は僅差で負けるパターンBの重みの方が大きくなるのが普通だよね? それで良いんだろうか?ってこと。 これらのパターンが選択可能な時、より確実に勝ちたかったら、パターンCを選びたいよね? 安定度っていうのはそういうこと。 今の評価関数にはこういうのが入っていないと思う。
|

|