- 323 名前:310 mailto:sage [2015/09/03(木) 10:38:17.33 ID:Fd8XT4rV.net]
- >>320
もともとひっくり返しあった後の終局を予測するのが目的なので、教師データは最終局面 の石差です。盤面の特徴(パターン)から、最終石差を予想するための重回帰計算なので、 その時点の石数は、説明変数に入れてません。なので、パターンの選択が適切なら、 最善手の応酬において1手毎にどれだけ石数が入れ替わろうと、影響を受けずに、 二乗誤差が終局に近づくほど減っていくと予想されます。 というか、そうなるように説明変数であるところのパターンを模索していくと理解しています。 手元にあるwzebraなんかは、評価値と称して最終石差予想が表示されているのですが、 やはり、ある程度の誤差を含みつつも、大きくぶれているようには見えません。 評価関数の使い道を考えると、実は絶対値はそれほど重要ではありません。 中盤探索のn手読みの時の盤面評価と、ムーブオーダリングに使うので、ある局面から 派生したn手先の局面における相対的な関係が保たれていればOKです。 また、MTD(f)法などを使う時の、fの初期値設定にも使います。この時は絶対値で正確な 方が良いはずですが、外れはすぐにカットされて次に行くので、トータルの時間に対する 影響は小さいように感じます。 とはいえ、相対的な関係が保たれているのかをチェックするのは難しいですから、 結局のところ出来上がった評価関数の評価は、教師データとの二乗誤差の小ささに するしかないかなと。
|

|