▲コンピュータ将棋ス ..
[2ch|▼Menu]
981:名無し名人
17/08/02 23:39:12.51 BbbOEtXN0.net
ちょっとコード追加して、新たなブレンドモードを作ったら、面白い評価関数ができた。
なんだかしらないけど強い。どうして強いのかもわからない。w

982:名無し名人
17/08/02 23:39:22.46 UVdPtMyZ0.net
山本は2σじゃ危なくてダメと言ってるからな

983:名無し名人
17/08/03 00:22:59.29 bdPIOIQT0.net
その最低限5%の足切りすら突破出来ない評価関数が多すぎるんだなこれが

984:名無し名人
17/08/03 00:23:14.57 dkenphoI0.net
細かい改良を100回テストしたら4回はずれるんだから当然


僅かな改善 (R20 程度) を無数に重ねあわせて、少しずつレーティングを改善している。とてもつらい。
URLリンク(denou.jp)

これは99.7%信頼区間3000局の誤差上限52.7%以上の事だった


山本氏はそれぞれ違うバージョンのポナンザ同士に3000回程度の対局をさせ、
この対局統計を分析しより良いポナンザのプログラムを採択する方式でポナンザを改良した。
採択されたポナンザはそうでないポナンザより平均2%ポイント程度勝率が高かったという。
対局で52%の勝率を上げたポナンザが生き残り、このポナンザがもう一つのポナンザと対局を行う。
URLリンク(japanese.joins.com)

985:名無し名人
17/08/03 00:35:03.23 dkenphoI0.net
信頼区間を乱数でテストするとこんな感じ

擬似1000局勝率50% 100万セット
95%信頼区間 46.9〜53.1%

532勝以上 23269 回 2.3%
468勝以下 23089 回 2.3%
範囲内 953642 回 95.4%

986:名無し名人
17/08/03 00:40:47.04 bdPIOIQT0.net
>>973
片側検定で頼むで

987:名無し名人
17/08/03 01:01:05.98 hnnjruuk0.net
>>974
強いかどうかなら勝率50.05%以上を仮定しておくと
(勝率50%だと弱くはない=互角も可能なのでわずかに勝率を50%より上げておく)
95%だと526勝474敗で達成

>>972
細かい改良を積み重ねる方式なら別にいい
最悪マイナスの改良でなければいいのだから

だがどこの馬の骨かわからんものが100個あったときに
最強のものを決めるという問題の場合にはそれは使えない
0.95^100=0.59%
つまり実力ではなくたまたま運が良かっただけという可能性が99.41%になるから
0.9995^100=95%になるから
100個のものの検定を95%の信頼区間で行うときには
1個あたりでは99.95%の信頼区間を最低限取る必要がある

988:名無し名人
17/08/03 01:04:35.31 Xzd14CNR0.net
短時間の勝率と長時間の勝率が一致しないって話が出てきている時代に
統計の「厳密」な議論がどこまで意味があるのだろうか

989:名無し名人
17/08/03 01:06:22.08 hnnjruuk0.net
それに完全互角でも先手勝率55%と予想されてるからな
勝率52%とかなってくると先後の差ですら影響するよな

990:名無し名人
17/08/03 01:20:45.22 bdPIOIQT0.net
>>975
突っ込みどころが多すぎるぞ・・・

991:名無し名人
17/08/03 01:35:43.65 BiY1ZAvL0.net
ガバガバ数学定期

992:名無し名人
17/08/03 07:43:29.97 /+xpQuez0.net
>>969
新しいブレンドモードをぜひやねうら王さんに送って
使えるようにお願いします

993:名無し名人
17/08/03 07:44:40.46 GD2QJudBa.net
開発は改良の積み重ねだからごくわずかなレート向上が重要だけど、
ユーザーが有意水準を考えなければならないレベルのどんぐり関数を比較すること自体が馬鹿馬鹿しい
あくまで将棋スレなのに、将棋である必要がない議論しかなされてないよね
まあ一時期はスマホのスペックの話題ばっかだったし、そういうのは求められてないんかね

994:名無し名人
17/08/03 09:57:51.12 qQ0Hnmhn0.net
いやstockfishもR20とかそれ以下の改良の積み重ねだけどね

995:名無し名人
17/08/03 10:05:49.80 SUTyR97Ca.net
要は将棋なんて興味ないんだよ
他人をなぎ倒せりゃそれでいいw

996:名無し名人
17/08/03 10:26:52.51 O6Kx/nBor.net
>>976
難癖を付けるのが目的だからね
日本の保守(笑)なおっさん、ジジイには良くあること

997:名無し名人
17/08/03 11:59:27.48 vws3z6oG0.net
ENGINE_VERSIONどこにあるんだっけ?と思ったら
extra/config.hじゃなくてshogi.hにあったのね
直観的にあると見当をつける場所ではないような気もするが

998:名無し名人
17/08/03 12:30:52.22 4oXMxa6wM.net
>>981
少し前まで将棋の内容について触れると湧いてくる荒らしが常駐してた影響もあるだろうね

999:名無し名人
17/08/03 14:59:46.79 OfsfbDFG0.net
>>985
Bonanzaもshogi.hにBNZ_VERがある。

1000:名無し名人
17/08/03 18:43:32.53 rIYopPsc0.net
>>983
これが真理だな。
去年の真やねうら王をスマホで動かしてウォーズ40連勝くらいできるし、もはや人間には理解できないレベル。

1001:名無し名人
17/08/03 19:45:05.79 +EXgPMmfd.net
>>988
それはお前にとっての真理だろ。
開発者の中には将棋の神にどれだけ近づけるかや、完全解析の究明を目指したりしてる人だっている


1002:だから。



1003:名無し名人
17/08/03 19:54:25.82 rIYopPsc0.net
>>989
メッチャキモいぞ

1004:名無し名人
17/08/03 20:06:57.27 a8wHEm/s0.net
完全解析を目指してる開発者はいないだろうなぁ

1005:名無し名人
17/08/03 20:19:33.43 KqHHKgtz0.net
今の少しずつようするに「棋力」を上げるアプローチから完全解析ってできるの?
全く別の方向から考えないとダメなんじゃ?

1006:名無し名人
17/08/03 20:39:01.21 Xzd14CNR0.net
まずはどうぶつしょうぎに自己対戦学習させて初期局面の後手評価値がかなり大きくなるかどうか
やってみてほしい。

1007:名無し名人
17/08/03 20:46:11.03 jUKcdWmf0.net
完全解析はとにかくスピード命だろ
どんなに頑張っても終わらんだろうけどw

1008:名無し名人
17/08/03 20:46:34.02 PNftBja60.net
完全解析したら棋士は廃業。棋士は開発者を殺してでも阻止する

1009:名無し名人
17/08/03 21:20:29.76 lCUntu6Qa.net
急に変なの湧いてきたな

1010:名無し名人
17/08/03 21:23:51.02 0E8cXZGBd.net
完全解析()

1011:名無し名人
17/08/03 21:48:12.99 BnXYy6R3d.net
量子コンピュータはD−Wave社が実用化してるからそれ借りてきて来年の選手権に出れば余裕で優勝できるよ。

1012:名無し名人
17/08/03 21:50:43.56 6b9jyaI2d.net
1000なら今年中に完全解析

1013:名無し名人
17/08/03 21:56:32.76 BnXYy6R30.net
1000なら俺が幸せになる

1014:1001
Over 1000 Thread.net
このスレッドは1000を超えました。
もう書けないので、新しいスレッドを立ててくださいです。。。
life time: 16日 12時間 38分 13秒

1015:過去ログ ★
[過去ログ]
■ このスレッドは過去ログ倉庫に格納されています


最新レス表示
スレッドの検索
類似スレ一覧
話題のニュース
おまかせリスト
▼オプションを表示
暇つぶし2ch

57日前に更新/266 KB
担当:undef