- 1 名前: [2017/07/18(火) 09:18:19.79 .net]
- !extend:checked:vvvvv:1000:512
!extend:checked:vvvvv:1000:512 叡王戦公式HP www.eiou.jp/ 第27回世界コンピュータ将棋選手権 参加チーム www2.computer-shogi.org/wcsc27/team.html 詰将棋メモ コンピュータ将棋2017 toybox.tea-nifty.com/memo/2017/01/post-965e.html 世界コンピュータ将棋選手権参加ソフトリンク集 www.ne.jp/asahi/tetsu/toybox/soft/softlink.htm floodgate 最新2週間レーティング wdoor.c.u-tokyo.ac.jp/shogi/LATEST/players-floodgate14.html コンピュータ将棋協会 www.computer-shogi.org/ コンピュータ将棋 ja.wikipedia.org/wiki/%E3%82%B3%E3%83%B3%E3%83%94%E3%83%A5%E3%83%BC%E3%82%BF%E5%B0%86%E6%A3%8B 将棋フリーソフト rating on single machines(各ソフトのレーティング評価) uuunuuun.wix.com/shogi-engines VIPQ2_EXTDAT: checked:vvvvv:1000:512:----: EXT was configured
- 966 名前:名無し名人 [2017/08/02(水) 16:55:04.09 ID:413Dp7DT0.net]
- >>952
ああ、やっぱりそうか。 情報サンクス。
- 967 名前:名無し名人 mailto:sage [2017/08/02(水) 18:05:14.87 ID:RXcpbdXZd.net]
- 習甦の竹内の奥さんと写ってる写真の笑顔が最高すぎる
- 968 名前:名無し名人 mailto:sage [2017/08/02(水) 18:27:48.43 ID:R1Oyv/qP0.net]
- yaselmoなどR4100位あると思われるソフトが本当にそのレートにあるのか、
技巧やnozomiあたりとの対局を始める。 @uuunuuun1 有能
- 969 名前:名無し名人 mailto:sage [2017/08/02(水) 18:52:36.39 ID:knWHdPXU0.net]
- >>956
そこ大事だよな。楽しみ
- 970 名前:名無し名人 mailto:sage [2017/08/02(水) 19:03:07.21 ID:qhHDnFG0M.net]
- >>956
いいゾ〜これ
- 971 名前:名無し名人 mailto:sage [2017/08/02(水) 19:07:35.71 ID:Pe4B52dnM.net]
- yaselmoが入玉に弱いなら、玉位置指定ブレンドで玉が上の方に行ったときだけ100%elmoとかするとどうなるだろうかとふと思ったり
- 972 名前:名無し名人 mailto:sage [2017/08/02(水) 19:13:42.77 ID:DumI0mqS0.net]
- >>959
もしかしたら yaselmoに関しては進行度加えた方が強かったりするかもね
- 973 名前:名無し名人 [2017/08/02(水) 19:17:55.22 ID:IV2rpxczd.net]
- 絞り・ブレンドを取り入れたソフトは短時間と長時間とじゃ強さは変わるのだろうか
- 974 名前:名無し名人 [2017/08/02(水) 19:20:31.20 ID:IV2rpxczd.net]
- 1分10秒加算と、1手1秒を比較してみます。
- 975 名前:名無し名人 [2017/08/02(水) 19:48:31.36 ID:/mMMDZcop.net]
- >>961
元にした素材の素性と、教師局面の深度と量で全然変わる
- 976 名前:名無し名人 [2017/08/02(水) 20:06:08.71 ID:Z9ihJXLs0.net]
- まだやってんの?
- 977 名前:名無し名人 mailto:sage [2017/08/02(水) 20:10:02.66 ID:AAyWmbNl0.net]
- 思考時間によるレーティング上昇にノード数の閾値のようなものはあるかという問答をしてみたい。
一手10秒と一手1秒で測定されたRのずれは、 一手1秒と一手0.1秒で測定されたRのずれと同じなのか?という話。 思考時間によるレーティングの向上は経験則だと 上昇レーティング = 500 log(t/t0) くらいで、 つまり持ち時間10倍で500くらい上がるっていうのはまぁよくある話だった。 だが、近年の評価関数は持ち時間によって有利不利が変わる。 おそらくelmoなんかは思考時間10倍で600とか上がってしまうのだろう。 あの経験則は「10倍になると」という相対的な事しか言っていないので、 「elmoが600 log(t/t0)で、他のソフトは500 log(t/t0)です。」のように言い切れるならば 最初に書いたように10秒と1秒を比較する必要はなく、 1秒と0.1秒を比較し、そのまま直線を引いて10秒でのR差を出せば良いことになる。 今回の問題は、経験式のようにどこまでもまっすぐ線が引けるかだが、 「ある深さ、ある探索ノード数まで読みが進むとある評価関数は急に強くなる」 みたいな事が起こっているならば残念ながら直線は引けない。 レーティング上昇ぶりに変化が出るノード数の閾値みたいなものがあるのかって問答
- 978 名前:名無し名人 mailto:sage [2017/08/02(水) 20:21:14.95 ID:DumI0mqS0.net]
- 自己対戦で有意差が出る直前で一気に引き戻された時の絶望感ったらないな
開発者の人は毎回こんな絶望を味わっているのか
- 979 名前:名無し名人 mailto:sage [2017/08/02(水) 20:59:58.01 ID:6qtj7qdY0.net]
- そもそも5%の有意水準ってかなり甘いけどね
- 980 名前:名無し名人 [2017/08/02(水) 23:22:36.81 ID:CztcLG4f0.net]
- 俺って天才だよなあ
- 981 名前:名無し名人 [2017/08/02(水) 23:39:12.51 ID:BbbOEtXN0.net]
- ちょっとコード追加して、新たなブレンドモードを作ったら、面白い評価関数ができた。
なんだかしらないけど強い。どうして強いのかもわからない。w
- 982 名前:名無し名人 [2017/08/02(水) 23:39:22.46 ID:UVdPtMyZ0.net]
- 山本は2σじゃ危なくてダメと言ってるからな
- 983 名前:名無し名人 mailto:sage [2017/08/03(木) 00:22:59.29 ID:bdPIOIQT0.net]
- その最低限5%の足切りすら突破出来ない評価関数が多すぎるんだなこれが
- 984 名前:名無し名人 mailto:sage [2017/08/03(木) 00:23:14.57 ID:dkenphoI0.net]
- 細かい改良を100回テストしたら4回はずれるんだから当然
僅かな改善 (R20 程度) を無数に重ねあわせて、少しずつレーティングを改善している。とてもつらい。 denou.jp/tournament2016/img/PR/Ponanza.pdf これは99.7%信頼区間3000局の誤差上限52.7%以上の事だった 山本氏はそれぞれ違うバージョンのポナンザ同士に3000回程度の対局をさせ、 この対局統計を分析しより良いポナンザのプログラムを採択する方式でポナンザを改良した。 採択されたポナンザはそうでないポナンザより平均2%ポイント程度勝率が高かったという。 対局で52%の勝率を上げたポナンザが生き残り、このポナンザがもう一つのポナンザと対局を行う。 japanese.joins.com/article/737/231737.html
- 985 名前:名無し名人 mailto:sage [2017/08/03(木) 00:35:03.23 ID:dkenphoI0.net]
- 信頼区間を乱数でテストするとこんな感じ
擬似1000局勝率50% 100万セット 95%信頼区間 46.9〜53.1% 532勝以上 23269 回 2.3% 468勝以下 23089 回 2.3% 範囲内 953642 回 95.4%
- 986 名前:名無し名人 mailto:sage [2017/08/03(木) 00:40:47.04 ID:bdPIOIQT0.net]
- >>973
片側検定で頼むで
- 987 名前:名無し名人 mailto:sage [2017/08/03(木) 01:01:05.98 ID:hnnjruuk0.net]
- >>974
強いかどうかなら勝率50.05%以上を仮定しておくと (勝率50%だと弱くはない=互角も可能なのでわずかに勝率を50%より上げておく) 95%だと526勝474敗で達成 >>972 細かい改良を積み重ねる方式なら別にいい 最悪マイナスの改良でなければいいのだから だがどこの馬の骨かわからんものが100個あったときに 最強のものを決めるという問題の場合にはそれは使えない 0.95^100=0.59% つまり実力ではなくたまたま運が良かっただけという可能性が99.41%になるから 0.9995^100=95%になるから 100個のものの検定を95%の信頼区間で行うときには 1個あたりでは99.95%の信頼区間を最低限取る必要がある
- 988 名前:名無し名人 mailto:sage [2017/08/03(木) 01:04:35.31 ID:Xzd14CNR0.net]
- 短時間の勝率と長時間の勝率が一致しないって話が出てきている時代に
統計の「厳密」な議論がどこまで意味があるのだろうか
- 989 名前:名無し名人 mailto:sage [2017/08/03(木) 01:06:22.08 ID:hnnjruuk0.net]
- それに完全互角でも先手勝率55%と予想されてるからな
勝率52%とかなってくると先後の差ですら影響するよな
- 990 名前:名無し名人 [2017/08/03(木) 01:20:45.22 ID:bdPIOIQT0.net]
- >>975
突っ込みどころが多すぎるぞ・・・
- 991 名前:名無し名人 mailto:sage [2017/08/03(木) 01:35:43.65 ID:BiY1ZAvL0.net]
- ガバガバ数学定期
- 992 名前:名無し名人 [2017/08/03(木) 07:43:29.97 ID:/+xpQuez0.net]
- >>969
新しいブレンドモードをぜひやねうら王さんに送って 使えるようにお願いします
- 993 名前:名無し名人 [2017/08/03(木) 07:44:40.46 ID:GD2QJudBa.net]
- 開発は改良の積み重ねだからごくわずかなレート向上が重要だけど、
ユーザーが有意水準を考えなければならないレベルのどんぐり関数を比較すること自体が馬鹿馬鹿しい あくまで将棋スレなのに、将棋である必要がない議論しかなされてないよね まあ一時期はスマホのスペックの話題ばっかだったし、そういうのは求められてないんかね
- 994 名前:名無し名人 mailto:sage [2017/08/03(木) 09:57:51.12 ID:qQ0Hnmhn0.net]
- いやstockfishもR20とかそれ以下の改良の積み重ねだけどね
- 995 名前:名無し名人 mailto:sage [2017/08/03(木) 10:05:49.80 ID:SUTyR97Ca.net]
- 要は将棋なんて興味ないんだよ
他人をなぎ倒せりゃそれでいいw
- 996 名前:名無し名人 mailto:sage [2017/08/03(木) 10:26:52.51 ID:O6Kx/nBor.net]
- >>976
難癖を付けるのが目的だからね 日本の保守(笑)なおっさん、ジジイには良くあること
- 997 名前:名無し名人 mailto:sage [2017/08/03(木) 11:59:27.48 ID:vws3z6oG0.net]
- ENGINE_VERSIONどこにあるんだっけ?と思ったら
extra/config.hじゃなくてshogi.hにあったのね 直観的にあると見当をつける場所ではないような気もするが
- 998 名前:名無し名人 mailto:sage [2017/08/03(木) 12:30:52.22 ID:4oXMxa6wM.net]
- >>981
少し前まで将棋の内容について触れると湧いてくる荒らしが常駐してた影響もあるだろうね
- 999 名前:名無し名人 mailto:sage [2017/08/03(木) 14:59:46.79 ID:OfsfbDFG0.net]
- >>985
Bonanzaもshogi.hにBNZ_VERがある。
- 1000 名前:名無し名人 [2017/08/03(木) 18:43:32.53 ID:rIYopPsc0.net]
- >>983
これが真理だな。 去年の真やねうら王をスマホで動かしてウォーズ40連勝くらいできるし、もはや人間には理解できないレベル。
- 1001 名前:名無し名人 [2017/08/03(木) 19:45:05.79 ID:+EXgPMmfd.net]
- >>988
それはお前にとっての真理だろ。 開発者の中には将棋の神にどれだけ近づけるかや、完全解析の究明を目指したりしてる人だっている
- 1002 名前:だから。 []
- [ここ壊れてます]
- 1003 名前:名無し名人 [2017/08/03(木) 19:54:25.82 ID:rIYopPsc0.net]
- >>989
メッチャキモいぞ
- 1004 名前:名無し名人 mailto:sage [2017/08/03(木) 20:06:57.27 ID:a8wHEm/s0.net]
- 完全解析を目指してる開発者はいないだろうなぁ
- 1005 名前:名無し名人 mailto:sage [2017/08/03(木) 20:19:33.43 ID:KqHHKgtz0.net]
- 今の少しずつようするに「棋力」を上げるアプローチから完全解析ってできるの?
全く別の方向から考えないとダメなんじゃ?
- 1006 名前:名無し名人 mailto:sage [2017/08/03(木) 20:39:01.21 ID:Xzd14CNR0.net]
- まずはどうぶつしょうぎに自己対戦学習させて初期局面の後手評価値がかなり大きくなるかどうか
やってみてほしい。
- 1007 名前:名無し名人 mailto:sage [2017/08/03(木) 20:46:11.03 ID:jUKcdWmf0.net]
- 完全解析はとにかくスピード命だろ
どんなに頑張っても終わらんだろうけどw
- 1008 名前:名無し名人 [2017/08/03(木) 20:46:34.02 ID:PNftBja60.net]
- 完全解析したら棋士は廃業。棋士は開発者を殺してでも阻止する
- 1009 名前:名無し名人 [2017/08/03(木) 21:20:29.76 ID:lCUntu6Qa.net]
- 急に変なの湧いてきたな
- 1010 名前:名無し名人 mailto:sage [2017/08/03(木) 21:23:51.02 ID:0E8cXZGBd.net]
- 完全解析()
- 1011 名前:名無し名人 mailto:sage [2017/08/03(木) 21:48:12.99 ID:BnXYy6R3d.net]
- 量子コンピュータはD−Wave社が実用化してるからそれ借りてきて来年の選手権に出れば余裕で優勝できるよ。
- 1012 名前:名無し名人 [2017/08/03(木) 21:50:43.56 ID:6b9jyaI2d.net]
- 1000なら今年中に完全解析
- 1013 名前:名無し名人 [2017/08/03(木) 21:56:32.76 ID:BnXYy6R30.net]
- 1000なら俺が幸せになる
- 1014 名前:1001 [Over 1000 Thread.net]
- このスレッドは1000を超えました。
もう書けないので、新しいスレッドを立ててくださいです。。。 life time: 16日 12時間 38分 13秒
- 1015 名前:過去ログ ★ [[過去ログ]]
- ■ このスレッドは過去ログ倉庫に格納されています
|
|