1 名前:名無し名人 [2018/12/06(木) 01:26:53.92 ID:K6I+wbnXM.net BE:437086469-PLT(13000)] img.5ch.net/ico/imo.gif ↑スレ立て時は1行目と2行目に「!extend:checked:vvvvv:1000:512」をコピペして立てて下さい 荒らし対策のために強制コテハン(ワッチョイ)を表示するコマンドです 第28回世界コンピュータ将棋選手権 参加チーム https://www.apply.computer-shogi.org/wcsc28/team.html 詰将棋メモ コンピュータ将棋2018 toybox.tea-nifty.com/memo/2018/01/post-0205.html 世界コンピュータ将棋選手権参加ソフトリンク集 www.ne.jp/asahi/tetsu/toybox/soft/softlink.htm floodgate 最新2週間レーティング wdoor.c.u-tokyo.ac.jp/shogi/LATEST/players-floodgate14.html コンピュータ将棋協会 www.computer-shogi.org/ コンピュータ将棋 ja.wikipedia.org/wiki/ コンピュータ将棋 コンピュータ将棋 まとめサイト(コンピュータ将棋レーティング) https://www.qhapaq.org/shogi/ ※前スレ ▲コンピュータ将棋スレッド143 https://mevius.5ch.net/test/read.cgi/bgame/1540817996/_EXTDAT: checked:vvvvv:1000:512:----: EXT was configured VIPQ2_EXTDAT: checked:vvvvv:1000:512:----: EXT was configured
201 名前:名無し名人 mailto:sage [2018/12/08(土) 22:01:29.28 ID:WZp33Rgc0.net] こういうこと言われないためにAlphaZero側がむしろ消費電力が少ないぐらいの条件で対局すればよかった
202 名前:名無し名人 mailto:sage [2018/12/08(土) 22:10:40.47 ID:iu3hDVAL0.net] 思ったほど圧倒的に勝ち越せなくてスペック盛ったとかだったら嫌だわ
203 名前:名無し名人 mailto:sage [2018/12/08(土) 22:24:15.47 ID:WZp33Rgc0.net] >>202 その可能性はあるでしょ インパクト出すためにマシンスペック盛るぐらいは必然の手筋
204 名前:名無し名人 mailto:sage [2018/12/08(土) 22:29:27.20 ID:Ty0xY3GO0.net] AlphaZero : TPU v1 X 4 = 40W(max) X 4 = 160W elmo : Xeon E5-2699 v4 X 2 = 145W X 2 = 290W elmoの方が消費電力が大きい。ウソ言ったものの勝ちかよ。
205 名前:名無し名人 mailto:sage [2018/12/08(土) 22:35:53.74 ID:iu3hDVAL0.net] >>204 対局に使ったのって第二世代なんじゃなかったっけ? あとTPUのワット数ってどこに載ってるか教えてほしい
206 名前:名無し名人 mailto:sage [2018/12/08(土) 22:42:51.87 ID:EFAeRw8l0.net] >>205 eetimes.jp/ee/articles/1705/30/news104.html
207 名前:名無し名人 mailto:sage [2018/12/08(土) 22:51:05.85 ID:iu3hDVAL0.net] >>206 サンクス 40Wは最初に発表された第一世代のほうだね 第二世代は性能アップと共に消費電力は倍増しているんじゃないかと予想されている この記事では公開されてないからなんともいえないが80Wくらいだったとして320W わりと公平なセッティングだったのかもな
208 名前:名無し名人 mailto:sage [2018/12/08(土) 22:54:04.15 ID:a8V/86X50.net] >>206 >第2世代TPUは28nmプロセスを適用したチップで、消費電力は40W、動作周波数は700MHzである。主論理ユニットには6万5536個の8ビット乗算累算ユニットと24Mバイトのキャッシュを搭載しているという。 この部分は第1世代の話だね 多分記事が間違えてる 第2世代はヒートシンクの大きさから200Wオーバーという話も
209 名前:名無し名人 mailto:sage [2018/12/08(土) 23:04:51.60 ID:Ty0xY3GO0.net] full-paper: Stockfish and Elmo used 44 central processing unit (CPU) cores. AlphaZero and AlphaGo Zero used a single machine with four first-generation TPUs and 44 CPU cores Xeon E5 2699 v4: https://ark.intel.com/ja/products/91317/Intel-Xeon-Processor-E5-2699-v4-55M-Cache-2-20-GHz- www.atmarkit.co.jp/ait/articles/1807/06/news108.html TPU v1 : 40W
210 名前:名無し名人 mailto:sage [2018/12/08(土) 23:21:32.98 ID:iu3hDVAL0.net] >>209 サンクス それにしても40Wってすごいな、GTX1060ですら120Wなのに
211 名前:名無し名人 [2018/12/08(土) 23:23:42.24 ID:uvZ7t8q10.net] >>204 AlphaZeroはTITAN V(TDP250W)相当のTPUを4基使っており、elmoはXeon E5-2699 v4相当のCPU(TDP145W)を2基使用で およそ3倍の電力差があるぞ
212 名前:名無し名人 mailto:sage [2018/12/08(土) 23:32:42.68 ID:/DV+3gd50.net] TCEC シーズン14の3部リーグは4回戦総当たり全28ラウンドを終了して Leela chess 0 が18勝1敗9分の1位、Komodo MCTSが14勝2敗12分の2位で それぞれ3位以下を大きく引き離して2部昇格 KomodoMCTSの2敗はLc0からで、これを考えると従来型エンジンへのMCTSはまだ時期尚早か 2部は間もなくスタート
213 名前:名無し名人 mailto:sage [2018/12/08(土) 23:35:18.13 ID:9FZcfG9E0.net] 88番の棋譜仕掛けの後のちょっと珍しい手と終盤の面白さがいいな
214 名前:名無し名人 mailto:sage [2018/12/08(土) 23:54:40.71 ID:0GScs9T+0.net] 電力差が実は公平だったとしてもわりと手の届きそうな強さに希望を感じる ということを去年も言った気がする 来年も言ってるかもしれない
215 名前:名無し名人 [2018/12/08(土) 23:56:33.78 ID:uvZ7t8q10.net] ハードの消費電力が高いほどソフトの棋力も高く出来るからな、あえてelmoより電力3倍以上 使ったAlphaZeroは不公平なハードの力での結果だからな
216 名前:名無し名人 mailto:sage [2018/12/09(日) 00:15:48.31 ID:qjHDtLMJ0.net] ルールだけ教えて2時間で強くなったところが重要なんだから電力とかどうでもいいじゃん
217 名前:名無し名人 mailto:sage [2018/12/09(日) 00:18:36.47 ID:y4kVLvKe0.net] 電力うんぬん言ってるやつは 論文4ページの下から4行目から見てみ 対局に使われたのは第二世代のTPU(推定200 wattsから250 watts)じゃなくて第一世代のTPU(公表40 watts)4基 ちなみに去年の論文では対局に使われたTPUのバージョンは書かれてなかった
218 名前:名無し名人 [2018/12/09(日) 01:04:44.97 ID:hwy67+4T0.net] お前らってなんで対局時の電力しか考えないの? 学習にかけた時間は無視すんの? もっと言えば、人件費も考慮しろよ Deepmindの超高給取り研究者十数人と日本のIT土方一人 数億円と数百万やから電力以上の比やぞw
219 名前:名無し名人 mailto:sage [2018/12/09(日) 01:13:12.02 ID:VGjiF8sU0.net] エコロジーの時代やし…
220 名前:名無し名人 mailto:sage [2018/12/09(日) 01:17:31.26 ID:oHE6OQbDa.net] まぁ学習にかけた電力はドン引きレベルなのは確実
221 名前:名無し名人 mailto:sage [2018/12/09(日) 01:25:09.34 ID:ueU4BKsP0.net] とりあえずNNUEkai7に勝率8割と見積もっておく
222 名前:名無し名人 mailto:sage [2018/12/09(日) 01:46:34.93 ID:bHh5Xxq30.net] ねえよ、ねえ
223 名前:名無し名人 mailto:sage [2018/12/09(日) 02:56:43.59 ID:y4kVLvKe0.net] 「負けたのはaperypaqじゃなくてeloqhappa!」 ← aperypaqが置いてあったURLがeloqhappaだっただけ 「250WのTPUを4基使ってる!elmoとくらべて電力三倍!」 ← 40WのTPUを4基でした 言い掛かりじゃなくてAlphaZero見習って相掛かりやれよ
224 名前:名無し名人 mailto:sage [2018/12/09(日) 06:41:58.15 ID:rHc6TuHhd.net] NNUEKAI7がaperypaqに勝率77%だからまぁ わりと追い付けそうな感じ。 コンピューター将棋もR4500あたりで頭打ちになると盛り下がりそう
225 名前:名無し名人 [2018/12/09(日) 07:32:53.71 ID:a9vjUCgu0.net] 電王戦はアルファゼロに挑戦する棋戦として復活したら?
226 名前:名無し名人 mailto:sage [2018/12/09(日) 07:33:49.52 ID:/YLHk49or.net] >>224 山下さんが将棋の限界がR4400〜4500くらいって言ってたような
227 名前:名無し名人 mailto:sage [2018/12/09(日) 07:56:06.70 ID:T35vp8UF0.net] どうせなら、矢倉や振り飛車もあったほうが盛り上がっただろうな ちょっとopeningを調整したらいいだけだし
228 名前:名無し名人 mailto:sage [2018/12/09(日) 08:12:59.96 ID:523uUMZd0.net] >>55 > elmoは1手120億局面で対局しているから > AlphaZeroの手を評価するには > 最低でもNNUEkai7で1手120億局面は欲しいね > それでも互角くらいだろうから倍の240億局面が理想だけど現実的ではない はっきり言って深さ35以降進むことは現実的に困難だと思う。 1階層深くなるのにとんでもない局面数を探索しなければならないからだ。 候補3 時間 356:17.1 深さ 37/51 ノード数 26868955647 評価値 74 読み筋 ▲7九角(88) △2四歩(23) 候補2 時間 356:17.1 深さ 37/56 ノード数 26868955647 評価値 177 読み筋 ▲7六歩(77) △同 飛(74 候補1 時間 356:17.1 深さ 38/56 ノード数 26868955647 評価値 204 読み筋 ▲5七銀(68) △5一銀(42 候補3 時間 236:39.6 深さ 37/51 ノード数 17782208909 評価値 74 読み筋 ▲7九角(88) △2四歩(23) 候補2 時間 236:39.6 深さ 37/51 ノード数 17782208909 評価値 155 読み筋 ▲5七銀(68) △5一銀(42 候補1 時間 236:39.6 深さ 37/54 ノード数 17782208909 評価値 177 読み筋 ▲7六歩(77) △同 飛(74 候補3 時間 210:01.0 深さ 36/36 ノード数 15736865173 評価値 98 読み筋 ▲6七玉(58) △3四飛(74) 候補2 時間 210:01.0 深さ 37/51 ノード数 15736865173 評価値 155 読み筋 ▲5七銀(68) △5一銀(42 候補1 時間 210:01.0 深さ 37/54 ノード数 15736865173 評価値 177 読み筋 ▲7六歩(77) △同 飛(74 候補3 時間 165:10.3 深さ 36/52 ノード数 12338603650 評価値 81 読み筋 ▲7六歩(77) △同 飛(74) 候補2 時間 165:10.3 深さ 36/50 ノード数 12338603650 評価値 98 読み筋 ▲6七玉(58) △3四飛(74) 候補1 時間 165:10.3 深さ 37/51 ノード数 12338603650 評価値 155 読み筋 ▲5七銀(68) △5一銀(42
229 名前:名無し名人 mailto:sage [2018/12/09(日) 08:30:47.36 ID:1lAquVWv0.net] >>226 まじか いつ発言されたのかは知らないが、本当だとしたらかなり鋭い分析だね。 Alphazeroのaperyqhapaqとの勝率とも合致する
230 名前:名無し名人 [2018/12/09(日) 08:47:22.32 ID:MkOcHDZx0.net] 囲碁界の人は謙虚に棋譜から学ぼうとしてたのに 将棋界は文句しか言わねえなあw
231 名前:名無し名人 mailto:sage [2018/12/09(日) 09:39:12.21 ID:IhMiLK7pM.net] 前回の論文の問題点をほぼほぼ解消したのにまだ叩かれるAlphaZeroかわいそう
232 名前:名無し名人 mailto:sage [2018/12/09(日) 10:04:43.83 ID:jCZVdmHO0.net] そもそもpreprintって正式な論文の前段階だからな
233 名前:名無し名人 mailto:sage [2018/12/09(日) 10:15:46.74 ID:1lAquVWv0.net] そうですね。まぁ査読を出す前の論文ですし。 いろんな指摘があるのはいいこと
234 名前:名無し名人 [2018/12/09(日) 10:24:18.02 ID:XWvGmoEtM.net] そもそも論として 数十億ノードの世界でorqhaやNNUEkai7がelmoよりも強いという保障もない 検討用途を考えたら億単位のノードでの強さが最重要だから それを証明してみせたAlphaZeroが現状では頂点でしょう >>228 120億ノードは自分の計算ミスで 実際にはelmo側は1手30億ノードくらいっぽい
235 名前:名無し名人 mailto:sage [2018/12/09(日) 10:39:09.98 ID:u2/Ipr2xp.net] depth32ですら中盤だと50億ノードくらい読むことあるからな depth40で1億教師作れればalphazeroを軽く超えられるんだろうが現実的じゃない
236 名前:名無し名人 [2018/12/09(日) 10:50:46.50 ID:wceCBXeY0.net] コンピューター将棋ってコンテンツが低レベルなガラパゴスコンテンツ過ぎてオワコンだなー googleが汎用プログラムで12時間学習させるだけでガラパゴス王者をフルボッコw 井戸の中の蛙なことを知らずにお釈迦様の手のひらの上でイキってる孫悟空だな
237 名前:名無し名人 mailto:sage [2018/12/09(日) 10:59:18.19 ID:ZUkyEdMt0.net] >>209 これ見るとAlphpaZeroは44コアのマシン1台と第1世代TPUx4 elmoは44コアのマシン1台 だよね?
238 名前:名無し名人 mailto:sage [2018/12/09(日) 11:09:18.04 ID:y4kVLvKe0.net] そうだけど Stockfish is designed to exploit CPU hardware and cannot make use of GPU/TPU, whereas AlphaZero is designed to exploit GPU/TPU hardware rather than CPU.
239 名前:名無し名人 [2018/12/09(日) 11:18:02.42 ID:i/ylB3Z40.net] 最近ついにstockfishのVer10がリリースされた 某将棋エンジンと違い確実にレートが上がって いるようだ このチームに将棋エンジンも作って ほしいな
240 名前:名無し名人 mailto:sage [2018/12/09(日) 11:47:07.22 ID:E3XDf7xYF.net] 今はもうstockfishの最新を反映させても対して強くならないよ
241 名前:名無し名人 mailto:sage [2018/12/09(日) 11:52:05.40 ID:C0iVFJRf0.net] 将棋とチェスでは中盤に入ってからの展開がかなり違うからな stockfishと同じように枝を刈ってもそうそう劇的に強くならないだろう
242 名前:名無し名人 mailto:sagad [2018/12/09(日) 12:01:51.57 ID:gOrXfzPJ0.net] ロタ @Rota_JP 【orqha1018は横歩取りの後手番を持たない】 次のWCSCでは横歩取りは消滅する予感
243 名前:名無し名人 mailto:sage [2018/12/09(日) 12:17:31.74 ID:2gz6K2uL0.net] ロタ如きが何を偉そうに
244 名前:名無し名人 mailto:sage [2018/12/09(日) 12:22:47.87 ID:jCZVdmHO0.net] 青野流は先手勝率7、8割の世界だからな 最低限対策(△7四飛)を調べてからじゃないと後手は大損するだけ
245 名前:名無し名人 mailto:sage [2018/12/09(日) 12:23:38.32 ID:XWvGmoEtM.net] 「消滅する予感」の部分は本人言ってないぞ 風評被害はやめよう
246 名前:名無し名人 mailto:sage [2018/12/09(日) 12:28:13.82 ID:jCZVdmHO0.net] とは言っても去年の選手権のときに横歩取りの青野流は二局あって実は先手が負けているんだよな。 ハードが強力になれば事前のデータ通りにいかない可能性もある
247 名前:名無し名人 mailto:sage [2018/12/09(日) 12:31:19.26 ID:C0iVFJRf0.net] 常にdepth34くらいまで読める状況なら後手にもまだいい手があるかもしれないしな
248 名前:名無し名人 [2018/12/09(日) 12:55:06.98 ID:ZUNl4RoE0.net] alphazeroはチェスのDeep Blueの衝撃には遠く及ばない https://www.youtube.com/watch?v=6EsO4mO9B5M alphazeroはElmoを少し超えただけだった https://www.mikunimaru.com/entry/2017/12/06/142754 既にalphazeroと同等のPCソフトが登場している
249 名前:名無し名人 mailto:sage [2018/12/09(日) 13:13:45.97 ID:xTXNMET7d.net] トロシュナの新馬戦の大外一気がすごいとワイの中で話題に‪ 2018年10月21日 新潟5R 2歳新馬牝 トロシュナ https://youtu.be/mh_Vf8DEAj0 @YouTubeより‬
250 名前:名無し名人 mailto:sage [2018/12/09(日) 13:22:54.45 ID:Mkh5glrJ0.net] 実際問題、白ビールやPALのようなアンチコンピューティングに長けたソフトが 十分な設備・定跡ONでぶつかればAlphaZeroもそこまで圧倒的大差をつけることは出来ないと思うけどな AlphaZeroの指し方はいかにも未完成でスキがある 近いレーティングのソフト相手にあのような舐めプが通じるだろうか? AlphaZeroの学習がサチってるなら1年以内には追い越すだろう
251 名前:名無し名人 mailto:sage [2018/12/09(日) 13:27:06.00 ID:jCZVdmHO0.net] なめぷなのはかなり差がついてからだよ。
252 名前:名無し名人 mailto:sage [2018/12/09(日) 13:47:11.52 ID:gBiAkfkJa.net] AlphaZeroは80ブロックのネットワークを使えばもっと強くなるのかな? もちろん学習に必要な計算量が多すぎるけど
253 名前:名無し名人 mailto:sage [2018/12/09(日) 13:57:28.44 ID:RHPzR7XO0.net] AlphaZeroは、全くの自力の学習で強くなるよと示す論文であって、縛りプレイしてるから、 もっと効率的に学習することそのものは可能。 たとえば、最初はElmoの出す教師局面の評価値から学習して、その後自己対戦で学習、 とするだけで基本的な戦略の獲得のところはすっ飛ばせて、 最終レート到達までの時間やステップ数は早められる。 ただ、学術的にはそんな将棋ソフト用の特殊な学習の仕方をしても意味が無くて、むしろ、汎用的に学習できるよと示すために あえて多少非効率でも自己対戦のみという縛りプレイでやってるんだよ。 強くすることそのものが目的の各種将棋ソフトとはその点で成り立ちが違う。
254 名前:名無し名人 mailto:sage [2018/12/09(日) 13:59:24.73 ID:RHPzR7XO0.net] せっかく羽生竜王に協力してもらうなら、 桂馬が横にも飛べるルールで自己対戦学習したAlphaZeroと羽生竜王との対局とかして欲しかったな。
255 名前:名無し名人 mailto:sage [2018/12/09(日) 14:06:26.36 ID:jCZVdmHO0.net] 勝勢になってからなめぷなのはランダムに全部の手を学習させて勝率だけしか評価されてないから。 華麗な最短の寄せだろうが形勢が悪くならない悪手だろうが等価になる。
256 名前:名無し名人 mailto:sage [2018/12/09(日) 14:40:17.38 ID:kRCLz1510.net] >>253 だよね 汎用的な学習という戦略の評価なのにアウトプットの優劣つけて騒いでるの馬鹿みたい
257 名前:名無し名人 mailto:sage [2018/12/09(日) 14:44:25.97 ID:kRCLz1510.net] 羽生とはNHKの取材通じて接触があったしこういうときに一番業界で有名な人を釣りだすのが いつものDM/Googleのやり方なんでいってもしょうがないのだが 相掛かりスキーということで羽生でなく郷田に棋譜選定してもらいたかったな、てのだけが憾み
258 名前:名無し名人 mailto:sage [2018/12/09(日) 15:50:46.04 ID:ueU4BKsP0.net] 新しいハードの開発は個人じゃ限界があるし、google先生に遅れをとるのはしゃーない。 これからはTPUで開発する時代になるんだろうか。知らんけど あえてCPUにこだわる利点は?
259 名前:名無し名人 mailto:sage [2018/12/09(日) 16:09:06.31 ID:kgpuQiQE0.net] >>252 たぶん微差だと思うよ。 強くするために必要なパラメータ数はたぶん指数関数的に増えていくから、2倍にしてもたいして変わらんと思う。
260 名前:名無し名人 [2018/12/09(日) 16:14:40.53 ID:ps7dLMWkd.net] >>236 >googleが汎用プログラムで12時間学習させるだけでガラパゴス王者をフルボッコw Googleが専門家を集めて組織的に数年前に渡り開発したソフトが、個人が趣味で数ヶ月間?で開発したソフトに勝率9割くらいだった ディープラーニングの実験だったとは言え開発効率ではelmoが優っていた elmoに勝率が99.99%くらいでないと互角ではないと思う
261 名前:名無し名人 mailto:sage [2018/12/09(日) 16:26:49.96 ID:ueU4BKsP0.net] やたらelmoばかりが比較対象になるけど そろそろaperypaqに9割のほうがよくないかね
262 名前:名無し名人 mailto:sage [2018/12/09(日) 17:26:21.38 ID:y4kVLvKe0.net] >>242 定跡使って横歩除いたら勝率の悪い後手横歩を回避しないNNUEkai7のほうが強い可能性あるよね
263 名前:名無し名人 mailto:sage [2018/12/09(日) 17:32:09.26 ID:C0iVFJRf0.net] 今のレーティングの数字って横歩にかなり左右されてるからな実際
264 名前:名無し名人 mailto:sage [2018/12/09(日) 18:02:28.84 ID:jCZVdmHO0.net] 相掛かり系でもちょっと変わった手順前後で横歩取りに誘導できるときもあるから 後手の横歩を完全に避けるのはけっこうめんどいよ
265 名前:名無し名人 mailto:sage [2018/12/09(日) 18:44:43.86 ID:Ua5OT1f/0.net] >>253 AlphaZeroが青野流や雁木を自分で見つけたのはいいんだが, 振り飛車は自己学習で対戦した上で,勝率悪くて不利だとして指してないのかね? AlphaZeroに対して先手中飛車やノーマル振り飛車が通用しないのかは,ちと気になる。
266 名前:名無し名人 [2018/12/09(日) 20:03:01.76 ID:ZUNl4RoE0.net] 第29回世界コンピュータ将棋選手権の余興で、AlphaZero vs 優勝ソフトの三番勝負はどうだろうか 優勝ソフトの圧勝で決着すると思うが、実現したら面白そうだ
267 名前:名無し名人 mailto:sage [2018/12/09(日) 20:14:08.60 ID:w43mE8ae0.net] 読みが勝ってれば勝てるゲームで勝率が100%に近くならない時点で強さ論ずる意味があるのかは疑問だが 99.999%位いって当たり前じゃね?
268 名前:名無し名人 [2018/12/09(日) 20:46:32.00 ID:i/ylB3Z40.net] >>266 本当に自信があったら正式に参加するだろうし その逆だったら余興にも参加しないだろう
269 名前:名無し名人 mailto:sage [2018/12/09(日) 20:59:08.97 ID:kRCLz1510.net] >>258 TPU使ってるのは画像分析/深層学習を前提としたシステムだからで そうでない従来型のソフトがTPU使っても意味ないんじゃね
270 名前:名無し名人 mailto:sage [2018/12/09(日) 21:23:36.46 ID:5GqsS6pe0.net] このスレをコピペて荒らしてるの誰なんだろな 無関係なスレを張ったりしてるところを見ると囲碁板をあらしてる奴と同一人物ぽいが
271 名前:名無し名人 mailto:sage [2018/12/09(日) 21:31:42.29 ID:LWq2PjgR0.net] 千田の番組月刊でやってほしいわ
272 名前:名無し名人 mailto:sage [2018/12/09(日) 22:57:16.42 ID:ueU4BKsP0.net] 消費電力でも負けるとなるとCPUの長所が分からなくなってくる。動作が軽い?
273 名前:名無し名人 mailto:sage [2018/12/09(日) 23:02:23.85 ID:jPOVUoJ20.net] 汎用性
274 名前:名無し名人 mailto:sage [2018/12/09(日) 23:08:38.89 ID:C0iVFJRf0.net] 個人が手軽に使うならやっぱりCPUがいいよね
275 名前:名無し名人 mailto:sage [2018/12/09(日) 23:12:15.69 ID:jCZVdmHO0.net] アルファ碁のときも言われていたけど実際には何十手先も先の局面を読んでるわけじゃないのに 直観力が優れているからあたかも読んでいるかごとくの指し手を選ぶことがあるってことなんだよね? 実際に読んでいる局面の量はかなり少ないわけなんだから
276 名前:名無し名人 mailto:sage [2018/12/09(日) 23:19:24.30 ID:C0iVFJRf0.net] 各局面での感覚が随分違うんだろうなとは感じたね
277 名前:名無し名人 mailto:sage [2018/12/09(日) 23:21:09.73 ID:ueU4BKsP0.net] マシンパワーに押されてほとんどふさがれてるけど例外に弱いという弱点もある、 とも言われてたと思う。
278 名前:名無し名人 mailto:sage [2018/12/09(日) 23:36:46.60 ID:jCZVdmHO0.net] 12番の▲7六歩ってついたの普通のソフトだとずっと先手不利な状態が続くね。。 千田解説にあった▲8三角とか▲4一角の超絶攻防手を知ってないと絶対に指せない手だからな。。 後手の持駒:歩二 9 8 7 6 5 4 3 2 1 +---------------------------+ |v香v桂 ・v金v玉 ・v銀v桂v香|一 | ・ ・v銀 ・ ・ ・v金v角 ・|二 | ・ ・v歩v歩v歩v歩 ・ ・v歩|三 |v歩 ・ ・ ・ ・ ・v歩 飛 ・|四 | ・v飛 ・ ・ ・ ・ ・ ・ ・|五 | 歩 ・ ・ ・ ・ ・ 歩 ・ ・|六 | ・ ・ 歩 歩 歩 歩 ・ ・ 歩|七 | ・ 角 金 玉 ・ ・ 銀 ・ ・|八 | 香 桂 銀 ・ ・ 金 ・ 桂 香|九 +---------------------------+ 先手の持駒:歩二
279 名前:名無し名人 mailto:sage [2018/12/09(日) 23:44:45.61 ID:ZUkyEdMt0.net] AlphaZeroの消費電力は TPU x4 だけじゃなくて それにプラス44コアCPUの消費電力も加算だから elmoよりTPU分消費電力は多いよ
280 名前:名無し名人 mailto:sage [2018/12/09(日) 23:54:55.49 ID:jCZVdmHO0.net] この6万npsっては読みの深さはどれくらいなんだろ?かなり枝狩りするのか他のソフトと同じ程度の枝狩りなのか知りたい >AlphaZeroはMCTSを使うことで、例えばチェスではチャンピオンのStockfishが1秒当たり >約6000万のポジションを検索するのに対し、わずか6万しか検索せずに済むという。 www.itmedia.co.jp/news/articles/1812/09/news018.html
281 名前:名無し名人 mailto:sage [2018/12/09(日) 23:57:35.72 ID:RHPzR7XO0.net] なんで電力あたりの強さなんて評価で見てるんだ。 AlphaZeroのアーキテクチャだと、TPUの方ばっかり回って CPUはスカスカの稼働率かも知れないから、実際のところの使用電力なんか分からんよ。 TPUは流石に100%使い切るだろうけど、両方を100%使い切ることはなかなか難しい。
282 名前:名無し名人 mailto:sage [2018/12/10(月) 00:08:36.20 ID:hFUBAjRt0.net] 消費電力はともかく、TPU 1基が180T FLOPSで、4基だと720T FLOPS かたや48コアPCでも3T FLOPSぐらいしかないので 単純計算だと240倍ぐらい演算能力が違うように思うけど… (実際はそこまでの差ではない?)
283 名前:名無し名人 mailto:sage [2018/12/10(月) 00:10:03.44 ID:RNs3wWE/0.net] 重いけど正確な評価関数で少なく局面を読むAlphaZeroと、 軽いけど精度が粗い評価関数で大量に読むこれまでのソフト、という構図。 現状の既存の将棋ソフトの構造では局面の評価値の精度はAlphaZeroに圧倒的に及ばない。 どっちの方向に将来的を感じるかと言ったら、より高精度な評価関数を持ちうるAlphaZeroの方。 AlphaZeroの方は精度をあまり落とさず更に軽量化して方向もある(ニューラルネットの軽量化は既にある手法)だろうし。
284 名前:名無し名人 mailto:sage [2018/12/10(月) 00:28:23.54 ID:fj2KDBcj0.net] NNUEはどちら側なんだか。KPPTは見かけなくなったな
285 名前:名無し名人 [2018/12/10(月) 07:06:34.91 ID:1tPbwWt50.net] 「AlphaZero」がチェス、将棋、囲碁の各世界最強AIを打ち負かす AlphaZeroはこの方法で、チェスを9時間学習した後チェスの世界チャンピオンAI「Stockfish」を、将棋を12時間学習した後世界コンピュータ将棋選手権の2017年の勝者「elmo」に、囲碁を13日間学習した後AlphaGo Zeroに勝利した。 www.itmedia.co.jp/news/articles/1812/09/news018.html
286 名前:名無し名人 mailto:sage [2018/12/10(月) 07:37:49.96 ID:IpzUBUx80.net] 枝刈り評価値上位3つぐらいで探索したとして50手先の最強の手を予想する 場合は以下の局面数を評価しないといけないことになる。 3^50 = 717,897,987,691,853,000,000,000.0000 = 717,897,987,691,853 x 1兆局面だぞ! これはどんな最強マシンでも不可能に思える。 だから単純な評価値のminmax法だけではすぐに完全な読みには限界がくる。 具体的には20手ぐらいの評価値探索で打ち切る方法でどれぐらい節約できか にかかっているかと思う。 そこまでの数学力がないので調べることがないが現時点での 探索みると深さ37開始時に18,339,449,975(約183億) 探索みると深さ38開始時に27,868,971,435(約270億) 掛かってる。 (候補手1の場合で候補手3の場合はこの3倍かかる) 枝刈りによる局面数増加を抑える仕組みがあるとしてこのまま100億ノードで 深さが1づつ増えるのなら希望も持てるが果たしてどうなのだろうか?
287 名前:名無し名人 [2018/12/10(月) 08:06:22.15 ID:/jHlt7TAM.net] >>278 *kifu for windows に張り付け 後手の持駒:歩二 9 8 7 6 5 4 3 2 1 +---------------------------+ |v香v桂 ・v金v玉 ・v銀v桂v香|一 | ・ ・v銀 ・ ・ ・v金v角 ・|二 | ・ ・v歩v歩v歩v歩 ・ ・v歩|三 |v歩 ・ ・ ・ ・ ・v歩 飛 ・|四 | ・v飛 ・ ・ ・ ・ ・ ・ ・|五 | 歩 ・ ・ ・ ・ ・ 歩 ・ ・|六 | ・ ・ 歩 歩 歩 歩 ・ ・ 歩|七 | ・ 角 金 玉 ・ ・ 銀 ・ ・|八 | 香 桂 銀 ・ ・ 金 ・ 桂 香|九 +---------------------------+ 先手の持駒:歩二 *▲8七歩だと塚田スペシャル風手順で後手有利 ▲8七歩 △9五歩 ▲同 歩 △9六歩 ▲同 香 △8六歩 ▲同 歩 △同 飛 ▲8七歩 △9六飛 *なので▲7六歩は必然だが▲8三角とか▲4一角の超絶攻防手があって後手ペースか *でも▲8三角とか▲4一角はムズイな
288 名前:名無し名人 mailto:sage [2018/12/10(月) 15:47:49.24 ID:2FX4cVdX0.net] 287の図で考えることは… ・▲7六歩△8八角成る▲同銀△3三角▲8六歩△同飛▲8七歩 こう進んだ時の持ち角の価値と歩の数の差 (と評価値) ・▲8七歩△9五歩▲同歩△9六桂のとこからの変化 ▲3七桂△9五飛▲3四飛とか ▲7六歩△9五飛▲3四飛とか 飛回りが消えてるから人間同士なら前者選びそう 後者は乱戦というか盤面全体の戦いと言うかに持ち込んで 端をぼかしてしまおうという高等戦術だね この辺を突き詰めて調べると評価値どうなるかだなあ
289 名前:名無し名人 mailto:sage [2018/12/10(月) 19:00:11.45 ID:3EnB4Srs0.net] 俺も >>286 と同じで数学の証明問題が苦手で教えて欲しいんだが >>11 の駒落ち必勝手順の証明で 「裸王では、下手が偶数手目に78飛76歩75歩74歩73歩成72と73飛成33角成と指せば、17手目に上手玉がどこにあっても残り3手で詰みである。」 これは「20手以下で必勝」という必勝手順の証明だが、最善手の証明ではない 最善手と証明するには、18手以下の必勝手順は無いと証明しないといけないって事でOK?
290 名前:名無し名人 [2018/12/10(月) 19:17:02.18 ID:bpthwlnoa.net] >>289 最善手の定義とは何? 詰将棋においては手数は大事だけど 指し将棋においては手数はスコアに影響しない
291 名前:名無し名人 mailto:sage [2018/12/10(月) 20:35:31.87 ID:FbdnoEqa0.net] ロタって1500万ノード厨の典型的ガイシで AlphaZeroの棋譜を妄信するw お前の1500万とAlphaZeroや現実の対戦するノードと剥離があるのすら理解できてない 今まで1GBで計測してて疑問視されてたのに急に変える能無し レーティングサイトはuuunが苦肉で決めた基準なのに個人の主観入ってる時点でクソ 河童もパクられるのムカツク発言してたのに野良パクって平岡に苦言される始末 AlphaZeroの棋譜でてイキッてるマウントガイジしかいない
292 名前:名無し名人 mailto:sage [2018/12/10(月) 20:38:48.75 ID:ltbukS4bd.net] ガイジは黙っててね
293 名前:名無し名人 mailto:sage [2018/12/10(月) 20:40:44.12 ID:fj2KDBcj0.net] AlphaZeroをageるにしてもsageるにしてもなんかこう毎回極端というか それはそうと河童絞りDepth16が地味に気になる
294 名前:名無し名人 mailto:sage [2018/12/10(月) 20:49:22.32 ID:xKEYmk3k0.net] あれだけ計算資源投入した棋譜なんてそうそう作れないから、それだけでかなり価値があると思うんだがな ここのところ毎回評価関数ではトップのもの作ってるし河童絞りは優秀だよな
295 名前:名無し名人 mailto:sage [2018/12/10(月) 21:06:33.67 ID:AmMY0JAk0.net] >>246 それは単に青野流先手の定跡の作り込みが甘かっただけでしょ? PALや白ビールは後手で持っても相手がそこにハマれば勝てる定跡を持ってた
296 名前:名無し名人 mailto:sage [2018/12/10(月) 21:09:20.58 ID:AmMY0JAk0.net] >>266 デイビッド・シルバーを読んで論文の報告会を開いてもらうのが一番ためになりそう そこでWCSCの様子を見て面白いと思えばなにが進むかもね
297 名前:名無し名人 mailto:sage [2018/12/10(月) 21:26:26.89 ID:AmMY0JAk0.net] ニューラルネットワークとMCTSの終盤については今やってるTCEC見てると、 176スレッドのストックフィッシュが早々に評価値ゼロのドローを示してる時に LeelaChess0は自分に+6.0とかの圧勝の数値を出してたりするんだよなあ
298 名前:名無し名人 mailto:sage [2018/12/10(月) 21:27:28.57 ID:xKEYmk3k0.net] elmoに76歩を強要してるせいでalphazeroの後手番での真の力がイマイチわからない感あるのが残念 普通にやらせるとわりと負けるんだったらalphazeroはかなり後手番苦手ってことになるがどうなんだろう 自分は絶対76歩突かないくせに相手には必ず突かせるってちょっとひどすぎるよな
299 名前:名無し名人 mailto:sage [2018/12/10(月) 21:29:40.80 ID:hckZRqqo0.net] elmoが対戦相手としては弱すぎて何にも分からんというのが実際のところ せめてAperypaqの棋譜が公開されていれば… それでも弱すぎるが…
300 名前:名無し名人 mailto:sage [2018/12/10(月) 21:39:27.10 ID:rDgjdwyu0.net] >>295 記憶違いしてたみたい。強い相手だと調べたらこんな感じだった。たぬき戦は決勝で定跡ではめたけど終盤力で負けたってのがあった 第五回電王トーナメント決勝 たぬき戦に負け Yorkieに256手で勝ち(例の騒動になったの) 第28回世界コンピュータ将棋選手権 Apery戦に256手で引き分け