- 1 名前:名前は開発中のものです。 mailto:sage [2019/11/23(土) 19:09:58.05 ID:0YM91Vba.net]
- 比較的地味なボードゲーム専用のスレが欲しくて立ててみました。
前スレ 【オセロ,将棋】ボードゲーム Part2【囲碁,War】 https://mevius.5ch.net/test/read.cgi/gamedev/1508056498/
- 226 名前:535 [2020/04/16(木) 19:32:35 ID:y39ZfUyK.net]
- お、凄い!たった一日で五目並べっぽくなってる!
たまにそっぽ打つのは乱数でランダムな手を打つようになってるんでしょうね。
- 227 名前:名前は開発中のものです。 mailto:sage [2020/04/16(木) 19:37:25 ID:y39ZfUyK.net]
- うお、早くも人間(俺)に勝った!!
あり得ね〜〜〜!!!
- 228 名前:名前は開発中のものです。 mailto:sage [2020/04/16(木) 19:38:07 ID:y39ZfUyK.net]
- ヤバイ、これはヤバイww
- 229 名前:535 mailto:sage [2020/04/16(木) 19:40:53.49 ID:y39ZfUyK.net]
- 15路という非常に広い盤面でここまで早く強くなるとは…
- 230 名前:535 mailto:sage [2020/04/16(木) 19:44:25.68 ID:y39ZfUyK.net]
- もう五目並べの学習は十分ですね。
となると次のステップはライフゲーム囲碁か囲連星を移植ですね。
- 231 名前:535 mailto:sage [2020/04/16(木) 19:54:51.08 ID:y39ZfUyK.net]
- ライフゲーム囲碁はパスを実装しないといけないからまずは9路囲連星かなぁ
- 232 名前:535 mailto:sage [2020/04/16(木) 20:15:49.42 ID:y39ZfUyK.net]
- すぐにでもコード書き始めたくなるけどぐっと我慢して>>208のソースを少し読み解かねば。。。
- 233 名前:535 mailto:sage [2020/04/16(木) 21:57:22 ID:y39ZfUyK.net]
- あれ、モチベすげー湧いてくると思ったのに意外とそうでもないな…
仕事で疲れてんのかな…
- 234 名前:535 [2020/04/18(土) 17:12:26 ID:FJQxs35t.net]
- 実はライフゲーム囲碁を移植しようとしてたのですがパスの実装がやはり意外と難しそうです
9路囲連星に転進しようかな
- 235 名前:535 mailto:sage [2020/04/18(土) 20:23:03 ID:dW+TeRwf.net]
- は〜目の前に理想のalpha zeroがあるというのになぜかモチベが湧いてこない、踏ん張りがきかない。
さぼりモードに入りつつあるorz。 ていうか思ってるより移植が工数かかる作業なのかもしれない。
- 236 名前:535 mailto:sage [2020/04/19(日) 14:29:45.72 ID:w4GEcYV8.net]
- 9路囲連星はコードを消失していたので19路囲連星を移植してます。
- 237 名前:535 [2020/04/19(日) 17:44:45 ID:w4GEcYV8.net]
- 多分移植完了した。バグが無ければ。
学習フェーズへ移項します。
- 238 名前:535 mailto:sage [2020/04/19(日) 17:58:16 ID:w4GEcYV8.net]
- うーん。これGUIの盤のひろさとプログラム上での盤の広さが違いますね。
まあ論理的には整合性は取れているので見た目だけの問題なので放置。
- 239 名前:535 mailto:sage [2020/04/19(日) 18:02:39 ID:w4GEcYV8.net]
- まだ学習始めたばっかなので全然見当違いのところに打ちまくるの見てて切ないw
でもまあ、五目並べではわずか一日で人間(俺)に勝てるところまで来たのだから期待して待ちましょう。
- 240 名前:535 mailto:sage [2020/04/19(日) 18:42:21.72 ID:w4GEcYV8.net]
- メモリ10GBくらい使ってる。
思ったよりでかい。
- 241 名前:535 mailto:sage [2020/04/19(日) 21:12:09.10 ID:w4GEcYV8.net]
- GPUのファンが五月蠅い。
タスクマネージャーだと1%とかなのに。 タスクマネージャーじゃ使用率ちゃんと測れないのかな?
- 242 名前:535 mailto:sage [2020/04/20(月) 18:56:48 ID:fRC4t5vc.net]
- 強くなってないと思ったら致命的なバグがorz
勝敗データをパイソンに渡す個所にバグがあったようです。 丸一日の学習がパーorz
- 243 名前:535 mailto:sage [2020/04/20(月) 21:27:15 ID:fRC4t5vc.net]
- ん、付けにははねよを覚えたっぽい?
だとしたら凄い。
- 244 名前:535 [2020/04/21(火) 20:44:10.63 ID:JovHD0OJ.net]
- 1日学習させたけど強くなってるように見えませんね
15路五目並べと19路囲連星じゃ勝手が違うか とりあえず1週間位は粘ってみます
- 245 名前:535 mailto:sage [2020/04/22(水) 18:48:41 ID:mXEm0GNy.net]
- 強くなってませんね。
完全なランダムでないにせよ。 もう少し様子見します。
- 246 名前:535 mailto:sage [2020/04/22(水) 20:21:27.03 ID:mXEm0GNy.net]
- は〜じれったい。ハード性能があと10000倍くらいあればな〜
- 247 名前:535 mailto:sage [2020/04/22(水) 20:23:13.93 ID:mXEm0GNy.net]
- むしろ一生懸命7並ばないようにしているとさえ思えるw
バグなのかなぁ
- 248 名前:310 mailto:sage [2020/04/22(水) 20:43:03.08 ID:ZptezZKq.net]
- 相変わらず棋譜作成中。
プログラムはそれなりに改良しているつもりだけど、成果は全くなし。 まあ、思いついて試すのが楽しいんだけどね。 つか、逆順探索での棋譜訂正。やってるそばからあまりに間違っている筋を 見つけて、修正かける過程で、新しい棋譜どんどん増えて、バックログがどんどん 増えていく地獄になっています。まだまだ重要な分岐でも間違いというか未探索 が多すぎる。 手作業で修正箇所見つけるの面倒なので、延々やらないといけないけど、 ε-Greedy的な何か導入しようかなぁと思い始めています。
- 249 名前:535 mailto:sage [2020/04/22(水) 21:56:00 ID:mXEm0GNy.net]
- お、もしかしてポン抜き覚えたか?
しかしこの学習速度で線形の速度で強くなるとしたらとてもじゃないが時間かかりすぎるが、 ある地点から爆発的に強くなったりしないのかなぁ
- 250 名前:310 mailto:sage [2020/04/22(水) 22:21:38 ID:ZptezZKq.net]
- あるところまでは、間違いは間違いと学習するための時間かも知れませんね。
- 251 名前:535 mailto:sage [2020/04/23(木) 18:58:28.20 ID:ynaVt4IB.net]
- うーん、少し囲連星っぽくなってきてるかなぁ?
ま、当分様子見かな。
- 252 名前:535 mailto:sage [2020/04/23(木) 21:04:31.79 ID:ynaVt4IB.net]
- でもまあディープラーニングってルールも知らないネットワークが勝敗結果だけで強くなるって凄いことだよな。
人間がルール知らずに勝敗結果だけで強くなろうとしたら発狂するw
- 253 名前:535 mailto:sage [2020/04/24(金) 19:11:09 ID:aNVKQhdF.net]
- 囲連星本来の棋譜とはまだまだ程遠いけど、何かをつかみつつあるような気配がする。。。
様子見続行。
- 254 名前:535 mailto:sage [2020/04/24(金) 19:47:38 ID:aNVKQhdF.net]
- あーネットワークの層増やしてみたいな。
囲連星は7目並べだから7層がちょうどよかったかも… 今デフォルトの4層でやってるんだけど。 でもいまさら後に引けないか。
- 255 名前:310 mailto:sage [2020/04/24(金) 19:50:11 ID:wU9GyZ2x.net]
- DCNNなら層数よりもフィルタ数の方が大事かも。
- 256 名前:535 mailto:sage [2020/04/24(金) 19:55:02 ID:aNVKQhdF.net]
- まじすか
現状でもフィルタは256(デフォルト)とかなり贅沢に使ってるんですが。。。 オリジナルの作者もフィルタ数が大事と思ったのかもしれませんね。
- 257 名前:310 mailto:sage [2020/04/24(金) 22:19:55 ID:wU9GyZ2x.net]
- >>256
256フィルタあるんなら流石に大丈夫そうだね。
- 258 名前:535 mailto:sage [2020/04/25(土) 21:48:41.17 ID:wwp+rt8W.net]
- やっぱ9路囲連星にしとけばよかったかな〜
でもいまさら後に引けない…orz
- 259 名前:535 mailto:sage [2020/04/26(日) 17:31:58 ID:73Aw05p/.net]
- うーむ、進むべきか引き返すべきか段々悩ましくなってきた。
まあもうちょい様子見続行か。。。
- 260 名前:535 mailto:sage [2020/04/26(日) 19:51:54 ID:73Aw05p/.net]
- 知性の芽生えみたいなものを全く感じないわけじゃないから打ち切るのも躊躇われるが、
いかんせん成長速度が遅いんだよなぁ。ウーム悩ましい。
- 261 名前:535 mailto:sage [2020/04/27(月) 17:44:36.98 ID:bKact/KJ.net]
- 囲めば石取れることはわかってるっぽいんだよなぁ
もう少し粘ろう
- 262 名前:535 [2020/04/27(月) 21:17:34 ID:bKact/KJ.net]
- あーパソコン複数台ほしいなぁ
でも置き場所がないからなぁ となるとAWSとかGCPとかかなぁ でもあれ、金がやばいらしいからなぁ
- 263 名前:535 mailto:sage [2020/04/27(月) 21:37:15 ID:bKact/KJ.net]
- 囲連星もやりたいけど、ライフゲーム囲碁もやりたいんだよなぁ。
>>208のやつはパス実装するのが難しいからなんか別の奴探してこようかなぁ。 ルール的にはオセロのクローンから移植すればライフゲーム囲碁移植しやすいはず。
- 264 名前:535 mailto:sage [2020/04/28(火) 19:29:54.42 ID:VfQhex7P.net]
- 打ち筋は確かに改善されてるような気がするんだよなぁ。
ただ、あまりに上達が遅い。
- 265 名前:535 mailto:sage [2020/04/28(火) 20:06:48.30 ID:VfQhex7P.net]
- 何で五目並べはあんなうまく行くんだろう?
やっぱ複雑度が全然違うのだろうか?
- 266 名前:535 mailto:sage [2020/04/30(木) 18:36:10 ID:6uxMdcsM.net]
- どんなに早くてもleela zeroが強くなるのに必要だったぐらいの時間はかかるのかもしれないなこれ…
- 267 名前:535 mailto:sage [2020/05/02(土) 20:07:05.00 ID:ppsdwWbz.net]
- あかん、超長期戦になりそうorz
マシンパワーがあと10000倍あればorz
- 268 名前:535 mailto:sage [2020/05/03(日) 19:21:36 ID:6By0oz27.net]
- らちが明かないので19路囲連星はいったん止めて9路囲連星に移行します。
でもいつかは戻ってきたい。 I shall return.
- 269 名前:535 mailto:sage [2020/05/03(日) 22:42:03 ID:6By0oz27.net]
- お、9路囲連星は結構強くなるかも。
早くもランダムではない何かを感じる。
- 270 名前:535 mailto:sage [2020/05/03(日) 23:03:31.98 ID:6By0oz27.net]
- もしかしたら19路囲連星は層の数が足りなかったってことなのかも。
9路囲連星は6層でやってます。 5目並べが4層でうまく行ったから7目並べの囲連星なら6層かな?と思ったのですが当たりだったかも。
- 271 名前:535 mailto:sage [2020/05/03(日) 23:32:54 ID:6By0oz27.net]
- これは…
明らかに知性がある…
- 272 名前:535 mailto:sage [2020/05/05(火) 17:29:46.91 ID:3PlXxhBg.net]
- おっとバグがあったorz
でもこれで行けるはず。
- 273 名前:535 mailto:sage [2020/05/06(水) 10:40:38 ID:Oyc/dCE2.net]
- うおお、公式ボットに勝った〜
凄い!!
- 274 名前:535 mailto:sage [2020/05/06(水) 15:40:57 ID:Oyc/dCE2.net]
- しかしalpha zero てこの手のゲームの最終解答にちかいな。
単に移植しただけで既存ボットに勝つとは。
- 275 名前:535 mailto:sage [2020/05/07(木) 19:53:48 ID:LRbJj7fv.net]
- 学習が進んだので既存ボットと対戦してみましたが、大幅に負け越しますね。。。
過学習?
- 276 名前:535 mailto:sage [2020/05/07(木) 20:07:16 ID:LRbJj7fv.net]
- うーん、わからん。層数をさらに増やして学習させてみようかな…
囲碁AIにならって20層くらい一気にいってみるかな…
- 277 名前:535 mailto:sage [2020/05/07(木) 20:19:50 ID:LRbJj7fv.net]
- チャネル数 384
層数 20 の超ビッグネットワークで再挑戦します。
- 278 名前:535 mailto:sage [2020/05/07(木) 20:59:06 ID:LRbJj7fv.net]
- ん、CPU使用率が上がらない?
ネットワークでかすぎたか?
- 279 名前:535 mailto:sage [2020/05/07(木) 21:03:55 ID:LRbJj7fv.net]
- GPUのメモリが溢れてるっぽいorz
しょうがない、小さくするか。
- 280 名前:535 mailto:sage [2020/05/07(木) 21:25:17 ID:LRbJj7fv.net]
- GTX 1080 でもメモリ足らんとかorz
気安くいってくれるぜ
- 281 名前:535 mailto:sage [2020/05/07(木) 21:27:42 ID:LRbJj7fv.net]
- バッチサイズもでかくしたのまずかったっぽい
- 282 名前:535 mailto:sage [2020/05/07(木) 22:52:16.50 ID:LRbJj7fv.net]
- うーん、もしかしたらCPUはあんま必要なくてGPUに金使ったほうがいいのかもしれないな。これは。
- 283 名前:535 mailto:sage [2020/05/08(金) 20:21:50 ID:vYlFFPu/.net]
- 層増やしたけどあんまうまく行ってないのかなぁ。
それともまだまだ学習が足りないだけなのか…
- 284 名前:310 mailto:sage [2020/05/09(土) 00:56:41.26 ID:tOwbW1Pp.net]
- 棋譜作成触りすぎるとなかなかはかどらなくなるので、しばし回しっぱなし。
そろそろBookが巨大化しすぎているので、メモリーからSDDに移せないか検討中。 concurrent_unordered_mapを自作した経緯があるので、同じような感じでランダム アクセスなDB化をしてます。確定分は探索で使うのでメモリーにおいて、速度を 必要としないアクセスをDBにしようかなと。 巨大Bookの作成処理の類を並列処理にしているので、何とか並列にできないかと 色々やっていますが、色々と罠がある。複数プロセスからの並列更新はあきらめた けど、単一プロセスからの並列更新でロック範囲がまだいまいち。 専門書買ってコード見て勉強した方が早いんだろうけど、まあ、しばらく楽しみます。
- 285 名前:535 mailto:sage [2020/05/12(火) 21:24:42.90 ID:autiDqQV.net]
- 1ゲームすら勝てない…
何が悪いんだ?
- 286 名前:535 mailto:sage [2020/05/12(火) 21:56:06 ID:autiDqQV.net]
- いままで新旧のAIを比較するとき10戦中6勝以上でAI更新にしてたのを50戦中30勝以上で更新にしてみます。
もしかしたら試行回数が少なすぎて弱くなっていてもAI更新してたかもしれないので。
- 287 名前:310 mailto:sage [2020/05/12(火) 23:05:51.81 ID:AcB4a3UT.net]
- うぬぬ。DB化は並列諦めてみたけど、やはり更新が遅すぎる。
もうちょっと工夫してみるけど。
- 288 名前:535 mailto:sage [2020/05/14(木) 19:16:54 ID:7UgQPtyV.net]
- ただ待ってるだけってのもつらいな。
結果も出ないし。
- 289 名前:535 mailto:sage [2020/05/15(金) 18:59:37.53 ID:55GCUZ0E.net]
- 心が折れそうorz
- 290 名前:535 mailto:sage [2020/05/15(金) 19:20:34.85 ID:55GCUZ0E.net]
- 自己対局みてると結構強そうに見えるだけどな。
公式AIと対局すると勝てねんだよな。
- 291 名前:535 mailto:sage [2020/05/15(金) 19:53:09.72 ID:55GCUZ0E.net]
- ギブアップです。
何か次のこと考えよう。
- 292 名前:名前は開発中のものです。 mailto:age [2020/05/16(土) 11:39:42 ID:n0PK2vlL.net]
- AlphaGoは計算資源をコスト度外視で使って1000年分対局してるから……
- 293 名前:名前は開発中のものです。 [2020/05/16(土) 15:42:40 ID:G8tru4l4.net]
- IT掲示板群 ttp://x0000.net/forum.aspx?id=15
学術の巨大掲示板群 - アルファ・ラボ ttp://x0000.net 数学 物理学 化学 生物学 天文学 地理地学 IT 電子 工学 言語学 国語 方言 など simulationライブラリで純粋な関数式プログラミングをする ttp://x0000.net/topic.aspx?id=3631-0 UIライブラリ (C#, 2D) を作ったよ ttp://x0000.net/topic.aspx?id=3688-0 連続と離散を統一した! ttp://x0000.net/topic.aspx?id=3709-0 4Dエンジン ttp://x0000.net/topic.aspx?id=3677-0 matrixのライブラリ ttp://x0000.net/topic.aspx?id=3711-0 ある強力なFor関数 ttp://x0000.net/topic.aspx?id=3630-0 SQLライブラリ ttp://x0000.net/topic.aspx?id=3675-0
- 294 名前:535 mailto:sage [2020/05/16(土) 18:10:49.03 ID:BsSPHqoG.net]
- >>292
/ ̄⌒⌒ヽ | / ̄ ̄ ̄ヽ | | / \| .| | ´ ` | (6 つ / ちくしょう・・・ .| / /⌒⌒ヽ | \  ̄ ノ | / ̄ ,冖 ,、 冖 / // ,. - ―- 、 `,-. -、'ヽ' └ァ --'、 〔/ / _/ ヽ ヽ_'_ノ)_ノ `r=_ノ / / ,.フ^ー- j ,冖 ,、 ,へ / ,ィ / \ `,-. -、'ヽ' く <´ 7_// / _/^ 、`、 ヽ_'_ノ)_ノ \> / / / _ 、,.;j ヽ| n 「 | /. | -'''" =-{_ヽ{ ll || .,ヘ / ,-、 | ,r' / ̄‐-..,フ! ll ヽ二ノ__ { / ハ `l/ i' i _ `ヽ l| _| ゙っ  ̄フ.rソ i' l r' ,..二''ァ ,ノ |l (,・_,゙> / { ' ノ l /''"´ 〈/ / ll ,冖 ,、 > >-' ;: | ! i { l| `,-. -、'ヽ' \ l l ;. l | | ! |l ヽ_'_ノ)_ノ トー-. !. ; |. | ,. -、,...、| :l ll ,冖 ,、 |\/ l ; l i i | l ll `,-. -、'ヽ' iヾ l l ;: l | { j { |l ヽ_'_ノ)_ノ { |. ゝ ;:i' `ー‐-' } . n. n. n l | ::. \ ヽ、__ ノ |! |! |! l | ::. `ー-`ニ''ブ o o o ,へ l :. |
- 295 名前:535 mailto:sage [2020/05/18(月) 18:55:35 ID:ErVFXYqV.net]
- 次のアイディアもなくすっかりさぼりモード
- 296 名前:310 mailto:sage [2020/05/18(月) 21:57:15.59 ID:lyHQ6R5E.net]
- Hash関数変更
DBのハッシュキーの効率が悪かったので、ちょっと考えてみた。 今まではshuffle_epi8でバイト単位シャッフルしていたのを、BMIのpextでビット単位の シャッフルと、rotateしたものを、xorでまとめていく方法。以前よりは、ちょっと良くなった 気がする。 何をもってよくなったかの指標が欲しくなり、ネットを探索したけど、数値指標みたいなの は見つからない。確率論の誕生日問題の反対みたいな状況なのでしばらく考えてみる。 要するに、1万人くらいの生徒がいる学校で、誰一人誕生日ではない日が何%くらい存在 するのかという類の問題です。 また、そう考えてみると、現状では直観よりかなり未使用キーが多い気がしています。 xorを繰り返してビットのオンオフをすると、いずれ立っているビット数が32個を平均と した正規分布(二項分布)になって、一様分布にならないのではないかという疑念が。 正規分布だと、中央に近いところは重複しやすく、立っているビット数が0とか64とか の出現確率が下がる事になります。xor繰り返すと正規分布に本当に近づいていくのか、 ちょっと検証してみたい。
- 297 名前:310 mailto:sage [2020/05/18(月) 22:17:24.43 ID:lyHQ6R5E.net]
- DBの件
たぶんあるだろうとネットで検索してみたら、Kyoto Cabinetなるキーバリュー型の 簡易DBライブラリがある事が判明。ほかにもLevelDBとか、何種類かあるみたい。 RDB使うまでもないけど、データ量が多いとメモリーだとリソース勿体ないみたいな。 やはりみんな考える事は一緒だなと。せっかくなので導入の方向で検討。 DBの速度問題 また、おそらく1棋譜単位でのBook更新は速度的に問題ないのですが、DAG(合流) 時に、棋譜外の合流元の方の更新がされないという問題があり、学習前に一括で 再構築しています。この一括更新が件数の関係ですごく時間がかかる事が問題です。 一応、1棋譜単位で更新した時に、DAG分もちゃんと処理するロジックを検討中です。 バグさえなければ速度問題はかなり解消できるはず。とはいえ、何回もループを回す 処理となるため、速度に自信なし。
- 298 名前:310 mailto:sage [2020/05/18(月) 23:50:13 ID:lyHQ6R5E.net]
- DBの件…
確定探索の時にはメモリーに確定分だけおいとくと考えていましたが、 今件数確認したらおよそ2/3は確定分として確保しなきゃならない 事に気づきました(汗 棋譜作成時はメモリーでやるしかないかも。 1棋譜更新でのDAG問題回避はやりたいかな。 Book再構築にだいたい20分くらいかかる。 DAG回避で1棋譜分更新するのが1秒として1000棋譜追加でおよそ16分。 これ以下の時間で済むならやる価値ありそう。
- 299 名前:310 mailto:sage [2020/05/20(水) 01:15:22.70 ID:Xgj8E+2H.net]
- 久々に完全読み切りでバグ発生。
ProbCutを広げながらmtd(f)している時に、どうもパス絡みで発生しているっぽい。 ProbCutによるIterative Wideningを止めたらちゃんと読み切る。 まあ、置換表絡みなんだとは思うけど、事例が少なすぎて(数か月に1回程度)、 前の記録消しちゃったので、とりあえず記録を残し、絆創膏当てて続行。 気が向いたらデバッグしてみる。可能性があるところはなんとなくわかっている つもりだけど。 Book更新時のDAG回避は、かなり悩ましい。というか頭がこんがらがる。 未使用Hashの期待値計算も頭が未だにこんがらがってます。。
- 300 名前:名前は開発中のものです。 mailto:sage [2020/05/20(水) 03:14:41.24 ID:kE3dJxL+.net]
- お姉さん問題で有名な、北大の湊教授のZDD を使えないの?
本も出てる
- 301 名前:535 mailto:sage [2020/05/20(水) 16:25:53 ID:BUng/tdF.net]
- katagoを使った9路囲碁の巨大Book作成、やってみようかなぁ。
難しそうだけど。
- 302 名前:310 mailto:sage [2020/05/20(水) 17:28:20.84 ID:Xgj8E+2H.net]
- Hash関数の効率判断基準できました。
同じキーにデータが8つくらい入っているようなものもあり、それが適正かどうか 判断できなくてゴチャゴチャしていましたが、昨夜しれっと書いたように未使用キー の数の期待値に着目したら簡単でした。 キーサイズと、データ件数からExcelなどで簡単に計算できます。 3件程度調べてみましたが、理想的な一様ランダム値で生じる未使用キー数の 期待値との差は0.1%未満で、このHash関数も一様ランダム化するものと言って 良いレベルでした。 逆に言えば、自分の典型的な使用方法だと20〜30%のキーが未使用になる という事のようです。これはこれで…。
- 303 名前:535 mailto:sage [2020/05/20(水) 18:41:29 ID:BUng/tdF.net]
- やっぱライフゲーム囲碁やりてぇなぁ。
ウーム悩ましい。
- 304 名前:310 mailto:sage [2020/05/21(木) 00:46:28 ID:ahADKaci.net]
- Hash値、1件2件…と期待値出そうと思ったら、なんとなく昔の記憶が戻ってきて、
0件の時は不要だけど、こちらではPとかCとかが必要になるような気がしてきた。 確率の勉強するかな。 ZDDちらっと見てみたけど、ちょっと目的と違うような感じがしている。 本買ってみるけど。 脱線はこれくらいにして、DAG考慮したBook更新に戻ろう。
- 305 名前:535 mailto:sage [2020/05/22(金) 19:57:06.06 ID:khQY98T/.net]
- 自己流でライフゲーム囲碁に取り組むべきか。
なぜalpha zeroがうまく行かなかったのかを調査すべきか。 まあしばらくさぼりモードだけど。
- 306 名前:名前は開発中のものです。 mailto:age [2020/05/26(火) 02:09:09.91 ID:dgMv5Qb/.net]
- ・19路盤での定石の発見とかを可視化して、強さを判断する
・まず5〜9路盤で最強目指す 俺なら後者を選択する バグが出なくなったら前者に取り組む
- 307 名前:535 mailto:sage [2020/05/26(火) 18:51:39 ID:QRHJU3eS.net]
- >>306
実際に自分で手を動かす人なら歓迎するぞ? 口先だけならいらない。
- 308 名前:310 mailto:sage [2020/05/29(金) 00:49:53.42 ID:wYh6jGrP.net]
- DAG時のBook更新の件、めっちゃ悩み中。
普通にやったら1件更新に14秒とかかかって使い物にならない。 逆引きDBを作ろうかと思うのだけど、結構なサイズになるので、それこそメモリーに 置きたくない。形としてはunordered_multimapになるんだけど、Kyoto Cabinetが重複 キーを許すのか英文読まなきゃならないので止まってる。 そうこうするうちに完全読み切りのバグがまた発生して、事例が3件になったので、 調査開始。2か所間違いを発見。一つ目はケアレスミス。 2つ目は最善手の直後にパスが来るケース。置換表登録はパス後、オーダリングなどで 読む時はパス前の盤面になっていた。これで値が狂う理由がいまいち理解できないの だけど、修正したら正しい答えが出るようになった。パスの処理は本当に鬼門。 たぶんバグは取れたけど、50%くらい速度低下。どこかにまだバグがありそう。
- 309 名前:310 mailto:sage [2020/05/29(金) 00:56:37.17 ID:wYh6jGrP.net]
- 速度低下は50%どころではなかった…150〜200%だorz
- 310 名前:310 mailto:sage [2020/05/29(金) 20:25:58 ID:wYh6jGrP.net]
- orderingの中でパス処理をしていたのでmobility関数を呼びまくっているのが遅い原因
ではないかと思い、パスの処理の仕方を変えて、パスも1手とするように変更したところ、 15〜20%の速度低下まで戻りました。他にも、つられてバグが発覚したので修正。 かなりのレアケースでしか発生しないバグですが、今まで自信満々で完全読み切りは 間違っていないと思っていましたが、なんか自信なくなった。 中盤探索も同様に修正したら、浅い探索の読み筋が変わったみたいで、少しは精度が 良くなるのかなぁと期待しています。
- 311 名前:535 mailto:sage [2020/05/30(土) 18:11:38 ID:TznaFVwY.net]
- 以前もちょろっと触れたけど囲碁ディープラーニングプログラミングという本の12章にあるactor-critic法というのがまた気になり始めた。
自分なりに解釈して実装してみようかな。
- 312 名前:310 mailto:sage [2020/05/31(日) 10:02:44 ID:/CnVYfEH.net]
- またエラーが…
なんとなく記憶をたどっていくと、初段で並列処理してMap-Reduceすると、βカットの関係で 評価値は合っていても、ordering次第で間違った手を返す事を思い出しました。 で、たまたま回避策となっていた処理を>>201で外してしまったのではないかと。 並列探索だと本質的に回避できない気がするので、初段を順次処理に変更。残り空きマス 26での平均処理時間。一時は20〜25秒くらいまで来ていたのが、30秒程度に悪化orz
- 313 名前:535 [2020/06/04(木) 21:00:10.17 ID:asDXFlye.net]
- 藤井センセw
- 314 名前:310 mailto:sage [2020/06/05(金) 22:28:59 ID:TnykYlJh.net]
- 藤井7段凄かったね。今年中に8段行っちゃうんじゃないかと思った。
エラーの原因を冷静に見直したところ、どこをどう変えたか覚えていないレベルの ちょっとした修正を加えたところからドツボって、修正するたびに更にバグを仕込んで いたような。結局、元々のプログラムに戻して、速度も復旧しました。むむむ。 こういうのがあるからから、終盤探索に手を入れたくないorz Bookの遡り修正ですが…行き詰っています。 Kyoto Cabinetはやはり単一キーしか扱えず。 メモリー上に逆引きDBを作ると、たぶんBookよりサイズが大きくなるためメモリーにおけない。 しばし悩み中。 息抜きで、棋譜作成のロジックをちょこっと修正。 同じような評価値が並んでいたり、最善手より評価値が良くなる分岐について、今までは 見つけて気になったところだけ手で追加していましたが、適度なペースで見つけて自動的 に追加する様にしました。
- 315 名前:535 mailto:sage [2020/06/15(月) 22:53:27.40 ID:SQc2KJ2b.net]
- 長期サボりモードに突入
なんか本で読んだけどモンテカルロ木探索の訪問回数をdnnの教師データとして使うようなやり方もあるらしい
- 316 名前:310 mailto:sage [2020/06/15(月) 23:12:30 ID:r41RfhWg.net]
- DB化、未だに方法が見いだせずストップしてます。
パブリックドロー臭いのにそうじゃない筋を手動で修正して、20件ほどもとに戻った。 その間に、棋譜が100万件突破しました。 が、Book眺めていると、まだまだ間違い多い。 Zebraも結構間違えているけどね。
- 317 名前:535 mailto:sage [2020/06/17(水) 21:35:01.75 ID:nCYZMpcd.net]
- 2020/05/11 グロービス、囲碁AI「GLOBIS-AQZ」のプログラムをオープンソース化 プロジェクトの集大成としてソースコードを公開
https://www.globis.co.jp/news/release/20200511_globis.html 知らなかった。 ちょっと見てみようかなぁ
- 318 名前:535 mailto:sage [2020/06/17(水) 23:13:34.58 ID:nCYZMpcd.net]
- なお、公開しているソースコードは対局・解析のみの実装で、学習に関する機能は含まれていません。
駄目じゃんorz
- 319 名前:535 mailto:sage [2020/06/18(木) 19:28:02.18 ID:i+asT3Px.net]
- ライフゲーム囲碁でモンテカルロ木探索の訪問回数をdnnの教師データにするのやり始めました。
今教師データを収集してるところです。
- 320 名前:535 mailto:sage [2020/06/19(金) 19:58:32 ID:Y5lRzoqU.net]
- 教師データを学習させてみましたがあんまり強くなりませんでした。orz
- 321 名前:535 mailto:sage [2020/06/19(金) 20:44:26.89 ID:Y5lRzoqU.net]
- そもそもモンテカルロ木探索を教師にしてる時点で、モンテカルロ木探索の強さを大きくは超えられないわけで。
根本的に駄目な気はしてきたorz
- 322 名前:535 mailto:sage [2020/06/19(金) 23:03:06.10 ID:Y5lRzoqU.net]
- 結局、現状、良い教師データがないと厳しい。
アルファゼロ方式の自己対局で強くなるのは1000年かかりそうだし。 むうぅ
- 323 名前:535 mailto:sage [2020/06/22(月) 19:37:12.00 ID:q97LdCHr.net]
- katago最後のリリース
https://github.com/lightvector/KataGo/releases
- 324 名前:535 mailto:sage [2020/06/28(日) 20:46:44.93 ID:7SoJ+c30.net]
- 藤井センセw
棋聖戦2勝目か
- 325 名前:535 mailto:sage [2020/06/29(月) 19:50:03 ID:gKYec+q1.net]
- ライフゲーム囲碁で打った石が最終的に取られるかどうかを学習させてみようかと考え中
- 326 名前:310 mailto:sage [2020/07/03(金) 01:33:21.30 ID:ULg6SDrD.net]
- 相変わらず棋譜作成しながら評価関数学習を続けています。ようやく100万件突破。
推定パブリックドローは大体700件くらいで増えたり減ったりしています。 対称形や合流も重複させていますので、重複除くと400件くらいかなぁ。 終盤は比較的多数の分岐を試しているのですが、序中盤の分岐が不足していて、 棋譜が偏っているような気がしてきたので、棋譜作成のロジックを大幅に変更して 序中盤の分岐が多くなるように。また、評価値とBook値が大きく違う分岐を再検証 するようにしてみました。これで、抜けている筋がだいぶ拾えるようになると期待。 棋譜作成中に暇な時間が多いので、試しにZebraと対戦。Zebraはランダムに パブリックドロー筋から外れる様にできているようですが、外れたら勝てるはずが、 なかなか勝てない。Zebra26手読み、こちらは時間の都合で20手読みくらいなので 仕方が無いのですが、それにしてもBook外れた時の評価関数の精度が悪いという事に。 あと、やはり中盤探索の速度に大きな差があり、とても26手読みなどできない。 むむむ。
|

|