【オセロ,将棋】ボードゲーム Part3【囲碁,War】

【オセロ,将棋】ボードゲーム Part3【囲碁,War】 at GAMEDEV

[前50を表示]
200:310
20/03/28 22:16:21.29 vtZj/mQ8.net
見直し版のチェックを本番やりながら進めてます。
今のところ、学習の速度が３０％程度ダウンしたものの、終盤探索の速度が
３０～５０％高速化している感じ。どちらも原因不明。

201:310
20/03/31 00:30:27 1mhY2vrp.net
見直し版で、遡りチェックで無駄な処理を見つけて直しました。
更に速度アップして、トータル５０％強の速度アップとなりました。
まだ探索自体の速度は上がってませんが、まだ無駄があったとは。

202:310
20/04/01 23:58:19.45 SRR0rDGm.net
急に探索自体の速度アップを思い立ちまして、いくつか実行。
ヒープ領域に作っていたオーダリング処理をスタック領域に来るように修正。
置換表のHash関数の修正で、置換表のキーエントリーの偏りを減らす。
これらにより更に高速化して、トータルで前バージョンの倍速近くなった感じです。
残り２６手探索処理が１時間に９０件弱→１６０件くらい。
あと、もうちょっとやってみたい事があります。

203:名前は開発中のものです。
20/04/02 03:15:04.40 iWlfdZP3.net
katago聞いたことない
alpha zeroは使わないの？

204:535
20/04/02 19:14:11.82 9cAiWeM1.net
deep mindのオリジナルのalpha zeroは公開されてないはず。
github行くとクローンがいくつかあるけど。
katagoはKGSってネット碁会所で最高段位9dで打ってる。

205:535
20/04/02 20:00:58.76 9cAiWeM1.net
でも当たり前だけどkatagoも相当高度なプログラムなので流用するのはかなり難しそう。

206:535
20/04/02 21:24:35.34 9cAiWeM1.net
あかん、やっぱkatago相当難しい。
githubから簡単そうな奴探してお茶を濁すか…

207:310
20/04/06 22:33:27 eOx9NvDZ.net
更に少し高速化しました。

オーダリングのvectorをスタック領域の配列に変更する部分ですが、並列探索部分
にも適用しました。配列も&でアドレス渡せばSTLのalgorism周りが使えるの知りました(^^;
スレッド間でのlockも他の処理と一緒にできるので、オーバーヘッドはありません。
あと、地味にセーブの時間がかかっていたので、回数減らしました。

残り２６手１０００件で１０時間半が、５時間４０～５０分くらいまで来ました。平均２０秒強。
残り２５手の読み切りができていてBookで時短しているので、まったくの新規棋譜の
読み切りはもっと遅くなります。

sort部分も何とかならないかと思いましたが、もともと３２件以下（オセロはたまたま
ですが次の手の上限は３２）は挿入ソートになっているようです。コピペで挿入ソート
を組んで、速度比較してみましたが、有意差は出ませんでした。

件数少ない時に早くかつ安定ソートな方法が他にないか調べてみようかと思います。

208:535
20/04/10 20:40:22.22 KcO1uf/C.net
今これ見てます。
URLﾘﾝｸ(github.com)
libraryをビルド通るところまで行ったんだけどpythonでそのライブラリ読み込むと以下のようなエラーになる。
K:\alpha-zero-gomoku-master\test>python library_test.py
Traceback (most recent call last):
File "library_test.py", line 6, in <module>
from library import Gomoku, MCTS
File "../build\library.py", line 15, in <module>
import _library
ImportError: DLL load failed: 指定されたモジュールが見つかりません。

209:名前は開発中のものです。
20/04/12 04:59:53.78 DFViLwjz.net
その環境の内容見てないから詳しくはわからないけど…原因は大体これ
1. 読み込もうとしているdllが適切なパスに存在してるか
2. 読み込むdllは64bitか32bitか（ビルド構成と一致していないとダメ

210:535
20/04/12 10:52:42 lk7abFDy.net
32bitか64bitかは64bitしか選べないみたいです。
適切なパスに存在しているかというのはどうやってしらべればよいでしょうか。
library.pyと_library.pydをカレントディレクトリに置いたりもしてみたのですが駄目でした。

ちなみにこれはswigというのを使っていてC++をpythonから読めるようにしているようです。
library.pyと_library.pydが生成されてlibrary.pyから_library.pydをインポートするときにこけています。

211:名前は開発中のものです。
20/04/13 02:33:11.01 q8ASrlIp.net
github見てみましたが、中国人が下で同じような質問してますね
buildディレクトリにコンパイルされたファイルを配置しないと駄目なようです
Pythonとかライブラリのバージョンも書いてあるので合わせたほうがいいかもですね
URLﾘﾝｸ(github.com)

212:535
20/04/13 20:06:39 E8a4txq0.net
ありがとうございます。
今python が3.6だったので3.7にしてみようとしたらpytorchがpipで入らず苦戦しています。

213:535
20/04/13 20:47:56.22 E8a4txq0.net
結局python 3.8.2を入れたんですが駄目っぽいorz
やっぱ無理にでも3.7にすべきか…

214:535
20/04/14 20:06:25 ezpleFZl.net
python 3.7.6を試してみましたが駄目。
pytorchももう1.1手に入らないっぽい。
手詰まりです。

215:535
20/04/14 23:01:32 ezpleFZl.net
>>208 動いたらめっちゃよさそうなんだけど悔しいな～

216:名前は開発中のものです。
20/04/15 20:25:07.80 4FzrEabb.net
Ruby なら、require/load で相対パスで指定されたときに、ファイルを検索する時の場所は、$LOAD_PATH だけど、
Python にはそういうパスが無いのか？
これで、site_ruby, vendor_ruby などが、ずらずらと表示される
ruby -e 'puts $LOAD_PATH'
Python は、よく知らないけど、import _library
で、拡張子 .pyd まで探してくれるのか？
_library.pyd

217:535
20/04/15 21:11:30 rifVao0V.net
レスありがとうございます。

ファイルを検索する場所はsys.pathというのがあるみたいです。
表示させたら以下のようになりました。

['K:\\temp\\alpha-zero-gomoku-master_orig\\test',
'C:\\Users\\nagat\\AppData\\Local\\Programs\\Python\\Python37\\python37.zip',
'C:\\Users\\nagat\\AppData\\Local\\Programs\\Python\\Python37\\DLLs',
'C:\\Users\\nagat\\AppData\\Local\\Programs\\Python\\Python37\\lib',
'C:\\Users\\nagat\\AppData\\Local\\Programs\\Python\\Python37',
'C:\\Users\\nagat\\AppData\\Local\\Programs\\Python\\Python37\\lib\\site-packages',
'..\\build']

import _library.pyd はエラーになりました。

218:535
20/04/15 21:32:18.35 rifVao0V.net
ん、neural_network_test.pyは動いた。
どういうことだ？？？

219:535
20/04/15 21:34:10.97 rifVao0V.net
import libraryの前にimport torchをつければいいのか？？？もしかして

220:535
20/04/15 21:42:29.92 rifVao0V.net
うおお、動いたっぽい！！！！
ありがとうございます！！

221:535
20/04/15 21:59:07.45 rifVao0V.net
leaner_test.py train 動きました！！
GUIが起動してポチポチ自己対局を始めました！！
これは期待が高まる！！

222:535
20/04/15 22:01:14 rifVao0V.net
とりあえず、五目並べでちゃんと強くなるかどうか2～3日学習させてみます。

223:535
20/04/15 22:19:15.19 rifVao0V.net
ん、GPUの使用率が1%くらいから上がりませんね。
でも0%じゃないからちゃんと使ってんのかな…

224:535
20/04/15 22:36:14 rifVao0V.net
お、早くも石が中央に寄り始めた？？
そうだとしたら凄い。

225:535
20/04/15 22:48:39 rifVao0V.net
しかし、4すら止めないｗ。
ホントに0からの学習なんだなぁ

226:535
20/04/16 19:32:35 y39ZfUyK.net
お、凄い！たった一日で五目並べっぽくなってる！
たまにそっぽ打つのは乱数でランダムな手を打つようになってるんでしょうね。

227:名前は開発中のものです。
20/04/16 19:37:25 y39ZfUyK.net
うお、早くも人間（俺）に勝った！！
あり得ね～～～！！！

228:名前は開発中のものです。
20/04/16 19:38:07 y39ZfUyK.net
ヤバイ、これはヤバイｗｗ

229:535
20/04/16 19:40:53.49 y39ZfUyK.net
15路という非常に広い盤面でここまで早く強くなるとは…

230:535
20/04/16 19:44:25.68 y39ZfUyK.net
もう五目並べの学習は十分ですね。
となると次のステップはライフゲーム囲碁か囲連星を移植ですね。

231:535
20/04/16 19:54:51.08 y39ZfUyK.net
ライフゲーム囲碁はパスを実装しないといけないからまずは9路囲連星かなぁ

232:535
20/04/16 20:15:49.42 y39ZfUyK.net
すぐにでもコード書き始めたくなるけどぐっと我慢して >>208のソースを少し読み解かねば。。。

233:535
20/04/16 21:57:22 y39ZfUyK.net
あれ、モチベすげー湧いてくると思ったのに意外とそうでもないな…
仕事で疲れてんのかな…

234:535
20/04/18 17:12:26 FJQxs35t.net
実はライフゲーム囲碁を移植しようとしてたのですがパスの実装がやはり意外と難しそうです
9路囲連星に転進しようかな

235:535
20/04/18 20:23:03 dW+TeRwf.net
は～目の前に理想のalpha zeroがあるというのになぜかモチベが湧いてこない、踏ん張りがきかない。
さぼりモードに入りつつあるorz。
ていうか思ってるより移植が工数かかる作業なのかもしれない。

236:535
20/04/19 14:29:45.72 w4GEcYV8.net
9路囲連星はコードを消失していたので19路囲連星を移植してます。

237:535
20/04/19 17:44:45 w4GEcYV8.net
多分移植完了した。バグが無ければ。
学習フェーズへ移項します。

238:535
20/04/19 17:58:16 w4GEcYV8.net
うーん。これGUIの盤のひろさとプログラム上での盤の広さが違いますね。
まあ論理的には整合性は取れているので見た目だけの問題なので放置。

239:535
20/04/19 18:02:39 w4GEcYV8.net
まだ学習始めたばっかなので全然見当違いのところに打ちまくるの見てて切ないｗ
でもまあ、五目並べではわずか一日で人間（俺）に勝てるところまで来たのだから期待して待ちましょう。

240:535
20/04/19 18:42:21.72 w4GEcYV8.net
メモリ10GBくらい使ってる。
思ったよりでかい。

241:535
20/04/19 21:12:09.10 w4GEcYV8.net
GPUのファンが五月蠅い。
タスクマネージャーだと1%とかなのに。
タスクマネージャーじゃ使用率ちゃんと測れないのかな？

242:535
20/04/20 18:56:48 fRC4t5vc.net
強くなってないと思ったら致命的なバグがorz
勝敗データをパイソンに渡す個所にバグがあったようです。
丸一日の学習がパーorz

243:535
20/04/20 21:27:15 fRC4t5vc.net
ん、付けにははねよを覚えたっぽい？
だとしたら凄い。

244:535
20/04/21 20:44:10.63 JovHD0OJ.net
１日学習させたけど強くなってるように見えませんね
15路五目並べと19路囲連星じゃ勝手が違うか
とりあえず1週間位は粘ってみます

245:535
20/04/22 18:48:41 mXEm0GNy.net
強くなってませんね。
完全なランダムでないにせよ。
もう少し様子見します。

246:535
20/04/22 20:21:27.03 mXEm0GNy.net
は～じれったい。ハード性能があと10000倍くらいあればな～

247:535
20/04/22 20:23:13.93 mXEm0GNy.net
むしろ一生懸命７並ばないようにしているとさえ思えるｗ
バグなのかなぁ

248:310
20/04/22 20:43:03.08 ZptezZKq.net
相変わらず棋譜作成中。
プログラムはそれなりに改良しているつもりだけど、成果は全くなし。
まあ、思いついて試すのが楽しいんだけどね。
つか、逆順探索での棋譜訂正。やってるそばからあまりに間違っている筋を
見つけて、修正かける過程で、新しい棋譜どんどん増えて、バックログがどんどん
増えていく地獄になっています。まだまだ重要な分岐でも間違いというか未探索
が多すぎる。
手作業で修正箇所見つけるの面倒なので、延々やらないといけないけど、
ε-Greedy的な何か導入しようかなぁと思い始めています。

249:535
20/04/22 21:56:00 mXEm0GNy.net
お、もしかしてポン抜き覚えたか？
しかしこの学習速度で線形の速度で強くなるとしたらとてもじゃないが時間かかりすぎるが、
ある地点から爆発的に強くなったりしないのかなぁ

250:310
20/04/22 22:21:38 ZptezZKq.net
あるところまでは、間違いは間違いと学習するための時間かも知れませんね。

251:535
20/04/23 18:58:28.20 ynaVt4IB.net
うーん、少し囲連星っぽくなってきてるかなぁ？
ま、当分様子見かな。

252:535
20/04/23 21:04:31.79 ynaVt4IB.net
でもまあディープラーニングってルールも知らないネットワークが勝敗結果だけで強くなるって凄いことだよな。
人間がルール知らずに勝敗結果だけで強くなろうとしたら発狂するｗ

253:535
20/04/24 19:11:09 aNVKQhdF.net
囲連星本来の棋譜とはまだまだ程遠いけど、何かをつかみつつあるような気配がする。。。
様子見続行。

254:535
20/04/24 19:47:38 aNVKQhdF.net
あーネットワークの層増やしてみたいな。
囲連星は7目並べだから7層がちょうどよかったかも…
今デフォルトの4層でやってるんだけど。
でもいまさら後に引けないか。

255:310
20/04/24 19:50:11 wU9GyZ2x.net
DCNNなら層数よりもフィルタ数の方が大事かも。

256:535
20/04/24 19:55:02 aNVKQhdF.net
まじすか
現状でもフィルタは256（デフォルト）とかなり贅沢に使ってるんですが。。。
オリジナルの作者もフィルタ数が大事と思ったのかもしれませんね。

257:310
20/04/24 22:19:55 wU9GyZ2x.net
>>256
２５６フィルタあるんなら流石に大丈夫そうだね。

258:535
20/04/25 21:48:41.17 wwp+rt8W.net
やっぱ9路囲連星にしとけばよかったかな～
でもいまさら後に引けない…orz

259:535
20/04/26 17:31:58 73Aw05p/.net
うーむ、進むべきか引き返すべきか段々悩ましくなってきた。
まあもうちょい様子見続行か。。。

260:535
20/04/26 19:51:54 73Aw05p/.net
知性の芽生えみたいなものを全く感じないわけじゃないから打ち切るのも躊躇われるが、
いかんせん成長速度が遅いんだよなぁ。ウーム悩ましい。

261:535
20/04/27 17:44:36.98 bKact/KJ.net
囲めば石取れることはわかってるっぽいんだよなぁ
もう少し粘ろう

262:535
20/04/27 21:17:34 bKact/KJ.net
あーパソコン複数台ほしいなぁ
でも置き場所がないからなぁ
となるとAWSとかGCPとかかなぁ
でもあれ、金がやばいらしいからなぁ

263:535
20/04/27 21:37:15 bKact/KJ.net
囲連星もやりたいけど、ライフゲーム囲碁もやりたいんだよなぁ。
>>208のやつはパス実装するのが難しいからなんか別の奴探してこようかなぁ。
ルール的にはオセロのクローンから移植すればライフゲーム囲碁移植しやすいはず。

264:535
20/04/28 19:29:54.42 VfQhex7P.net
打ち筋は確かに改善されてるような気がするんだよなぁ。
ただ、あまりに上達が遅い。

265:535
20/04/28 20:06:48.30 VfQhex7P.net
何で五目並べはあんなうまく行くんだろう？
やっぱ複雑度が全然違うのだろうか？

266:535
20/04/30 18:36:10 6uxMdcsM.net
どんなに早くてもleela zeroが強くなるのに必要だったぐらいの時間はかかるのかもしれないなこれ…

267:535
20/05/02 20:07:05.00 ppsdwWbz.net
あかん、超長期戦になりそうorz
マシンパワーがあと10000倍あればorz

268:535
20/05/03 19:21:36 6By0oz27.net
らちが明かないので19路囲連星はいったん止めて9路囲連星に移行します。
でもいつかは戻ってきたい。
I shall return.

269:535
20/05/03 22:42:03 6By0oz27.net
お、9路囲連星は結構強くなるかも。
早くもランダムではない何かを感じる。

270:535
20/05/03 23:03:31.98 6By0oz27.net
もしかしたら19路囲連星は層の数が足りなかったってことなのかも。
9路囲連星は6層でやってます。
5目並べが4層でうまく行ったから7目並べの囲連星なら6層かな？と思ったのですが当たりだったかも。

271:535
20/05/03 23:32:54 6By0oz27.net
これは…
明らかに知性がある…

272:535
20/05/05 17:29:46.91 3PlXxhBg.net
おっとバグがあったorz
でもこれで行けるはず。

273:535
20/05/06 10:40:38 Oyc/dCE2.net
うおお、公式ボットに勝った～
凄い！！

274:535
20/05/06 15:40:57 Oyc/dCE2.net
しかしalpha zero てこの手のゲームの最終解答にちかいな。
単に移植しただけで既存ボットに勝つとは。

275:535
20/05/07 19:53:48 LRbJj7fv.net
学習が進んだので既存ボットと対戦してみましたが、大幅に負け越しますね。。。
過学習？

276:535
20/05/07 20:07:16 LRbJj7fv.net
うーん、わからん。層数をさらに増やして学習させてみようかな…
囲碁AIにならって20層くらい一気にいってみるかな…

277:535
20/05/07 20:19:50 LRbJj7fv.net
チャネル数　384
層数 20

の超ビッグネットワークで再挑戦します。

278:535
20/05/07 20:59:06 LRbJj7fv.net
ん、CPU使用率が上がらない？
ネットワークでかすぎたか？

279:535
20/05/07 21:03:55 LRbJj7fv.net
GPUのメモリが溢れてるっぽいorz
しょうがない、小さくするか。

280:535
20/05/07 21:25:17 LRbJj7fv.net
GTX 1080 でもメモリ足らんとかorz
気安くいってくれるぜ

281:535
20/05/07 21:27:42 LRbJj7fv.net
バッチサイズもでかくしたのまずかったっぽい

282:535
20/05/07 22:52:16.50 LRbJj7fv.net
うーん、もしかしたらCPUはあんま必要なくてGPUに金使ったほうがいいのかもしれないな。これは。

283:535
20/05/08 20:21:50 vYlFFPu/.net
層増やしたけどあんまうまく行ってないのかなぁ。
それともまだまだ学習が足りないだけなのか…

284:310
20/05/09 00:56:41.26 tOwbW1Pp.net
棋譜作成触りすぎるとなかなかはかどらなくなるので、しばし回しっぱなし。
そろそろBookが巨大化しすぎているので、メモリーからSDDに移せないか検討中。
concurrent_unordered_mapを自作した経緯があるので、同じような感じでランダム
アクセスなDB化をしてます。確定分は探索で使うのでメモリーにおいて、速度を
必要としないアクセスをDBにしようかなと。
巨大Bookの作成処理の類を並列処理にしているので、何とか並列にできないかと
色々やっていますが、色々と罠がある。複数プロセスからの並列更新はあきらめた
けど、単一プロセスからの並列更新でロック範囲がまだいまいち。
専門書買ってコード見て勉強した方が早いんだろうけど、まあ、しばらく楽しみます。

285:535
20/05/12 21:24:42.90 autiDqQV.net
1ゲームすら勝てない…
何が悪いんだ？

286:535
20/05/12 21:56:06 autiDqQV.net
いままで新旧のAIを比較するとき10戦中6勝以上でAI更新にしてたのを50戦中30勝以上で更新にしてみます。
もしかしたら試行回数が少なすぎて弱くなっていてもAI更新してたかもしれないので。

287:310
20/05/12 23:05:51.81 AcB4a3UT.net
うぬぬ。DB化は並列諦めてみたけど、やはり更新が遅すぎる。
もうちょっと工夫してみるけど。

288:535
20/05/14 19:16:54 7UgQPtyV.net
ただ待ってるだけってのもつらいな。
結果も出ないし。

289:535
20/05/15 18:59:37.53 55GCUZ0E.net
心が折れそうorz

290:535
20/05/15 19:20:34.85 55GCUZ0E.net
自己対局みてると結構強そうに見えるだけどな。
公式AIと対局すると勝てねんだよな。

291:535
20/05/15 19:53:09.72 55GCUZ0E.net
ギブアップです。
何か次のこと考えよう。

292:名前は開発中のものです。
20/05/16 11:39:42 n0PK2vlL.net
AlphaGoは計算資源をコスト度外視で使って1000年分対局してるから……

293:名前は開発中のものです。
20/05/16 15:42:40 G8tru4l4.net
IT掲示板群 URLﾘﾝｸ(x0000.net)

学術の巨大掲示板群 - アルファ・ラボ URLﾘﾝｸ(x0000.net)<)
UIライブラリ (C#, 2D) を作ったよ
URLﾘﾝｸ(x0000.net)
連続と離散を統一した！
URLﾘﾝｸ(x0000.net)
4Dエンジン
URLﾘﾝｸ(x0000.net)
matrixのライブラリ
URLﾘﾝｸ(x0000.net)
ある強力なFor関数
URLﾘﾝｸ(x0000.net)
SQLライブラリ
URLﾘﾝｸ(x0000.net)

294:535
20/05/16 18:10:49.03 BsSPHqoG.net
>>292
　　　　／￣⌒⌒ヽ
　　　 | ／￣￣￣ヽ
　　　 | |　　／　＼|
　　　　.| |　　　 ´　｀　|
　　　 (6　　　　つ　/　　　ちくしょう・・・
　　　　.| 　　/ ／⌒⌒ヽ
　　　 |　　　＼　￣ノ
　　　　 |　　　　　/￣
　 ,冖　,､　冖　　 /　／/　　　　　 ,. - ―-　､
　`,-.　-､'ヽ' └ｧ --'､　〔／　/　　＿／　　　　　　ヽ
　ヽ_'_ﾉ)_ﾉ　　 `r＝_ﾉ　　　 /　／　　　　　　,.ﾌ^ー- j
　 ,冖　,､　　　,へ　　　 /　 ,ｨ　　　　　／　　　　　　＼
　`,-.　-､'ヽ' 　く <´　　　7_／/　　　　 / 　　　 _／^　　､`､
　ヽ_'_ﾉ)_ﾉ　　　　＼>　　　　/ 　　　 /　　　／　_　､,.;j ヽ|
　　　n　　　　　「 |　　　　　/. 　　　　|　　　　 -'''"　=-{_ヽ{
　　　ｌｌ　　　　　|｜ .,ﾍ　　/　　 ,-､　　|　　,r' ／￣‐-..,ﾌ!
　　　ｌl　　　　　ヽ二ノ__　｛　　/ ﾊ `l／　 i'　i 　　＿　　｀ヽ
　　　ｌ|　　　　　　　 _| ﾞっ　￣フ.rｿ　　　　 i' l　　r'　,..二''ｧ ,ﾉ
　　　|l　　　　　　　 (,･_,ﾞ> 　／ { '　ﾉ　　　　 l　 /''"´　〈/ /
　　　ｌl　　　　　,冖　,､　 >　 >-' 　　　 ;:　|　 !　　　　i　{
　　　ｌ|　　　　`,-.　-､'ヽ' 　＼ l　　 l 　　 ;. ｌ｜　　　|　!
　　　|ｌ　　　　ヽ_'_ﾉ)_ﾉ　　ﾄー-.　　 !. 　　 ; |. | ,. -､,...､| :l
　　　ｌl　　　　　,冖　,､　|＼/　　　ｌ　　 ; l　ｉ　　 i　 | l
　　　ｌｌ　　　　`,-.　-､'ヽ' iヾ　l　　　 l　　;: ｌ｜　　{　j {
　　　|ｌ　　　　ヽ_'_ﾉ)_ﾉ　 {　　 |. 　　　ゝ　 ;:i'　｀ｰ‐-'　}
.　ｎ.　ｎ.　ｎ　　　　　　　　l　　|　　　::.　　＼ヽ､__ 　　　ﾉ
　 |!　 |! 　|!　　　　　　　　 l　 |　　　 ::. 　　　`ー-｀ニ''ﾌﾞ
　 o　 o 　o　　　　　　,へ　l　　　　　 :.　　　　　　　　　|

295:535
20/05/18 18:55:35 ErVFXYqV.net
次のアイディアもなくすっかりさぼりモード

296:310
20/05/18 21:57:15.59 lyHQ6R5E.net
Hash関数変更
DBのハッシュキーの効率が悪かったので、ちょっと考えてみた。
今まではshuffle_epi8でバイト単位シャッフルしていたのを、BMIのpextでビット単位の
シャッフルと、rotateしたものを、xorでまとめていく方法。以前よりは、ちょっと良くなった
気がする。
何をもってよくなったかの指標が欲しくなり、ネットを探索したけど、数値指標みたいなの
は見つからない。確率論の誕生日問題の反対みたいな状況なのでしばらく考えてみる。
要するに、１万人くらいの生徒がいる学校で、誰一人誕生日ではない日が何％くらい存在
するのかという類の問題です。
また、そう考えてみると、現状では直観よりかなり未使用キーが多い気がしています。
xorを繰り返してビットのオンオフをすると、いずれ立っているビット数が３２個を平均と
した正規分布（二項分布）になって、一様分布にならないのではないかという疑念が。
正規分布だと、中央に近いところは重複しやすく、立っているビット数が０とか６４とか
の出現確率が下がる事になります。xor繰り返すと正規分布に本当に近づいていくのか、
ちょっと検証してみたい。

297:310
20/05/18 22:17:24.43 lyHQ6R5E.net
DBの件
たぶんあるだろうとネットで検索してみたら、Kyoto Cabinetなるキーバリュー型の
簡易DBライブラリがある事が判明。ほかにもLevelDBとか、何種類かあるみたい。
RDB使うまでもないけど、データ量が多いとメモリーだとリソース勿体ないみたいな。
やはりみんな考える事は一緒だなと。せっかくなので導入の方向で検討。
DBの速度問題
また、おそらく１棋譜単位でのBook更新は速度的に問題ないのですが、DAG（合流）
時に、棋譜外の合流元の方の更新がされないという問題があり、学習前に一括で
再構築しています。この一括更新が件数の関係ですごく時間がかかる事が問題です。
一応、１棋譜単位で更新した時に、DAG分もちゃんと処理するロジックを検討中です。
バグさえなければ速度問題はかなり解消できるはず。とはいえ、何回もループを回す
処理となるため、速度に自信なし。

298:310
20/05/18 23:50:13 lyHQ6R5E.net
DBの件…
確定探索の時にはメモリーに確定分だけおいとくと考えていましたが、
今件数確認したらおよそ２／３は確定分として確保しなきゃならない
事に気づきました（汗

棋譜作成時はメモリーでやるしかないかも。

１棋譜更新でのDAG問題回避はやりたいかな。
Book再構築にだいたい２０分くらいかかる。
DAG回避で１棋譜分更新するのが１秒として１０００棋譜追加でおよそ１６分。
これ以下の時間で済むならやる価値ありそう。

299:310
20/05/20 01:15:22.70 Xgj8E+2H.net
久々に完全読み切りでバグ発生。
ProbCutを広げながらmtd(f)している時に、どうもパス絡みで発生しているっぽい。
ProbCutによるIterative Wideningを止めたらちゃんと読み切る。
まあ、置換表絡みなんだとは思うけど、事例が少なすぎて（数か月に１回程度）、
前の記録消しちゃったので、とりあえず記録を残し、絆創膏当てて続行。
気が向いたらデバッグしてみる。可能性があるところはなんとなくわかっている
つもりだけど。

Book更新時のDAG回避は、かなり悩ましい。というか頭がこんがらがる。
未使用Hashの期待値計算も頭が未だにこんがらがってます。。

300:名前は開発中のものです。
20/05/20 03:14:41.24 kE3dJxL+.net
お姉さん問題で有名な、北大の湊教授のZDD を使えないの？
本も出てる

301:535
20/05/20 16:25:53 BUng/tdF.net
katagoを使った9路囲碁の巨大Book作成、やってみようかなぁ。
難しそうだけど。

302:310
20/05/20 17:28:20.84 Xgj8E+2H.net
Hash関数の効率判断基準できました。
同じキーにデータが８つくらい入っているようなものもあり、それが適正かどうか
判断できなくてゴチャゴチャしていましたが、昨夜しれっと書いたように未使用キー
の数の期待値に着目したら簡単でした。
キーサイズと、データ件数からExcelなどで簡単に計算できます。
３件程度調べてみましたが、理想的な一様ランダム値で生じる未使用キー数の
期待値との差は０．１％未満で、このHash関数も一様ランダム化するものと言って
良いレベルでした。
逆に言えば、自分の典型的な使用方法だと２０～３０％のキーが未使用になる
という事のようです。これはこれで…。

303:535
20/05/20 18:41:29 BUng/tdF.net
やっぱライフゲーム囲碁やりてぇなぁ。
ウーム悩ましい。

304:310
20/05/21 00:46:28 ahADKaci.net
Hash値、１件２件…と期待値出そうと思ったら、なんとなく昔の記憶が戻ってきて、
０件の時は不要だけど、こちらではPとかCとかが必要になるような気がしてきた。
確率の勉強するかな。

ZDDちらっと見てみたけど、ちょっと目的と違うような感じがしている。
本買ってみるけど。

脱線はこれくらいにして、DAG考慮したBook更新に戻ろう。

305:535
20/05/22 19:57:06.06 khQY98T/.net
自己流でライフゲーム囲碁に取り組むべきか。
なぜalpha zeroがうまく行かなかったのかを調査すべきか。
まあしばらくさぼりモードだけど。

306:名前は開発中のものです。
20/05/26 02:09:09.91 dgMv5Qb/.net
・19路盤での定石の発見とかを可視化して、強さを判断する
・まず5～9路盤で最強目指す
俺なら後者を選択する
バグが出なくなったら前者に取り組む

307:535
20/05/26 18:51:39 QRHJU3eS.net
>>306
実際に自分で手を動かす人なら歓迎するぞ？
口先だけならいらない。

308:310
20/05/29 00:49:53.42 wYh6jGrP.net
DAG時のBook更新の件、めっちゃ悩み中。
普通にやったら１件更新に１４秒とかかかって使い物にならない。
逆引きDBを作ろうかと思うのだけど、結構なサイズになるので、それこそメモリーに
置きたくない。形としてはunordered_multimapになるんだけど、Kyoto Cabinetが重複
キーを許すのか英文読まなきゃならないので止まってる。
そうこうするうちに完全読み切りのバグがまた発生して、事例が３件になったので、
調査開始。２か所間違いを発見。一つ目はケアレスミス。
２つ目は最善手の直後にパスが来るケース。置換表登録はパス後、オーダリングなどで
読む時はパス前の盤面になっていた。これで値が狂う理由がいまいち理解できないの
だけど、修正したら正しい答えが出るようになった。パスの処理は本当に鬼門。
たぶんバグは取れたけど、５０％くらい速度低下。どこかにまだバグがありそう。

309:310
20/05/29 00:56:37.17 wYh6jGrP.net
速度低下は５０％どころではなかった…１５０～２００％だorz

310:310
20/05/29 20:25:58 wYh6jGrP.net
orderingの中でパス処理をしていたのでmobility関数を呼びまくっているのが遅い原因
ではないかと思い、パスの処理の仕方を変えて、パスも１手とするように変更したところ、
１５～２０％の速度低下まで戻りました。他にも、つられてバグが発覚したので修正。

かなりのレアケースでしか発生しないバグですが、今まで自信満々で完全読み切りは
間違っていないと思っていましたが、なんか自信なくなった。

中盤探索も同様に修正したら、浅い探索の読み筋が変わったみたいで、少しは精度が
良くなるのかなぁと期待しています。

311:535
20/05/30 18:11:38 TznaFVwY.net
以前もちょろっと触れたけど囲碁ディープラーニングプログラミングという本の12章にあるactor-critic法というのがまた気になり始めた。
自分なりに解釈して実装してみようかな。

312:310
20/05/31 10:02:44 /CnVYfEH.net
またエラーが…

なんとなく記憶をたどっていくと、初段で並列処理してMap-Reduceすると、βカットの関係で
評価値は合っていても、ｏｒｄｅｒｉｎｇ次第で間違った手を返す事を思い出しました。
で、たまたま回避策となっていた処理を>>201で外してしまったのではないかと。

並列探索だと本質的に回避できない気がするので、初段を順次処理に変更。残り空きマス
２６での平均処理時間。一時は２０～２５秒くらいまで来ていたのが、３０秒程度に悪化orz

313:535
20/06/04 21:00:10.17 asDXFlye.net
藤井センセw

314:310
20/06/05 22:28:59 TnykYlJh.net
藤井７段凄かったね。今年中に８段行っちゃうんじゃないかと思った。

エラーの原因を冷静に見直したところ、どこをどう変えたか覚えていないレベルの
ちょっとした修正を加えたところからドツボって、修正するたびに更にバグを仕込んで
いたような。結局、元々のプログラムに戻して、速度も復旧しました。むむむ。
こういうのがあるからから、終盤探索に手を入れたくないorz

Bookの遡り修正ですが…行き詰っています。
Kyoto Cabinetはやはり単一キーしか扱えず。
メモリー上に逆引きDBを作ると、たぶんBookよりサイズが大きくなるためメモリーにおけない。
しばし悩み中。

息抜きで、棋譜作成のロジックをちょこっと修正。
同じような評価値が並んでいたり、最善手より評価値が良くなる分岐について、今までは
見つけて気になったところだけ手で追加していましたが、適度なペースで見つけて自動的
に追加する様にしました。

315:535
20/06/15 22:53:27.40 SQc2KJ2b.net
長期サボりモードに突入
なんか本で読んだけどモンテカルロ木探索の訪問回数をdnnの教師データとして使うようなやり方もあるらしい

316:310
20/06/15 23:12:30 r41RfhWg.net
DB化、未だに方法が見いだせずストップしてます。
パブリックドロー臭いのにそうじゃない筋を手動で修正して、２０件ほどもとに戻った。

その間に、棋譜が１００万件突破しました。
が、Book眺めていると、まだまだ間違い多い。
Zebraも結構間違えているけどね。

317:535
20/06/17 21:35:01.75 nCYZMpcd.net
2020/05/11　グロービス、囲碁AI「GLOBIS-AQZ」のプログラムをオープンソース化　プロジェクトの集大成としてソースコードを公開
URLﾘﾝｸ(www.globis.co.jp)
知らなかった。
ちょっと見てみようかなぁ

318:535
20/06/17 23:13:34.58 nCYZMpcd.net
なお、公開しているソースコードは対局・解析のみの実装で、学習に関する機能は含まれていません。

駄目じゃんorz

319:535
20/06/18 19:28:02.18 i+asT3Px.net
ライフゲーム囲碁でモンテカルロ木探索の訪問回数をdnnの教師データにするのやり始めました。
今教師データを収集してるところです。

320:535
20/06/19 19:58:32 Y5lRzoqU.net
教師データを学習させてみましたがあんまり強くなりませんでした。orz

321:535
20/06/19 20:44:26.89 Y5lRzoqU.net
そもそもモンテカルロ木探索を教師にしてる時点で、モンテカルロ木探索の強さを大きくは超えられないわけで。
根本的に駄目な気はしてきたorz

322:535
20/06/19 23:03:06.10 Y5lRzoqU.net
結局、現状、良い教師データがないと厳しい。
アルファゼロ方式の自己対局で強くなるのは1000年かかりそうだし。
むうぅ

323:535
20/06/22 19:37:12.00 q97LdCHr.net
katago最後のリリース
URLﾘﾝｸ(github.com)

324:535
20/06/28 20:46:44.93 7SoJ+c30.net
藤井センセw
棋聖戦2勝目か

325:535
20/06/29 19:50:03 gKYec+q1.net
ライフゲーム囲碁で打った石が最終的に取られるかどうかを学習させてみようかと考え中

326:310
20/07/03 01:33:21.30 ULg6SDrD.net
相変わらず棋譜作成しながら評価関数学習を続けています。ようやく１００万件突破。
推定パブリックドローは大体７００件くらいで増えたり減ったりしています。
対称形や合流も重複させていますので、重複除くと４００件くらいかなぁ。
終盤は比較的多数の分岐を試しているのですが、序中盤の分岐が不足していて、
棋譜が偏っているような気がしてきたので、棋譜作成のロジックを大幅に変更して
序中盤の分岐が多くなるように。また、評価値とBook値が大きく違う分岐を再検証
するようにしてみました。これで、抜けている筋がだいぶ拾えるようになると期待。
棋譜作成中に暇な時間が多いので、試しにZebraと対戦。Zebraはランダムに
パブリックドロー筋から外れる様にできているようですが、外れたら勝てるはずが、
なかなか勝てない。Zebra２６手読み、こちらは時間の都合で２０手読みくらいなので
仕方が無いのですが、それにしてもBook外れた時の評価関数の精度が悪いという事に。
あと、やはり中盤探索の速度に大きな差があり、とても２６手読みなどできない。
むむむ。

327:310
20/07/03 01:35:54.46 ULg6SDrD.net
つか、藤井先生強すぎ。
１回勝負なら時々一発入るけど、番勝負で勝ち越せる人いないんじゃないかな。
竜王戦勝ち進んで、豊島竜王名人との番勝負が見てみたい。

328:535
20/07/04 11:25:12 aqVM5XYH.net
そこに打ったらn手以内に反撃で取られてしまうか？を判定するルーチンを書いてAIに組み込んだら、かなり動きがよくなった。

329:535
20/07/05 17:58:06 pswe4q4i.net
結局、強化学習できない限り、DNNあんま意味ないんじゃ？という状態。

330:535
20/07/09 22:57:20 j8dvyCDa.net
藤井センセ今日は駄目だったか。次回に期待。

331:310
20/07/11 00:47:07.96 UjRsM2rb.net
残念だったね＜Ｆ７先生。相当疲れているんじゃないかな。まだ連戦続くので心配。

こちらは棋譜じゃんじゃか追加中。もう逆順探索で正確さを高めるなんて言ってられない。
いちいち遡りチェックするより、分岐を増やしてしまった方が早い気がしてきた。
で、Zebraと対戦させると、まだまだ穴だらけ。Zebraがわざとパブリックドローから外した
ところからが本番の対局となるのですが、そこから１０～２０手の間に２回くらい間違えて
逆転される感じ。逆にZebraがほとんど間違えていない事に驚いています。評価値は怪しい
ところもあるけど、選択する手のミスが本当に少ない。Zebra２４手読みに変えましたが、
こちらは１７手。読む深さの差もあるのか。
デバッグ用のBookチェックプログラムを改良して、簡易対戦と棋譜訂正が外から簡単
にできるようにしました。今まではプログラム動かしていると、気が付いた訂正箇所も
いちいちプログラム止めないと追加できなかったのですが、動かしっぱなしのままで
訂正済棋譜にして適宜放り込めるようになりました。ただ、Bookが凄い勢いで増大して
いるので、メモリーがかなり危機的状況になってきました。BookチェッカーもBook全体を
読み込むので、ダブルで効いてくる。今16Gなのですが32Gは欲しい。
Zebraに負けた棋譜の手を遡って最善手順っぽいの探して訂正していくと、まだまだ
パブリックドローっぽい手順が結構見つかる。過去に間違えてパブリックドローではない
と判断している奴も結構ありそうなので、見つけられたら最終８００件くらいは行くと思う。
中盤探索の速度差は、ただのProbCutとMulti-ProbCutの差かなぁ。あれ、再計算が重くて
以前は実装していたんだけど、PC壊れてソース全滅して以来手を出していないのよね。

332:535
20/07/16 19:51:32.84 5lwAwdbR.net
藤井センセええええええええええ！！！

333:310
20/07/17 13:10:16.58 wiyFtChq.net
王位戦第二局も含めて、ツエーーーーーーーーーー！って、今更ながらに思った。
人間相手ならabemaAI的４０：６０で不利な局面程度はひっくり返せるという事なんだろうなぁ。
あと、木村王位の体育座りが悲しかった。

棋譜作成は、自動作成で一気に大量に貪欲法かけたところ、既存の推定パブリックドロー筋
の４割くらいが、事前の分岐でパブリックドローから外れる事態に（汗
想定からズレた箇所は、見つけ次第ログに書き出して、そこから貪欲法でチェックするの
ですが、それでもパブリックドローから外れる筋については、Zebra使って徹底チェック。
自分のAIとZebraが同意見でも、読みが深まるにつれて揺れ動くZebraの評価値を見ていた
ら、なんとなくZebraが間違えていそうな着手がわかるようになってきて、その手をさらに
深堀してチェックする事で、ほぼ元の数まで戻す事ができました。たぶん、「パブリック
ドローから外れるのが正解」という筋が２系統ありまして、逆に周辺を掘って行ったら別の
パブリックドロー筋が見つかったりして、現在のところ残り３０手推定パブリックドローが
７８０通り程度となりました。
増えたり減ったりはあるけど、今週だけで８０件近く増えているので最終は１０００件程度に
なってもおかしくない気がします。
もろに、人間が判断して手作業で修正みたいなのが、悲しいところ。
Zebraが無ければこんな事できないわけで。

334:535
20/07/19 18:17:42.01 ZoPMvH5f.net
とりあえず、>>328のAIで棋譜取り始めることにしました。
棋譜取った後の方針はまだあんまり固まってませんが。

335:535
20/07/20 21:59:52.85 Jx63yD56.net
ちょっと寄り道して4x4タイルゲームの最善手順計算してみた。
双方最善で20手で後手勝利みたい。
結構手順長いですね。

336:535
20/07/21 20:43:23.14 bqi5P5mB.net
あれ、ちがう？
22手かな？

337:535
20/07/23 21:12:02.22 ly3edh17.net
ふとやねうらおさんのサイトちょっとみてみたら、やっぱレベルたけーんだなって感じ。

338:535
20/07/29 22:17:32.28 X7Evhq9+.net
さぼりまくってます。

339:310
20/07/31 00:20:53.97 EPRjv06N.net
一括貪欲法を何度か繰り返す事で少し落ち着いてきたみたいで、パブリックドロー候補は
８５０件くらいになりました。
別途、Bookの再構築を速度アップしました。今までは文字通り再構築でしたが、直したい
のはDAGから生じる矛盾の修正だったので、トップから再帰で潜って戻りながら評価値など
を更新する形にして、再構築分の手間を削減しようという目論見です。が、シングルスレッド
でしか動作しないため非常に遅い。最終的に、基本の対称形を一括処理するようにして、
２手目の分岐単位でスレッドを分割して、何とか２０分から５分に短縮できました。
まだ、スレッド３つしか使えていないので、もうちょっと工夫して８スレッド全部使えるように
しようかと思っています。目論みでは２分～３分くらいまで行けかな。

340:310
20/07/31 00:22:31.35 EPRjv06N.net
>>335
タイルゲームの最善手計算凄いですね。
５×５とか６×６にしたらどうなるんでしょうね。

341:310
20/08/10 01:12:51.32 ABN1ddg2.net
bookの再構築は１分５０秒台まで短縮しました。
３０手読み切りのパブリックドロー候補は９００件超え。
割と淡々と増えているので、ホンマかいなと不安になってきています。
過去にパブリックドローとみなした筋が、パブリックドローを外れた時に、原因となった
着手を追いかけて、間違い箇所探していて、大抵直す事ができるのですが、この新しく
棋譜にした筋の評価値が結構へんてこになっています。Zebraも時々そういう局面が
ありますが、結構遭遇します。おそらく過学習の絞り尻が、棋譜に出現していない局面
に押し込められているのだと思います。という訳で貪欲法のロジックを変更して、評価値
が怪しい局面から分岐をさせるように変更。とにかく棋譜を作りたいし、過去に間違えた
筋の訂正にもなるので、これをメインにしてみます。遡りチェックは、諦めて、棋譜の数の
暴力で正解筋を引く方向に変更。
そろそろ合流筋が増えて来たのと、FFOテストの局面が３つ棋譜から生成されたので、
手筋のカバー度は結構上がってきていると思うんだけどなぁ。
ちなみに現在１１８万棋譜。どこかで区切りつけたい気もしてきた。

342:535
20/08/20 17:45:24 g83UO1Ed.net
2冠とかやば過ぎ

343:310
20/09/04 16:05:06.49 h5QFISg8.net
棋譜数の暴力で１３０万棋譜突破。
Book確認用画面の方で手修正を掛けられるようにして、通常の棋譜作成プログラム
を動かしながら、おかしなBook値のところから後続の棋譜作成を手作業で指示して
修正がかけられるようにしました。最初は１件単位だったのが、縦深型の貪欲法で
チェック掛けられるようになり、処理時間はかかるけど効率よく修正できるようになり
ました。
となると、以前からパブリックドローの可能性が否定できないと思っている筋（Zebraで
+0～-1程度の変化）を重点的に調べる事ができるようになりました。調査自体はドロー
ではないと確信できるまで、Zebra参考に縦深貪欲法を適用するだけですが、結構な
筋でドローが見つかりました。続いて、既存の幅優先貪欲法と３０手まで遡りチェックで
ドロー筋である事を確認。幅優先貪欲法は間違いが多いので、ここで外れた筋はもう
１回縦深貪欲法でチェック。これを繰り返して、

344:310
20/09/04 16:15:15.87 h5QFISg8.net
途中で送信しちゃった。
まあ、要するに、色々棋譜作成していたら、現在ドロー候補が１０００件超えました。
FJTは生きてますが、LOGISTELLOは消えました。F5d6C4g5筋がそこそこ充実。
斜め取りはF5f6E6f4G5d6からE3は消えましたが、F3とD7、もしかしたらC5も候補として浮上。
まだ、間違いがあって消える筋もあり、場合によっては２００件単位でボツという事もありえ
ますが、最初は１００件程度から始まった事を思えば、増えたものです。
今はとりあえずリストアップ優先ですが、最後の最後に、ガッツリとチェックの篩にかける
つもりです。どれくらい残るかなぁ。

345:310
20/09/10 17:54:29.45 4Zp+kLKC.net
やっちまった。操作ミスで棋譜データ飛ばした。たまたま８月２０日のバックアップと、
現時点でのパブリックドローリストがあったので、現在そこから復旧中。
消えた棋譜は恐らく１０万件以上orz
こういうミスが起きそうなのは認識していたし、色々プログラムも整理したいので、また
プロジェクト一から作り直しするかなぁ。

346:535
20/10/01 19:43:08.37 nw9XcH/L.net
ちょっとわけあって長期で活動から離れていました。
また活動再開する予定もないのですが、このままフェードアウトするのも寂しいのでLifeGameGoのAIを公開します。
アルゴリズムはモンテカルロ木探索+>>328のヒューリスティックですね。
URLﾘﾝｸ(drive.google.com)

347:535
20/10/01 20:04:23.49 nw9XcH/L.net
>>346のAIはそこそこ強いと思います。
vectorで公開してるやつより若干強いはず。

348:310
20/10/06 23:13:30.11 RrvANMT6.net
棋譜件数とパブリックドローリストはほぼ復活。
パブリックドロー件数は、１２００件くらいのところで落ち着きそうな気が
してますが、まだしばらく増減があると思います。
ソースも整理して、気になっていたところを直しました。
これでデータ飛ばすリスクはかなり減りました。
ただ、Bookはまだまだスカスカだし、評価値もギザギザです。
棋譜が間違っていると思ったら、評価値（自作もZebraも）が間違っていた
というケースも散見され、そろそろBuroさん型の評価関数の限界が見えて
きた気がしています。
今ある棋譜を生かして、もっとフィット率が良い評価関数が作れないものか。
とはいえ、NN系は計算が重すぎるし、いまいちモチベーションがわかない。

349:535
20/10/08 20:45:51.47 1JnWon84.net
AI作成はやってないのですがライフゲーム囲碁ってタイルゲームみたいに千日手存在するのだろうか？というのがちょっと気になってツラツラ考えています。
きちんと証明しようとすると意外と難しい

350:535
20/10/09 21:35:50.16 xNMc+C8z.net
ライフゲーム囲碁では千日手はなさそう。
でもうまく証明できないな。

351:535
20/10/12 19:22:24.77 Vplf5eGF.net
全ての棋理を表現できる構造体作れないかな、とかちょっと妄想したけど、
もしかしてCNNでほぼ実現できてるのかな、とも思ったり。

352:310
20/10/16 00:09:49.89 5RABX7jk.net
やねうら王２０１９のソースを見つけてダウンロードしたけど、やっぱり他人のソースを
見るモチベーションが沸きません（汗。NNUEとかLazySMPとか興味はあるんだけど。
LazySMPは８スレッド以上だと効果が出るそうで、自分の
CNNは十分な複雑さがあれば万能近似関数になりうるので、可能性はありますが、

353:535
20/10/17 21:21:42.37 /ZY5iNBP.net
単純すぎる棋理で勝てちゃうゲームもつまらないし
棋理らしい棋理もなく逆転逆転ばっかりのゲームもつまらないし
理想のゲームバランスってどんなんなんだろね

354:535
20/10/18 11:57:29.71 YswYLMUk.net
DeepMindのMuzeroってAtari 2600のゲームも解けるらしいけど、
冷静に考えるととんでもないことですね。

355:310
20/10/19 14:10:40.58 pQ38Gazt.net
書き込み途中で送信しちゃった直後から、BBQになってます。
とりあえず仕事場からカキコ。

356:310
20/10/22 21:49:58.25 1yysGYXi.net
そろそろ書けるかな？
CNNは色の無い万能近似関数で、汎化性能なるものが幻想ならば、という前提で。
万能近似関数が正しく学習できるためには、全局面分の教師データが必要となります。
その時、万能近似関数で学習する暇があったら、全局面分の教師データでTHE BOOK
を作ってしまえば良い。これで絶対に間違えなくなる。
という事で、可能性はあるけど、それが実現できるレベルに至ったら、そもそもCNNが
必要ないという事になるのではないかと思います（汗
評価関数なるものは、そもそも全局面を列挙する事が不可能な時に、とりあえず重要そう
な局面のセットで学ばせるものではないかと思います。

357:535
20/10/23 19:27:05.19 rxutEBUW.net
>>356
どもです。
>THE BOOKを作ってしまえば良い。
最近タイルゲームでTHE　BOOKをどれだけコンパクトに表現できるか？
みたいなことをツラツラ考えていたりします。
勝利局面を列挙する以上にコンパクトにできたら素敵だなと。
羽生さん100期がんばれ！

358:535
20/10/24 10:09:31.57 fFCFDrI6.net
cnnが汎化性能出せるかどうかはゲームによるところもあるのかな、と思ったり

359:535
20/10/25 19:16:15.46 aUU7qa3J.net
タイルゲームのTHE BOOKをテキストでダンプしてみました。
266MBくらいになった。
>>300のZDDで圧縮、ちょっとやってみたいかも？

360:310
20/10/29 23:07:11.56 ZYSZpPVA.net
藤井二冠の自作PCについて最強将棋ソフト開発者に聞いたらトンデモないことが判明した件
URLﾘﾝｸ(originalnews.nico)
コンピュータ将棋スレで拾って読んだけど、めちゃうなずいてしまった。
あと、テラショック定跡という名前でビビッて劣等感を感じていたけど１００万局面とな。
今１４０万超の棋譜なので、局面ではその６０倍になる。重複外しても１０００万はあるはず。
でも、オセロの様な単純なゲームにとっても、まだ全然スカスカ。
貪欲法の効率が上がり、ついでにおかしそうな棋譜の訂正もかけるようにしたので、
以前よりは、ゴミ棋譜が減ったと思う。過去のゴミ棋譜除去にはまだ時間かかるけど。

361:名前は開発中のものです。
20/10/31 15:36:57.51 gkuxF2zq.net
タイルゲームがかんたんそうだからやってみる

362:535
20/11/01 17:36:13.31 WsZt6LBI.net
>>361
がんばれ～
俺はもうかなりさぼりモード入ってるからスレを盛り上げてくれると嬉しい。

363:535
20/11/01 18:23:47.85 WsZt6LBI.net
ちなみにタイルゲームは盤面が小さいからしらみつぶしできるってだけで、
盤面が大きくなったら全然簡単じゃないからね。

364:535
20/11/03 10:39:48.77 PG2hl+5T.net
ライフゲーム囲碁はルール上、パス機能が必須だと思ってたけど、
片方が一回合法手がなくなった時点で終局図は確定してしまうから
パス機能なしでも大丈夫だということに気づいた。
すなわちgithubからひろってきたalpha zeroで
パスを実装しなくてもライフゲーム囲碁を移植できる！

365:名前は開発中のものです。
20/11/03 10:57:52.07 lQNtzFqi.net
パスしないと負け、パスすれば勝ちのケースはあるのでは?
ルール上、パスがオーケーなら組み込まないと別ゲームになってしまう
囲碁や将棋やオセロではパスはできないが
ルールはしらないが

366:名前は開発中のものです。
20/11/03 10:59:51.84 lQNtzFqi.net
いや間違えた
オセロは手がなくなればパスに自動的だが
戦略上、パスもできるゲームはパスいれないと駄目だが、正確なルールは把握してない

367:名前は開発中のものです。
20/11/03 11:19:49.85 lQNtzFqi.net
いやさらにまちがってたかも?
囲碁もいまいちで
囲碁はパスしていいルールだった気もしてきた

368:535
20/11/03 12:25:56.24 PG2hl+5T.net
ライフゲーム囲碁はどんな着手であってもパスより自分の不利に働くことがないゲームなのです。

369:535
20/11/06 21:02:13.20 2Q8zXTlZ.net
ryzen 5000シリーズ発売ですね。

370:535
20/11/09 18:39:21.46 dBz3DOja.net
羽生さん、99期で終わったら死んでも死にきれないだろ

371:535
20/11/11 18:24:55.16 ffgIJO2s.net
羽生さん大丈夫か？

372:310
20/11/11 19:16:52.71 PnPV3j+5.net
入院したみたいですね。
お寺対局って寒そうだし。

373:535
20/11/12 23:01:44.49 elKbgDlH.net
コロナではないようですね。
100期は何とか達成してほしいですね～。

374:535
20/11/15 20:53:35.50 AsfZgPnz.net
ちょっとgoogle colabに手を出し始めました。

375:535
20/11/17 22:57:35.19 N4TMVNAS.net
google colab(python)上でライフゲーム囲碁のルールが大体実装できてきました。
あとはgit hubでも漁ってalpha zeroなりmuzeroなりを移植できれば。

376:535
20/11/22 11:58:41.04 wvqeKXn/.net
タイルゲームの作者って絶対、完全解析、達成してるはずなんだよな。
でもしなかったってのは完全解析より成長するＡＩのほうがおもしろいと思ったってことかな？

377:名前は開発中のものです。
20/11/22 12:07:01.75 +vYtv0Hx.net
コネクト6はどうですか

378:535
20/11/22 14:39:25.83 wvqeKXn/.net
なんかalpha zero も muzeroも全然できそうにないな。
まるでＲＰＧでまだフラグが立ってないからこれ以上先に進めない、みたいなのと同じ感覚に陥る。

379:535
20/11/22 16:00:21.78 wvqeKXn/.net
なんとか簡単なやつはないかと色々ググってます。
今これ見てる。
URLﾘﾝｸ(qiita.com)

380:535
20/11/22 17:13:40.44 wvqeKXn/.net
一応動いてるっぽいな。

381:535
20/11/22 19:11:20.07 wvqeKXn/.net
あかん、これはGPUないと計算時間がとてつもないかも。

382:535
20/11/27 19:51:59.28 zSE0X91F.net
羽生さん駄目か？
がんばれ、超がんばれ！

383:310
20/11/27 22:44:47.70 hZcTJqyt.net
ご無沙汰です。
現在棋譜は１６０万くらいになっています。縦掘り型の貪欲法が良い調子なので、学習より
棋譜作成を優先しています。残り３０手推定パブリックドローは相変わらず１１００～１３００件
くらいを行ったり来たりしています。まだ、知られていないドロー筋がありそうです。
やねうら王さんのサイト見ていたら、終盤近辺のヒューリスティックスオーダリングのアイデア
（偶数理論がらみ）を思いついてしまった。どうしよう（汗
羽生さん残念だったね。
正月のabemaTVトーナメントスピンオフ企画が楽しみです。

次ページ