- 1 名前:名前は開発中のものです。 [2017/10/15(日) 17:34:58.03 ID:RaMh0le2.net]
- 比較的地味なボードゲーム専用のスレが欲しくて立ててみました。
前スレ 【オセロ,将棋】ボードゲーム【囲碁,War】 mevius.2ch.net/test/read.cgi/gamedev/1057763418/
- 279 名前:ナす。 []
- [ここ壊れてます]
- 280 名前:535 mailto:sage [2018/03/03(土) 19:51:05.26 ID:nviHj1ts.net]
- やっぱ小路盤五目並べと比べて時間かかりますね。
焦れるw とりあえず、これでウェイトファイルが出力されれば第一段階クリアですが…
- 281 名前:535 mailto:sage [2018/03/03(土) 20:18:47.79 ID:nviHj1ts.net]
- あ〜これシングルスレッドなんですね。
まあ確かにコード読んでてもマルチスレッドには見えなかったけど。
- 282 名前:535 mailto:sage [2018/03/06(火) 20:34:35.86 ID:4NZM8BU2.net]
- ベストポリシーとか言うファイルは出力されましたが…
いかんせん遅すぎますねぇ 並列化してハードも強化してあと30倍は速くしないと…
- 283 名前:535 mailto:sage [2018/03/06(火) 22:28:34.91 ID:4NZM8BU2.net]
- んんん、もしかして仮想環境だとディスクアクセスめっちゃ重くなる?
CPUがほとんど仕事してないんだが…
- 284 名前:535 mailto:sage [2018/03/06(火) 22:40:05.64 ID:4NZM8BU2.net]
- こりゃネイティブLinux環境構築も考えるか…
- 285 名前:535 mailto:sage [2018/03/07(水) 20:16:56.97 ID:Xay4EsKj.net]
- ディスクアクセスが100近くいって処理がほとんど進まなくなっちまったorz
いったん止めるべきかな〜
- 286 名前:310 mailto:sage [2018/03/08(木) 00:53:26.17 ID:KJS05rsc.net]
- 新評価関数版ようやく一通りできた。
強化学習にすごーく時間がかかりそう(汗 というわけでNew PC見繕ってます。 ノートPCでi7-8700Kの6コア12スレッドにメモリー32メガで GTX1080搭載のノートPCがある。 むむむ。
- 287 名前:535 mailto:sage [2018/03/08(木) 18:17:36.63 ID:GeAn+CtF.net]
- お高いんでしょう?
- 288 名前:535 mailto:sage [2018/03/08(木) 19:23:50.24 ID:MQ3zVdYu.net]
- 帰ってきてパソコン見てみたら学習が強制終了してました。
土曜からずっと動かしっぱなしでしたが、ここにきて強制終了は痛いですね。 解決しようにも再現させるだけで数日かかってしまうし目星を付けることすら難しそう。
- 289 名前:535 mailto:sage [2018/03/08(木) 20:05:12.94 ID:MQ3zVdYu.net]
- 途中で出力されたポリシーモデルで対戦してみましたが、
予想してたよりずっとまともな手を返してきますね。 ほぼランダムに着手すると思ってました。 これはちゃんと学習できる環境整えればかなり期待できるかも!
- 290 名前:535 mailto:sage [2018/03/08(木) 20:11:16.29 ID:MQ3zVdYu.net]
- 俺も良い目のノート一台買ってLinux入れようかなぁ
デスクトップ2台は手狭だからなぁ
- 291 名前:535 mailto:sage [2018/03/08(木) 21:30:30.05 ID:MQ3zVdYu.net]
- とりあえず、Linuxならパイソン動くことはわかったから
他のもっと高速化に力入れたalpha zeroプロジェクトも試してみようかな
- 292 名前:310 mailto:sage [2018/03/08(木) 23:33:49.98 ID:KJS05rsc.net]
- どもです。
お高いですが、デスクトップのフルスペックの1/3以下で済むようです。 回しっぱなしの奴がレアケースで異常終了すると萎えますね。 自分の奴は、たぶん怪しいところはほぼ蓋をしているので、今は安心しています。 とはいえ、評価値の保存に数秒かかるようになってしまったので、保存中にうっかり 終了してウェイトファイルを破壊しないように、いくつか策を講じました。最近はOSの アップデートで勝手に再起動されちゃうので。
- 293 名前:535 mailto:sage [2018/03/09(金) 20:26:00.14 ID:wTwCUiOb.net]
- デスクトップの1/3って性能がですか?
- 294 名前:310 mailto:sage [2018/03/10(土) 19:53:38.63 ID:jEGGoWyJ.net]
- あ、価格と性能です(^^;
強化学習に凡ミス発見。 強化学習が良いのは、学習し続ければ何とか復旧できると思えるところorz
- 295 名前:535 mailto:sage [2018/03/10(土) 20:42:21.57 ID:MfccYD4W.net]
- 価格コムで調べたら>>281って50万以上ですよね?
- 296 名前:310 mailto:sage [2018/03/10(土) 23:47:40.15 ID:jEGGoWyJ.net]
- こいつです。
https://www.pc-koubou.jp/products/detail.php?product_id=617093 i9-7080XEのデスクトップだとメモリー頑張ると100万ですからね…
- 297 名前:535 mailto:sage [2018/03/11(日) 00:26:26.59 ID:Rh0MFs+Y.net]
- >>291
ほほう? ハイスペックノートの割には確かに安いですね。
- 298 名前:535 mailto:sage [2018/03/12(月) 23:17:36.89 ID:t7pU5NWq.net]
- うわパイソン部分でルール間違ってたorz
やっぱ軽くでもテストはやっておかないとあかんなorz
- 299 名前:310 mailto:sage [2018/03/14(水) 21:17:53.41 ID:Hsr0gVbu.net]
- うぬぬ。強化学習でどこかおかしい。
強化学習単純化しすぎちゃったかなぁ。 暫定的にひたすら記譜作成&記譜学習に戻しました。 遡り30手が鬼門。記譜学習で、ここをクリアする事を当面の目標にします。 とはいえ、残り29手完全読み切りの記譜がそれなりにあるのは、以前では 考えられない状況ではありますが。
- 300 名前:310 mailto:sage [2018/03/15(木) 22:46:56.01 ID:CxmBs8oA.net]
- 強化学習がおかしいというより、記譜のパターンが圧倒的に足りていなかった
のかもと思い始めました。それによって、着手して分岐しても±0となっている みたいな。 とりあえず、記譜の増殖手段を模索中。 今は、ヌルウィンドウサーチを使用して、遡り探索を行っている関係で、間違った 着手(石損となる手)を捨ててますが、ある程度までその手も読み切って、記譜に 加えても良いのかなぁと思っています。 とりあえず、βカット(もっと良い手があった)時の評価関数は明らかに読み間違い をしているので、そこ限定で記譜に加えていますが、ある程度以上の手数は全て 付け足しても良いのかなぁと。
- 301 名前:310 mailto:sage [2018/03/17(土) 02:14:23.31 ID:Foa7nGV6.net]
- なんとなく想像しただけですが、何が悪かったのかわかり始めました。
今の学習は「良い手」しか学習していないという事です。 序盤はある程度ランダムな着手を入れて、結果がばらつくようにしていますが、 途中から読みを入れて、良い手だけで着手し、その結果を遡りで訂正しています。 遡りが有効なのは30手くらいまでで、序盤のランダムは20手程度までに抑えて あります。とすると、遡れる範囲では、悪手を打ったらどういう事になるのかという 学習が抜けている。間違えた着手もちょっとだけ悪いだけでです。結果、最善手の 評価値はそこそこ正確なのですが、極端な悪手も、評価値としてはちょっとだけ 悪い数字でも問題が起きないという事になります。 これはこれで順序付けさえ合っていればそれで良いのですが、ちょっと学習が 進んで、微妙に係数が変わった時に、計算上0.1程度しか悪くない相当な悪手 をうっかり選択しやすくなってしまうという事で、これがオーダリングで悪さをして、 探索時間を長引かせてしまう可能性があります。 恐らく評価関数のステージ分割で、表現力がかなりアップした事から、こういう 学習漏れみたいな事が起きてくるのかなぁと。ほんと、評価関数はスカスカです。 というわけで、昨夜書いたように、ある程度深さを捨てて分岐をすべて記譜に残す ようにしてみようかなぁと思っています。しばらく記譜作成しながら、この事を踏まえ た強化学習をちょっと考えてみたいと思っています。
- 302 名前:535 mailto:sage [2018/03/18(日) 22:34:31.76 ID:tUeDVO3T.net]
- 結果が出るまで時間がかかり過ぎるなぁ。
もうちょっと様子見るけど。。。 やっぱマルチスレッド化された別のalpha zeroプロジェクト探そうかな…
- 303 名前:535 mailto:sage [2018/03/20(火) 21:45:14.39 ID:/Ra5toxr.net]
- 駄目だぁ、強くなる気配がないorz
別のalpha zero プロジェクト本気で探すか… ここまで来てもったいない気もするけど…
- 304 名前:535 mailto:sage [2018/03/23(金) 21:13:02.23 ID:Z4T42krD.net]
- なんかバグ直して再学習したら、ランダムに打ったほうがマシ、くらいに変な手(1の1とか)打つんだが?
もう嫌になっちゃう。
- 305 名前:535 mailto:sage [2018/03/23(金) 21:21:30.45 ID:Z4T42krD.net]
- そういやLeela Zeroも学習過程では一線うってたな。。。
逆にいい傾向なのか???
- 306 名前:310 mailto:sage [2018/03/25(日) 02:23:39.84 ID:Yig4cMbl.net]
- 分岐をすべて記譜にリストアップするようにしてから、爆発的に記譜が増えてます。
2000程度だったのが、15000超えました。 が、まだまだスカスカみたいです。 ここまでするんなら、真面目に自己対戦して遡りせずに、ランダム着手に対して 分岐をリストアップさせても一緒というか、早い気がしてきています(汗
- 307 名前:310 mailto:sage [2018/03/31(土) 01:38:59.31 ID:h3UgGfs1.net]
- ランダム着手も追加して記譜増殖中。ただいま32000超え。
もっとも、残り数手とかの記譜もあるけど(汗 ステージ分割しているので、記譜がなかなか生成されない25〜30手近辺で 非常に少ない教師データで何度も学習する事になり、そのあたりが極端な 過学習になってしまった。 解消方法をいくつか検討中です。 1)時間かかっても良いので、25〜30手の記譜ができるまで頑張る 2)前後の盤面を混ぜて、教師データを増やしてみる 3)ランダム強化学習してみる。 2)3)をやると、おそらく、平均化されて評価値がフラットになるが大小関係は 治ってくると思う。 というわけで、今夜は2)3)を試してみる予定。
- 308 名前:310 mailto:sage [2018/03/31(土) 01:43:35.07 ID:h3UgGfs1.net]
- あと、時々スコア指定(ヌルウィンドウサーチ)の記譜作成処理で
エラー(スコア間違い)が出る時がある。 運が悪い事にハンドリングミスその他で、記譜を残せていないので、 現象の特定ができていない。 頻度としては数日に1回くらい。 たぶん、全滅と直前のパスがらみだと思うんだけど。
- 309 名前:535 mailto:sage [2018/03/31(土) 23:42:05.28 ID:4ltMn3J2.net]
- Geforce GTX 1060を増設しました。
>>214をpytorchで学習してみます。
- 310 名前:535 mailto:sage [2018/03/31(土) 23:46:58.88 ID:4ltMn3J2.net]
- んーうごかん。
GPUありとなしでポリシーファイルに互換性がないんですかね? もしかして。 初めからやり直すか…
- 311 名前:310 mailto:sage [2018/04/01(日) 01:07:10.57 ID:OBeH+1OH.net]
- おお。どんどん進んでますね。
こちらは、昨夜のバグの現象は特定しました。 スコアが62や−62で、mtd(f)の探索開始が64や−64の時に、 置換表に残った64や−64が悪さして、64や−64と誤答する模様。 とはいえ、どこを直すべきかはわかりません。探索開始が64や−64 の時に、62や−62にしてやる事で、姑息的に回避はできるので後回し。 あと、記譜作成に色々機能を加えていたら、どこかがおかしそうだという 不安な状態になってしまいまして。このまま記譜学習を進めて良いか自信 が無いので、今までのデータで安全な部分をテスト用に回して、新たに 記譜を作成開始。34手目までは全探索しながら普通に遡れる感じです。 33手目から先は探索時間がしんどいので、ひとしきり落ち着いてから、もう 一度、遡りチェックのプログラムをきちっと見直して、追加していこうかな と思っています。この間に、強化学習混ぜて、過学習部分を解消して いこうと思います。
- 312 名前:535 mailto:sage [2018/04/01(日) 12:43:33.62 ID:lACu3cfl.net]
- お、ちゃんと時間測ってないからあれだけど、気持ち速くなってる気がする。
ちゃんと時間測りたいなぁ。
- 313 名前:310 mailto:sage [2018/04/01(日) 13:49:33.48 ID:DAl+8Sdv.net]
- バグ問題は、結局姑息的手段では回避できず。
全滅がらみでほかのケースでも誤答するケースが発生しました。 元々FFO#59用にmin-Max探索に入れていた、全滅時の処理くらいしか 原因となりそうなものが思い当たらなかったので、とりあえずコメントアウト して様子見です。全滅時の探索が速度低下しますが、仕方がありません。
- 314 名前:310 mailto:sage [2018/04/02(月) 20:15:06.48 ID:9LYme7cN.net]
- 結局バグ問題は…迷宮入り臭いです。
記譜作成で負荷テスト並みに探索を繰り返すと、全滅絡まなくても間違うケースが 出てきました。再現性が無いのが辛いところ。 その昔悩んでいた時も、やっぱり置換表がらみの問題で迷宮入りでしたが、 今回も、ケチって置換表を極力クリアせずに使用していた事から、何らかの 矛盾が起きているようです。それを言っちゃうと、置換表付mtd(f)でf値を変え ながら探索することも、またその時に作成された置換表を流用して記譜作成 兼ねた読み切り処理を速度アップすることも、怪しいという事になるわけで。
- 315 名前:間違えてしまった事が判明した時点で、その探索は捨てるくらいしか対策が
無いという事になります。 ネットで調べたら、将棋AI界隈でも置換表の問題点を書いている人がいまして。 少なくとも深さがあっていない置換表データは使うべきではない模様。 今の調子だと一晩動かすと結構な頻度で朝見たら止まっているとい状態なので せめて発生率を下げるべく、mtd(f)に入る前に置換表をクリアする事にしました。 なぜしなかったかというと、記譜データからスコアが確定している盤面を置換表に 入れて、それを見ながら既に読み切りしている盤面は飛ばす処理をしていたから です。置換表をクリアして盤面再構築に時間がかかるためです。別途盤面キャッシュ を持って、そちらは追記、置換表は毎回クリアという形に変更しました。 [] - [ここ壊れてます]
- 316 名前:535 mailto:sage [2018/04/02(月) 22:24:32.85 ID:3iK+AnRP.net]
- Leela ZeroがKGSでかなり強くなってる。
俺がパクったプログラムも学習し続けたらあれくらい強くなるんだろうか?
- 317 名前:535 mailto:sage [2018/04/04(水) 20:42:51.24 ID:Y0WMbzNW.net]
- え、ちょっとまってよ。
GPUありなしでポリシーファイルが違うってことは 成果物を配布しようとしたらGPU持ってる人しか遊べないってこと?
- 318 名前:535 mailto:sage [2018/04/04(水) 20:54:25.72 ID:Y0WMbzNW.net]
- しかもCUDAとかも一緒にインストールしてもらわないといけない?
ええぇ?
- 319 名前:310 mailto:sage [2018/04/06(金) 22:00:28.44 ID:952uhqxW.net]
- 誤答問題は、置換表クリアで解消しました。
違う局面の探索で使用した置換表データは使いまわしてはいけないという事で。 なんか、結果的に、2年くらい前にも同じ事で騒いでいたような。 色々整ってきたので、あとはひたすら記譜作成しながら学習を回すだけになって しまって、暇になってます。別PC買ってそっちで学習させながら、別の事をはじめ ようかなぁと思い始めています。
- 320 名前:535 mailto:sage [2018/04/07(土) 20:43:17.69 ID:SqbCC315.net]
- うーん、つよくならないorz
学習は継続しつつ別のalpha zero プロジェクトも物色するか…
- 321 名前:535 mailto:sage [2018/04/08(日) 22:10:18.77 ID:ZB9Bj6DG.net]
- ん、なんかメモリリークあんのかな…
swigでC++から移植したクラスってデフォルトでガベージコレクトされないのかなぁ? もしかして。
- 322 名前:535 mailto:sage [2018/04/08(日) 22:43:04.99 ID:ZB9Bj6DG.net]
- VMWareの設定がメモリ1GBになってた。
とりあえず8GBに増やしてみた。
- 323 名前:535 mailto:sage [2018/04/08(日) 22:53:48.62 ID:ZB9Bj6DG.net]
- お、メモリ増やして再起動かけたら結構いい感じで進みだした?
メモリ増やしたのと再起動かけたのどっちが効いたのかわからんが。
- 324 名前:535 mailto:sage [2018/04/09(月) 20:58:16.91 ID:500BArdX.net]
- くそ〜ベストポリシー更新が全く来ないorz
もう何回目だ?TT
- 325 名前:535 mailto:sage [2018/04/11(水) 20:46:51.70 ID:uiOmKVU+.net]
- お、メモリ増やしたせいか連続運転が安定している。
しかしベストポリシー更新は相変わらずなしorz
- 326 名前:535 mailto:sage [2018/04/11(水) 23:07:04.06 ID:uiOmKVU+.net]
- もしかして、ネットワークの初期値が糞すぎるんだろうか。
でも確かめようがないorz
- 327 名前:535 mailto:sage [2018/04/15(日) 20:07:24.81 ID:8sCJrZFg.net]
- ベストポリシー更新まじコネ〜
でも他のプロジェクトに浮気しようにもなかなか手ごろなのがないんだよなぁ
- 328 名前:535 mailto:sage [2018/04/15(日) 20:21:37.51 ID:8sCJrZFg.net]
- いっそ実績のあるLeelaZeroを本気でパクりに行ってみるべきか…
でも多分、難解なんだろうな〜
- 329 名前:535 mailto:sage [2018/04/16(月) 20:30:05.64 ID:6KBtspgu.net]
- あんまりおかしいんでソースをオリジナルとdiffとったら学習係数が1/100になってたんだがwww
え〜何時いじったかな全く記憶にないwww これで学習が進んでくれれば!!
- 330 名前:535 mailto:sage [2018/04/16(月) 23:37:28.33 ID:6KBtspgu.net]
- loss も entropyも減ってきてる!
これでベストポリシー更新が来れば!!
- 331 名前:535 mailto:sage [2018/04/17(火) 22:16:19.94 ID:E16XJnGD.net]
- キタ━━━━━━(゚∀゚)━━━━━━ !!!!!
ベストポリシー更新きました! 次の切りのいいところで止めてプレーしてみよう
- 332 名前:535 mailto:sage [2018/04/17(火) 22:34:03.78 ID:E16XJnGD.net]
- それはそうとzen+の発売日が迫ってますね。
金がないから買えないけど情報だけは追っかけてみます。 爆速だとい
- 333 名前:「な。 []
- [ここ壊れてます]
- 334 名前:535 mailto:sage [2018/04/18(水) 23:48:24.10 ID:7NtNWbU1.net]
- あとちょっとだけ待とう
終局までの手数も順調に減ってきてるから意味のある手を打ってるんだろう多分 ワクワク
- 335 名前:535 mailto:sage [2018/04/19(木) 20:50:17.33 ID:lyvIQrMy.net]
- 打ってみました。
序盤、中盤は棋理の芽生えみたいなものが感じられました。 伸ばせそうなところを伸ばすとか伸ばされそうなところを止めに来るとか でもわざと負けようとしても5連までは積極的に作りに来るのにそこからパタッと伸ばすのをやめて7連を作ってくれませんw なぜw? でもまあ、希望は感じられました。 もうすこし学習してみます。
- 336 名前:535 mailto:sage [2018/04/19(木) 23:51:35.82 ID:lyvIQrMy.net]
- zen+なかなかよさげですね。
前世代と比べて一割前後性能アップ?
- 337 名前:310 mailto:sage [2018/04/20(金) 09:40:06.18 ID:HgLFJ5UM.net]
- うーん。AMDはSIMD命令で遅い命令があって、速度低下するかもって
どこかで読んじゃったからなぁ。 こちらは地道に記譜作成しながら学習させてます。 深さ優先で記譜作成すると、分岐が少ない手筋ばかり増えていくので、 幅優先で、同じ深さである程度記譜溜まってから、次の深さとするように したのですが、空きマス27からの記譜展開で、時間がかかるようになって なかなか空き28マスに行けない。オーダリングの精度が出ていないから だと思いますが、同時に選択肢も増えてきて、余計時間がかかる感じ。 空き30マス突破したら、かかる時間の増加率は下がるはずなんだけど。
- 338 名前:535 mailto:sage [2018/04/20(金) 22:59:48.32 ID:1YRRGto3.net]
- もしかして終盤はあえてランダム性を残すことによって学習が進みやすくなるなどの深い理由があるのだろうか?
わからんが。
- 339 名前:535 mailto:sage [2018/04/20(金) 23:02:21.21 ID:1YRRGto3.net]
- それとも序盤は同一局面のデータがたくさん現れるから学習できるけれど
終盤に行くとデータが散らばっちゃって学習できなくなるということだろうか
- 340 名前:名前は開発中のものです。 mailto:sage [2018/04/20(金) 23:03:29.26 ID:1YRRGto3.net]
- あるいは一線や二線は打たないほうがいいと学習してしまっているがため、7連を作れないのだろうか?
- 341 名前:310 mailto:sage [2018/04/21(土) 20:32:42.81 ID:AdkW58BW.net]
- オセロは記譜生成させてるだけで暇なので、将棋の事を考えてました。
KKPとかよくわからないし、同じ事をやってもつまらないので、利きを点数化 しようかと考えてみまして、実際の計算方法を考えていたら、自玉周辺と 相手玉に対する利きがKKPなのではないかと思い至ってしまいました。 持ち駒の点数は駒種毎に固定で振られていて、駒同士のぶつかりによる優劣 特に駒交換はmin-Maxにて補間しているのかなと。評価関数自体は意外と単純 な事しか学習していない感じで、探索で補っている部分が大きいように感じます。 こうやって見ると、上手く単純化しているなぁと。 自分で勝手に想像した内容に感心してしまいました。 ただ、これならこれで、自玉KPと相手玉KPの合算で、2駒関係に次元を落とせ そうではないかと思ってしまいました。まあ、無理なんでしょうけど。 自分がやる上での一番のネックは、オセロの評価関数が点数だったために、 なんちゃって強化学習しかやった事がな点ですね。あと、みなさんライブラリ化 されていて、それに則れば色々な人の考えた高速化・高効率化のネタが利用 できる点で、一から車輪の再発明していては追い付けないよなぁと。
- 342 名前:535 mailto:sage [2018/04/21(土) 20:39:59.86 ID:8g8p+RpI.net]
- ほう、将棋に進出ですか。
将棋AI界はオープンソースが進んでる感じなんですかね。
- 343 名前:535 mailto:sage [2018/04/21(土) 20:50:54.10 ID:8g8p+RpI.net]
- alpha zero のパクりプログラムgithubから丸パクしてきたわけだけど
そろそろちゃんとソース読み解いてみようかな。難しいだろうけど 丁寧な解説がどこかにあればいいんだけどね
- 344 名前:535 mailto:sage [2018/04/22(日) 17:35:27.70 ID:QOhFsFyf.net]
- お、AIが7作った。
いままではわざと負けようとしても勝ってくれなかったけど今回は勝ってくれた。 まだまだ弱いけどもっと学習させてみよう
- 345 名前:535 mailto:sage [2018/04/22(日) 19:13:47.98 ID:QOhFsFyf.net]
- 俺も学習見守るだけで暇になっちゃったからなんか始めたいけど
計算リソースが学習にもってかれちゃってるからそこどうするか。 やっぱPC新調か? グラボも効果あるみたいだし今度はGeforce 1080 Tiとか試してみたいな。 金がないけど。
- 346 名前:310 mailto:sage [2018/04/22(日) 19:48:13.41 ID:wf3ukgDl.net]
- だよね。自分も脳内妄想で我慢です。
PC新調しちゃうか思いっきり悩み中。
- 347 名前:535 mailto:sage [2018/04/25(水) 20:09:35.29 ID:QZIUF0Ri.net]
- もっとネットワーク大きくしてみたいな。
でもさらに学習時間がかかると思うと躊躇する。
- 348 名前:535 mailto:sage [2018/04/27(金) 21:32:10.80 ID:b1G/gV5U.net]
- お、損失が3点台だったのが2点台になった。
いい感じなんじゃないでしょうか?
- 349 名前:535 mailto:sage [2018/04/28(土) 17:38:12.12 ID:MUOfiFNK.net]
- ジムケラーがインテルに来たとか。
いいCPU作ってくれるならどこでもいいけどね。
- 350 名前:535 mailto:sage [2018/04/29(日) 20:30:57.65 ID:mX318X6T.net]
- 序盤は素晴らしい棋理の芽生えを感じるが、いかんせん終盤がなぁ
ほかのアルファゼロクローンも似たような感じなのだろうか?
- 351 名前:535 mailto:sage [2018/04/29(日) 20:50:13.18 ID:mX318X6T.net]
- 公式AIともやってみたけど序盤センスは互角以上と感じられる。
実際、必至をかける一歩手前まで行った。 終盤力さえ磨かれればおそらく公式AI越えはある。
- 352 名前:535 mailto:sage [2018/04/30(月) 22:51:47.16 ID:qAJqtYoj.net]
- 学習が1000エピソード突破。
1500が規定値だから最後まで回したいな。
- 353 名前:535 mailto:sage [2018/05/01(火) 21:34:25.66 ID:bYHVWZMu.net]
- もっとパワー、速度が欲しいな。
こんなことなら最初から1080 Ti いっときゃ良かったかな?
- 354 名前:535 mailto:sage [2018/05/03(木) 10:58:16.57 ID:gNd8xJ5s.net]
- ちょっと思うところがあって、思い切ってネットワーク大きくしてみました。
学習最初からやり直しです。 さて吉と出るか凶とでるか。
- 355 名前:535 mailto:sage [2018/05/03(木) 13:28:58.30 ID:gNd8xJ5s.net]
- ん、ネットワーク構成変えたら学習率もいじらないと上手くいかないのか?
ネットワークでかくしたら学習率は大きくすればいいのか小さくすればいいのか…
- 356 名前:535 mailto:sage [2018/05/03(木) 13:42:41.42 ID:gNd8xJ5s.net]
- ネットワークでかくしたら学習率は小さくするのがいいみたい?
- 357 名前:310 mailto:sage [2018/05/03(木) 20:31:46.75 ID:EAR7zekO.net]
- なんか順調でうらやましい。
俺もやっぱGPU付きのPC買うべかな。 一般的にLRでは、学習率は発散しない限界まで大きくするのが良いらしく、 昔は、最初大きく、試行回数増えるごとにだんだん小さくみたいな事をしてました。 NNではRMSPropとかADAMとかで自動調整する流れだと当時理解していました。 ただ、Googleの論文読むと、普通に学習率固定っぽく読めてしまうんですよね。 強化学習だと学習率固定が良いのかも知れません。 表現力大きいからあんまり問題ない気がするのですが、学習率は小さくすると 学習に時間がかかる代わりに、収束しやすくなります。局所解には陥りやすく なるのではないかと愚考しますが、強化学習における局所解と、教師付学習に おける局所解は現象が違うから、よくわかりません。
- 358 名前:310 mailto:sage [2018/05/03(木) 20:37:19.91 ID:EAR7zekO.net]
- こちら、例によってひたすら分岐付き記譜を作成しています。
空きマス27の所(完全読みとしては26)のところから、計算時間が案の定すごく かかるようになってしまって、遅々として進まなくなりました。 最後の手段でとっておいた、UCT探索で仮PV作成し、それでmtd(f)にて評価値を 迅速に確定して、その評価値で正しいPVを求めるという流れにしたところ、恐らく 数倍程度に高速化され、それによって記譜が集まり正確になる事で、評価関数の 精度が上がって、仮PVが正確になりという好循環に、ようやく入る事ができました。 ただ、それでもまだ時間はかかるというか、今空きマス28まで持っていったら、 また時間がかかる地獄に入りそう。最低でも空きマス30までは持っていきたい。 つか、待っている時間が長い…セカンドPCが欲しい。
- 359 名前:310 mailto:sage [2018/05/03(木) 20:41:41.51 ID:EAR7zekO.net]
- >>351
>数倍程度に高速化され あくまで仮PVが数手分合っている時の話で、仮PVが間違っていると、 むしろ遅くなる可能性があります。 あと、一つの局面に対し、最善手が複数あるケースでは、例えば最善手 が2つあると2倍程度時間がかかるという問題があるのは認識していて、 対策は可能なのですが、そうするとバグった時にβカットのエラーを吐か ないという恐ろしい状態になってしまうので躊躇しています。
- 360 名前:310 mailto:sage [2018/05/04(金) 19:57:24.12 ID:5CQB8Di3.net]
- 世界コンピュータ将棋選手権の2次予選までで強さをみせつけている
T.N.K(通称たぬき)ですが、DL勢にして高速評価関数という事なので アピール文書を見てみました。 これ、CNNではなく、全結合のDeep Networkの模様。追加で論文も 出ているので、見たところ5層のMLPです。 入力層に玉との2駒関係を使っていて、そこは計算量が多いので、 ここだけ差分計算で高速化しているとの事。自分は行列をEigenに 任せちゃってるので差分計算していませんが、オセロでも結構使え るはず。 もう一度オセロをMLPに拡張したくなってきた(汗
- 361 名前:535 mailto:sage [2018/05/07(月) 20:19:04.83 ID:m+uVPKyG.net]
- ネットワーク大きくすると学習が収束する確率下がるんですかね?
なんか学習がうまく進んでないようです。
- 362 名前:535 mailto:sage [2018/05/08(火) 00:21:37.96 ID:VKk6NsC2.net]
- もしかして学習率だけでなく、ほかのパラメータにも手を加えなければならないってことですかね?
- 363 名前:310 mailto:sage [2018/05/08(火) 01:01:09.30 ID:6noaUyVY.net]
- バックプロパゲーションで計算している以上、深さが深くなると、
その分初段まで誤差を遡らせるのに時間がかかるから、収束が 遅くなって当然かと思います。 あと、初期値のランダム値の幅も、適切に設定しないとなかなか 収束しなくなりますし、それでも初期値の運が悪いとまったく収束 しないなんて事もあり、ちょこっと不安定なところがあります。 XavierとかHeとか初期値の設定項目はありませんか? 本で読んだ知識なので、現実にどれくらい影響するのか良くわかりませんが(^^;
- 364 名前:535 mailto:sage [2018/05/08(火) 19:21:19.88 ID:3yhYJr6O.net]
- おお、ありがとうございます。
しらべてみます。
- 365 名前:535 mailto:sage [2018/05/09(水) 21:58:37.29 ID:53SriW94.net]
- パソコン壊れたかと思ったが放電したらなおった
あー怖かったTT
- 366 名前:535 mailto:sage [2018/05/10(木) 20:05:15.86 ID:X+P+UxO/.net]
- 学習率の変動率?を下げたら結構うまく動いてるっぽいです。
- 367 名前:535 mailto:sage [2018/05/11(金) 20:15:31.62 ID:TPpBGuAT.net]
- loss とか entropyはいい感じに減ってるのに自己対局の結果がついてこないですね。
うーん、なんだろう?
- 368 名前:535 mailto:sage [2018/05/12(土) 17:16:50.40 ID:UY4N1vvW.net]
- いや、自己対局もちょっとづつ改善してるみたいです。
もっと時間が必要かな。
- 369 名前:535 mailto:sage [2018/05/13(日) 18:33:11.99 ID:jNzVm6ts.net]
- windowsがたまに夜中に勝手に再起動してしまうんだが?
マジむかつく(怒
- 370 名前:310 mailto:sage [2018/05/13(日) 19:53:17.92 ID:i+O998yE.net]
- Windows Updateかな?
俺は通知もらうだけにして、タイミング見て自分で再起動かけてる。 まあ、24時間経つとカウントダウンが始まるので、早目に再起動する事になるけど。
- 371 名前:535 mailto:sage [2018/05/16(水) 19:41:44.02 ID:zhHRqcbt.net]
- いままで50エピソード毎に自己対戦してたけど、自己対戦がかなり重いから200エピソード毎に自己対戦にしたらなかなかいい感じ。
- 372 名前:535 mailto:sage [2018/05/16(水) 20:52:45.23 ID:zhHRqcbt.net]
- ネットワーク大きくしても詰めが甘いのはかわらないです
- 373 名前:ヒorz.
公式AIに勝つチャンスあったのに勝ちを逃してしまいました。 [] - [ここ壊れてます]
- 374 名前:310 mailto:sage [2018/05/17(木) 20:16:35.67 ID:3wU0adoY.net]
- Surfaceの電源ケーブル、そろそろ断線しそうだなぁと思っていたら、
PCをひょいと動かした瞬間に、まさかの電源落ち。 ウェイトデータ書き込み中に停まらないように色々工夫していても、 この手の落ちには対処できるわけもなく、また大変に運が悪い事に またしても後半10ステージ程度のウェイトデータが飛んでしまい ました。バックアップとっていたのですが、気づかずにいたので、既に 上書き済みという罠。 後ろ10ステージ分のみゼロクリアして、そこだけ今のデータで再度 学習する羽目になりました。 orz
- 375 名前:535 mailto:sage [2018/05/17(木) 20:37:00.03 ID:anbc4vLN.net]
- 乙w
- 376 名前:535 mailto:sage [2018/05/17(木) 23:06:00.81 ID:anbc4vLN.net]
- これはNew マシンを買えとの神のお告げww
- 377 名前:535 mailto:sage [2018/05/18(金) 20:48:52.38 ID:UxmUzKYy.net]
- まただよw(再起動)
- 378 名前:名前は開発中のものです。 mailto:sage [2018/05/18(金) 21:21:28.72 ID:UxmUzKYy.net]
- 藤井聡太さんが7段昇格とか。
凄すぎ
- 379 名前:535 mailto:sage [2018/05/19(土) 20:01:16.80 ID:PB1pw3rI.net]
- むう、AlphaZeroのポテンシャルはこんなものではないはずだが。
でも100万局くら学習させないと真価は発揮できないかもなぁ。
- 380 名前:535 mailto:sage [2018/05/20(日) 23:46:47.79 ID:A2GqvvmZ.net]
- 19路囲碁だと20層くらい層がないと駄目だとか。
うーん20層は厳しい。。。
- 381 名前:310 mailto:sage [2018/05/21(月) 20:17:29.25 ID:aDShJzMX.net]
- 畳み込み窓が3×3で、隣との関係を1マス分づつ認識しているとすると、19路で
19層必要で、出力の全結合層つけて20層って事なのかなぁ。 あとフィルタ数も大事だと思う。フィルタで認識する特徴の種類が決まっていると思う。 なんとなくだけど、こう仮定している。検証はしていない(汗
- 382 名前:535 mailto:sage [2018/05/21(月) 21:00:41.57 ID:9qAF6usq.net]
- いまのところ192 * 6 でやってます。
9路だから192 * 10 にすればよかったかなぁ
- 383 名前:310 mailto:sage [2018/05/22(火) 20:12:53.71 ID:do1nJaPu.net]
- 五目系なら、周辺5マスが把握できていればよいかもよ。
比較検証しなきゃわからんけど。
- 384 名前:535 mailto:sage [2018/05/22(火) 20:18:42.34 ID:025jAm4L.net]
- うーん、そうなんですか?。
ライフゲーム囲碁はもろ周辺5マスなんですけどね。 囲連星成功したらライフゲーム囲碁もやりたいですね。
- 385 名前:535 mailto:sage [2018/05/23(水) 23:49:25.39 ID:z+TgzaXz.net]
- くそ〜何時まで経っても一手の重みみたいなものを理解してくれないorz.
なんか足の遅い打ち方するんだよなぁ。 もういっそ20層にしちゃおうかな orz
- 386 名前:535 mailto:sage [2018/05/24(木) 20:38:02.47 ID:g5FOS6wP.net]
- ん、ちょっとづつだけど強くなってる気がする。。。
くそ〜Googleの計算リソースがあれば30分くらいで名人超えるんだろうけど。。。
- 387 名前:535 mailto:sage [2018/05/24(木) 20:57:44.30 ID:g5FOS6wP.net]
- 自己対戦が勝率100%行ってしまいました。
対戦相手も更新されていくなら勝率100%は行かないと思うんですが。 もともとの実装がなにかおかしいのだろうか…
- 388 名前:535 mailto:sage [2018/05/25(金) 23:18:10.63 ID:Wo9ACErv.net]
- まだ公式AIに勝てないけど毎日ちょっとづつ進歩しているのは感じる。
まだ希望はある。
- 389 名前:535 mailto:sage [2018/05/26(土) 20:20:48.78 ID:qA0Nw26t.net]
- Alpha Zeroのアルゴリズムは囲連星よりもライフゲーム囲碁に向いてる気がする。
- 390 名前:535 mailto:sage [2018/05/26(土) 21:33:20.38 ID:qA0Nw26t.net]
- FacebookがELF OpenGoというのを公開したとか。
プロ棋士にも勝てるみたいですね。
- 391 名前:535 mailto:sage [2018/05/27(日) 19:07:25.97 ID:kULpg0Pw.net]
- ELF OpenGo もGPU 2000台とか使わないと強くならないみたい?
は〜絶望する。
- 392 名前:535 mailto:sage [2018/05/28(月) 22:00:33.18 ID:hqRKJ+dG.net]
- 昔のLeela zeroもそうでしたがシチョウが読めてないっぽいですねぇ
- 393 名前:535 mailto:sage [2018/05/28(月) 22:12:43.53 ID:hqRKJ+dG.net]
- でもちょっとづつでも確かに前進してる気がします。
ロールアウトの回数増やしたら学習の質も上がるかなぁ? やってみるか。。。
- 394 名前:535 mailto:sage [2018/05/29(火) 20:13:27.71 ID:LETTkqJf.net]
- ん、lossとentropyがかなり増えてますね。
ロールアウトを増やしたえいきょうだろうか?
- 395 名前:535 mailto:sage [2018/05/29(火) 21:44:21.56 ID:LETTkqJf.net]
- ネットワークを192 * 20 にしたい衝動に駆られるw
危険な賭けだが…
- 396 名前:535 mailto:sage [2018/05/30(水) 22:20:56.63 ID:s+sw+z1r.net]
- キタ━━━━━━(゚∀゚)━━━━━━ !!!!!
公式AIに初勝利! 内容としては相手のミスに助けられただけだけどそれでも格段に進歩してる! ( ;FF[1]GM[1]SZ[9] ;B[fe];W[fc];B[de];W[dc];B[ed];W[ec] ;B[gc];W[gb];B[ee];W[cb];B[ce];W[hb] ;B[ge];W[fh];B[be];W[gd];B[he])
- 397 名前:535 mailto:sage [2018/05/31(木) 22:06:07.55 ID:CLpDRjz4.net]
- 惜しい!惜しいなぁ。
中盤まで内容は圧倒しておきながら最後の盤端のシチョウが読めずに逆転負け。 学習途中のAlpha Zero系の弱点が出てしまいました。 でも、ここ克服したら100戦100勝もあり得るかも。 ( ;FF[1]GM[1]SZ[9] ;B[df];W[fe];B[de];W[cg];B[ef];W[hg] ;B[ff];W[gf];B[cf];W[gd];B[fg];W[gh] ;B[dg];W[gc];B[gg];W[ge];B[dc];W[hb] ;B[dd];W[dh];B[db];W[da];B[eh];W[ha] ;B[eg];W[hc];B[he];W[ie];B[hf];W[if] ;B[hd];W[id];B[he];W[ch];B[hf];W[hd] ;B[he];W[hf];B[di];W[he])
- 398 名前:535 mailto:sage [2018/06/01(金) 22:15:38.64 ID:i1DTZ7p0.net]
- 本来負けてたはずのゲームですが逆転勝利しました!
以前より大分、棋理のようなものが身についてきている感じがします。 ロールアウト増やしたのが効いたかな? ( ;FF[1]GM[1]SZ[9] ;B[df];W[fb];B[ef];W[ff];B[fe];W[ge] ;B[fg];W[gf];B[gg];W[cg];B[cf];W[hg] ;B[fd];W[gd];B[gc];W[hc];B[fc];W[hb] ;B[hf];W[hd];B[he];W[eg];B[dg];W[hh] ;B[eh];W[eb];B[dd];W[gb];B[db];W[dc] ;B[ec];W[de];B[cc];W[bc];B[ed];W[id] ;B[ce];W[ie];B[ei];W[bh];B[ee];W[ba] ;B[eg])
- 399 名前:535 mailto:sage [2018/06/02(土) 21:54:09.55 ID:GZGHIXxE.net]
- ぼちぼちウインドウズに移植することも考え始めなければ…
- 400 名前:535 mailto:sage [2018/06/04(月) 20:50:12.16 ID:Hw4HpbU5.net]
- 毎日棋風がすこしずつ変わっていくな。
面白い。 3線を重視し始めたようだ。
- 401 名前:535 mailto:sage [2018/06/04(月) 21:29:44.63 ID:Hw4HpbU5.net]
- なんかネットワークの規模が足りてない気がしてきたわ。orz orz orz
一気に256 * 20くらいに増やしてみようかな? 気が早いかな〜
- 402 名前:535 mailto:sage [2018/06/04(月) 21:42:52.90 ID:Hw4HpbU5.net]
- うーん、どうせやり直すなら早いほうがいいよね?
でもこのまま学習続けたら何が起こるかも知りたいし… 悩ましい。
- 403 名前:535 mailto:sage [2018/06/04(月) 22:55:50.50 ID:Hw4HpbU5.net]
- 思い切ってネットワーク構成を256 * 24 にしました。
激遅になりそうだが…
- 404 名前:535 mailto:sage [2018/06/04(月) 23:05:36.60 ID:Hw4HpbU5.net]
- ネットワークを192 * 6 から 256 * 24 にしたら計算量は(256*24)/(192*6)=5.333倍であってる?
まさか指数的に計算量増えたりしないよね?
- 405 名前:535 mailto:sage [2018/06/04(月) 23:18:15.88 ID:Hw4HpbU5.net]
- メモリが足らんといわれたぜwww
12GBも割り当てたのにwwww こりゃニューマシン買うしかないな。
- 406 名前:535 mailto:sage [2018/06/05(火) 00:01:42.42 ID:2ipfQYrF.net]
- とりあえず、64 * 24 にしてみました。
これでも6GB位メモリ食う。 まじでスレッドリッパーに128GB積みたい衝動に駆られるw
- 407 名前:535 mailto:sage [2018/06/06(水) 21:01:18.82 ID:/EVpmksK.net]
- やっぱ24層は無理かもorz
全然学習が進んでるように見えないorz
- 408 名前:310 mailto:sage [2018/06/06(水) 21:38:17.47 ID:dXECgVmr.net]
- 残り28手のところで1か月足踏み。やっと記譜がたまってきた。
残り30手まで行くのに半年くらいかかりそうw というか、まだまだパターンが足りていないかも。 >>396 隠れ層のサイズは2乗で効いてくるから、256^2/192^2。 深さは単純に計算量が4倍になるとして、ざっと7倍くらいになるのでは? 学習は深さが増えるとどんどんきつくなるかと。 誤差逆伝播の宿命です。
- 409 名前:535 mailto:sage [2018/06/06(水) 22:38:14.91 ID:/EVpmksK.net]
- >隠れ層のサイズは2乗で効いてくるから
おお、そうなんですか。ありがとうございます。 >学習は深さが増えるとどんどんきつくなるかと。 24層は諦めました。 今12層くらいで試行錯誤しています。
- 410 名前:535 mailto:sage [2018/06/07(木) 00:15:51.92 ID:FD/EuCH4.net]
- うーん、極めて微妙なバランス調整を強いられるのか?これは
- 411 名前:310 mailto:sage [2018/06/07(木) 22:47:08.28 ID:3tsX2weq.net]
- マシンパワーが潤沢にあれば、かなり大きいネットワークから学習させて、
最低限どれくらいの大きさなら弱くならないかが求められるんだけどねぇ。 Googleみたいに。
- 412 名前:535 mailto:sage [2018/06/07(木) 22:50:20.44 ID:FD/EuCH4.net]
- そういえば新しいスレッドリッパーは32コアになるとか。
うーん欲しい。
- 413 名前:310 mailto:sage [2018/06/08(金) 09:01:40.50 ID:kLQfp5L9.net]
- 今見た。64スレッドだってw
- 414 名前:535 mailto:sage [2018/06/08(金) 21:09:32.65 ID:sd8J+TAa.net]
- あんまりうまくいかないから気分が萎えてきちゃった。
少し気分転換するか…
- 415 名前:535 mailto:sage [2018/06/09(土) 22:29:54.70 ID:E47zq0gI.net]
- 層を9層に減らして再チャレンジ
どんどん後退していくが仕方ない
- 416 名前:535 mailto:sage [2018/06/10(日) 22:48:39.36 ID:vDwVPN5j.net]
- Googleが無料で12時間のクラウドGPUを提供してるとかなんとか
https://www.tdi.co.jp/miso/google-colaboratory-gpu
- 417 名前:535 mailto:sage [2018/06/11(月) 20:34:52.58 ID:CmwqwxJa.net]
- くそーどうにもうまく行かね〜
一回試すのに結構時間かかるのも痛いorz
- 418 名前:535 mailto:sage [2018/06/12(火) 18:16:53.37 ID:ZNBJ6nca.net]
- あんまり上手くいかないんで頭おかしくなりそう
ちょっと休憩します
- 419 名前:310 mailto:sage [2018/06/12(火) 22:17:08.85 ID:tW9CPEWd.net]
- NNの罠ですな。
自分が逃げたのは、それです(汗
- 420 名前:535 mailto:sage [2018/06/12(火) 22:59:32.98 ID:0htatJhS.net]
- >>411 くそー
パラメータ100種類くらい用意して同時に実行したい orz
- 421 名前:535 mailto:sage [2018/06/15(金) 20:18:16.05 ID:8McWyxkP.net]
- CPU Ryzen 2700X
GPU Geforce 1080 Memory 64GB SSD 500GB これを満たそうとするとやはり40万円近くなる。 厳しい。
- 422 名前:535 mailto:sage [2018/06/15(金) 23:05:29.07 ID:8McWyxkP.net]
- フロンティアってショップかなり安くない?
なんか裏があんのかな?
- 423 名前:310 mailto:sage [2018/06/16(土) 09:22:12.72 ID:zNyAzUlc.net]
- フロンティアと言えば懐かしのフロンティア神代(こうじろう)かなと思ったらビンゴでした。
Wikipedia情報によると、フロンティア神代はヤマダ電機に吸収されて解散していて、 BTOショップにフロンティアという名前だけ残っているみたいです。 ヤマダ電機なので裏は無いでしょうね。 7980XEに1080Tiで128Mとかにしていくと、だいぶ価格差は詰まっていきますが、 それでも多少安いみたいですね。というか、8700Kだったらかなり安いかも。
- 424 名前:535 mailto:sage [2018/06/16(土) 23:00:41.95 ID:Xmjs3i0Q.net]
- pytorchってAMDのGPU使えないよね?
Cudaだよね?
- 425 名前:535 mailto:sage [2018/06/16(土) 23:08:34.52 ID:Xmjs3i0Q.net]
- 多層を重ねるのは諦めてフィルタ数で勝負というのもあるだろうか?
- 426 名前:535 mailto:sage [2018/06/17(日) 20:06:40.29 ID:S/cw4ZOV.net]
- 実はこっそり再開してましたが9層からさらに後退すべきか悩んでます。
ここから1層づつ減らしていって学習がまともに進むところまで後退するのを考えています。
- 427 名前:535 mailto:sage [2018/06/18(月) 21:07:45.14 ID:Wo5CnXra.net]
- 8層も望み薄
7層は囲連星が7目並べだからあるいみちょうどいいかも?
- 428 名前:535 mailto:sage [2018/06/18(月) 23:34:21.39 ID:Wo5CnXra.net]
- お、7層はうまくいくかも
まだわからないけど
- 429 名前:535 mailto:sage [2018/06/18(月) 23:35:41.11 ID:Wo5CnXra.net]
- でも6層でだめで7層でOKというのもちょっと考えづらいといえば考えづらいんだよなぁorz.
- 430 名前:310 mailto:sage [2018/06/19(火) 00:55:25.28 ID:FOfYGuya.net]
- ゲームとして必要最低限と思われる最低限の層数から1層づつ増やして行って、
一つ前の奴に有為に勝てる様になるまでの学習時間を図っていくという手もある かなと思います。 面倒でやりたくないですが。 自分はひたすら記譜作成。 少しづつ改良を加えていますが、残り28手(読み切りとしては27手)で足踏みして います。早ければ6分程度で終わるのですが、いかんせん25〜26手目の評価 関数が穴だらけみたいで、長いと4時間とかかかってしまい、なかなか棋譜が集め 切れません。記譜が集まると速くなるのですが、集まるまでの時間がかかりすぎ。
- 431 名前:535 mailto:sage [2018/06/19(火) 22:25:49.15 ID:pDwqV+QB.net]
- パラメータ調整ってプログラミング本来の楽しみがほとんどなくてそこが辛い。
とくに他人のコードだと。 弱くてもオリジナルのヒューリスティック実装するのは楽しいんだよなぁ。 うーん。
- 432 名前:310 mailto:sage [2018/06/19(火) 23:13:29.58 ID:FOfYGuya.net]
- すごくわかりますorz
だから、非効率でも、自分でNNのライブラリ作っちゃおうとしたりするのでする。
- 433 名前:535 mailto:sage [2018/06/20(水) 20:38:16.59 ID:HpjQCtCz.net]
- 7層も駄目っぽいorz orz orz
もう少し粘るか悩むorz orz orz
- 434 名前:535 mailto:sage [2018/06/20(水) 21:21:48.36 ID:HpjQCtCz.net]
- そこそこ上手くいってた6層のバックアップを引っ張り出して続きの学習をさせてみることにしました。
結局、全部無駄だった orz orz orz
- 435 名前:310 mailto:sage [2018/06/23(土) 00:43:44.99 ID:MYOaLSBl.net]
- 長いと4時間…
出張中に丸48時間動かしっぱなしにしましたが、3つしかできなかった。 一つ16時間w
- 436 名前:535 mailto:sage [2018/06/24(日) 23:17:32.46 ID:+0RpmqDG.net]
- なんか異様に辺の星を重視するようになった。
ちょっと単純化しすぎな気がするが、やっぱ層が足りてないのか?
- 437 名前:535 mailto:sage [2018/06/25(月) 20:09:56.17 ID:EkJF+fRZ.net]
- んあ、なんか一線打つようになった?
過学習かなんかか?
- 438 名前:535 mailto:sage [2018/06/25(月) 20:42:46.09 ID:EkJF+fRZ.net]
- 結局6層も駄目なのかなぁ orz orz orz
アルファゼロのポテンシャルはこんなものではないはずだが。orz orz orz
- 439 名前:535 mailto:sage [2018/06/25(月) 21:48:22.04 ID:EkJF+fRZ.net]
- もうちょっと粘ってみるけど、アルファゼロ(少なくとも>>214のプログラム)からの撤退も考え始めてるorz orz orz
- 440 名前:535 mailto:sage [2018/06/26(火) 21:04:26.12 ID:1tkUkpm5.net]
- お、一線に打つのは治ったようです。
- 441 名前:535 mailto:sage [2018/06/27(水) 21:01:58.89 ID:dPu535sz.net]
- お、すごい!
まだ詰めはあまいけど、まるで地を取ることはいいことだという棋理を理解したような打ち方で勝った! まだ希望はある! ( ;FF[1]GM[1]SZ[9] ;B[ee];W[eg];B[ec];W[ff];B[gd];W[dg] ;B[cd];W[cg];B[fd];W[dd];B[de];W[fh] ;B[gg];W[gh];B[hh];W[gf];B[hg];W[dc] ;B[hf];W[bg];B[he];W[ah];B[hc];W[hd] ;B[id];W[ba];B[hb];W[bi];B[hd])
- 442 名前:535 mailto:sage [2018/06/28(木) 21:14:27.14 ID:Owd80tJ7.net]
- まただよ(再起動)
- 443 名前:535 mailto:sage [2018/06/28(木) 21:14:59.02 ID:Owd80tJ7.net]
- ネイティブリナックスにしたら再起動なくなるんだろか
- 444 名前:535 mailto:sage [2018/06/29(金) 21:22:30.04 ID:24sRxbs9.net]
- ふと思ったけど詰みルーチンをルールに組み込んで詰みがあるときは詰みを打たなきゃいけないルールにして学習させて
十分学習したら詰みルールを外したら学習時間短縮できたりしないんだろうか? ルールが違ったら全く重みが役に立たなくなっちゃうかな?
- 445 名前:535 mailto:sage [2018/06/29(金) 22:02:45.79 ID:24sRxbs9.net]
- 2線を重視し始めたようです。
毎日棋風が変わっていくな。 AIが自らいろいろ試してるみたいでホントに知性があるかのような錯覚を覚える。
- 446 名前:535 mailto:sage [2018/06/29(金) 22:37:39.80 ID:24sRxbs9.net]
- 相変わらず隅のシチョウが読めてないですね。
7連を作るにはほぼ必須なので克服してほしい。
- 447 名前:535 mailto:sage [2018/06/30(土) 22:29:57.74 ID:8vhkC7kM.net]
- 圧勝の形勢を築いておきながら隅の石が取れずに逆転負け。
ここは何としても克服せねばなりませんなぁ。 ( ;FF[1]GM[1]SZ[9] ;B[hh];W[df];B[cg];W[fg];B[gc];W[ef] ;B[gf];W[ge];B[cc];W[fc];B[ce];W[ed] ;B[cf];W[cd];B[bd];W[dd];B[bc];W[bh] ;B[bg];W[ff];B[fb];W[eh];B[ec];W[fi] ;B[fd];W[dc];B[db];W[
- 448 名前:eb];B[ea];W[cb]
;B[bb];W[dh];B[be];W[bf];B[ca];W[gb] ;B[cb];W[ch];B[gh];W[hb];B[de];W[ee] ;B[af];W[ba];B[fh];W[hc];B[ah];W[hd] ;B[eg];W[dg];B[gg];W[fe];B[ei];W[gd] ;B[ig];W[bi]) [] - [ここ壊れてます]
- 449 名前:310 mailto:sage [2018/07/01(日) 09:58:13.46 ID:rTgUJVKi.net]
- 強化学習は一通り失敗をして、ダメな手を覚えていくものですからね。
- 450 名前:310 mailto:sage [2018/07/01(日) 16:25:08.28 ID:rTgUJVKi.net]
- 過去に途中でプログラム止めて、中途半端な状態になっている記譜(棋譜としては
成立しているけど、他の記譜との接点が無い)を見つけて、続きを実行するような 仕組みを作りました。 これで心置きなく途中で止められる。
- 451 名前:535 mailto:sage [2018/07/01(日) 23:21:40.95 ID:1CvUBjWR.net]
- いったん学習中断します。
気分を変えて囲連星やめてライフゲーム囲碁に逃げようかと思ってます。 プログラムもgithubから別の拾ってこようかと思います。 マルチスレッドに対応してて大規模ネットワークを想定してそうな奴。
- 452 名前:535 mailto:sage [2018/07/04(水) 19:57:24.45 ID:t+xDGMvg.net]
- githubに落ちてて大規模ネットワークに対応してるとなるとleela zero とかだろうか?
- 453 名前:535 mailto:sage [2018/07/04(水) 21:32:30.05 ID:t+xDGMvg.net]
- とりあえずAQって囲碁ソフトのソース見てます。
- 454 名前:535 mailto:sage [2018/07/04(水) 21:43:59.79 ID:t+xDGMvg.net]
- んんん、AQってヒューリスティックてんこ盛りなんですかね?
他ゲームに応用が利かなさそうな怪しげなコードが見受けられるw シチョウのコードとかあるっぽいし。 つっても囲連星なら応用効くだろうけど。 逆に19路囲連星に走るというのも考えられるw
- 455 名前:535 mailto:sage [2018/07/04(水) 23:19:04.05 ID:t+xDGMvg.net]
- あかん、これは相当キツイわw
まあ勉強にはなるかもしれんがモノになるかは微妙だww
- 456 名前:535 mailto:sage [2018/07/08(日) 22:10:22.48 ID:cyFrinl7.net]
- がっつりさぼってますw
- 457 名前:535 mailto:sage [2018/07/12(木) 22:46:30.45 ID:sqTgsSS4.net]
- やる気が出なくて、昔作ったモンテカルロのAIを動かしたりしていますが
モンテカルロでも割といい線行ってたんだとちょっと思いました。 なにかもう一度動き出すきっかけが欲しい。
- 458 名前:310 mailto:sage [2018/07/12(木) 23:01:05.40 ID:x4U4b182.net]
- 相変わらずひたすら記譜作成中。
現状の記譜の中に、ランダム着手の記譜が混じっていて、そいつらを 遡るのにものすごく時間がかかる事が経験的にわかっています。 つまり、そこそこ最善に近い手を打っている記譜の遡りは早く、悪い手 ばかりの記譜は遅い。 現状、最善に近い手に対しては、そこそこまともな評価関数になっている という事は言えるので、一旦遡り対象の記譜を消して、この評価関数で 作られる新しい記譜で継続学習させた方が良いかもと思い始めています…。
- 459 名前:535 mailto:sage [2018/07/15(日) 19:54:25.23 ID:I+Rk5Prr.net]
- だめぽ
3連休も無為に過ごしてしまったorz あと一日あるけど
- 460 名前:310 mailto:sage [2018/07/16(月) 22:12:02.39 ID:99JpH5NZ.net]
- 棋譜作成のロジックをだいぶ変更。
過去の奴に当てはめると結構面倒な事になるので、 >>449の予告通り記譜はいったんリセット。 あと、パブリックドロー(残り40手最善)な記譜が いくつか見つかったので、そいつらも棋譜に混入。 もっとパブリックドローな記譜が欲しい。
- 461 名前:535 mailto:sage [2018/07/19(木) 22:43:05.06 ID:7AkuvwH4.net]
- reinforcement learningとやらについてやさしく書かれた書籍ないかなぁ
- 462 名前:535 mailto:sage [2018/07/22(日) 21:40:49.08 ID:W18yPuDN.net]
- 勉強として>>214のソースちゃんと解読してみようかなぁ
やりっぱなしじゃ勿体ないかもしれないし。
- 463 名前:535 [2018/07/23(月) 21:26:02.08 ID:h2uxnpW8.net]
- 熱暴走なのかpcが急に再起動したw
もし学習連続運転してたら火吹いて火事にでもなってたかもな
- 464 名前:535 mailto:sage [2018/07/24(火) 21:22:08.00 ID:65EBIksd.net]
- pcが起動しないorz
電源ボタン押すとファンが少し動いて止まってを繰り返す 暑さで逝ってしまったか?
- 465 名前:535 mailto:sage [2018/07/25(水) 21:55:40.30 ID:P+agX1Gu.net]
- しばらく活動出来ませんねこれは、、、
- 466 名前:310 mailto:sage [2018/07/27(金) 22:29:42.44 ID:yYgmXJLn.net]
- あれれ。大変ですね。
うちは、ここ2〜3日回線ダウンでした。本日ようやくNTTに連絡して再開。 暑さでONUが死んでたみたいです。 棋譜作成は、結局元の棋譜もマージしてしまいました。 おかげさまでえらく時間がかかっています。
- 467 名前:535 [2018/08/08(水) 19:39:47.19 ID:O1x6YwVI.net]
- 活動やめたら楽チンすぎてなかなか復帰する気になれないw
何かに追われるように毎日過ごしてましたからね。 メインマシンも壊れたまんまだし。 それはそうと13日にスレッドリッパー発売ですね。 金がないから買えないけど1ファンとして楽しみにしてます。
- 468 名前:310 mailto:sage [2018/08/09(木) 22:24:55.93 ID:86sArqqe.net]
- 最近はボーっとしながらひたすら棋譜作成です。
そろそろハイクラスPCを買って、完全に放置プレーしようかと思っていたりします。 DCNNに対する興味はすっかり薄れてしまいました。 しばらくはゆっくりしたいですね。
- 469 名前:535 mailto:sage [2018/08/15(水) 22:34:00.44 ID:BoOe3LxW.net]
- NVIDIAからグラボの新作がでるとか。
それを機にPC新調してこのスレに復帰するか…
- 470 名前:535 mailto:sage [2018/08/25(土) 20:51:29.15 ID:rZw/NWPD.net]
- メインマシン復活させようと思ってたぶん壊れたのHDDだと予想して
新しいHDD買ってきて動かしてみたけどはずれだった見たいorz あんまハードウェアのトラブルシュートの経験ないんだよなぁ
- 471 名前:名前は開発中のものです。 mailto:sage [2018/08/26(日) 10:48:28.72 ID:FqCSlXSS.net]
- とりあえず外付の光学ドライブからlinuxの何か適当なデストリで起動させてみるべきでしょ
- 472 名前:535 mailto:sage [2018/08/27(月) 00:06:58.09 ID:JrsDI1JE.net]
- お、レス付いてる。
ありがとうございます。 しかし、BIOSの画面すら立ち上がらない状態なのでどうしたものか…
- 473 名前:310 mailto:sage [2018/08/27(月) 09:30:35.26 ID:QOs+gZK+.net]
- PC新調するとか言って、またプログラムいじってます。
もうやる事はないだろうとか思っても、なんか出てくるんですよね。
- 474 名前:310 mailto:sage [2018/08/27(月) 09:34:46.66 ID:QOs+gZK+.net]
- BIOS上がらないんだとすると、保証期間があるうちに
販売店に持ち込んでチェックしてもらった方が良いかと思う。 ハード障害の切り分けとかスキルとしては面白いけど、今の本題じゃないし。
- 475 名前:535 mailto:sage [2018/08/27(月) 21:13:56.92 ID:JrsDI1JE.net]
- うーん。もう保証書とかどっかいっちゃってますねorz
まあ、やはりここはしばらくお休みをいただいて Geforce 2080のレビューが出るのをまって よさそうだったらPC新調してそれから復帰します。 Geforce人工知能系も強化されてるとのうわさもありますし。
- 476 名前:535 mailto:sage [2018/09/18(火) 20:53:46.52 ID:vzQA+msr.net]
- Geforceの発売が迫ってますね。
性能もいいけど値段もいい値段するとかって話で悩ましいですね。 しばらく様子見か。
- 477 名前:535 mailto:sage [2018/09/21(金) 21:09:54.51 ID:2dO4A596.net]
- 新Geforce、とりあえずpytorchが対応するのかどうか、
対応したとしてどれくらい性能上がるかみきわめてからですかね? 仮に大金だして買うとしても。
- 478 名前:310 mailto:sage [2018/10/02(火) 09:01:31.04 ID:Rgg2Um0o.net]
- ご無沙汰です。
地味に棋譜作成を続けていますが、そろそろ色々と重くなってきたので、 裏で新バージョンを作り始めています。探索に関係ないところは、色々 整理して結構軽くなった(と思う)のですが、探索部分の速度が大幅に 低下してしまって悩み中。 現バージョンとまったく同じ条件で比較したところ中盤探索で3倍弱は遅い。 比較してないけど終盤探索は下手すると10倍近く遅い感じ。 中身はほぼ一緒なので、何が原因で遅くなっているのか不明。 コンパイルオプションなんかは一緒。共通で使用しているclassのどこかに 原因が潜んでいそうなんだけど、違いが見当たらない…
- 479 名前:310 mailto:sage [2018/10/02(火) 23:18:16.56 ID:odJoEjbT.net]
- まさかまさかの__vectorcallが原因だった。
全部取っ払ったら中盤探索については逆に速度30%アップ。 変な事考えないでコンパイラに任せましょうというお話でした。
- 480 名前:310 mailto:sage [2018/10/10(水) 09:51:58.44 ID:+G+W4fz+.net]
- 28コア56スレッド…
18コア36スレッドが安くなるかなぁ。 棋譜作成を新バージョンに乗り換えました。 全体的に速くなる修正については、10〜20%程度なので効果不明。 あと特定の条件で遅くなる原因を見つけて地味に潰しています。 後者については、一つ原因わかっていて直しようが無いものが。 並列処理にPPL使っているのですが、parallel_forではせっかく並び替えしても ランダムに処理が走ってしまう事。ybwcなのでPVを最初に実行する事は保証され ているのですが、PVが間違っていた時に、parallel_for内部で2番目の順位の スレッドがいつキックされるのかわからないどころか、最悪一番最後の可能性も ある点です。null window searchでβカットに強く依存しているので、ここは非常に 困ります。 解決策1)parallel_forの改良版を自分で書く 解決策2)スレッド数の多いPCに乗り換えて、この問題が起きる確率を下げる どうしよう(汗
- 481 名前:535 mailto:sage [2018/10/12(金) 21:02:40.65 ID:ji0aAVVe.net]
- 9900Kも結構面白いかも?
結局新PC購入に踏み切れてないけど、 来るべきその日のためにGithub漁るところから再スタートしようかなぁ
- 482 名前:310 mailto:sage [2018/10/12(金) 23:00:16.66 ID:CTNeLPXP.net]
- 結局あきらめて解決策3)初段のみYBWCのお兄さんを2人にして様子を見てます。
forwardのロジック(最善手の手順で着手可能な手を展開)を全面改訂。 今まで降りていく手を、BitboardのLSBに近い方から1つだけ選択してましたが、 これによって局面の偏りが生じていたようなので、全て展開するようにしました。 棋譜の増殖が凄い事になっちゃうんだけど、仕方ありません。 同じ仕掛けでbackwardも書き直し。 Eigenの並列化、リソースモニタ見ても2コアしか使っていない感じ。4コア使う指定 しているのに。謎。 その他、並列化できるところは並列化を検討。 やっぱPC欲しい…12コアくらいでも良いかという気がしてきた。
- 483 名前:310 mailto:sage [2018/10/14(日) 23:06:48.18 ID:Z3+yTgkQ.net]
- 局面の偏りが結構酷い事になっていました。
新しいforwardでは反復深化の評価値を表示するようにしたのですが、探索が進む ほどに0になっていきます。そこで盤面のパターンが一回も出てこないケース(0値) を調べたところ、後ろの方が大量に…。前回書いたLSB問題の影響がかなり大きい という事です。 というわけで、棋譜作成の時には、少なくとも複数選択しあるときにはランダムに 選択するように変更し、既存の棋譜については、仕方がないので後ろの方をランダム を導入した仕組みで再探索したものを追加していく事にしました。 1件1秒程度でできるので、折に触れてランダム化していこうと思います。 全部展開すると件数が大変な事になるので、様子を見ながらこの辺でお茶を濁して みようと思います。
- 484 名前:名前は開発中のものです。 mailto:sage [2018/10/18(木) 01:59:08.41 ID:VXZ7Gx+W.net]
- ずっと昔にオセロを作っていた者です。
久しぶりに再燃したので熱があるうちに… 50万棋譜計画のバグっている棋譜、被っている棋譜を消去して、22マス空きからの読み切り訂正をやってます プログラムを3つほど立ち上げて一日9万局…めどは一ヶ月ぐらい 最近寒くなってきたのでちょうどいいかなとw FFO45が32秒ぐらいで、まだまだトッププログラムには及びませんけど、 この棋譜訂正で大幅に縮まらないかと希望を持ちつつ進めてます
- 485 名前:535 mailto:sage [2018/10/20(土) 22:43:08.00 ID:T970svPP.net]
- zen2まで待つのはさすがに待ちすぎかなぁ?w
とりあえずAQのコードに結構詳細なコメントが付いてることにいまさらながら気づいて もう一度チャレンジしてみるかどうか迷ってるところ。
- 486 名前:310 mailto:sage [2018/10/21(日) 22:20:35.21 ID:wV/AjJxk.net]
- >>475
はじめまして。新規参入嬉しいですね。 50万記譜計画の記譜は今はHPからダウンロードできないですね。懐かしい。 評価関数が正しくないと、探索時間かかりますからね。 自分は今は、自作の記譜を後ろから順番に訂正していってます。 が、やはりすごく時間がかかりまするorz
- 487 名前:310 mailto:sage [2018/10/21(日) 22:39:45.97 ID:wV/AjJxk.net]
- 先日、局面の偏りで反復深化で評価値がゼロになっていく件を書きましたが、
もっと大きな問題な気がしてきました。 マイナスの評価値になるはずの局面から、中盤探索を反復深化で深くしていく時、 途中で評価関数的に未知の局面に入って、評価値0を返すようになる事があります。 もともと期待される評価値はマイナスなので、評価値0のルートに乗り換えてしまい ます。どうもこの様な現象が起きる事で、探索を間違える事がありそうです。 これから、デバッグ用のプログラム書いて、現象を確認してみようと思います。 もしかしたら、評価関数の初期値をゼロから始めるのが、良くないのかもしれません。 初期値を−1にすると、未知の局面は−66点(パターンの種類)になるし、1つ2つ 混入したくらいでは、評価値への影響も小さいのかなと思っています。 評価関数のゼロデータを−1にして動かしてみる方が早いかなぁ?
- 488 名前:310 mailto:sage [2018/10/22(月) 22:40:29.62 ID:cyPX+oid.net]
- 一応、ゼロデータをすべて−1に置き換えてみたところ、それなりな感じで、
頻度はだいぶ減りました。が、まだ時々おかしな時があります。 デバッグ用のプログラムが案外簡単にできたので、評価値の計算を確認して みたところ、反復深化の計算のどこかにバグがありそうだという結論に…。 ただ、ほとんどのケースでは正しそうなんだなぁ。
- 489 名前:310 mailto:sage [2018/10/22(月) 22:53:50.11 ID:cyPX+oid.net]
- ソース見てたら、一瞬で判明(汗
ほぼtypoの類でしたorz これで探索少し早くなるかな?
- 490 名前:310 mailto:sage [2018/10/23(火) 01:08:22.60 ID:rwBd0O0t.net]
- ウェイトのゼロデータを−1にしてみましたが、関係なさそうなので0に戻しました。
原理的にはマイナス評価値の問題は起きそうなのですが、評価値ゼロはあまり 発生していない感じです。 残り27手読み切りあたりから今のやり方では追い付かなくなって来ていますので、 MPCモドキの導入を考えています。MPCのスレッショルドの計算を真面目に やると、それだけで日が暮れてしまいそうなので、あくまでモドキですが(汗 置換表から作り直しになるし、記譜作り直しで、まだ27手まで時間がたっぷりある ので、1週間くらいじっくり考えてから始めようかと思います。
- 491 名前:535 mailto:sage [2018/10/28(日) 21:48:30.83 ID:X2c31b1r.net]
- うう、やっぱPCに30万はおいそれと出せないorz orz orz
しかし、何もしないままでただ時間が過ぎていくほうが怖いような気もする。
- 492 名前:535 mailto:sage [2018/10/30(火) 23:21:10.12 ID:pl1cfUhR.net]
- なんかRTXに不具合があるとか何とか
- 493 名前:
マジ? もうしばらく様子見が正解か… [] - [ここ壊れてます]
- 494 名前:310 mailto:sage [2018/11/01(木) 00:10:54.87 ID:D90j6hyj.net]
- MPCですが、完全読み切りをIterative Wideningで速度アップするためのProbCutを
作ってます。とりあえずスレッショルド計算のところまでできました。線形近似と誤差の 標準偏差の計算ですが、以前はループでゴリゴリ計算してました。今回はEigen使って 行列で計算するようにしたら超簡単でびっくりするほど早くなりました。 結局、計算時間の大半は浅い探索になります。 で、結果を見れば見るほど、無理に計算しなくてよいのではないかと思えてきます(汗 誤差は1σ=4〜5程度の固定値。線形近似は、1次係数は1.0で0次の定数(バイアス) を、深さが偶数で+1〜+2、奇数−1〜−2くらい。探索の深さを変えると、誤差は 減っていきますが、あまり頑張るとオーバーヘッドになります。 そもそもIterative Wideningでは、探索精度ではなく、徐々に探索対象を広める事で、 置換表の精度を上げていく事で高速化をしますので、アドホックな値でも良いのかなと。 誤差やバイアスは今の自分の評価関数での値ですが、気が向いた時に再度チェック するくらいで良いのかなと思う次第。 というわけで、大幅に簡素化・定数化して、読み切り処理の方に移る事にしました。
- 495 名前:535 mailto:sage [2018/11/02(金) 23:35:29.24 ID:1vnWpGba.net]
- 9900K発売ですか。
かなり入手困難みたいですね。
- 496 名前:535 mailto:sage [2018/11/04(日) 21:31:50.64 ID:AYd3OzR3.net]
- 11/6にAMDからなにか発表があるとか
ZEN2くるかなー? とりあえず今は待ちか。
- 497 名前:535 mailto:sage [2018/11/08(木) 22:14:39.88 ID:l30eANOm.net]
- 結局zen2は春ごろなんですかね?
いまはRyzen 2700xを買っていつでも乗り換えられる体勢を取るのが正解かなぁ?
- 498 名前:310 mailto:sage [2018/11/10(土) 22:53:18.40 ID:MAqAiuT/.net]
- ぬぬぬ。
ProbCutのバグ取りに時間がかかりました。というか、なかなか高速化できません。 むしろ倍以上時間がかかってしまいます。 もっとひどい事に、今までのやり方のうち、比較的単純なやつが最も早い可能性が 高いという事に気が付いてしまいました…。下手すると40%くらい早いかも。 ProbCut比では3〜4倍速いという事です。 もともとProbCu自体は中盤探索で前方枝刈するための仕組みです。 これを読み切りしながら順次探索範囲を広げる事でソート順を修正する方向で 活用しようとしているのですが、下位のところを何度も読むオーバーヘッドがあり、 そこを置換表で高速化と考えていましたが、どこかがおかしい…。 そうこうするうちに、評価関数の精度が上がって、反復深化で十分実用になる ソート順がセットできる事になった模様です。 まだバグの可能性は捨てきれませんが、一旦諦めようかな。
- 499 名前:310 mailto:sage [2018/11/15(木) 23:13:39.64 ID:Gy98Zi+i.net]
- ProbCutは一旦放置して、地道にSolverの速度アップを始めました。
作り直した時に、末端ノードの処理を結構簡素化しちゃったので、やり直しです。 で、Zebraの初期バージョンのオーダリングを日本語で解説した資料を見つけて 色々とノウハウを得まして、Fastest Fastの処理を見直したり、その他色々やった ところ、速度が倍になりました。 が、見たくない現実としては、まだZebraの当時のFFOテストより若干遅い感じです。 以前はFFO#20限定で0.3秒くらいまで行っていたのですが、まだ1〜2秒前後。 ちなみに、似たスペックのPCでの計測値が公表されているマスターオセロは、 更に10倍程度高速です。ぬぬぬ。 棋譜作って学習していくと、探索時間が地味に短くなっていくし、時にはオーダリング の間違いが直ってジャンプするように特定の盤面で高速化する事がありますので、 まだまだ辛抱かなぁ。
- 500 名前:名前は開発中のものです。 mailto:sage [2018/11/17(土) 11:28:45.78 ID:8gp5y6uH.net]
- なんとか棋譜訂正が終わりました
それだけだと終盤探索にあまり効き目はなかったようです… これで終わりたくなくて色々見直したところ、なんとかFFO55が6000秒から2500秒切るレベルまで高速化されました ただ問題があって、空きマスリストを用意していない影響で、空きマスが2つになるまでビット演算で着手番号を取得してるので、NPSがかなり低くなっています ここを改善するだけでも20%ぐらいは高速化するのではないかと…今週はそのへんやってみようかと思います
- 501 名前:名前は開発中のものです。 mailto:sage [2018/11/17(土) 11:43:10.64 ID:8gp5y6uH.net]
- テスト結果を載せます
ここから2倍ぐらいになれば、MasterReversiの背中が見えてくるレベル・・・まだまだです YBWCとかやらないとなぁ Microsoft Windows 10 Intel(R) Core(TM) i5-6500 CPU @ 3.20GHz キャッシュサイズ256MB FFO#40 ( Exact:(a2:+38) 1.19sec node: 12.33[Mn] nps:10323[Knps] ) FFO#41 ( Exact:(h4: +0) 2.99sec node: 35.31[Mn] nps:11825[Knps] ) FFO#42 ( Exact:(g2: +6) 2.86sec node: 39.98[Mn] nps:13961[Knps] ) FFO#43 ( Exact:(G3:-12) 2.49sec node: 25.47[Mn] nps:10236[Knps] ) FFO#44 ( Exact:(D2:-14) 4.08sec node: 40.86[Mn] nps:10006[Knps] ) FFO#45 ( Exact:(b2: +6) 29.92sec node: 449.45[Mn] nps:15022[Knps] ) FFO#46 ( Exact:(b3: -8) 7.48sec node: 87.43[Mn] nps:11687[Knps] ) FFO#47 ( Exact:(G2: +4) 3.71sec node: 49.65[Mn] nps:12851[Knps] ) FFO#48 ( Exact:(F6:+28) 18.78sec node: 216.42[Mn] nps:11523[Knps] ) FFO#49 ( Exact:(e1:+16) 53.12sec node: 655.97[Mn] nps:12350[Knps] ) FFO#50 ( Exact:(d8:+10) 141.11sec node: 1.39[Gn] nps: 9873[Knps] ) FFO#51 ( Exact:(E2:+6) 39.81sec node: 509.68[Mn] nps:12804[Knps] ) FFO#52 ( Exact:(a3:+0) 54.33sec node: 725.60[Mn] nps:13355[Knps] ) FFO#53 ( Exact:(d8:-2) 774.22sec node: 10.74[Gn] nps:13873[Knps] ) FFO#54 ( Exact:(c7:-2) 965.65sec node: 14.37[Gn] nps:14973[Knps] ) FFO#55 ( Exact:(G6:+0) 7124.95sec node: 105.41[Gn] nps:14794[Knps] ) FFO#56 ( Exact:(H5:+2) 244.72sec node: 3.22[Gn] nps:13475[Knps] ) FFO#57 ( Exact:(a6:-10) 926.60sec node: 11.06[Gn] nps:13352[Knps] ) FFO#58 ( Exact:(g1:+4) 551.11sec node: 8.16[Gn] nps:14803[Knps] ) FFO#59 ( Exact:(g8:+64) 0.94sec node: 5.28[Mn] nps: 5626[Knps] )
- 502 名前:名前は開発中のものです。 mailto:sage [2018/11/17(土) 11:45:17.49 ID:8gp5y6uH.net]
- 間違えて前のバージョンを載せてしまいましたw
今回はこちらです。比較になってちょうどよかったかも FFO#40 ( Exact:(a2:+38) 1.29sec node: 10.63[Mn] nps: 8244[Knps] ) FFO#41 ( Exact:(h4: +0) 2.97sec node: 25.54[Mn] nps: 8599[Knps] ) FFO#42 ( Exact:(g2: +6) 2.24sec node: 20.58[Mn] nps: 9189[Knps] ) FFO#43 ( Exact:(C7:-12) 2.54sec node: 19.23[Mn] nps: 7572[Knps] ) FFO#44 ( Exact:(B8:-14) 4.32sec node: 32.07[Mn] nps: 7418[Knps] ) FFO#45 ( Exact:(b2: +6) 27.68sec node: 294.61[Mn] nps:10644[Knps] ) FFO#46 ( Exact:(b3: -8) 7.56sec node: 68.56[Mn] nps: 9070[Knps] ) FFO#47 ( Exact:(G2: +4) 3.25sec node: 36.70[Mn] nps:11293[Knps] ) FFO#48 ( Exact:(F6:+28) 21.11sec node: 195.99[Mn] nps: 9286[Knps] ) FFO#49 ( Exact:(e1:+16) 34.84sec node: 346.90[Mn] nps: 9958[Knps] ) FFO#50 ( Exact:(d8:+10) 108.94sec node: 960.91[Mn] nps: 8820[Knps] ) FFO#51 ( Exact:(E2:+6) 36.21sec node: 378.54[Mn] nps:10453[Knps] ) FFO#52 ( Exact:(a3:+0) 63.95sec node: 730.82[Mn] nps:11429[Knps] ) FFO#53 ( Exact:(d8:-2) 545.77sec node: 6.17[Gn] nps:11304[Knps] ) FFO#54 ( Exact:(c7:-2) 626.09sec node: 7.42[Gn] nps:11848[Knps] ) FFO#55 ( Exact:(G6:+0) 2492.74sec node: 31.10[Gn] nps:12475[Knps] ) FFO#56 ( Exact:(H5:+2) 212.26sec node: 2.52[Gn] nps:11894[Knps] ) FFO#57 ( Exact:(a6:-10) 520.85sec node: 6.35[Gn] nps:12183[Knps] ) FFO#58 ( Exact:(g1:+4) 588.80sec node: 8.54[Gn] nps:14512[Knps] ) FFO#59 ( Exact:(g8:+64) 1.88sec node: 8.86[Mn] nps: 4722[Knps] )
- 503 名前:535 mailto:sage [2018/11/17(土) 17:28:43.31 ID:s4ulT91Q.net]
- うおお、ついに新PC買っちゃいました!
s.kota2.net/1542443012.jpg
- 504 名前:535 mailto:sage [2018/11/17(土) 17:38:57.27 ID:s4ulT91Q.net]
- なんか買っただけで満足してしまっている自分がいるwww
- 505 名前:名前は開発中のものです。 mailto:sage [2018/11/17(土) 18:39:02.10 ID:8gp5y6uH.net]
- 空きマスリストを作る方式でやってみたのですがビット演算のほうが5%速かったみたいです
こうなるとオーダリングのコストを下げるしか無くなってきました
- 506 名前:名前は開発中のものです。 mailto:sage [2018/11/17(土) 18:40:00.61 ID:8gp5y6uH.net]
- RYZENですか
自分もi5なので、新しいPCが欲しいところ
- 507 名前:535 mailto:sage [2018/11/17(土) 19:32:43.11 ID:s4ulT91Q.net]
- >>496
せっかくなのでなにか͡コテ名乗ってくれませんか? まあ無理強いはしませんが。
- 508 名前:535 mailto:sage [2018/11/17(土) 20:03:37.36 ID:s4ulT91Q.net]
- シネベンチマルチ1705CB
うーん、壊れる前のマシンの倍くらいにはなってるんですかね?
- 509 名前:535 mailto:sage [2018/11/17(土) 20:20:24.98 ID:s4ulT91Q.net]
- さて本題のAI開発は何から始めようか?w
差しあたっての目標はAQをwindowsでビルドかな
- 510 名前:535 mailto:sage [2018/11/17(土) 22:39:28.71 ID:s4ulT91Q.net]
- >>491
よくみたらキャッシュ256MBってどうゆうこっちゃw
- 511 名前:535 mailto:sage [2018/11/18(日) 00:16:59.82 ID:rI0UFOUu.net]
- windowsでビルドするの結構難しそう。
気分転換にAQのあらかじめexeになってるものを落として動かしてみたら割とサクサク動く。 そして当たり前だけど強い。 これは期待が高まるw
- 512 名前:310 mailto:sage [2018/11/18(日) 01:01:51.11 ID:CiNHjYBr.net]
- おお。大体僕の倍くらいの速度ですね。
なお、気が短いし、記譜訂正が26手目くらいまでしかできていないので、 今は#40-#44の5つしか計測していません。昔から#41がピンポイントで遅い。 空きマスのビット演算、ちょうどやったところです。 mobility使わずに、flip関数がゼロだと着手不能ってパターンです。 静的オーダリングを使っていますが、角優先×最後って事で。 パターン配列作ってループ回してAND版と、先に空きマスをpextで並び替えて、 テーブル引いて元に戻して着手する版と2種類トライしまいしたが、速度差は 誤差としか言いようが無いレベルでしたorz 元に戻す演算を思いついたらまたトライする予定。 本日はProbCutを再トライ。今度はちゃんと高速化しているようです。 スレッショルド1.0σで反復無しで、その結果を用いてアスピレーションウィンドウ サーチして、少し高速化できたかなぁと言う感じ。 ただ、投機的に高速化しているので、FFOで比較しても、苦手盤面がありそうです。 棋譜が揃って来たら投機のヒット率が上がると信じて、しばらく使ってみます。
- 513 名前:310 mailto:sage [2018/11/18(日) 01:13:00.25 ID:CiNHjYBr.net]
- 535さんニューマシンおめ!
自分はSurface3で、i7-4650Uの1.7GHz(2.29GHz)×4です。 キャッシュとかどこで見れるのかなぁ。
- 514 名前:310 mailto:sage [2018/11/18(日) 01:19:18.37 ID:CiNHjYBr.net]
- ちなみに、偶数理論は何度かトライしていますが、速度低下してしまうので
使えずにいます。 ZebraはUndo方式で空きマスリストを常時更新しているようです。 僕はCopy方式で、末端の該当ノードで空きマスリストを作ろうとしているので すが、なかなかうまくできません。 過去にpaint処理みたいな方法で完全な空きマスリストを作成しましたが、 当然オーバーヘッドが大きくて使い物になりませんでした。 最近は「どうせ4隅でしょ?」という事で、盤面を4分割して空きマス計算して いますが、それでも遅い。 「どうせ4隅」が良くないのか、偶数理論の理解が間違っているのか…
- 515 名前:535 mailto:sage [2018/11/18(日) 17:01:14.00 ID:rI0UFOUu.net]
- 高負荷時のファンが意外とうるさいorz
熱風もなかなかorz あんまり連続実行しないほうがいいのかもorz
- 516 名前:535 mailto:sage [2018/11/18(日) 17:56:00.38 ID:rI0UFOUu.net]
- なんかクロームがメモリ1GBとか使ってるんだがこれで平常運転なのか?
メモリに余裕あるからってなめすぎじゃね?
- 517 名前:495 mailto:sage [2018/11/18(日) 18:39:39.38 ID:w1KaGZJD.net]
- >>497
なるほど、では495ということで… あとキッシュサイズは置換表のサイズです
- 518 名前:535 mailto:sage [2018/11/18(日) 18:55:52.33 ID:rI0UFOUu.net]
- >>507
コテありがとうございます。よろしくお願いします。 CPUのキャッシュかと思ってビビりましたw。
- 519 名前:535 mailto:sage [2018/11/18(日) 19:17:18.42 ID:rI0UFOUu.net]
- AQのビルド、linuxだとBAZELで、windowsだとCMakeでって書いてあるんだけど、
CMake用の入力ファイルが見当たらないorz windowsもBAZELでやるんだろうか?そこからわからんorz
- 520 名前:535 mailto:sage [2018/11/20(火) 20:47:23.74 ID:sCHL0ufM.net]
- いかん、投資に見合った成果を挙げねばww
とは思うが腰が重いorz
- 521 名前:535 mailto:sage [2018/11/21(水) 22:15:48.48 ID:YJjwR4VH.net]
- windowsは一旦保留にしてLinuxに走るのが正解だろうか?
- 522 名前:535 mailto:sage [2018/11/22(木) 23:20:13.56 ID:ak7z/rHD.net]
- ネイティブリナックスをデュアルブートにするかVMWareでいくか。
なんかwindows10とlinuxのデュアルブートは罠があるらしくちょっと怖い。
- 523 名前:535 mailto:sage [2018/11/23(金) 15:43:50.93 ID:uREb6qVe.net]
- うーん、やっぱAQ無理かもorz.
もっと簡単そうなのに逃げるべきだろうか? とほほ
- 524 名前:名前は開発中のものです。 mailto:sage [2018/11/24(土) 05:53:44.23 ID:quW8CQIk.net]
- 同一HDD 内で、Windows10・Linux のデュアルブートは、素人では元に戻せない。
だから、日経Linux では、仮想OS を使うように書いてある。 Virtual Box が多いかな Ruby できるなら、Vagrant, Chef から使うのもよい 漏れは、WSL・Ubuntu16.04 を使っている。 ただし、WSL はGUI なし。コマンドのみ 開発用だから、本番では使えないし、Docker なども使えないけど、 WSLは単なるアプリだから、遊ぶには気楽
- 525 名前:535 mailto:sage [2018/11/24(土) 20:30:54.02 ID:CNsuI7eC.net]
- うーん、今後の方向性が定まらないorz.
最終的にはwindowsでやりたいからそこも悩みどころ。
- 526 名前:名前は開発中のものです。 [2018/11/24(土) 23:59:56.87 ID:MjnwrHjN.net]
- ボードゲームスレだよな?なんの話してんの?
- 527 名前:310 mailto:sage [2018/11/25(日) 09:01:51.50 ID:Mml0PIJf.net]
- Iterative Widening何とかできた。平均的に高速化できていると思う。
FFOについては相変わらず>>495さんと比較して速度は半分くらいかな。 一方で記譜作成的には倍速になったイメージ。細かく4σまでWideningして いる事で、仮探索の誤答が減った事が効いています。 仮探索で増える時間 > 仮探索が正解した時に減る時間 + 誤答した時に増える時間 Iterative Wideningで、仮探索時間の削減と正答率の向上の両方が実現できた 感じです。この辺、課題盤面との相性がある話なので、統計的に計ろうとすると かなり面倒です。というか、統計的に計るためには、前提となる評価関数をロック しなきゃなりませんが、現在記譜作成しながら評価関数学習させてますので、 前提が常に動いてしまいます。 現在オーバーヘッドが嫌で、ノード数をとっていません。並列化するとロック の待ち時間で数%〜10%くらい速度が落ちちゃうからです。ノード数をとれば 純粋な速度比較がしやすいのですが、悩みどころです。
- 528 名前:535 mailto:sage [2018/11/25(日) 22:15:31.15 ID:MnTu6mxc.net]
- なんも進展がないのでとりあえず昔作った19路囲連星AIをビルドする環境を新マシンに構築しました。
リハビリの意味でもしばらくこれいじってようかな。
- 529 名前:名前は開発中のものです。 [2018/11/26(月) 11:23:16.87 ID:3TlDlboD.net]
- オンラインボードゲームって作れば流行ると思うんだけど、誰もやらないってことはサーバの維持費の方が高くなるんかね?
- 530 名前:名前は開発中のものです。 mailto:sage [2018/11/26(月) 12:10:20.62 ID:dM/DsP5w.net]
- そう簡単に流行るかよ
囲碁のkgsとかだってかなり廃れてきてるのに
- 531 名前:535 mailto:sage [2018/11/26(月) 22:59:02.56 ID:PdBnQCC1.net]
- 気持ちだけ焦るけど、何も進まないというorz
とりあえず、結果だけ求めるのは謹んで、 地道に愚直にディープラーニングの勉強するのが正解だろうか?
- 532 名前:310 mailto:sage [2018/11/27(火) 09:45:52.43 ID:IL6H1udh.net]
- 自分の場合、プログラムいじるネタが欲しくて、ヘウレーカ!って感じを味わいたくて、
続けているだけだからなぁ(汗 目標でかすぎるとか、期限切りすぎると、焦って嫌になるだけだよ。 オセロなんて、既にやってる人ほとんどいないから、ちょうど良いのだw 今の目標は、60歳になるまで続ける事w
- 533 名前:535 mailto:sage [2018/11/27(火) 18:36:07.13 ID:oxbu/SRL.net]
- そうですね
結局自分のペースで一歩一歩進んでいくしかないですよね ありがとうございます
- 534 名前:535 mailto:sage [2018/11/27(火) 20:02:14.21 ID:DriHkSnO.net]
- これからどうしようかなぁ。
以前、途中までうまくいきかけた9路囲連星を移植したalpha zero クローンのコードを読み解くのやってみようかなぁ。 それとももっと本とか読んで理論の基礎から固めていくべきだろうか。
- 535 名前:名前は開発中のものです。 [2018/11/27(火) 21:15:20.03 ID:8ndts6Rn.net]
- loser_sのブログ読んだけど、重大発表やばすぎだろ
- 536 名前:535 mailto:sage [2018/11/28(水) 22:14:06.77 ID:h+t1ldhF.net]
- VMWareのubuntuで9路囲連星のalphazeroクローン動かしてみたらなんかメモリリークする。
前のマシンではメモリリークなかったのに? OSとかpython とかCUDAのバージョンが変わったせいだろうか? うーん、解決する気力がいまいち湧いてこないorz
- 537 名前:535 mailto:sage [2018/11/28(水) 22:31:22.70 ID:h+t1ldhF.net]
- やっぱ出来ればwindows & C++ で行きたいなぁ。
うーん。
- 538 名前:535 mailto:sage [2018/11/28(水) 22:44:28.01 ID:h+t1ldhF.net]
- 悶々としつつ19路囲連星AIでLV3と対戦させたら素晴らしい勝ち方した。
(;SZ[19] ;B[jj];W[ji];B[ii];W[hi];B[ih];W[ik];B[ki];W[jl] ;B[hh];W[ij];B[jh];W[lh];B[gg];W[ff];B[fg];W[gi] ;B[kg];W[eg];B[lg];W[hg];B[hf];W[jg];B[jf];W[km] ;B[ig];W[hj];B[fh];W[ln];B[mo];W[lj];B[hg];W[mj] ;B[jg]) 自然な流れからのダブル必勝形。 こういうのがたまにあるから止められないんだよなぁ。
- 539 名前:535 mailto:sage [2018/11/29(木) 20:09:22.49 ID:vNqglcEX.net]
- ふーむ。ダブル必勝形で勝負ありかと思ったら白にも粘り筋があって意外と奥が深い。
でも正しく打てばたぶん黒の勝ち。
- 540 名前:535 mailto:sage [2018/11/30(金) 20:09:22.21 ID:QHRZJCgT.net]
- やっとこさ週末か。でもどうせ進まない予感orz
せめてなにかこれだという方針が定まらないと。 焦っちゃダメと頭では分かっていてもついww
- 541 名前:535 mailto:sage [2018/11/30(金) 20:59:59.07 ID:QHRZJCgT.net]
- 理想を言えばwindows & C++ & reinforcement learning
その線で探ってみるか
- 542 名前:535 mailto:sage [2018/12/01(土) 19:46:42.48 ID:1G6ID0fa.net]
- まだまだ方向が定まらないけど、来るべき時のために今のうちに棋譜集めを始めるべきだろうか?
無駄になるかもしれないけど、何もしないよりはいいよね?
- 543 名前:535 mailto:sage [2018/12/01(土) 20:48:59.14 ID:1G6ID0fa.net]
- 16プロセス並列棋譜取り
なかなか圧巻ですな ファンがうるさいけど
- 544 名前:535 mailto:sage [2018/12/01(土) 23:10:46.72 ID:1G6ID0fa.net]
- 全コア使い切っちゃうとほかの作業がしづらいorz
開発用と計算ぶん回す用で2台欲しいwww ありえないけど。
- 545 名前:310 mailto:sage [2018/12/02(日) 10:27:19.04 ID:YQiXDU8o.net]
- 使用コア数制限するパラメータないの?
自分のは並列化処理に使用コア数カウンタ入れて、同時並列数を制限している。 もっとも常に4コアで4多重マックスで動かしているけどorz。16コアなら1つくらい 他のプロセスに空けても、あんま速度低下なさそうでうらやましい。 今現在は記譜作成がメインなので、気が向かない
- 546 名前:時もほっとけば棋譜を訂正しながら
勝手に学習して、少しづつ速度アップしてくれている。気が向かない時に焦らずに済む のでお勧め(^^; 一時速度アップに燃えていたけど、1勝9敗以上の比率で速度アップに失敗して(まあ そんなもんなんだけど)、今は停滞期間中w [] - [ここ壊れてます]
- 547 名前:535 mailto:sage [2018/12/02(日) 21:28:29.33 ID:tVJh9ePf.net]
- >>535
その手がありましたねww 作業中は12プロセス位にしとくか なにはなくとも棋譜取りだけはコツコツつづけます。 一日で多分3〜4000局くらい取れるはず。 ちなみに今これ見てるけど速攻挫折しそうorz https://github.com/HerveFrezza-Buet/RLlib
- 548 名前:535 mailto:sage [2018/12/03(月) 20:43:08.98 ID:M6xR0Sx+.net]
- 一日回して4652局
思ったより取れてる。
- 549 名前:535 mailto:sage [2018/12/03(月) 23:14:26.77 ID:M6xR0Sx+.net]
- 平日まとまった時間が取れなくてもちょっとづつでも進んでいかないとねぇ。
まあ、棋譜取りしてるだけでもいくらか気がまぎれるけど。 100万局目指すか。
- 550 名前:535 mailto:sage [2018/12/08(土) 23:40:47.79 ID:BUSkl7iI.net]
- RLlibやっとサンプルがコンパイルできた
ここまで長かった つかリンクオプションで-lgslつけなきゃいけないとかずっぽり嵌ったわ
- 551 名前:310 mailto:sage [2018/12/09(日) 13:20:20.42 ID:j5g2lrg3.net]
- まったりと記譜取りしてても仕方ないので、速度アップできないか色々あがいてました。
久々にプロファイラで確認したところflip関数が30%、mobility関数が8%ほどでした。 Edaxのソース見つけたので禁断の答え合わせ。flip関数は一つ昔のタイプなので、 恐らく自分の方が早い。mobilitiy関数は少し早そうなので、考え方を導入。でも誤差 範囲の効果しかなかった。 速度計測ルーチンを作って、並列単体速度比が1.2程度しか無い事が判明。 並列処理で排他待ちしそうなところに無駄がないかチェックしたところ、ほぼ全部無駄 だった事が判明(汗。無駄箇所を全て削除したけど、誤差範囲(汗 後方枝刈(ヒューリスティックスなオーダリング)が気になるので、ノード採取してみた。 やはり2割程度速度ダウンするので、プリプロセッサで普段は切り離す事に。 その他もろもろ誤差範囲の改良を積み上げた結果、なんとなく1〜2割は速度アップ した気がしますが、並列処理の効率が悪いのと、後方枝刈の工夫が足りていないの 2か所が、これからの課題かなと思います。 あれ?なんか、ループしてmin-Max探索の高速化に目的が戻ってきている(笑)
- 552 名前:535 mailto:sage [2018/12/09(日) 15:16:13.02 ID:jd/NSaBy.net]
- んあ?RLlibって強化学習のライブラリではあるけどalpha zeroとは直接関係ないのか?
全部無駄だった? www
- 553 名前:535 mailto:sage [2018/12/09(日) 20:10:15.58 ID:jd/NSaBy.net]
- ふらふら浮気しまくりww
浮き草のような人生だ。 今これ見ようとしてます。 https://github.com/novoselov-ab/ai-zero
- 554 名前:535 mailto:sage [2018/12/09(日) 21:08:44.25 ID:jd/NSaBy.net]
- g++ にfilesystemってヘッダがないorz
とりあえずいまVSインストールしてる
- 555 名前:535 mailto:sage [2018/12/09(日) 21:40:01.98 ID:jd/NSaBy.net]
- 動いたっぽい。
久しぶりに一歩進んだ気分。
- 556 名前:535 mailto:sage [2018/12/10(月) 22:15:43.67 ID:wVpZGnnS.net]
- なんか非合法手を選んでしまうみたいなんだが?
うーんなんだろ?
- 557 名前:535 mailto:sage [2018/12/12(水) 22:24:55.51 ID:eFK7VQKv.net]
- 他人のコードに頼るのやめて自力実装に走るべきだろうか?
他人のコードってなによりいまいち情熱が湧いてこない。 でも他人のコードも読めるようにならないと先はないんだろうなぁ。 我流じゃすぐ限界迎えそう。 悩ましい。
- 558 名前:535 mailto:sage [2018/12/14(金) 00:02:46.12 ID:52LN5bpq.net]
- まただよ(再起動)
windows10でも変わらずか…
- 559 名前:535 mailto:sage [2018/12/14(金) 22:52:23.39 ID:52LN5bpq.net]
- コーディングは進まないけど棋譜だけは溜まっていきます。
今、LV3 vs LV3の棋譜が61950局分溜まってます。 ファンがうるさいから夜中は回してないから日中だけなのにこのペース。 8コアはさすがといったところか。 アルファ碁Leeが16万局分の棋譜を使ったらしいからとりあえずその辺目指すか。
- 560 名前:310 mailto:sage [2018/12/18(火) 00:10:23.05 ID:4TPQUuZQ.net]
- FFOテスト(#40−#49)、色々誤差範囲の改良を加えてじわじわスピードアップ
していたけど、ある日突然20%くらい悪化。元に戻せるところは戻したけど、 結局ダメで、裏で評価関数の学習し続けた結果、途中経過でたまたま探索が 悪化するところにはまってしまったと言う事かなぁと。 実際、悪化しているの#49だけで他は改善していたし、学習都度表示している FFO問題の8手読みの次の一手の合否が、14/20から11/20に悪化している。 こういうのあると、速度アップで何を信じて良いのかわからなくなるよね…
- 561 名前:310 mailto:sage [2018/12/18(火) 00:14:29.31 ID:4TPQUuZQ.net]
- という問題もありながら、ノード数表示して、>>492さんの結果と比較すると、
ノード数に圧倒的な差が。NPSは速いけど、それ以上にノード数が多い。 枝刈の差というにはあまりに大きな差で、一桁近い差です。 これ、Iterativeな手法で生じる置換表探索の差じゃないかと思う。 自分のは置換表の動作が遅いので、あまり深い探索まで置換表を適用できず、 読切において後ろの方は置換表が無い(そもそも使用していない)事で、何度も 再探索しているからかなと。 concurrent_unordered_mapを使っているけど、自前でハッシュDB作った方が 良いかもと思い始めた。そこで速度アップすると、置換表適用深度を深くできる。 こういう時、自前で作る人はチェーンハッシュ使っているのかな?
- 562 名前:535 mailto:sage [2018/12/18(火) 23:29:10.84 ID:N5ttC8SJ.net]
- 昔自前でハッシュ作ったことありますが素朴な実装だとさほど性能出なかった記憶がありますね。
自分の場合STLでいいじゃんみたいな結果でした。 テーブルのサイズをでかくすると意外と巡回が遅くなるみたいな。
- 563 名前:535 [2018/12/19(水) 21:16:40.83 ID:REA/9P4B.net]
- スマホでconnect4のパーフェクトソルバーをちょくちょく遊んでるのですが
パターンをかなり覚えて7割くらい勝てるようになりました 囲碁とかも真の棋理が明らかになった方が 逆に人間がコンピュータに勝てるようになるかもしれませんね
- 564 名前:310 mailto:sage [2018/12/19(水) 22:48:18.33 ID:T2sH1fj1.net]
- ハッシュの構想し始めましたが、確かに自分が作って早くなる保証はないですね。
インターフェースを既存のstlに合わせようとか思って調べ始めたら面倒になりました。 で、色々見ていたら、そのまんま効率化できそうな使い方を見つけた。 有れば読み込んで更新、無ければ追加の方法です。 あとバケットサイズとか個数とか、その辺を調べていった方が早くなるかも。 並列処理だとtry_emplaceが使えないのね。これが使えたらきっと早くなるのに。
- 565 名前:535 mailto:sage [2018/12/20(木) 23:32:19.98 ID:zB5frbtZ.net]
- また再起動してる。。。
まあいいけど、もう諦めぎみ。 なんか仕事が急に忙しくなってますますコーディングから遠ざかってますが、 棋譜だけは地味に溜まってます。今82889局分溜まってます。 並列化ハッシュってどんななんですかね。そういえば知らない。
- 566 名前:310 mailto:sage [2018/12/21(金) 00:04:37.10 ID:kvniGc89.net]
- いや。まぁ。バケットか中のレコードか、どちらかの単位で排他かけるだけです。
Hash関数がきちんとばらけさせてくれたら、基本的にあんまり排他で捕まる事は 無いので、それほど気にしなくてもパフォーマンスに影響ないかなぁと。実際に concurrent_unordered_mapの配列用意して、適当にハッシュでばらけさせて格納 してみたら(つまり、同じmapじゃなければ排他はおきない)、排他で遅くなっている 訳ではない事が確認できています。 と言いながら、iteratorとか考えだすと、何を並列セーフにして、何をアンセーフに するかみたいな事で悩んじゃいます。 先日の続きでmax_load_factorとかbacketサイズとかいじってみましたが、 パフォーマンスにほとんど影響がないです。というか、どうせ後で逐次的に拡張する くらいならと、backetサイズを増やしても性能は上がらないし、max_load_factorを 増やしても、性能が落ちるだけだったり…。 棋譜作成だけなら並列化レベルをもう1段上げて、4記譜同時作成とかすれば、 個々の読み切りはシングルスレッドに下げられて、ただのunordered_mapが使えるし その方が棋譜作成的には速度アップしそうな気がしてきた(汗 FFO的には別処理になるけど。
- 567 名前:535 mailto:sage [2018/12/22(土) 00:08:33.74 ID:w0ekMTPt.net]
- 採りためた棋譜をもとに序盤DBを更新してみましたが、
確かにうち筋は変わってる気がしますが強くなってるかはよくわからないというorz まあ序盤DBは誤魔化しみたいなものだから期待しすぎもよくないか。
- 568 名前:535 mailto:sage [2018/12/22(土) 00:42:25.73 ID:w0ekMTPt.net]
- 序盤DB更新で強くなってるか統計とってみたいけどモンテカルロが遅すぎてそれもままならないというorz
やはりモンテカルロに代わる何かを実装しなければ…
- 569 名前:535 mailto:sage [2018/12/26(水) 00:12:59.86 ID:2Tvqp++w.net]
- 棋譜USBメモリにコピーしたらめっちゃ時間かかるorz
130MBくらいなのにUSBメモリってやっぱ遅いんだな。
- 570 名前:310 mailto:sage [2018/12/26(水) 00:20:29.39 ID:Rkthqh0l.net]
- 4記譜並列作成実装してみました。ただいま本番状態でテスト中。
並列処理の基本は、なるべく上位の層で並列化すべしでした。 現状、並列探索の速度は、シングル探索の2倍程度です。 1つ1つの探索には時間が2倍かかるけど、4つ並列なので、トータルでは 半分の時間で処理できるので、実質2倍みたいな。 探索中のオーバーヘッドはほぼ無いはずで、待ち合わせロスくらいなので、 大量に一気に処理する分には、ほぼ無視できるかなと。 これやると、スレッドの数がモロに効いてくるんで…48並列くらいできたら…
- 571 名前:535 mailto:sage [2018/12/26(水) 00:30:44.15 ID:2Tvqp++w.net]
- 310さんはintel派なんでしたっけ?
AMDでもzen2はかなりコスパいいものが来ると思いますが…
- 572 名前:535 mailto:sage [2018/12/26(水) 00:40:17.50 ID:2Tvqp++w.net]
- 試しにSSDに棋譜コピーしてみたらかなり速いw
やっぱそうなのか。
- 573 名前:310 mailto:sage [2018/12/26(水) 03:07:45.74 ID:Rkthqh0l.net]
- あれれ。思ったほど速度が出ない…というか、単体の速度が半分どころか、
1/4くらいになっているイメージ…。深さが深いものほど遅いという事は、 置換表周りかなぁ。 棋譜作成する対象によって速度が結構変わるので、評価しづらい。 メモリー配置等の問題も考えないといかんような気がしてきた。 いかん。夜も更けていく…。 >>561 なんか、フラッシュメモリー自体は書き込みが遅くて、SSDだとその辺を並列 化とかキャッシュとかで回避しているらしいです。USBメモリーは、その辺真面目 にやっているもの(高価)と、そうじゃないもの(安価)で差があるけど、それでも SSDには敵わないとか。
- 574 名前:535 mailto:sage [2018/12/26(水) 21:06:48.31 ID:2Tvqp++w.net]
- 明日か明後日あたりで棋譜10万局分溜まりそう
深層学習のプログラム、組みたいなぁ でも難しいんだよなぁ
- 575 名前:310 mailto:sage [2018/12/27(木) 00:00:43.02 ID:APLuuq5f.net]
- 悩ましい。
シングルmin-Maxの並列動作と、パラレルmin-Maxのシングル動作。 どうも速度的には大差ない感じ。 2倍くらい速度出ると思ったのに…。 スレッド数が増えたら差が出てくるのかなぁ。
- 576 名前:535 mailto:sage [2018/12/27(木) 20:54:08.52 ID:gYB4tQZF.net]
- 10万局いきました。
- 577 名前:535 mailto:sage [2018/12/27(木) 21:18:27.23 ID:gYB4tQZF.net]
- 多分俺が世界で一番囲連星LV3の計算を回した人だろうなw
- 578 名前:310 mailto:sage [2018/12/27(木) 22:00:15.50 ID:APLuuq5f.net]
- 色々あがいた挙句、そこそこ時間がかかる26手空きを、それぞれで解いてみた。
並列探索で6分。シングル単独動作で12分。シングル4並列動作で18分。 やはり、シングルも4並列する事でなにがしかのオーバーヘッドがあるようです。 単純計算だと並列探索6分を4個で24分に対して、シングル18分で4つ解ける 事から33%の速度アップが見込める事になるけど、体感そこまでの効果が感じ られないというか、時間がかかる問題では更に差が大きくなっていて、そいつらに 足を引っ張られている印象。 そのうえで、裏でゴソゴソやりながら計算させる時に色々弊害があるので、 CPUの増強を決断するまで放置しようかと思います。 色々あがいた結果か、並列探索ですこーし速度アップした感じ。 10%行くかいかないか。
- 579 名前:535 mailto:sage [2018/12/27(木) 22:05:17.88 ID:gYB4tQZF.net]
- よくわからんがハイパースレッディングって単純に性能2倍になるわけではないということではなくて?
- 580 名前:310 mailto:sage [2018/12/27(木) 23:06:53.59 ID:APLuuq5f.net]
- もちろんそうなんだけど、排他待ちを要するデータも、待ち合わせロスも
無いので、もうちょっと性能出るんじゃないかと思っていたのです。 あと、うまく説明できないけど、ノード数が多い探索は、ノード数比以上に 時間がかかっている気がしています。まだ感覚の話ですが。
- 581 名前:535 mailto:sage [2018/12/28(金) 20:37:08.10 ID:HWMCAOZD.net]
- LV3は強いんだけど詰み状態から詰みを逃してる棋譜が散見される。
直せるもんなら直したほうがいいんだろうけどかなり大変だろうな
- 582 名前:310 mailto:sage [2018/12/29(土) 09:40:46.33 ID:hnomLa8j.net]
- んー。シングル並列動作で6時間かかっても解けずに諦めた盤面とを見つけて、
パラレルで解いたら1時間40分だった。空きマス26だと通常1分程度なんだけど、 時々こういう時間がかかる盤面がある。今までテストが面倒なので、10分以内に 終わりそうな奴でテストしていたけど、もしかしたら探索ノードが多い奴ほど、 シングル並列動作での速度低下が大きいのかも知れない。 時間がかかる奴ほど、シングル・パラレル比が悪化するなら、今考えている大体 3倍程度ってのは成り立たなくなって、もっと悪い事になる。それなら感覚的に 合致する。普通に流れている時には、シングル並列で高速化できそうな手ごたえ があるんだけど、時間がかかる盤面が来ると急速に逼塞していって、なかなか 回復しないという感じ。 パフォーマンスモニタにらみながら、unordered_mapのメモリアロケーションの方法 を
- 583 名前:想像してみた。初期確保件数指定(倍々で自動追加される)してみたけど、溢れて
もいないのにダラダラとメモリー使用量が増えていく。もしかしたらOSにメモリーを 貰いに行く動作が排他待ちになっているのかも知れない。どうやって検証しよう。 やっぱ自前置換表作るしかないのかなぁ。 [] - [ここ壊れてます]
- 584 名前:310 mailto:sage [2019/01/01(火) 10:13:37.88 ID:y24geaJt.net]
- あけおめです。
ヒープをダラダラと確保するのが気になったので、色々いじりました。 ordering用のvectorを、配列にしてスタックに。ついでにクラス化してメンテ性アップ。 少しだけ速度アップした気がする。 自前ハッシュテーブル型の置換表を作ってみた。 最初に大きく領域確保して、溢れた時以外領域確保しないようにした。 基本、余計な機能は実装していないので、処理は軽いはずなんだけど… 極ほんの少しだけ速度ダウンした感じ… 記譜作成はunordered_map版で実行しながら、改良をしてみたいと思います。 とはいえ、ソース的にはあんまり改良の余地がないんだよなぁ。 速度がそん色ないところまで行けたら、シングル版の並列での速度低下が メモリー確保が原因か検証できるかなぁ。
- 585 名前:310 mailto:sage [2019/01/05(土) 09:07:42.68 ID:KwyVlHZX.net]
- チェーン型でハッシュを組んでましたが、テーブルがあふれると結局ダラダラと
メモリー獲得し始めるので、オープンアドレス型に変更して、まとめて領域を追加 するようにしました。 この辺、もう趣味の世界ですね。 何をしても、速度は上がりも下がりもしない(汗 やっぱり探索ノードを減らす工夫が重要ですね。
- 586 名前:535 mailto:sage [2019/01/05(土) 21:26:02.72 ID:TXR2vHHf.net]
- 自己対戦のみで強くなるアルファゼロは理想ですが実装が難しそうなので
せっかく棋譜も集めてるので教師あり学習をやってみようかと思案中。
- 587 名前:535 mailto:sage [2019/01/06(日) 00:55:45.70 ID:6f3tqt5A.net]
- とりあえず、棋譜データからmin-max探索して黒有利の局面か白有利の局面かの2択を学習させようかな。とか思ってます。
そろそろ寝るか。。。
- 588 名前:535 mailto:sage [2019/01/06(日) 02:33:16.90 ID:6f3tqt5A.net]
- 寝るタイミングを逸してしまったw
プログラミングってこれがあるから怖いよねw
- 589 名前:535 mailto:sage [2019/01/06(日) 02:46:46.55 ID:6f3tqt5A.net]
- なんか100兆局くらい棋譜を集めると序盤DBだけでもかなり押せるんじゃないかなぁ。
そんな感じ。 いかん、寝なければww
- 590 名前:名前は開発中のものです。 mailto:sage [2019/01/06(日) 03:01:38.94 ID:aGENq217.net]
- 質の悪い棋譜ばかり100兆局集めてもあんまり強くならない気がするのですがどうなんでしょう
質のいい棋譜がそれだけ集まればいいですがそれはほぼ不可能ですし…
- 591 名前:535 mailto:sage [2019/01/06(日) 03:14:04.86 ID:6f3tqt5A.net]
- そうはいってもLV3の棋力はかなり高い。
囲碁将棋でいえばアマチュア3段くらいには相当するはず。
- 592 名前:535 mailto:sage [2019/01/06(日) 03:18:59.57 ID:6f3tqt5A.net]
- 波があるからアマチュア3段は言い過ぎだったかなw
でもまあ強い時はかなり強い。
- 593 名前:310 mailto:sage [2019/01/06(日) 14:23:08.43 ID:a93oWf/5.net]
- 置換表一時調子が良かったのですが、修正加えたら崩壊。
なんとなく読み取りが変な感じなんだけど、どこがおかしいのか全くわからず。 >>578 棋譜たくさん集めて序盤DB作ったら、その序盤DBのMax手順以外の手について は、分岐した以後の盤面だけで学習させると序盤の穴が埋まるというか、間違った 盤面でぼやっとした学習するの避けられるかも。 今、序盤についてはそのやり方で学習させてます。
- 594 名前:535 mailto:sage [2019/01/06(日) 20:12:44.73 ID:6f3tqt5A.net]
- とりあえず、昔作ったTINY-DNNのプログラムを引っ張り出してきて学習プログラムを仮組したが絶望的に遅いorz
グラボ使えればちっとは違うんだろか?うーむ。
- 595 名前:310 mailto:sage [2019/01/06(日) 20:34:20.52 ID:a93oWf/5.net]
- オープンアドレスうまく動くようになりました。
ここに愚痴ると、直後に原因がわかる罠w この数日の葛藤は何だったんだ。 <
- 596 名前:310 mailto:sage [2019/01/06(日) 20:36:40.74 ID:a93oWf/5.net]
- >>582
Tiny-DNNはGPU対応していないんじゃないかなぁ。 結局、DCNNはGPUで処理しないと無理っつー気がする。
- 597 名前:535 mailto:sage [2019/01/06(日) 20:44:29.63 ID:6f3tqt5A.net]
- >>584
あ〜やっぱそうなんですかねぇ。 GPUも結構いいの買ったのでぜひ活用したいところではあります。
- 598 名前:535 mailto:sage [2019/01/06(日) 22:23:00.36 ID:6f3tqt5A.net]
- 明日は仕事なのでハマらないうちに切り上げようww
社会人として自制しなければwww
- 599 名前:535 mailto:sage [2019/01/07(月) 20:55:27.41 ID:4rY/alBf.net]
- 学習回しても損失が全く減らない。。。
そういやそんなのあったな。orz
- 600 名前:535 mailto:sage [2019/01/07(月) 23:12:38.14 ID:4rY/alBf.net]
- なんかネットワーク初期化忘れてたみたいw
初期化したら損失減ったw ちょっと希望が出てきた。
- 601 名前:535 mailto:sage [2019/01/08(火) 23:12:12.87 ID:1omQC7Mg.net]
- 損失減ることは減るんだけどホントにちょっとづつしか減っていかない。
ネットワークの形状が悪いんだろうか?学習率だろうか? うーん、深みにはまりそうorz
- 602 名前:310 mailto:sage [2019/01/09(水) 20:33:25.82 ID:9GUGdavc.net]
- 学習の速度はオプティマイザに依存します。
普通のSGDだと、あちこちぐるぐる回ったり、平野トラップで立ち往生したり、 局所最適解から抜け出せなくなったり。また、SGDは学習率(α)を大きくすると、 簡単に発散しちゃったりしますので、学習率を低めにして1000回とか学習する 事になります。それでも上記の問題で、なかなか収束しなかったり、うまく学習 できなかったりします。 そういうものなのです。昔は、初期値(乱数設定しているはず)を変えてみたりして トライ&エラーしてましたが、今なら別のオプティマイザ(RMSpropやADAM)を試す べきかと思います。それでも数百回は学習を繰り返さないといけないと思います。 久々に検索したら結構種類が増えてた。 https://qiita.com/ZoneTsuyoshi/items/8ef6fa1e154d176e25b8 自分は線形回帰モデルですが、SMORMS3を使って効率化を図っています。 それでも、数百回学習しないと損失は落ち着いてきません。
- 603 名前:310 mailto:sage [2019/01/09(水) 22:31:13.85 ID:9GUGdavc.net]
- 置換表ですが、結局のところ、ハッシュのビット数を増やしてチェーン接続があまり
生じないようにし、メモリーをある程度のサイズでまとめて確保する、チェーン型 ハッシュに落ち着いています。 普段速度計測に使っているFFO#40-49ではconcurrent_unordered_map版より若干 遅いのです。が、どうも残り28手(現在はそのあたりをチェック中)では、自作チェーン ハッシュの方が早いというか、ノード数が増えた時に速度低下が少ないように感じて おり、現在は自作置換表を使っています。 とはいえ、29手や30手まで行った暁にはチェーン接続が多発し始めて速度低下が 始まると思われるので、対策を考えて行きたいと思います。28手が終わるまでまだ 一カ月くらいかかるので、幸か不幸か時間はたっぷりあります(--; 今のところチェーンの代わりに2分木を置いて、ハッシュが衝突したときの速度低下を O(n)からO(log(2)n)にしてみようかと考えています。
- 604 名前:535 mailto:sage [2019/01/09(水) 23:20:11.40 ID:ED/1LPLd.net]
- ふーむ。要素が少ない時はリストやツリーは遅く、配列が圧倒的に早いという認識でしたが。
- 605 名前:535 mailto:sage [2019/01/12(土) 00:34:20.08 ID:I11IVt9R.net]
- あれ、序盤DBに棋譜を追加したら全然おかしな手を打つようになっちゃった。
棋譜がまずいのかな?
- 606 名前:535 mailto:sage [2019/01/12(土) 01:02:50.64 ID:I11IVt9R.net]
- くそ〜強いAI(自我があるとかではないよ)作りてぇなぁ
- 607 名前:535 mailto:sage [2019/01/12(土) 01:39:38.14 ID:I11IVt9R.net]
- 三連休とはいえそろそろ寝なければな。
生活のリズム崩すのはいくない。
- 608 名前:535 mailto:sage [2019/01/12(土) 21:33:08.59 ID:I11IVt9R.net]
- 質にばらつきのある棋譜から良いデータを抽出する方法はあるのだろうか?
- 609 名前:535 mailto:sage [2019/01/12(土) 22:30:56.75 ID:I11IVt9R.net]
- うーんせっかく3連休なのに捗らないな。
これだというアイディアが湧くまでこねくり回すしかないか。
- 610 名前:535 mailto:sage [2019/01/13(日) 22:01:49.93 ID:vPz6niN1.net]
- 結局アルファゼロという正解がある限りその呪縛から逃れるのはかなり難しいorz
うーん。
- 611 名前:535 mailto:sage [2019/01/14(月) 21:36:22.16 ID:yfXkG3lc.net]
- やっぱグラボも活用したいなぁ。
でも難しいんだよなぁ。 とくにウィンドウズだと。
- 612 名前:535 mailto:sage [2019/01/16(水) 00:51:29.20 ID:ecOlQUBV.net]
- 昨日一日学習回して損失が初期値の2/3位になった。
この辺が限界かなぁ それともぞうきんを絞るようにまだまだ損失減るんだろうか?
- 613 名前:310 mailto:sage [2019/01/18(金) 00:47:06.53 ID:YI61Q9H1.net]
- NN系は学習してるんだかわからない時があるよね。
とことんまで回すと今度は過学習も怖くなってくるし。 こちらは、自作concurrent_mapクラスができました。 ハッシュキーは二分木で、ハッシュ値は64bit。 配列ハッシュキー版と同様に、削除もiteratorも無し。 すこーし速度があがったかなぁ程度。 衝突時の処理はチェーン式。流石に64bitだとキーの衝突が無い。 棋譜訂正は時間がかかるので、暇つぶしが必要な状態。 二分木を赤黒木に変えてみようかと思い始めています(汗。 本当はヒューリスティックスの改良の方が効果あるんだろうなぁ。
- 614 名前:535 mailto:sage [2019/01/18(金) 22:51:46.73 ID:glnAkAuX.net]
- 今週は残業がひどかったorz
でも土日は休める。
- 615 名前:310 mailto:sage [2019/01/19(土) 09:03:58.77 ID:/dbSBJQm.net]
- 赤黒木を検討してますが、これ並列処理だと木全体をロックしないと
いかんのではないかと…。置換表のように追加の頻度が高いケース では、排他待ちでパフォーマンス出ないかも。 まあ、やってみるしかないけれど。
- 616 名前:535 mailto:sage [2019/01/19(土) 11:25:42.95 ID:R+TIxYAB.net]
- 赤黒木とかめっちゃむずかしいやつですやん。
さすがですな。
- 617 名前:535 mailto:sage [2019/01/19(土) 19:50:28.36 ID:R+TIxYAB.net]
- ん、なんか学習したネットワークがすべてのデータに対して同じ結果を返してるっぽい?
- 618 名前:535 mailto:sage [2019/01/19(土) 19:58:01.80 ID:R+TIxYAB.net]
- 学習開始時のネットワークの重みの初期化をミスってるんだろうか
うーん。
- 619 名前:535 mailto:sage [2019/01/19(土) 20:54:13.90 ID:R+TIxYAB.net]
- tiny-dnn以外のGPU使えるライブラリで重みだけ学習してアプリケーションからはtiny-dnnを使うというのもあるのだろうか
- 620 名前:535 mailto:sage [2019/01/20(日) 02:28:47.86 ID:O7gh4nMQ.net]
- 全く同じ結果ではなく微妙に違う結果を返してるのは確認できたけど。
単に学習量がたりてないのかなぁ。
- 621 名前:535 mailto:sage [2019/01/20(日) 15:00:24.16 ID:O7gh4nMQ.net]
- やっぱり全く同じ結果返してる??
混乱してきたorz
- 622 名前:535 mailto:sage [2019/01/20(日) 15:40:18.18 ID:O7gh4nMQ.net]
- 層が多すぎたのが悪かったみたい?
層減らしたら違う値になった。
- 623 名前:535 mailto:sage [2019/01/20(日) 17:41:45.52 ID:O7gh4nMQ.net]
- お、LV1に勝った!
まあDNNの学習の効果の勝利というよりも序盤DBと詰みルーチンの補助による勝ちなんだけどね。 でもとりあえず、それっぽく動くところまで来ました。
- 624 名前:535 mailto:sage [2019/01/20(日) 17:54:10.26 ID:O7gh4nMQ.net]
- 序盤DBが良すぎてDNNの真価がわからないから序盤DB外してみるか…
- 625 名前:535 mailto:sage [2019/01/20(日) 17:59:21.27 ID:O7gh4nMQ.net]
- 酷すぎwwww
でもランダムよりはマシに見える。
- 626 名前:535 mailto:sage [2019/01/20(日) 18:24:44.15 ID:O7gh4nMQ.net]
- やっぱ序盤DBに頼るか…
こんなにプログラムが楽しいの久しぶりやな
- 627 名前:535 mailto:sage [2019/01/20(日) 20:01:09.83 ID:O7gh4nMQ.net]
- たぶんだけどまだまだ棋譜増やしたほうがいい。
ていうかあればあるほどいいい。まだまだ良くなる。 可能なら100万局を目指したい。
- 628 名前:310 mailto:sage [2019/01/22(火) 00:34:53.58 ID:9pySCUmT.net]
- 赤黒木大体できたけど…ただの二分木よりほんの少し遅い…。
元々ハッシュでランダマイズしているから、二分木の末端ノードまでの深さは 綺麗な正規分布になっていて、赤黒木にしても木の最頻高さで3割程度しか
- 629 名前:
小さくならないという事で、ツリーを修正するオーバーヘッドが効いているのか、 それとも木全体でしか排他できないのが原因なのか。 もうちょっと調べてから諦めます。 [] - [ここ壊れてます]
- 630 名前:535 mailto:sage [2019/01/22(火) 22:52:21.02 ID:jAP2hLDv.net]
- 要素が100個未満ならぶっちゃけvectorでいいと思いますが。。。
- 631 名前:535 mailto:sage [2019/01/22(火) 23:02:42.33 ID:jAP2hLDv.net]
- 前も同じこと言ったような気がするけど、学習させるなら局面の勝率より次の一手のほうがいいのだろうか?
- 632 名前:名前は開発中のものです。 [2019/01/22(火) 23:17:25.29 ID:LaaXTOn4.net]
- いまきたんですがここはどんなゲームを開発してるんですか
じぶんで開発したとして対戦相手=プログラムありますか
- 633 名前:535 mailto:sage [2019/01/22(火) 23:34:54.50 ID:jAP2hLDv.net]
- >>619
とりあえず、落ち着いて。 過去ログから読んでください。
- 634 名前:310 mailto:sage [2019/01/23(水) 01:56:46.43 ID:QHWWUXAJ.net]
- 置換表に使ってるので要素数は現在残り28手で100万超える事もあります(汗
まあ、βカットの具合でだいぶ変わるので、学習進むと減るんですが。 最低でも残り30手まで行くつもりなので、1000万くらいは想定したいです。 次の一手ソート用の配列は、Array型にしています。32個確保すれば足ります。 こちらも比較したところ、明確に速度差がありました。この辺から、領域をチマチマ 確保されるオーバーヘッドが気になりだした次第です。 で、赤黒木ですが、実装が悪いのだと思いますが、現時点で2分木と比較して およそ3倍時間がかかります。シングル動作でも同じくらいの差になるので、 排他待ちではなく、木のつなぎ替え処理の重さが原因かなと。置換表は追加が の比率が大きいので、ポインタたどるロスは優位ではない感じ。 というわけで、赤黒木はちょっと放置。 というか、二分木もシングル動作は10倍くらい速い感じなので、今一度シングル 探索の並列化を試そうと思っています。
- 635 名前:310 mailto:sage [2019/01/23(水) 02:07:28.76 ID:QHWWUXAJ.net]
- >>618
min-Max前提だと、探索値を求める際には勝率(点数)が必須で、 次の1手評価関数はオーダリングや前方枝刈向きではないですか? 探索深さ1なら次の1手で行けますが。 初代アルファ碁も、両方組み合わせていますが、次の1手評価関数で 手の優先順位をつける事で読み深さを実現した変則mctsで、最終的には 評価値で判断していますよね。
- 636 名前:535 mailto:sage [2019/01/23(水) 20:43:46.28 ID:B65SvCza.net]
- ふーむ、勝率のほうが応用が利くってことですかね?
もうしばらく勝率で学習させてみます。
- 637 名前:535 mailto:sage [2019/01/23(水) 21:07:20.14 ID:B65SvCza.net]
- ついネットワークを大きくしたくなっちゃうけど。
本当は小さいネットワークでエポック数を稼いだほうがいいのかもしれない。
- 638 名前:535 mailto:sage [2019/01/23(水) 21:28:27.72 ID:B65SvCza.net]
- そういえば、対称局面も学習データとして使ったほうがいいんでしたっけ?
- 639 名前:310 mailto:sage [2019/01/24(木) 01:32:42.88 ID:cGqmeFv+.net]
- 囲連星は初期配置ないんでしょ?
だったら対象局面ありの方が良いと思う。 オセロは悩み中。 初手をF5固定にした時に、本当に対称局面が出てくるのかわからない。 対称局面が同じ重要性で生じないのであれば、評価値を希釈しちゃうだけ。 学習の時間も単純に倍々で増えるので、今はやっていない。 強いて言うなら、F5F6E6の次がF4とD6で斜め対称になるので、ここだけは 記譜作成時にはF4固定にして、D6の対称局面を作っている。
- 640 名前:310 mailto:sage [2019/01/24(木) 01:49:46.37 ID:cGqmeFv+.net]
- 置換表自作の件、目的を見失っている(汗
一旦リセットして、最初からやり直して、当初の目的に戻ろうと思うorz
- 641 名前:578 mailto:sage [2019/01/24(木) 01:53:14.72 ID:mzMMzuaC.net]
- 私は教師データの数が8倍になるのは大きいと思って対称局面も入れて学習させてます
とくにDeep Learningさせてると(ネットワークの規模にもよりますが)だいぶ過学習しなくなります もっとも、Deep Learningするんだったら対称性を考慮したネットワークにしたほうがいいのかもしれないですが・・・
- 642 名前:310 mailto:sage [2019/01/24(木) 02:08:25.51 ID:cGqmeFv+.net]
- 着手できる場所の自由度が高いゲームは回転させるべきだと思う。
オセロは着手可能場所が限られるので、現れない局面が結構ありそう。 ちなみに、オセロは8倍じゃなくて4倍。初期配置が4対称だから。 囲連星は初手天元固定なのかな?
- 643 名前:578 mailto:sage [2019/01/24(木) 07:09:21.18 ID:mzMMzuaC.net]
- >オセロは8倍じゃなくて4倍
たしかに棋譜で考えると4対称しか無いですね 今のところ、学習させるときには現局面しか渡してないので、 90度回転で一致する局面が存在するかもしれないから8倍で良いはず…
- 644 名前:535 mailto:sage [2019/01/24(木) 22:03:23.55 ID:gSjgdU9w.net]
- うーん。今のやり方だとLV0やLV1とはいい勝負になるけどLV3には一生勝てないかも?
出来れば自己対戦による強化学習とか取り入れたいな〜 対称局面もやってみますね。
- 645 名前:535 mailto:sage [2019/01/24(木) 22:45:59.18 ID:gSjgdU9w.net]
- なんか長時間計算回してると画面が真っ暗になってマウスやキーボード押しても復帰しないことがあるんだが?
スリープは解除してるはずなんだけどなんなんだろう?
- 646 名前:535 mailto:sage [2019/01/25(金) 23:18:39.41 ID:gNQn5rdl.net]
- LV0ってやっぱ棋力低いな。
そんなLV0といい勝負の俺のAIもあれだけど。 やればやるほどLV3の完成度の高さが際立つ。
- 647 名前:310 mailto:sage [2019/01/26(土) 17:00:37.38 ID:VyVaK4H+.net]
- 自作置換表ですが、大体のところがまとまりました。
結局のところ、unordered_mapを作っていた形になります(汗 当初は領域の追加について、データ部分をまとめて追加する方向で改造し、 ハッシュ配列については22ビット固定で、高速化をしました。で、ハッシュ配列が 22ビット固定は芸がないと、二分木・赤黒木などを試しましたが、速度大幅低下。 要するに、unordered_mapにmapを組み合わせて、ハッシュのメリットを相殺して しまっていたという事で。 最終的に、ハッシュ配列の追加方法をようやく思いつき、組んでみたところ、それが そのままunordered_mapのrehashだと気が付きました(汗。その後、max_load_factor などを追加して、unordered_mapと条件を揃えて速度比較となりました。 iteratorと削除が無い分だと思いますが、unordered_map、concurrent_unordered_map に対して、それぞれシングル版、concurrent版とも若干高速になりました。 新たな課題は…stlも自作版も、どちらも並列に動かしたconcurrent版の方が遅いと 言う事です。もともとそういうものなのか…テスト方法が並列向けじゃないのか。
- 648 名前:535 mailto:sage [2019/01/26(土) 17:38:15.71 ID:VGsbBdjp.net]
- 8対称はメモリがやばいので4対称にします。
4対称で16GB位食ってる。
- 649 名前:535 mailto:sage [2019/01/26(土) 17:54:22.18 ID:VGsbBdjp.net]
- 思い切っていいPC買ったけどまだ足りないとかorzorzorz
ケチらず64GB積むべきだったか?
- 650 名前:535 mailto:sage [2019/01/26(土) 18:59:37.97 ID:VGsbBdjp.net]
- 1エポック4539秒
これは厳しいorzorzorz GPUが使えれば…
- 651 名前:535 mailto:sage [2019/01/26(土) 19:45:15.05 ID:VGsbBdjp.net]
- ん、1エポック目だけど損失がかなり少ない。。
対称局面を入力とすることで特徴量がよりはっきりしたということだろうか?
- 652 名前:535 mailto:sage [2019/01/26(土) 19:46:56.43 ID:VGsbBdjp.net]
- ん、動きが断然よくなってる?
まだわからんが。
- 653 名前:535 mailto:sage [2019/01/26(土) 19:53:15.64 ID:VGsbBdjp.net]
- 対称局面学習以前はどちらかというとランダムに近かったが
対称局面学習以後はどちらかというと知性があるっぽく見える。 まだわからんが。
- 654 名前:535 mailto:sage [2019/01/26(土) 20:02:51.02 ID:VGsbBdjp.net]
- これでエポックが進めばとんでもなく強くなる?
まだわからんが。
- 655 名前:535 mailto:sage [2019/01/26(土) 20:15:10.01 ID:VGsbBdjp.net]
- マシンパワーが欲しい!
Googleに匹敵するマシンパワーが!
- 656 名前:535 mailto:sage [2019/01/26(土) 20:40:08.93 ID:VGsbBdjp.net]
- まだLV3には遠く及ばないな。
でも希望が出てきた。
- 657 名前:535 mailto:sage [2019/01/26(土) 21:34:58.78 ID:VGsbBdjp.net]
- 学習用、棋譜採取用、対戦統計用、開発用で4台マシンほしいw
- 658 名前:535 mailto:sage [2019/01/26(土) 22:03:09.49 ID:VGsbBdjp.net]
- やっぱ思考時間短いのはいいな。
モンテカルロは強いけど思考時間長すぎたからな。
- 659 名前:535 mailto:sage [2019/01/26(土) 23:04:44.42 ID:VGsbBdjp.net]
- 棋力が低すぎてすさまじい泥仕合になるの切ないorz
- 660 名前:535 mailto:sage [2019/01/26(土) 23:32:04.39 ID:VGsbBdjp.net]
- メモリがもっとあれば異なるネットワークを並列に学習とかもできたかもなぁ
まさか32GBで足りないとは…
- 661 名前:535 mailto:sage [2019/01/27(日) 14:58:44.29 ID:RY/5cpPz.net]
- DNNの評価値とMM法の評価値の和で最終評価値を算出するようにしてみました。
多分DNNのみより強くなってます。
- 662 名前:535 mailto:sage [2019/01/27(日) 15:49:50.57 ID:RY/5cpPz.net]
- 黒番で軽く動かしてみました。
10局目 黒(airandom.dll)の勝利回数: 8 白(ai-lv1.dll)の勝利回数: 2 まずまずの結果かな。 ちなみに白番はうまく動いてなくて1の1とか打っちゃうので途中で中断しました。
- 663 名前:535 mailto:sage [2019/01/27(日) 16:41:37.92 ID:RY/5cpPz.net]
- うお、猛烈に追い上げられてるorz
悪くない手ごたえがあったと思いましたが… 25局目 黒(airandom.dll)の勝利回数: 15 白(ai-lv1.dll)の勝利回数: 10
- 664 名前:535 mailto:sage [2019/01/27(日) 19:54:22.32 ID:RY/5cpPz.net]
- ちょっとヒューリスティックを入れました。
詰めろがあるときは詰めろを優先的に打つ。 当たりの点数を恣意的に上げる。
- 665 名前:535 mailto:sage [2019/01/27(日) 21:09:49.27 ID:RY/5cpPz.net]
- うおお、キター
DNNでLV3に初勝利! (;SZ[19] ;B[jj];W[kj];B[ji];W[jk];B[kk];W[kl];B[lk];W[ih] ;B[li];W[mj];B[lj];W[kh];B[ki];W[mi];B[lh];W[ll] ;B[lg];W[lf];B[kf];W[ik];B[le];W[mf];B[jh];W[mk] ;B[ke];W[ml];B[kj];W[kg];B[jg];W[mh];B[mg];W[mm] ;B[mn];W[kd];B[kh];W[ld];B[kg]) 対LV1も流しなおしててこんな感じ 24局目 黒(airandom.dll)の勝利回数: 18 白(ai-lv1.dll)の勝利回数: 6
- 666 名前:535 mailto:sage [2019/01/27(日) 21:11:57.38 ID:RY/5cpPz.net]
- ついDNNの学習に計算リソースを使いたくなっちゃうけど
ぐっとこらえてすべての源泉である棋譜取りにリソースを回すのが正解かも?
- 667 名前:535 mailto:sage [2019/01/27(日) 21:39:45.24 ID:RY/5cpPz.net]
- いやーこんなに充実してるの久しぶりだな。
長いトンネルを抜けたようだ。
- 668 名前:535 mailto:sage [2019/01/27(日) 22:08:36.61 ID:RY/5cpPz.net]
- うお、またLV3に勝った!
まだまだ負け越すだろうけど、偶然の勝利じゃないってことか。 (;SZ[19] ;B[jj];W[ik];B[ii];W[jk];B[kk];W[lk];B[ll];W[kj] ;B[kl];W[hh];B[mm];W[ji];B[ij];W[ih];B[nn];W[oo] ;B[jm];W[ml];B[hg];W[hk];B[om];W[lm];B[ln];W[nl] ;B[nm];W[im];B[pm];W[km];B[kn];W[pp];B[km];W[qp] ;B[lm])
- 669 名前:535 mailto:sage [2019/01/27(日) 22:25:29.35 ID:RY/5cpPz.net]
- 明日は仕事だから夜更かしは社会人として自制しなければwwwww
そろそろ切り上げるかwwww
- 670 名前:535 mailto:sage [2019/01/28(月) 19:44:18.33 ID:m5wr/yMi.net]
- そういえば赤黒木って深さキャッシュして置くんですか?オーダーlogで深さを求める方法が思いつかない
- 671 名前:535 mailto:sage [2019/01/28(月) 21:07:17.34 ID:LAfUnJ6o.net]
- 長連判定入れなかったのが意外と響いてるな。
ちょくちょく長連に引っかかる
- 672 名前:535 mailto:sage [2019/01/28(月) 21:36:36.08 ID:LAfUnJ6o.net]
- ん、DNN学習の裏で棋譜取りしたら計算速度落ちてるな。
コア数は足りてるはずだがメモリ帯域が足を引っ張ったのだろうか?
- 673 名前:535 mailto:sage [2019/01/28(月) 22:36:38.66 ID:LAfUnJ6o.net]
- こちらの棋力が上がるのに呼応するようにLV3も素晴らしい手を返してくる。
奥が深いすな。
- 674 名前:535 mailto:sage [2019/01/28(月) 22:50:40.16 ID:LAfUnJ6o.net]
- LV3との対戦統計とってみたいけどまだ時期尚早かな。
まずは大量の棋譜を手に入れる。 量が質に転換する地点が必ずあるはず。
- 675 名前:535 mailto:sage [2019/01/28(月) 22:57:44.79 ID:LAfUnJ6o.net]
- 将来的には自己対戦による強化学習は絶対取り入れたい。
- 676 名前:535 mailto:sage [2019/01/29(火) 20:45:33.27 ID:PoANmAul.net]
- 今一手読みで打ってるから、3手読みとかモンテカルロか入れたらもちっと改善するかな?
でも計算量がどうなるかだなぁ。 遅いのはコリゴリ。
- 677 名前:535 mailto:sage [2019/01/29(火) 22:13:06.04 ID:PoANmAul.net]
- とりあえず2手読みにしてみたけど2手読みが限界かなぁ
3手は計算量的に相当厳しそう。
- 678 名前:535 mailto:sage [2019/01/29(火) 22:33:10.05 ID:PoANmAul.net]
- 2手読み、なかなかいい感じ。
1手読みから明らかにうち筋が良くなっている。 もし3手読みにしたら…
- 679 名前:535 mailto:sage [2019/01/30(水) 21:21:00.00 ID:d36pZkYy.net]
- 3手読みを仮組してみました。
計算時間がやばいので前方枝刈で思いっきり枝刈してます。
- 680 名前:535 mailto:sage [2019/01/30(水) 22:07:01.71 ID:d36pZkYy.net]
- あああ、惜しいなぁ!
今すごくいい勝ち方しそうだったのに! (;GM[1]FF[4]AP[Zenith:7.0]SZ[19]HA[0]KM[6.5]CA[UTF-8]PB[]BR[]PW[]WR[] ZT[60]DT[]RE[];B[jj];W[ik];B[kk];W[hj];B[ii];W[jk];B[ll];W[hh];B[mm]; W[nn];B[hi];W[gi];B[jl];W[hl];B[ki];W[km];B[lh];W[mi];B[kg];W[kl];B[ke]; W[kf];B[jf];W[lf];B[jd];W[ie];B[je];W[ig](;B[jg];W[jh];B[ih];W[ji];B[kh]; W[jh];B[ji];W[gg];B[jh])(;B[kh];W[jg];B[ih];W[gg];B[nm];W[gk];B[fh];W[gh]; B[gj];W[fj];B[gl];W[ek];B[fk];W[fl];B[mk];W[gm];B[mh];W[gl];B[jh];W[gj])) もしこの勝ち方ができてたら瞬間最大棋力は名人に届く、ってくらいすごかった。
- 681 名前:535 mailto:sage [2019/01/30(水) 22:44:38.83 ID:d36pZkYy.net]
- 実装もひと段落ついた感じがあるので対戦統計とってみます。
- 682 名前:535 mailto:sage [2019/01/31(木) 20:38:25.44 ID:wmRSa8/r.net]
- やはりLV3は強いですね。
正直、もっと勝てるかと思ってました。 まだまだ精進せねば。 41局目 黒(airandom.dll)の勝利回数: 33 白(ai-lv1.dll)の勝利回数: 8 58局目 黒(airandom.dll)の勝利回数: 48 白(ai-lv2.dll)の勝利回数: 10 32局目 黒(airandom.dll)の勝利回数: 6 白(ai-lv3.dll)の勝利回数: 26
- 683 名前:535 mailto:sage [2019/02/01(金) 20:50:18.97 ID:YKCFM9Y9.net]
- 序盤DBがlv3 vs lv3の生の勝率データだからちょっと加工したらもっと有益なデータにならないかな
- 684 名前:535 mailto:sage [2019/02/01(金) 23:25:50.28 ID:c38ZEsSq.net]
- バグは小説よりも奇なり
- 685 名前:535 mailto:sage [2019/02/03(日) 19:29:39.51 ID:AT8t8or9.net]
- (;SZ[19]
;B[jj];W[ij];B[ik];W[hk];B[hj];W[ii];B[hl];W[gk] ;B[gm];W[ki];B[jl];W[fl];B[km];W[gi];B[ji];W[jh] ;B[lm];W[im];B[il];W[in];B[ml];W[ll];B[lk];W[gl] ;B[nl];W[kl];B[kk];W[ol];B[ll];W[pl];B[kl])
- 686 名前:535 mailto:sage [2019/02/03(日) 20:43:10.48 ID:AT8t8or9.net]
- (;SZ[19]
;B[jj];W[ij];B[ik];W[hk];B[hj];W[ii];B[hl];W[jk] ;B[gk];W[hi];B[jl];W[kk];B[gi];W[km];B[kl];W[im] ;B[il];W[gl];B[gm];W[fl];B[ki];W[fn];B[lk];W[mk] ;B[fk];W[lh];B[kj];W[jn];B[kk];W[mg];B[hk];W[ng] ;B[jk])
- 687 名前:535 mailto:sage [2019/02/04(月) 21:24:20.28 ID:xSiFrXwQ.net]
- コア数が足りていたとしても性能が落ちるのは
ターボブーストが利かなくなる分クロックが落ちるということだろうか?
- 688 名前:535 mailto:sage [2019/02/04(月) 21:32:25.91 ID:xSiFrXwQ.net]
- 単独で学習流すと1エポック5000秒強くらいだが棋譜取りと並列にすると1エポック8000秒弱かかる。
結構違いますね。
- 689 名前:535 mailto:sage [2019/02/05(火) 19:35:44.19 ID:LeUKzWtY.net]
- 自分からすぐ取られる手を打たない、必敗の手順をちゃんと読む、などの地味な改良をした結果だいぶ改善したようです。
38局目 黒(airandom.dll)の勝利回数: 37 白(ai-lv1.dll)の勝利回数: 1 28局目 黒(airandom.dll)の勝利回数: 28 白(ai-lv2.dll)の勝利回数: 0 30局目 黒(airandom.dll)の勝利回数: 12 白(ai-lv3.dll)の勝利回数: 18
- 690 名前:535 mailto:sage [2019/02/05(火) 19:37:52.43 ID:LeUKzWtY.net]
- そろそろ白番もちゃんと動くようにしなければ…
- 691 名前:535 mailto:sage [2019/02/05(火) 20:01:16.79 ID:LeUKzWtY.net]
- 白番が動かないことには自己対局による強化学習も不可能…
- 692 名前:535 mailto:sage [2019/02/05(火) 20:07:09.73 ID:LeUKzWtY.net]
- >>676の棋譜を見ていますが自分からすぐ取られる手を打たなくしたはずなのですが打ってますね。。。
バグか。
- 693 名前:535 mailto:sage [2019/02/05(火) 20:47:39.46 ID:LeUKzWtY.net]
- すげぇぇぇええええぇえ!
ゲタ打った!!! (;SZ[19] ;B[jj];W[ji];B[ki];W[ii];B[ik];W[kh];B[jh];W[kj] ;B[li];W[hi];B[lh];W[mg];B[kk];W[lj];B[mi];W[mj] ;B[ni];W[ij];B[jk];W[hk];B[nk];W[gl];B[kg];W[fm] ;B[en];W[hm];B[gj];W[il];B[mh];W[hh];B[hj];W[gi] ;B[oh];W[fi];B[ih];W[ei];B[di];W[jg];B[nh];W[ig] ;B[kh])
- 694 名前:535 mailto:sage [2019/02/05(火) 20:55:47.56 ID:LeUKzWtY.net]
- ゲタなんか一切教えてないのにゲタ打った。
この衝撃がみんなに伝わるかなぁ。
- 695 名前:535 mailto:sage [2019/02/05(火) 21:18:10.97 ID:LeUKzWtY.net]
- あれ、ネットワークのファイル更新したらLV2に負けるようになっちゃった。
なぜ?
- 696 名前:535 mailto:sage [2019/02/05(火) 23:23:47.50 ID:LeUKzWtY.net]
- ネットワークじゃなくて序盤DBがおかしいのかなぁ。
- 697 名前:310 mailto:sage [2019/02/06(水) 01:11:54.97 ID:uzcir1oY.net]
- 久々です。
置換表は、だいぶ前にリハッシュ対応して、この辺にしとこうか状態になってます。 多分unordered_mapの仕組みはそこそこ理解できたと思います。 deleteとガベージコレクション、iteratorを除いてですが。 Edaxのソースを解析しようと、VC++で読み込んでみましたが、Edaxは裸のCで… _s地獄とコンパイラの違いで、動かすところまで持ち込むのが相当大変な感じ。 一番の地獄は、探索部のソースを見ても何がなんだかわからない事。 せめて偶数理論のところは見つけたいんだけど。滅茶諦めモード。 というわけで、記譜作成を動かし続けるしかなくなってしまいましたorz WZebraのソースが見たい…。
- 698 名前:310 mailto:sage [2019/02/06(水) 01:14:08.23 ID:uzcir1oY.net]
- >>675
メモリバスの帯域とか、L2キャッシュ溢れとか… わかっているけど、エビデンスが取れないので、認められないorz
- 699 名前:535 mailto:sage [2019/02/06(水) 20:19:19.81 ID:s2iJEq7C.net]
- ゲタっぽい手また打った。
パッと見成立しないんだけど、なんとなく味が悪いことわかってるんだな。 すごい! (;SZ[19] ;B[jj];W[ji];B[ki];W[ij];B[ii];W[jk];B[jh];W[li] ;B[kk];W[kg];B[ik];W[jl];B[hj];W[lj];B[lh];W[hl] ;B[jg];W[if];B[mk];W[lk];B[ll];W[kl];B[kj];W[lm] ;B[ml];W[mm];B[mi];W[il];B[mj];W[gj];B[nj];W[lj] ;B[li];W[jm];B[lk];W[oi];B[ij];W[pi];B[lj]) >>685 マルチ性能も大事だけどシングル性能も結構大事で 並列計算するか結構悩みどころですね。 学習結果が早くほしい時は棋譜取りしないというのもありっちゃあり。
- 700 名前:535 mailto:sage [2019/02/06(水) 21:11:19.34 ID:s2iJEq7C.net]
- ん、なんかいままでは序盤DBの力で勝ってきたようなものだけど、
むしろ中盤力のほうが勝り始めてる気がする。 序盤DBが物足りなく感じる。。。
- 701 名前:535 mailto:sage [2019/02/06(水) 21:50:52.85 ID:s2iJEq7C.net]
- いろいろ試してみたくなるけど、やっぱ棋譜取りがすべての源泉な気がする。
日中は棋譜取りに専念するのが吉か?
- 702 名前:535 mailto:sage [2019/02/07(木) 21:28:54.73 ID:GJ+3NG1C.net]
- やはり更なる上を目指すには強化学習が必須か?
- 703 名前:535 mailto:sage [2019/02/07(木) 21:49:04.85 ID:GJ+3NG1C.net]
- どうやっても勝ちってかんじではあるけど
17手目が面白い手でうまく必勝形につなげた。 正直この手は俺にも見えてなかった。 (;SZ[19] ;B[jj];W[ij];B[ii];W[hi];B[ik];W[ih];B[hj];W[gh] ;B[gi];W[fj];B[hh];W[hg];B[fh];W[jl];B[gg];W[kk] ;B[kh];W[ig];B[li];W[fi];B[mi];W[ji];B[jh];W[km] ;B[ki];W[ln];B[hi];W[mn];B[ji])
- 704 名前:310 mailto:sage [2019/02/08(金) 00:11:00.05 ID:Ar3tbH3V.net]
- 偶数理論なかなか良い実装を思いつきました。
オーバーヘッドが極小なのは、オーダリングへ影響する値だけゼロにして、 ほぼ速度低下が無い事で確認済です。が…何をどうしても速度がダウンします。 というわけで、またしても偶数理論挫折。 次ネタ考え中。 ネタを一つ見つけたけど、結構全面改訂になりそう。
- 705 名前:535 mailto:sage [2019/02/09(土) 16:38:22.33 ID:Y3QZLQMW.net]
- なんかひと段落ついちゃったら次何すればいいかわかんなくなっちゃったな。
とりあえず、棋譜取りだけは地味に続けるけど。
- 706 名前:535 mailto:sage [2019/02/09(土) 16:39:13.34 ID:Y3QZLQMW.net]
- 白番がバグってるの直すのあったなそういえば。。。
- 707 名前:310 mailto:sage [2019/02/09(土) 21:06:41.89 ID:bf+o2ihZ.net]
- 次ネタ結構大変だと思ったら、意外と簡単にできた。
FFO40-49のタイムは30%強短縮した。 FFO40が悪化して、49はだいぶ短縮しているので、探索深さが深い方が 効果が出る傾向に見える。という事は、残り28か所空きをやっている棋譜 作成では、もっと改善する可能性あるかも。 思い込みって怖い。正直、何故今まで思い付かなかったのだろうというレベルorz
- 708 名前:535 mailto:sage [2019/02/10(日) 00:11:19.28 ID:CIRPPqWT.net]
- 白番動くようになったみたいです。
白番でLV2に勝ちました! (;SZ[19] ;B[ef];W[eg];B[fg];W[fh];B[eh];W[dg];B[gh];W[fi] ;B[gf];W[di];B[df];W[fe];B[cg];W[dh];B[gi];W[ff] ;B[gg];W[ge];B[hi];W[ej];B[ij];W[de];B[hd];W[hj] ;B[he];W[if];B[hf];W[ih];B[hh];W[ig];B[hc];W[hg] ;B[gj];W[hk];B[gl];W[gk];B[fj];W[ei];B[cd];W[cf] ;B[jk];W[kl];B[ed];W[ee];B[ek];W[dj];B[jh];W[dk] ;B[il];W[df])
- 709 名前:310 mailto:sage [2019/02/10(日) 09:57:20.94 ID:WWsJbkKo.net]
- パラメータの調整というか、使い方変えたら、更に5%くらい改善。
残り28手空きの記譜作成は、トータル倍弱まで速度アップした模様。 とはいえl、記譜作成の方は、解く問題によってばらつきが大きすぎる ので、もう少し様子を見ないと、どれくらい早くなったかはなんとも 言えない。早くなったのは確実。 さて、またネタが無くなった(汗
- 710 名前:535 mailto:sage [2019/02/10(日) 14:13:32.91 ID:CIRPPqWT.net]
- 分かってたつもりだったけどLV2の黒番のうち筋が思ったより良くて、
序盤DBに取り込んでもいいかなってちょっと思うようになった。
- 711 名前:535 mailto:sage [2019/02/10(日) 14:38:22.21 ID:CIRPPqWT.net]
- lv2 vs lv3で棋譜取りしてlv2のいいところを抽出しようとしたら
lv3が強すぎてlv2のいいところが取れないっぽいんだがwwww これは計算外
- 712 名前:535 mailto:sage [2019/02/10(日) 16:41:39.34 ID:CIRPPqWT.net]
- lv2 vs lv3はlv2の勝率が3割3分くらい。
思ったよりはlv2が善戦してるかな?
- 713 名前:535 mailto:sage [2019/02/11(月) 00:03:36.62 ID:upj5oiO/.net]
- lv2の棋譜を取り込んで対戦統計とり始めました。
15局目 黒(airandom.dll)の勝利回数: 13 白(ai-lv1.dll)の勝利回数: 2 14局目 黒(airandom.dll)の勝利回数: 14 白(ai-lv2.dll)の勝利回数: 0 7局目 黒(airandom.dll)の勝利回数: 0 白(ai-lv3.dll)の勝利回数: 7 10局目 黒(ai-lv1.dll)の勝利回数: 1 白(airandom.dll)の勝利回数: 9 6局目 黒(ai-lv2.dll)の勝利回数: 3 白(airandom.dll)の勝利回数: 3 6局目 黒(ai-lv3.dll)の勝利回数: 3 白(airandom.dll)の勝利回数: 3 lv1には文句なく勝ってますね。 lv2もトータル勝ち越せるかも。 lv3は白番でいい勝負なのはすごいですが、 黒番で勝ててないのが気になりますね。
- 714 名前:535 mailto:sage [2019/02/11(月) 19:03:47.89 ID:N2auq0Bn.net]
- 黒番対lv2は勝率100% w
序盤DBが完全に筋に入ってる感じですかね。 対lv3の戦績もlv2 vs lv3の戦績と比較して決して悪くないです。 40局目 黒(airandom.dll)の勝利回数: 36 白(ai-lv1.dll)の勝利回数: 4 42局目 黒(airandom.dll)の勝利回数: 42 白(ai-lv2.dll)の勝利回数: 0 25局目 黒(airandom.dll)の勝利回数: 9 白(ai-lv3.dll)の勝利回数: 16 50局目 黒(ai-lv1.dll)の勝利回数: 7 白(airandom.dll)の勝利回数: 43 30局目 黒(ai-lv2.dll)の勝利回数: 22 白(airandom.dll)の勝利回数: 8 33局目 黒(ai-lv3.dll)の勝利回数: 24 白(airandom.dll)の勝利回数: 9
- 715 名前:535 mailto:sage [2019/02/11(月) 21:10:52.87 ID:N2auq0Bn.net]
- でも悲しいことに俺のAIには怖さがないんだよなぁ。
ちょっと気を抜くと負かされてしまうような怖さが。 lv2とlv3にはそれがある。
- 716 名前:535 mailto:sage [2019/02/12(火) 20:26:23.49 ID:G3iO6dyJ.net]
- こんな感じです。
50局目 黒(airandom.dll)の勝利回数: 45 白(ai-lv1.dll)の勝利回数: 5 50局目 黒(airandom.dll)の勝利回数: 50 白(ai-lv2.dll)の勝利回数: 0 40局目 黒(airandom.dll)の勝利回数: 14 白(ai-lv3.dll)の勝利回数: 26 50局目 黒(ai-lv1.dll)の勝利回数: 7 白(airandom.dll)の勝利回数: 43 48局目 黒(ai-lv2.dll)の勝利回数: 39 白(airandom.dll)の勝利回数: 9 46局目 黒(ai-lv3.dll)の勝利回数: 32 白(airandom.dll)の勝利回数: 14 ホントは全部50局打ちたかったんだけど時間がかかるので打ち切りました。
- 717 名前:535 mailto:sage [2019/02/13(水) 19:55:00.78 ID:7bnMzRQL.net]
- DNNの教師データを棋譜からの生勝率ではなく、少し探索した結果にしてみようかと思ってます。
- 718 名前:535 mailto:sage [2019/02/14(木) 22:04:12.79 ID:yW8Bcw4A.net]
- なんか変な手打つorz
結局、生勝率が一番いいのかな…
- 719 名前:名前は開発中のものです。 [2019/02/15(金) 23:01:57.18 ID:szQyRPlV.net]
- >>684
https://github.com/okuhara/edax-reversi-AVX は VC でもコマンドラインならビルド可能です。(NMakefile) (本家の Edax も NMakefile は付いているが、多少変更が必要) Edax の偶数は基本的に Zebra と同じ。QUADRANT_ID あたりを追ってみては?
- 720 名前:310 mailto:sage [2019/02/15(金) 23:44:55.03 ID:fcveN5+T.net]
- >>706
情報ありがとうございます。そのソースなのですが、コマンドラインなのですね。 ビルドしたかった理由はデバッグモードを使いたかったからです。 QUADRANT_IDのあたりは追っかけたのですが、もともとの探索の構造が 読めなくて、デバッグモードに頼ろうとした次第です。 で、処理内容を予想して自分で組んでみたのですが、FFOテストでは速度が 若干ですが、落ちてしまうのです。 あと、実はVC++しか使った事ないというか、オセロ開発でC++使い始めたので、 makefileが何やってるのかわからないです(汗 というわけで、ちと調べてみます。 動くだけでも、自動対戦の相手になってもらえる可能性ありますから。
- 721 名前:535 mailto:sage [2019/02/16(土) 00:14:31.55 ID:MvwJSI7c.net]
- 310さんってC++のエキスパートなのかと思ってたっす。
ちょっと意外。
- 722 名前:535 mailto:sage [2019/02/17(日) 21:11:39.54 ID:23WhPvCR.net]
- ネタがなくなってちょっと熱も冷めた感じ。
とりあえず、自己対局による強化学習をぼちぼち何とかしたい。
- 723 名前:535 mailto:sage [2019/02/18(月) 23:23:00.57 ID:dOglmLQj.net]
- 俺のAI vs 俺のAIの棋譜
(;SZ[19] ;B[jj];W[kj];B[kk];W[ji];B[lj];W[ki];B[ij];W[lk] ;B[ll];W[mk];B[ii];W[ml];B[mm];W[nn];B[hh];W[gg] ;B[oo];W[on];B[ih];W[nm];B[po];W[mj];B[nk];W[ok] ;B[ol];W[ni];B[nl];W[mo];B[ln];W[mn];B[lm];W[li] ;B[hk];W[oj];B[oi];W[pi];B[oh];W[qj];B[pk];W[nj] ;B[pj];W[pl];B[il];W[qk];B[in];W[pj];B[im];W[lj]) 両当たりかけられるところを放置したり抜かなくていい石を抜いたりいろいろ危なっかしいところはあるが 現状、こんな感じです。
- 724 名前:535 mailto:sage [2019/02/19(火) 22:08:59.80 ID:d5ndvgDR.net]
- いまよりもっと人工知能技術が普及して働き口が増えたら人工知能系の職に転職したいwww
- 725 名前:535 mailto:sage [2019/02/19(火) 22:42:38.22 ID:d5ndvgDR.net]
- 次のアイディアが出るまで
対LV3の棋譜をとる→序盤DBを更新する→DNNを更新する→対LV3の棋譜をとる のサイクルを繰り返すことにします。
- 726 名前:535 mailto:sage [2019/02/20(水) 21:16:37.27 ID:d5NzdsVZ.net]
- 珍しい負け方した。
白必勝形のダブルリーチ この形は非常に珍しいと思う。 (;SZ[19] ;B[jj];W[kk];B[ki];W[ik];B[ii];W[hi];B[ij];W[jk] ;B[hk];W[hl];B[gj];W[hj];B[gk];W[gl];B[jl];W[gi] ;B[fi];W[jm];B[kl];W[km];B[ll];W[im];B[fm];W[lm] ;B[hh];W[mm];B[hm];W[lk];B[gh];W[hn];B[gm];W[mk] ;B[li];W[nl];B[om];W[ok];B[nj];W[nk])
- 727 名前:535 mailto:sage [2019/02/21(木) 19:59:44.77 ID:PxV5X23E.net]
- 日に日にじわじわ強くなってる気がする。
どこかのタイミングで爆発的に強くなったりしないかな?
- 728 名前:310 mailto:sage [2019/02/22(金) 00:24:39.77 ID:e/VjvE/W.net]
- ようやく評価関数が安定してきたのか、遡り記譜作成の速度が上がってきた気がする。
暇なので、mctsでも組んどこうかと考え始めたら、置換表の新アイデアが。 今までは、unordered_mapにとらわれていましたが、もともと探索木は文字通り ツリー構造なので、その形のまんま置換表にして、探索しながら木を同時並行 でたどっていけば、置換表内で「探す」必要が無い上に、着手リストがそのまま ノードとして存在しているので、反復系の探索の時に何度もmobility関数を呼ぶ 必要が無い。 結構大掛かりな修正になりましたが、とりあえず基礎的な探索まではできるように なりました。速度計測はこれから。 あと、shared_ptr使った事で、不要な置換表データを自動削除できるので、minMaxで AIを組んだ時に、置換表を縮小しながら再利用できるかなと。 あ、mctsはどこに行ってしまったんだろう(汗
- 729 名前:535 mailto:sage [2019/02/22(金) 20:49:26.61 ID:pJcyJywR.net]
- 10並列でLV3と対戦しました。
29局目 黒(airandom.dll)の勝利回数: 15 白(ai-lv3.dll)の勝利回数: 14 32局目 黒(airandom.dll)の勝利回数: 15 白(ai-lv3.dll)の勝利回数: 17 32局目 黒(airandom.dll)の勝利回数: 20 白(ai-lv3.dll)の勝利回数: 12 34局目 黒(airandom.dll)の勝利回数: 16 白(ai-lv3.dll)の勝利回数: 18 30局目 黒(airandom.dll)の勝利回数: 12 白(ai-lv3.dll)の勝利回数: 18 32局目 黒(airandom.dll)の勝利回数: 6 白(ai-lv3.dll)の勝利回数: 26 30局目 黒(airandom.dll)の勝利回数: 12 白(ai-lv3.dll)の勝利回数: 18 33局目 黒(airandom.dll)の勝利回数: 18 白(ai-lv3.dll)の勝利回数: 15 37局目 黒(airandom.dll)の勝利回数: 17 白(ai-lv3.dll)の勝利回数: 20 32局目 黒(airandom.dll)の勝利回数: 13 白(ai-lv3.dll)の勝利回数: 19 トータル 144勝 177敗 勝率 44.9% これはLV2 vs LV3 と比べてかなりいい数字です!
- 730 名前:310 mailto:sage [2019/02/23(土) 17:22:38.75 ID:XSOOC+yB.net]
- >>715の続き
良く考えたら、ツリー構造で自分の値を残しておくという意味で、mtd(f)や 反復深化の系統には効果あるけど、同じ局面を見つける事ができないので そもそも置換表ではありませんねorz その代り、並列探索でも排他制御をしなくて良い事になります。 メモリー使用量も少なくて済みます。 速度については、今のところ微妙。 棋譜作成が一段落したらPCリセットしてクリーンな状態で再計測の予定。
- 731 名前:535 mailto:sage [2019/02/23(土) 19:16:16.09 ID:ThnkYxTz.net]
- 対戦統計っ
- 732 名前:て10000局くらいやらないと±10%くらいの誤差は簡単に出てしまうのかもしれない。
何局くらいやれば信頼できるんだろ?あんま統計詳しくないんだよな〜 [] - [ここ壊れてます]
- 733 名前:535 mailto:sage [2019/02/23(土) 19:28:15.18 ID:ThnkYxTz.net]
- そういえば「コンピュータ囲碁 ―モンテカルロ法の理論と実践」になんか書いてあったような気もする。
- 734 名前:535 mailto:sage [2019/02/24(日) 21:49:18.42 ID:auCrr5Wc.net]
- なんか弱くなってる気がするorz
LV0とかLV1にも序盤不利になったりするorz 最終的に逆転できることもあるんだけど、そのまま押し切られることもあるorz まずいでしょうこれはorz
- 735 名前:310 mailto:sage [2019/02/24(日) 23:56:43.56 ID:GBomweD/.net]
- んごー。めっちゃスピードダウンorz
ダメ筋だったかも。 途中速度アップしてる気がしていたけど、単にバグっていただけだった。 置換表機能が消えて、余計な筋を読んでいるのか。 それとも、パラパラとmake_sharedしているからなのか。 どうせやる事ないので、しばし検討。
- 736 名前:535 mailto:sage [2019/02/25(月) 20:30:16.25 ID:/PmJxqQK.net]
- もっとマシンパワーが欲しい!
モアパワー、モアトルクだ!
- 737 名前:535 mailto:sage [2019/02/25(月) 20:48:25.65 ID:/PmJxqQK.net]
- 大学で統計の単位とっとくんだったorz
独学は厳しいorz
- 738 名前:535 mailto:sage [2019/02/26(火) 20:20:50.08 ID:veq8AgWN.net]
- 序盤DBはもう少し工夫しないと駄目かもなぁ
- 739 名前:535 mailto:sage [2019/02/26(火) 22:16:04.17 ID:veq8AgWN.net]
- あの伝説の手筋が実現しかけたが、残念ながら実現しなかった。
あとちょっとだったのに、悔しい!! (;SZ[19] ;B[jj];W[jk];B[ki];W[ij];B[ik];W[hk];B[il];W[kj] ;B[ji];W[ih];B[hl];W[gm];B[ii];W[hi];B[gl];W[li] ;B[hh];W[ig];B[kk];W[ll];B[km];W[jl];B[jn];W[kl] ;B[lh];W[mg];B[lj];W[hj];B[gk];W[gh];B[lm];W[hf] ;B[he];W[kh];B[gi];W[hg];B[gj];W[jg];B[gg];W[lg] ;B[kf];W[fg];B[ef];W[kg];B[ng];W[gf];B[fe];W[gg])
- 740 名前:535 mailto:sage [2019/02/26(火) 23:53:19.73 ID:veq8AgWN.net]
- 負けたけど、7連までの手数が絡んだ微妙な駆け引きが素晴らしい名局だった。
勝つチャンスはあったと思うけどな〜惜しいな〜 (;SZ[19] ;B[jj];W[kj];B[jk];W[ki];B[kk];W[kh];B[il];W[lk] ;B[ll];W[ml];B[in];W[ji];B[im];W[ih];B[nm];W[hi] ;B[jo];W[gi];B[li];W[fh];B[ij];W[ii];B[io];W[ei] ;B[ip];W[fi])
- 741 名前:535 mailto:sage [2019/02/27(水) 21:30:22.80 ID:Y++kUwc3.net]
- モンテカルロ木探索とDNNと組み合わせてみようかなぁ
そのほうがランダム性も出せるし でも遅くなったらやだな。うーん
- 742 名前:535 mailto:sage [2019/02/27(水) 22:03:24.47 ID:Y++kUwc3.net]
- なんか取れないシチョウを追いかけたw
シチョウルーチンにバグがあるのか、DNNの評価値でシチョウを追いかけてしまったのかイマイチ判断がつかないな。
- 743 名前:535 mailto:sage [2019/02/27(水) 22:47:59.69 ID:Y++kUwc3.net]
- ん、なんかLV2にコロコロ負けるようになった。
自分のAI vs lv 3 の棋譜を取り入れたせいで序盤DBが狂っちゃったかな。
- 744 名前:535 mailto:sage [2019/02/28(木) 22:39:23.34 ID:VN3HTH0V.net]
- なんか新しいアイディアが欲しいな。
>>712のサイクルはちょっと手詰まり感。
- 745 名前:535 mailto:sage [2019/03/04(月) 20:07:01.61 ID:+UlAfF8J.net]
- ここ数日さぼりっぱなし。
棋譜取りも逆に弱くなりそうでさぼってます。
- 746 名前:535 mailto:sage [2019/03/04(月) 22:26:37.19 ID:+UlAfF8J.net]
- やっぱ序盤の大局観で優位に立ちたいんだよなぁ。
中盤、終盤はある程度読みでカバーできるけど序盤はマジ謎が多いからな。
- 747 名前:310 mailto:sage [2019/03/04(月) 23:03:17.87 ID:2gMEJXd0.net]
- バグでドツボ中。
再現性がなさすぎて、よーわからん。 頻度の低さと、再現性の無さから、置換表の二重更新だと思うんだけど… それっぽい箇所も見当たらない。
- 748 名前:535 mailto:sage [2019/03/09(土) 21:06:39.62 ID:jNDDSRBd.net]
- 完全にさぼり状態。
アイディアも枯渇したし。 どこかにネタ落ちてないかな。
- 749 名前:535 mailto:sage [2019/03/10(日) 00:25:59.41 ID:BU7hKn7v.net]
- 禁断の人間(俺)vs lv3の棋譜取りをやろうかと思ってます。
これは手間が半端ないw
- 750 名前:535 mailto:sage [2019/03/10(日) 00:40:34.55 ID:BU7hKn7v.net]
- 早くもギブアップwwwww
なかなかいい棋譜が取れない 基本的に無理筋orz.
- 751 名前:535 mailto:sage [2019/03/10(日) 20:17:25.17 ID:BU7hKn7v.net]
- 自分のAI vs lv3 で 手筋炸裂!!
うって返しでました! (;SZ[19] ;B[jj];W[ki];B[ii];W[kj];B[kk];W[ih];B[hh];W[gg] ;B[ll];W[mm];B[mk];W[jk];B[jl];W[ik];B[il];W[hk] ;B[hl];W[gl];B[gk];W[ji];B[hj];W[ij];B[jj];W[hi] ;B[jk];W[gi];B[ik];W[nk];B[lk];W[ok];B[hk])
- 752 名前:535 mailto:sage [2019/03/11(月) 19:47:21.03 ID:X4t/4BPO.net]
- 棋譜取り再開しました。
弱くなる可能性は潰せてないのですが、何もしないよりはましだと思って。
- 753 名前:535 mailto:sage [2019/03/11(月) 21:55:27.12 ID:X4t/4BPO.net]
- 10並列 対戦結果
30局目 黒(airandom.dll)の勝利回数: 16 白(ai-lv3.dll)の勝利回数: 14 21局目 黒(airandom.dll)の勝利回数: 10 白(ai-lv3.dll)の勝利回数: 11 29局目 黒(airandom.dll)の勝利回数: 12 白(ai-lv3.dll)の勝利回数: 17 22局目 黒(airandom.dll)の勝利回数: 6 白(ai-lv3.dll)の勝利回数: 16 24局目 黒(airandom.dll)の勝利回数: 14 白(ai-lv3.dll)の勝利回数: 10 27局目 黒(airandom.dll)の勝利回数: 14 白(ai-lv3.dll)の勝利回数: 13 27局目 黒(airandom.dll)の勝利回数: 14 白(ai-lv3.dll)の勝利回数: 13 30局目 黒(airandom.dll)の勝利回数: 15 白(ai-lv3.dll)の勝利回数: 15 23局目 黒(airandom.dll)の勝利回数: 10 白(ai-lv3.dll)の勝利回数: 13 28局目 黒(airandom.dll)の勝利回数: 13 白(ai-lv3.dll)の勝利回数: 15 トータル 124勝137敗 勝率 47.5% 悪くない
- 754 名前:535 mailto:sage [2019/03/12(火) 20:57:52.00 ID:ACQKgt0P.net]
- LV3に勝利。
途中負けかけたけど相手がミスした。 終盤の数手が素晴らしい一局だった。 (;SZ[19] ;B[jj];W[ki];B[ji];W[jh];B[ih];W[ig];B[kh];W[jg] ;B[kj];W[hf];B[li];W[kg];B[lg];W[gf];B[lk];W[mj] ;B[hi];W[fg];B[eg];W[mi];B[lf];W[lj];B[fi];W[gi] ;B[gj];W[gh];B[ej];W[fk];B[fj];W[ij];B[ik];W[ge] ;B[ii];W[hj];B[hk];W[fd];B[ki];W[me];B[ij];W[ne] ;B[hj])
- 755 名前:535 mailto:sage [2019/03/12(火) 21:01:50.73 ID:ACQKgt0P.net]
- それにしてもディープラーニングの学習がメモリ20GB食ってるんだがw
奮発してメモリ32GBにしといてよかった。 やっぱハードウェア性能は正義だな。 Zen2のスリッパ出たらうっかり買いそうで自分が怖いw
- 756 名前:535 mailto:sage [2019/03/13(水) 20:46:36.19 ID:7rSi15yT.net]
- 12並列対戦
29局目 黒(airandom.dll)の勝利回数: 12 白(ai-lv3.dll)の勝利回数: 17 30局目 黒(airandom.dll)の勝利回数: 17 白(ai-lv3.dll)の勝利回数: 13 28局目 黒(airandom.dll)の勝利回数: 11 白(ai-lv3.dll)の勝利回数: 17 28局目 黒(airandom.dll)の勝利回数: 10 白(ai-lv3.dll)の勝利回数: 18 36局目 黒(airandom.dll)の勝利回数: 13 白(ai-lv3.dll)の勝利回数: 23 25局目 黒(airandom.dll)の勝利回数: 11 白(ai-lv3.dll)の勝利回数: 14 31局目 黒(airandom.dll)の勝利回数: 14 白(ai-lv3.dll)の勝利回数: 17 28局目 黒(airandom.dll)の勝利回数: 13 白(ai-lv3.dll)の勝利回数: 15 32局目 黒(airandom.dll)の勝利回数: 13 白(ai-lv3.dll)の勝利回数: 19 33局目 黒(airandom.dll)の勝利回数: 17 白(ai-lv3.dll)の勝利回数: 16 31局目 黒(airandom.dll)の勝利回数: 17 白(ai-lv3.dll)の勝利回数: 14 25局目 黒(airandom.dll)の勝利回数: 8 白(ai-lv3.dll)の勝利回数: 17 156勝200敗 勝率 43.8% 弱くなったのか誤差の範囲なのか、うーん。
- 757 名前:535 mailto:sage [2019/03/14(木) 23:27:52.29 ID:V04VYcAB.net]
- >>742の棋譜を序盤DBに取り込んで、その序盤DBをもとにDNNの学習をやり足しました。
DNNは序盤DB拡張と学習のサイクルを繰り返し行っているので秘伝のタレみたいになってますw これで今夜からもう一度対LV3対戦やってみます。
- 758 名前:535 mailto:sage [2019/03/14(木) 23:40:56.98 ID:V04VYcAB.net]
- 7局目 黒(airandom.dll)の勝利回数: 3 白(ai-lv3.dll)の勝利回数: 4
7局目 黒(airandom.dll)の勝利回数: 4 白(ai-lv3.dll)の勝利回数: 3 7局目 黒(airandom.dll)の勝利回数: 3 白(ai-lv3.dll)の勝利回数: 4 5局目 黒(airandom.dll)の勝利回数: 4 白(ai-lv3.dll)の勝利回数: 1 7局目 黒(airandom.dll)の勝利回数: 4 白(ai-lv3.dll)の勝利回数: 3 5局目 黒(airandom.dll)の勝利回数: 3 白(ai-lv3.dll)の勝利回数: 2 4局目 黒(airandom.dll)の勝利回数: 1 白(ai-lv3.dll)の勝利回数: 3 5局目 黒(airandom.dll)の勝利回数: 3 白(ai-lv3.dll)の勝利回数: 2 9局目 黒(airandom.dll)の勝利回数: 7 白(ai-lv3.dll)の勝利回数: 2 6局目 黒(airandom.dll)の勝利回数: 4 白(ai-lv3.dll)の勝利回数: 2 6局目 黒(airandom.dll)の勝利回数: 2 白(ai-lv3.dll)の勝利回数: 4 7局目 黒(airandom.dll)の勝利回数: 4 白(ai-lv3.dll)の勝利回数: 3 42勝33敗 勝率56% 出だしは好調! 明日一日回してどうなるか… 👀 Rock54: Caution(BBR-MD5:1341adc37120578f18dba9451e6c8c3b)
- 759 名前:535 mailto:sage [2019/03/14(木) 23:44:29.21 ID:V04VYcAB.net]
- ありゃなんかRock54ついとる。
文章の繰り返しが駄目なんか?
- 760 名前:535 mailto:sage [2019/03/15(金) 20:06:11.54 ID:PqqnV2Up.net]
- 残念ながら駄目でしたorz
155勝 209敗 勝率 42.6% やっぱ対局回数増やすとこの辺に落ち着くのか、うーん
- 761 名前:535 mailto:sage [2019/03/16(土) 18:31:00.14 ID:7iioDFjE.net]
- >>746から対戦を止めずに継続していましたが
211勝289敗 勝率42.2% となりました。 やっぱこの辺が真の値なのかな。
- 762 名前:535 mailto:sage [2019/03/17(日) 00:52:38.93 ID:5SZpbjE6.net]
- 更に学習を続けます
- 763 名前:535 mailto:sage [2019/03/17(日) 21:35:48.21 ID:5SZpbjE6.net]
- まじでZen2スリッパでたら買ってしまいたい衝動に駆られる
- 764 名前:535 mailto:sage [2019/03/18(月) 00:19:09.18 ID:eJisfZab.net]
- 8勝2敗だと95%の確率で強いといえるらしいが、12並列もしてると1つは8勝2敗ぐらいになったりするw。
まあ確率的にはそうなのかも。 結局1000局くらいやらないと駄目ってことかな?
- 765 名前:535 mailto:sage [2019/03/18(月) 21:25:08.42 ID:eJisfZab.net]
- やっぱ弱くなってるかもT△T
143勝 220敗 勝率 39.4% このままこの学習サイクルを進めていいか迷うorz
- 766 名前:535 mailto:sage [2019/03/18(月) 21:37:35.02 ID:eJisfZab.net]
- 禁断のモンテカルロ木探索の封印を解くか?
しかしあれは計算時間が半端ないからな。 出来れば避けたい。
- 767 名前:535 mailto:sage [2019/03/18(月) 21:52:51.93 ID:eJisfZab.net]
- プロのタイトル戦が7番勝負とかだけど7番ぽっちじゃ真の強者はわからんってことやなw
- 768 名前:535 mailto:sage [2019/03/18(月) 23:53:39.58 ID:eJisfZab.net]
- モンテカルロ実装したけど、なんか素朴な手を選ぶようになってしまった。
うーん、コレジャナイ感がorz
- 769 名前:535 mailto:sage [2019/03/19(火) 21:06:00.35 ID:87DWY+/2.net]
- なんかおかしい。
LV3が強すぎる気がするw もしかしてLV3には学習機能がついていて計算回せば回すほど強くなるとか?w んなわけないか。
- 770 名前:535 mailto:sage [2019/03/21(木) 03:04:06.19 ID:gYmqCPQ5.net]
- 祝日だって油断してたらこんな時間w
弱くなってもいいから計算量削る方向で調整しています。
- 771 名前:535 mailto:sage [2019/03/21(木) 17:29:13.47 ID:gYmqCPQ5.net]
- 対戦統計とってます。
66勝 70敗 勝率48.5% 今のところむしろ勝率上がってます! 速度も若干だけど速くなったはず… 勝率50%が欲しい!
- 772 名前:535 mailto:sage [2019/03/22(金) 19:55:26.77 ID:9WNMIpie.net]
- 161勝188敗 勝率 46.1%
悪くない。
- 773 名前:535 mailto:sage [2019/03/22(金) 20:13:46.91 ID:9WNMIpie.net]
- 次のアイディアが欲しいところだ
- 774 名前:310 mailto:sage [2019/03/23(土) 00:07:59.98 ID:QKAaRf+n.net]
- 久々です。
新型版はテストのためにいちいち学習を止めるのが面倒で、放置しています。 一晩耐久テストやらないとわからないので。 で、未だずーっと棋譜作成&学習を続けています。 もともと800件強の記譜をベースに間違い訂正をしたり、確定しているところ以降 の全分岐を作成したりして学習データにしていたのですが、昔作った記譜なので 序盤で結構間違いが多く、効率よく学習できないのではないかと考えました。 で、最近は序盤の定石6〜20手からスタートして記譜を作成したりしていました。 そこそこ序盤の間違いが訂正されてきたのですが、まだところどころおかしい ところがあって、Zebraで並べてみながら、多分間違えたであろう箇所を特定して それ以後の記譜を作らせる事で、強制的に正しい手順に戻すなんていう、禁断の ドーピング技を始めてしまいました。 現在は1200記譜くらいまで増えていますが、まだまだ間違いも散見されますし、 パブリックドローの変化っぽいのに、記譜が無いものもあり、まだまだ記譜が足り ていない感じです。 あと、ドーピング作業やりながらZebraの評価値見ていると、20〜30手目あたりは 進行の種類によってはZebraの評価値もあまりあてにならないなぁと言う事に気付い てしまいました。ここら辺の精度を上げると、もっと強くできるのではないかと思います。 自動対戦してくれる序盤DB付きのオセロプログラムがあると、ドーピング作業が更に 楽になるんだけど(汗 現在残り20手目以後の学習に使う盤面は70万件くらいになっています。それでも 残り20手以後の初見の盤面の評価値では結構な誤差があります。本当にBuroさん の線形評価関数で良いのかというのも相変わらず悩ましいところです。
- 775 名前:535 mailto:sage [2019/03/23(土) 09:44:42.00 ID:C9QFpANM.net]
- 197勝 233敗 勝率 45.8%
悪くない。 一旦対局中断します。
- 776 名前:535 mailto:sage [2019/03/23(土) 17:57:32.40 ID:C9QFpANM.net]
- やっぱ1手1秒くらいで打ちたいなぁ。
そうすれば対戦統計も棋譜も全然もっと取れるのに
- 777 名前:535 mailto:sage [2019/03/23(土) 21:04:03.52 ID:C9QFpANM.net]
- LV2と対戦してみました。
50局目 黒(airandom.dll)の勝利回数: 48 白(ai-lv2.dll)の勝利回数: 2 勝率 96%
- 778 名前:535 mailto:sage [2019/03/24(日) 10:11:30.45 ID:IEpX66ro.net]
- LV1ともやってみました。
50局目 黒(airandom.dll)の勝利回数: 45 白(ai-lv1.dll)の勝利回数: 5 勝率 90%
- 779 名前:535 mailto:sage [2019/03/24(日) 21:21:09.27 ID:IEpX66ro.net]
- ふーむ、損失が減らない地点まで学習が進んでしまったようです。
一回止めるか。
- 780 名前:535 mailto:sage [2019/03/24(日) 21:27:42.78 ID:IEpX66ro.net]
- うーん、やっぱ現状を打破する画期的なアイディアが必要かな。
ちなみにいまは強さよりも速度が欲しいかも。
- 781 名前:535 mailto:sage [2019/03/25(月) 05:48:57.06 ID:9reqTGkG.net]
- 対戦してます。
黒番 対 LV3 107勝 102敗 勝率 51.2% 200戦以上して勝率50%超えはすごい! 今日一日回してみます。
- 782 名前:535 mailto:sage [2019/03/25(月) 21:18:02.28 ID:9reqTGkG.net]
- 結局負け越しでした
165勝 174敗 勝率48.7% でも決して悪い結果ではない!
- 783 名前:535 mailto:sage [2019/03/26(火) 21:11:49.41 ID:AISc91ZO.net]
- まだ回してました
239勝 237敗 勝率 50.2% キター! まあ、今だと50%行くかどうかはホント運しだいなんだろな。
- 784 名前:535 mailto:sage [2019/03/26(火) 21:12:45.47 ID:AISc91ZO.net]
- そろそろ対局止めて次の学習のターンに入ります。
- 785 名前:535 mailto:sage [2019/03/26(火) 21:59:22.07 ID:AISc91ZO.net]
- うお、棋譜が多すぎてls */*.sgfがコアダンプするようになったw
分割しないと駄目か〜
- 786 名前:535 mailto:sage [2019/03/27(水) 21:35:10.22 ID:4D2b4lCy.net]
- そろそろ人間(俺)相手に勝利が欲しいところだがまだむずかしいかな。
素人相手なら勝てるんだろうか?
- 787 名前:535 mailto:sage [2019/03/28(木) 19:32:56.94 ID:ZCt2CXW9.net]
- 165勝 176敗 勝率 48.4%
- 788 名前:310 mailto:sage [2019/03/30(土) 20:46:31.09 ID:IsrC9h82.net]
- 既知のパブリックドローのリストが見つかったというか、
今年になってブログでまとめて発表してくれている人がいた。 ちょうど良いタイミングすぎる(汗 2種類あるのと、自分がZebraから拾った奴を合体して、32手目まででカット。 ソートして重複削除したら450件程度に。多分既存の記譜と多少重複してると思う。 全部やるとかなり記譜が偏る気がするけど、やっちゃうかな。
- 789 名前:535 mailto:sage [2019/03/30(土) 23:47:00.24 ID:o6pzrkpp.net]
- 序盤DBを劇的に改善する方法ないかな?
不利なオープニングを避けるだけで勝率めちゃくちゃ上がりそうな予感がするんだが。
- 790 名前:310 mailto:sage [2019/03/31(日) 01:39:32.24 ID:5poc64Oc.net]
- 棋譜から序盤DB作れない?
- 791 名前:535 mailto:sage [2019/03/31(日) 09:41:09.06 ID:eFSA5935.net]
- 作ってるですがそれでも不利な局面になったりしますorz
- 792 名前:310 mailto:sage [2019/03/31(日) 20:14:25.76 ID:5poc64Oc.net]
- 棋譜から序盤DB作る時に、その盤面からの勝率入れて、勝率が高い手を指す
ようにするとか。まあ、ぶっちゃけ記譜単位でmctsやってるような事になるの。
- 793 名前:535 mailto:sage [2019/03/31(日) 20:34:17.11 ID:eFSA5935.net]
- いや、それに近いイメージのものはすでに実装してあるんですが、たまに変な手を打つのです。
- 794 名前:310 mailto:sage [2019/04/01(月) 20:17:52.98 ID:JaNWOXQ3.net]
- 普通DB化すると同じ手順だと毎回同じに間違えるはず。
だとするなら、DBの棋譜をテキストに吐き出すなどして、チェックしたら? 間違いっぽい分岐見つけたら、正解着手させてその後を対戦させて記譜を 強制的に正しい分岐を学習させるの。そのあとでも間違えて、なかなか治らない 事もあるけど。 これが>>760で書いたドーピング。
- 795 名前:310 mailto:sage [2019/04/01(月) 20:22:42.07 ID:JaNWOXQ3.net]
- >>774のリスト。パブリックドローはFJT分だけだった。
2種類あって、もう一つは代表的な序盤定石から適度に着手した後で、 残り30手を読み切ったリストで、ドローとは限らなかった。 遡りチェックの時にあり得ない奴があったので、気が付いた。 試しにZebraで並べて評価値見てみたら、中盤で結構変な手順になっていたりする。 まあ記譜の足しにはなるかなぁという感じ。
- 796 名前:535 mailto:sage [2019/04/01(月) 22:13:58.23 ID:58wx0Qom.net]
- 手動でDB書き換えるのは工数的に地獄の苦しみなのですw
まあ、負けた棋譜だけ水増ししてDBに登録するのはあるかも?
- 797 名前:535 mailto:sage [2019/04/01(月) 23:15:44.55 ID:58wx0Qom.net]
- 自動対局プログラムに手を入れて棋譜のファイル名に黒が勝ったか白が勝ったか入れるようにしました。
- 798 名前:535 mailto:sage [2019/04/02(火) 20:42:13.63 ID:IVxd4rzM.net]
- やっぱ手動で棋譜を訂正するのはムリゲーだなぁ。
棋譜訂正も自動化すべきかな。 うーん
- 799 名前:310 mailto:sage [2019/04/02(火) 20:42:16.77 ID:BP3gZfVl.net]
- そうか。オセロだとある程度定石はあるし、ZebraやEdaxで並べれば
終局スコアの予想はできて、間違いが見つけやすいけど、囲連星では そうはいかないですね。 途中で変な手を打つのは、恐らく記譜が足りていないからではないかと 思います。オセロでもドーピングやらないで純粋に自己対局学習だけで やった場合、1万〜10万対局くらいは必要かなと思っています。
- 800 名前:535 mailto:sage [2019/04/02(火) 22:11:14.64 ID:IVxd4rzM.net]
- 勝った棋譜水増しするのと負けた棋譜水増しするのどっちがいいんだろ?
おんなじ割合で水増ししたら意味ないかもw とりあえず負けたほう増やすか
- 801 名前:535 mailto:sage [2019/04/03(水) 22:07:38.48 ID:+wdY9CJ5.net]
- とりえあず、負けた棋譜を100倍にして序盤DBに注入してます。
定型パターンにはまりやすいLV2にはかなり効果あるのですが 変幻自在なLV3には今一つみたいです。
- 802 名前:535 mailto:sage [2019/04/04(木) 20:30:39.10 ID:QG8xddyq.net]
- 負けた棋譜だけ増やすとバランス崩れるかも?と思い始めました。
うーん。
- 803 名前:535 mailto:sage [2019/04/04(木) 22:06:44.84 ID:QG8xddyq.net]
- やはり大量、多種類の棋譜が欲しい。
棋力が下がっても計算量を抑えて、速度を稼ぐ方向で行くべきか?
- 804 名前:535 mailto:sage [2019/04/04(木) 22:52:58.55 ID:QG8xddyq.net]
- 2手読みだったところを1手読みにしたら大分早くなったけど、やっぱ棋力は落ちるな。
これはちょっと採用するか迷う。
- 805 名前:535 mailto:sage [2019/04/05(金) 22:13:28.38 ID:6lxF2ret.net]
- ん、なんか白番が絶望的に負けてる。
なんか評価値の計算まちがえたか?
- 806 名前:535 mailto:sage [2019/04/05(金) 22:26:12.15 ID:6lxF2ret.net]
- それとも棋譜水増しで入れた序盤DBが狂ったのかな?
- 807 名前:535 mailto:sage [2019/04/06(土) 00:52:52.21 ID:Uoezh941.net]
- 白番で、相手が初手端のほうに打ってきたときに、盤が狭くなって序盤DBどおりに打つのが悪くなるみたい?
とりあえず、白番持った時に相手が初手天元付近に打たなかったときは、中央寄りの斜めに打つように変えた。 これで少しでも緩和されるといいな。
- 808 名前:535 mailto:sage [2019/04/06(土) 01:11:14.50 ID:Uoezh941.net]
- 水増しした分の棋譜はいったん削りました。
確率の理論を根底から壊してしまうみたいなので。 やっぱ遅いようでもじっくり行くのが確実っぽい。
- 809 名前:535 mailto:sage [2019/04/10(水) 20:58:12.46 ID:x47ianNw.net]
- 今、極端な水増しはやめてほどほどの水増しにしてます。
新しい棋譜が古い棋譜の1〜2%程度になるくらいに水増ししてます。
- 810 名前:310 mailto:sage [2019/04/10(水) 23:44:48.34 ID:R42Zvvs5.net]
- どんより…
バグを見つけてしまった。 今ある記譜50万件の数%くらいに間違いがありそう。 直管的には、全データに対して読み切り処理を噛まさないと間違いの有無すら確認できない。 多分、逆順探索処理を簡素化した時にバグが入り込んだのだと思う。 暇なのでログ書き出しの処理を作ってたら見つかった。 うぐぐ。 もうしばらく様子を確認して、他にもバグが無いか見た上で…どうしよう。 一旦記譜をリセットして作り直すべか。
- 811 名前:310 mailto:sage [2019/04/10(水) 23:48:12.99 ID:R42Zvvs5.net]
- と、書いた直後に気が付いた。
ログの側のバグだった事に… お騒がせ様でした。
- 812 名前:535 mailto:sage [2019/04/15(月) 23:21:56.01 ID:+vRjXb2F.net]
- いままで8対称中4
- 813 名前:対称で学習してましたが、のこりの4対称も学習させてみることにしました。
8対称すべてはメモリに収まらないので半分づつ学習させます。 [] - [ここ壊れてます]
- 814 名前:535 mailto:sage [2019/04/16(火) 20:45:49.68 ID:+pjTjN+Q.net]
- 178勝192敗 勝率 48.1%
8対称、勝率あんまり上がらないですね。 うーん、うち筋は悪くないと思うんだけど。 なにかブレークスルーが欲しいですね。
- 815 名前:535 mailto:sage [2019/04/16(火) 21:15:27.46 ID:+pjTjN+Q.net]
- 2手読みに戻したら勝率上がるかな?
うーん。
- 816 名前:535 mailto:sage [2019/04/16(火) 22:50:30.94 ID:+pjTjN+Q.net]
- まじでZen2スリッパ欲しい。
- 817 名前:535 mailto:sage [2019/04/17(水) 20:33:59.36 ID:5Verubd2.net]
- 154勝178敗 勝率46.4%
2手読みに戻したらかえって勝率さがりましたね。 誤差の範囲かもわかんないですが。
- 818 名前:535 mailto:sage [2019/04/18(木) 22:39:13.48 ID:Bi+APi3V.net]
- お、素晴らしい勝ち方した。
必勝形のダブルリーチ これほど少ない石数でこの形を作れるとは… (;SZ[19] ;B[jj];W[kj];B[jk];W[li];B[ji];W[lh];B[kl];W[jm] ;B[ih];W[lk];B[ig];W[jf];B[il];W[ik];B[hk];W[if] ;B[im];W[ij];B[hj];W[lg];B[ii];W[in];B[ik];W[jn] ;B[ij])
- 819 名前:535 mailto:sage [2019/04/19(金) 21:34:26.27 ID:NHUtwCQF.net]
- ふーむ、いままで勝率のいい手かつ沢山選ばれた手を優先的に選択するように序盤DB周りを組んでいたのだけど、
それだと手が固定されてしまうかなと思って勝率のいい手かつあまり選ばれてない手を優先的に選ぶようにしたら 147勝 220敗 勝率40.1% これは誤差とは言えないほどの差ですねぇ。
- 820 名前:535 mailto:sage [2019/04/23(火) 20:49:51.89 ID:rLrZWc/a.net]
- 205勝 246敗 勝率45.5%
棋譜取り&序盤DBへの取り込みを継続したら少し勝率戻りました。 50%付近まで頑張ろう。
- 821 名前:535 mailto:sage [2019/04/24(水) 19:17:49.68 ID:DcbjCIK3.net]
- なかなかの快勝だった
こういう風に毎回打てるといいんだけど (;SZ[19] ;B[jj];W[ij];B[ki];W[ii];B[ik];W[ih];B[jh];W[ji] ;B[kj];W[jg];B[kh];W[if];B[hj];W[ig];B[lk];W[jk] ;B[jl];W[hk];B[kk];W[km];B[hl];W[gk];B[gm];W[fn] ;B[kg];W[kf];B[lf];W[mg];B[lg];W[gi];B[le];W[lh] ;B[mh];W[mi];B[li];W[ie];B[id];W[md];B[lh];W[nd] ;B[lj])
- 822 名前:535 mailto:sage [2019/04/25(木) 23:58:43.25 ID:DQ0GFyMT.net]
- 192勝 212敗 勝率 47.5%
棋譜取り、序盤DB更新、DNN更新だけでは50%の壁は突破できないかもな。
- 823 名前:535 mailto:sage [2019/04/26(金) 20:16:53.04 ID:F5QY8KS+.net]
- 130勝 195敗 勝率40.0%
ん、勝率かなり落ちた。 何が起きた?
- 824 名前:535 mailto:sage [2019/04/27(土) 23:11:18.27 ID:zszgzhMg.net]
- ん、序盤DB壊れたか?
- 825 名前:535 mailto:sage [2019/04/27(土) 23:25:35.40 ID:zszgzhMg.net]
- 序盤DB外したほうが勝率あがるかも?
- 826 名前:310 mailto:sage [2019/04/30(火) 03:48:07.73 ID:RyvRJxq2.net]
- どもです。
ひたすら記譜作成中に、やっぱり暇なので、記譜管理周りをリニューアルしていたら、 結局記譜ファイルの形式を大きくいじってしまい、かなり全面的なリニューアルに。 そしたら、あちこちバグが出て、結局記譜作成より新作デバッグ優先に(汗 >>809-810 序盤DBは、記譜溜めていくと途中で弱くなるけど、いずれ直ってくるものだと思う。 正しい手順があるとして、1回間違えると、間違えた側が負ける記譜ができる。 負ける事で、その手は選ばれない事が記譜に登録される。 しかし、探索の精度が低い状態で記譜作ると、2回間違える記譜ができて、本来 負けのルートで勝ってしまう。これが記譜に登録されると、この2回目の間違いが 訂正されるまでは勝率が下がる。 どのくらいで直るのかは、直接なのか評価関数経由の間接なのかなど、フィード バックのかかり方で変わってくる。直接的なら割とすぐに直るはず。 自分のは間接なのでかなり時間がかかりそうで面倒なので、Zebraで2つ目の間違い 箇所を特定して、そこまで着手した後探索をする棋譜を作って、かなり強制的に直し ちゃった。 序盤は大体良いのだけど、確定値で学習している箇所と、序盤DBで学習している 箇所の境目で、確定値が足りないまま過学習になっている評価値ステージがあって そこらあたりで大抵間違える
- 827 名前:(汗 []
- [ここ壊れてます]
- 828 名前:535 mailto:sage [2019/05/02(木) 21:41:13.81 ID:uWEPsgK5.net]
- 天頂の囲碁を使って9路を徹底的に調べたら面白いかも
ま、やらないけどね
- 829 名前:535 mailto:sage [2019/05/04(土) 19:08:14.82 ID:wk+bg2Ip.net]
- GWは何もしませんでした(過去形)
- 830 名前:310 mailto:sage [2019/05/04(土) 22:14:44.08 ID:fzBCFIZ6.net]
- 新作の探索周りを、例のバグ付のやつにしたら、案の定バグ発生。
色々と入れ替えながらバグ発生箇所を特定に成功しました。 が、なぜそこでバグっているのかわかりませんorz まともに動いたから良しとするしかない感じ。 あと2か所改良したいところがあります。 あと2日では無理だなぁ。
- 831 名前:310 mailto:sage [2019/05/04(土) 22:17:34.69 ID:fzBCFIZ6.net]
- と思ったら、またいきなりバグ発生。
原因は複数ありそうですorz
- 832 名前:310 mailto:sage [2019/05/05(日) 20:55:26.72 ID:GksqIPP4.net]
- 原因判明。アホなミスでした。
やっぱり当初の置換表に変なデータが登録されているのが正解だった。 残した課題のうち1つもできた。
- 833 名前:310 mailto:sage [2019/05/05(日) 23:26:28.04 ID:GksqIPP4.net]
- 最後の課題は、学習の速度アップを目論みましたが、まったくダメでしたorz
さて、何をしよう。
- 834 名前:535 mailto:sage [2019/05/06(月) 19:55:01.10 ID:uIBlT68N.net]
- 長連対策そろそろしなければ…
- 835 名前:535 mailto:sage [2019/05/06(月) 20:33:01.71 ID:uIBlT68N.net]
- 序盤DBがおかしくなってたので、序盤DBの手の採用基準をもとに戻しました。
あと中盤終盤でDNNの値の比重を大きくしました。
- 836 名前:535 mailto:sage [2019/05/07(火) 22:40:16.02 ID:hqvfZJCN.net]
- 59勝 62敗 勝率48.8%
なんとか勝率50%弱まで戻せました。
- 837 名前:535 mailto:sage [2019/05/08(水) 21:43:00.75 ID:c2FYdM3E.net]
- 来たっ
262勝 248敗 勝率51.4% 誤差の範囲かもしれないけど嬉しいっ
- 838 名前:535 mailto:sage [2019/05/08(水) 21:52:12.23 ID:c2FYdM3E.net]
- そろそろ白番も着手していくか、もうちょっと黒番を突き詰めるか。
悩ましいい。
- 839 名前:535 mailto:sage [2019/05/09(木) 20:06:42.08 ID:w95MoSGU.net]
- ありゃ、わずかな棋譜を序盤DBに加えただけなのに勝率めっちゃさがった
149勝 202敗 勝率 42.5% そんなに微妙なものではないと思ってたが??
- 840 名前:535 mailto:sage [2019/05/09(木) 20:28:40.86 ID:w95MoSGU.net]
- 棋譜さらっと見てみたけど序盤DBが壊れたって感じでもないなぁ
実は微妙なものだったのか、誤差の範囲なのか?
- 841 名前:535 mailto:sage [2019/05/09(木) 22:32:58.01 ID:w95MoSGU.net]
- なんか誤差の可能性が微レ存
- 842 名前:535 mailto:sage [2019/05/10(金) 21:38:12.73 ID:5KPSEUAN.net]
- 163勝 202敗 勝率44.7%
±5%くらいは誤差ででるのかもしれないなぁ
- 843 名前:535 mailto:sage [2019/05/10(金) 21:42:26.07 ID:5KPSEUAN.net]
- こんな時統計の知識があれば真の勝率は○○%〜××%の間とか論じられるんだろうなぁ
- 844 名前:535 mailto:sage [2019/05/11(土) 11:49:39.90 ID:fuy9y7gB.net]
- うお、すげぇ
179勝 149敗 勝率54.6% この数字をどう解釈すればいいのか…
- 845 名前:535 mailto:sage [2019/05/11(土) 17:43:16.57 ID:fuy9y7gB.net]
- まだ勝ってる。
222勝 194敗 勝率53.4% そろそろ棋譜反映させるか。
- 846 名前:535 mailto:sage [2019/05/11(土) 22:40:54.90 ID:fuy9y7gB.net]
- 長連対策、完全じゃないけど簡単な判定入れてみた。
さてどうかな?
- 847 名前:535 mailto:sage [2019/05/12(日) 10:03:08.61 ID:7HaK6dtp.net]
- かなりいい
対LV2 白番はもうちょっと勝ちたいかな 対LV1 黒番 61勝 9敗 勝率87.1% 白番 49勝 4敗 勝率92.5% 対LV2 黒番 57勝 0敗 勝率100.0% 白番 10勝 28敗 勝率26.3% 対LV3 黒番 25勝 16敗 勝率61.0% 白番 13勝 28敗 勝率31.7%
- 848 名前:535 mailto:sage [2019/05/12(日) 18:17:47.41 ID:7HaK6dtp.net]
- ふむ。かなりいい。
一回止めるか。 対LV1 黒番 90勝 10敗 勝率90.0% 白番 64勝 6 敗 勝率91.4% 対LV2 黒番 78勝 0敗 勝率100.0% 白番 14勝 33敗 勝率29.8% 対LV3 黒番 39勝 23敗 勝率62.9% 白番 19勝 40敗 勝率32.2%
- 849 名前:535 mailto:sage [2019/05/12(日) 18:46:46.62 ID:7HaK6dtp.net]
- ここらでドカンとブレークスルーが欲しいところだ。
- 850 名前:535 mailto:sage [2019/05/13(月) 20:57:06.68 ID:rQSLa/J8.net]
- お、すごい
249勝 204敗 勝率55.0%
- 851 名前:535 mailto:sage [2019/05/13(月) 21:55:46.89 ID:rQSLa/J8.net]
- LV3 vs LV3の黒番の勝率が65%くらいだったはずだから、黒番で勝率70%位いけばLV3越えといえるかも
- 852 名前:535 mailto:sage [2019/05/13(月) 23:06:54.58 ID:rQSLa/J8.net]
- 地味な学習も必要だとは思うけどアイディア一発でドカンと強くなるのも諦めきれない。
- 853 名前:535 mailto:sage [2019/05/14(火) 21:30:20.81 ID:kAvibZwR.net]
- ん、なんかDNN学習させたらうち筋はそんなに悪くなってないと思うんだけど勝てなくなったな。
なんだろう?
- 854 名前:535 mailto:sage [2019/05/15(水) 21:00:42.40 ID:ce+jhpkV.net]
- 173勝 176敗 勝率 49.6%
対戦してみたけど思ったほど負けてないな?
- 855 名前:535 mailto:sage [2019/05/15(水) 21:22:39.79 ID:ce+jhpkV.net]
- 初期アルファ碁のようにポリシーネットとバリューネットに分けてみるか?
- 856 名前:535 mailto:sage [2019/05/15(水) 21:35:41.77 ID:ce+jhpkV.net]
- そこそこの精度でも軽い評価関数は結構ほしいかも。
モンテカルロで役に立つし。
- 857 名前:535 mailto:sage [2019/05/15(水) 22:07:54.43 ID:ce+jhpkV.net]
- というわけで、今使ってるDNNより大幅に簡素化したネットワークで学習させてみる。
データは同じ。
- 858 名前:535 mailto:sage [2019/05/15(水) 22:45:22.49 ID:ce+jhpkV.net]
- あれ、大幅に簡素化したのに学習時間が思ったより短くならないな。
10倍速くらい早くなると思ってたのに3倍速くらいだ。
- 859 名前:535 mailto:sage [2019/05/15(水) 23:06:58.43 ID:ce+jhpkV.net]
- 更に簡素化して10倍速くらいにしました。
ちょっと簡素化しすぎかも?
- 860 名前:310 mailto:sage [2019/05/15(水) 23:27:46.15 ID:2Iqikd3t.net]
- 新バージョンで色々プログラム見直し。
探索部は全く改善していませんが、その他の部分が大幅にスピードアップ。 自動記譜作成時のオーバーヘッド(探索以外の時間)がかなり減った。 あとは学習の時間を減らしたい。
- 861 名前:535 mailto:sage [2019/05/16(木) 19:50:22.50 ID:bKmJMMur.net]
- 大きい方のネットワークの損失が3500位なのに対して小さい方のネットワークの損失が5300位。
さて、使い物になるかな?
- 862 名前:535 mailto:sage [2019/05/16(木) 20:26:43.20 ID:bKmJMMur.net]
- うおお,遅え!
モンテカルロに使おうと思ったらプレイアウト回数かなり減らさなきゃだめだな。
- 863 名前:535 mailto:sage [2019/05/16(木) 20:40:14.63 ID:bKmJMMur.net]
- 一回打ってみたけど打ち筋は決して悪くない。
だが激遅。 だかが300プレイアウトでここまで遅いとは…
- 864 名前:535 mailto:sage [2019/05/16(木) 20:49:50.51 ID:bKmJMMur.net]
- ん、でも打ち筋がいい。
ブレークスルー来たか??
- 865 名前:535 mailto:sage [2019/05/16(木) 21:05:06.63 ID:bKmJMMur.net]
- すごいな、こちらの打ち筋は相当改善されたのにLV3がその上を行ってくる。
奥が深い。
- 866 名前:535 mailto:sage [2019/05/16(木) 22:04:27.02 ID:bKmJMMur.net]
- ん、まだ学習飽和してないみたい。
ジリジリ損失減ってる。
- 867 名前:535 mailto:sage [2019/05/16(木) 22:42:50.95 ID:bKmJMMur.net]
- LV1と対戦させ始めてみたけど、かえって勝率落ちてるな?
まだ対戦回数少なすぎて結論出すのは早いけど、もっと50連勝くらいするかと思った。 対LV1 黒番 17勝 3敗 勝率85.0% 白番 13勝 3敗 勝率81.3%
- 868 名前:535 mailto:sage [2019/05/17(金) 21:14:13.13 ID:Af3ltV5Z.net]
- 勝率上がってるみたいです。やった!
対LV1 黒番 156勝 15敗 勝率91.2% 白番 109勝 8敗 勝率93.2%
- 869 名前:535 mailto:sage [2019/05/17(金) 21:17:20.41 ID:Af3ltV5Z.net]
- 小さいネットワークの損失も5180くらいまで減ってます!
次は本丸、LV3と決戦や!
- 870 名前:535 mailto:sage [2019/05/17(金) 22:31:13.53 ID:Af3ltV5Z.net]
- 対LV3 黒番
47勝 34敗 勝率58.0% ふーむ、まあ悪くないけど、正直もっと期待していたw 400〜500戦くらいはしないとまだ結論は早いけど。
- 871 名前:535 mailto:sage [2019/05/18(土) 01:00:18.55 ID:NdCkwblz.net]
- ほほう、6割行った。
120勝 80敗 勝率60.0%
- 872 名前:535 mailto:sage [2019/05/18(土) 16:28:24.45 ID:NdCkwblz.net]
- 291勝 231敗 勝率55.7%
ふーむ、まあ悪くないけど。 最終的には対LV3黒番勝率 70% を目指したい。
- 873 名前:535 mailto:sage [2019/05/18(土) 21:21:56.33 ID:NdCkwblz.net]
- そういえば、勝率ばかり気にして肝心の棋譜をあまり見てなかったな。
どんな負け方してるのかちゃんと把握せねば。
- 874 名前:535 mailto:sage [2019/05/18(土) 22:11:34.39 ID:NdCkwblz.net]
- ふーむ、必敗を避けるルーチンに若干バグがあるな。
- 875 名前:535 mailto:sage [2019/05/19(日) 07:21:38.98 ID:GRYTxzHT.net]
- GPU使いたいなぁ。
せっかくいいの買ったんだから。
- 876 名前:535 mailto:sage [2019/05/19(日) 07:52:25.50 ID:GRYTxzHT.net]
- ライフゲーム囲碁も平行で開発しようかなぁ。
アルファゼロアルゴリズムが心のどこかで捨てきれない。
- 877 名前:535 mailto:sage [2019/05/19(日) 13:54:34.49 ID:GRYTxzHT.net]
- ライフゲーム囲碁 コード書き始めました。
ルール実装が結構効率的な奴思い付いて、1000万プレイアウト/s位出ました。 並行でやるっつっても計算資源が問題だなぁ。 囲連星はアイディアないしちょっとお休みかなぁ。
- 878 名前:535 mailto:sage [2019/05/19(日) 17:10:04.89 ID:GRYTxzHT.net]
- GUIがないと不便だなぁ。うーん。
- 879 名前:535 mailto:sage [2019/05/21(火) 00:59:34.87 ID:rSRUkqQW.net]
- うお、ついに人間(俺)に勝った!
内容的にも文句ない勝ち方だ! (;SZ[19] ;B[jj];W[ji];B[ii];W[ih];B[ki];W[jh];B[kk];W[kh] ;B[lj];W[ij];B[hi];W[hk];B[hh];W[lg];B[gl];W[mg] ;B[gg];W[ff];B[gk];W[gj];B[ll];W[mm];B[fj];W[fi] ;B[gi];W[hj];B[hl];W[jk];B[ik];W[hj];B[gj];W[gf] ;B[gm];W[gh];B[fn];W[fh];B[lh])
- 880 名前:535 mailto:sage [2019/05/21(火) 01:06:56.53 ID:rSRUkqQW.net]
- ここまでくると囲連星はいったん公開してもいいかもな。
本当は白黒総合勝率でLV3に勝ってからが理想なんだけど。 あとDBのファイルサイズでかいんだよなぁ。
- 881 名前:535 mailto:sage [2019/05/21(火) 23:53:55.55 ID:rSRUkqQW.net]
- 現状の囲連星のAIを公開します。
ちなみに対LV2黒番必勝ではなくなってしまっているようです。 あと思考時間かなり長いです。 https://drive.google.com/file/d/1M86qczNQQScvkH-ZMyZVAlDvJ-K0OlVc/view?usp=sharing
- 882 名前:535 mailto:sage [2019/05/23(木) 20:03:18.47 ID:boQDU2Sa.net]
- 反応がなくて寂しい。。。
まあもともと過疎スレだからしかたないか。
- 883 名前:310 mailto:sage [2019/05/25(土) 01:28:48.60 ID:rX0QQhRb.net]
- すんまそん。
ダウンロードしたけど、記譜作成中なので、CPU食いたくなくて(汗
- 884 名前:535 mailto:sage [2019/05/25(土) 21:14:03.65 ID:LKgjurKe.net]
- 囲碁ディープラーニングプログラミングという本があったので買ってみた
- 885 名前:535 mailto:sage [2019/05/25(土) 22:41:49.53 ID:LKgjurKe.net]
- このサイトも面白そう
https://medium.com/applied-data-science/how-to-build-your-own-alphazero-ai-using-python-and-keras-7f664945c188
- 886 名前:535 mailto:sage [2019/05/25(土) 22:44:29.26 ID:LKgjurKe.net]
- C#からC++を呼び出すの結構難しい。
マネージドコードとアンマネージドコードがどうたらとか、、、
- 887 名前:535 [2019/05/27(月) 14:54:14.96 ID:6xYMMPUB.net]
- AMD Ryzen 3900来た
- 888 名前:535 mailto:sage [2019/05/27(月) 17:52:37.02 ID:8VbKHTBW.net]
- 囲碁ディープラーニングプログラム読んでるけどすっごい目が滑る
でも12章のactor critics法というのが面白そうで頑張って読みたい
- 889 名前:535 mailto:sage [2019/06/01(土) 23:30:05.61 ID:bijpxRGI.net]
- 俺のマザーボードRyzen3000シリーズに対応しないらしいorz
ショック
- 890 名前:535 mailto:sage [2019/06/02(日) 18:07:27.02 ID:rgij2qjY.net]
- はぁ〜だめだあぁ
目が滑る 頭に入ってこない
- 891 名前:535 mailto:sage [2019/06/02(日) 21:33:07.07 ID:rgij2qjY.net]
- うお、betago(>>868の本のプログラム)動いた。
そして意外と強い。
- 892 名前:535 mailto:sage [2019/06/02(日) 21:38:17.03 ID:rgij2qjY.net]
- ん、終局の仕方がわからん。
終局は実装されてないのかな?
- 893 名前:名前は開発中のものです。 [2019/06/02(日) 21:42:02.90 ID:pCuEsXAG.net]
- いまからやってみるか
- 894 名前:310 mailto:sage [2019/06/04(火) 01:18:15.20 ID:11K0AF4X.net]
- 強化学習本興味あります。
棋譜作成がいまいち上手く行っていないので。
- 895 名前:535 mailto:sage [2019/06/04(火) 21:25:33.03 ID:eotmjR11.net]
- くそう、時間が欲しい。
金さえあればニートになるのにww
- 896 名前:535 mailto:sage [2019/06/05(水) 21:45:28.39 ID:tAUB+cOz.net]
- これから仕事が忙しくなりそうな予感。
まあさすがに土日は休めるだろうけど。
- 897 名前:535 mailto:sage [2019/06/08(土) 18:42:48.95 ID:bTp76tLI.net]
- うおお、目が滑りまくりorz
一日無駄になったorz
- 898 名前:535 mailto:sage [2019/06/08(土) 21:38:02.44 ID:bTp76tLI.net]
- 目が滑るのは取り組み方が間違
- 899 名前:チてる証拠。 []
- [ここ壊れてます]
- 900 名前:名前は開発中のものです。 [2019/06/10(月) 12:52:10.55 ID:/Ra7JNmg.net]
- 囲碁は完全に人工知能に負け人間が追いつくことはないとおもうが。
これや将棋は微妙な線で、人間に勝ち目あるかもしれん。 囲碁より勝ち方、有利のさせ方が分かりやすい差。 人工知能なしの人間技で、人工知能に勝てる方法あるんじゃないかと。
- 901 名前:名前は開発中のものです。 [2019/06/10(月) 17:27:02.16 ID:sKxIYoYq.net]
- 大人も子供も白熱!最新ゲーム「ノッカノッカ」が面白い
https://ima.goo.ne.jp/column/article/5290.html ビビットカラーを使ったポップなデザインの二人用ボードゲーム「ガブル」 boardgame-kikou.blog.jp/archives/9311305.html LOGY GAMES ボードゲームカタログ www.logygames.com/index.html#catalogue オシャレで簡単、だけど深いボードゲーム sweetint.com/ic/tinttile-game コンポーネントに酔いしれて、戦略にゆったり溺れる「箱庭の国」 sake.saloon.jp/dojin_miniaturized-world/ 『すずめ雀』初心者でも本格的な駆け引きを楽しめるミニマル麻雀ゲームが登場 https://www.inside-games.jp/article/2018/05/02/114450.html エクストリーム将棋の企画から販売まで https://nakagawa-hands.com/digital-fabrication/ex-shogi_a2z/
- 902 名前:535 mailto:sage [2019/06/11(火) 18:15:44.55 ID:a3oKL+Tm.net]
- 「来た!」「16コア来た!」「メイン16コア来た!」「これで勝つる!」
- 903 名前:535 mailto:sage [2019/06/11(火) 22:20:28.87 ID:R+B8a+a7.net]
- 囲碁ディープラーニングプログラミング相変わらず目が滑ってるんだけど、
しつこく食らいついてたらすこしずつ目が滑らなくなってきてる。 何とかものにしたい。
- 904 名前:535 mailto:sage [2019/06/12(水) 19:47:45.91 ID:UjRskMNa.net]
- githubのリポジトリbetagoとは別に囲碁ディープラーニングプログラミング用のやつがあんのか!
気が付かなかったぜ! これで勝つる!
- 905 名前:535 mailto:sage [2019/06/13(木) 21:23:37.11 ID:ip5cHIAR.net]
- 囲碁ディープラーニングプログラミングのgithubのコードいいかも。
マルチスレッドにも対応してるっぽいし。 これはかなり期待できる。
- 906 名前:535 mailto:sage [2019/06/13(木) 21:36:37.70 ID:ip5cHIAR.net]
- GPUが使えてないみたいだな。
tensorflow-gpuうまく入ってないみたいだ。
- 907 名前:535 mailto:sage [2019/06/13(木) 21:38:46.69 ID:ip5cHIAR.net]
- それにしてもZen2 スリッパが欲しい。
16C32Tじゃ足りない。 64C128Tが欲しいww
- 908 名前:535 mailto:sage [2019/06/14(金) 21:40:47.35 ID:AD5EB04u.net]
- ん、27000回学習を回した時点から過去のAIに対する勝率が10%〜30%位しか行かなくなったみたい。
なぜ? こんなことってあるのか?
- 909 名前:535 mailto:sage [2019/06/14(金) 22:09:53.32 ID:AD5EB04u.net]
- ん、学習したネットワークと対戦する方法がわからんなぁ。
web_demo.pyあたりで行けそうな気もするが…
- 910 名前:535 mailto:sage [2019/06/15(土) 17:55:00.43 ID:ANVzDRfZ.net]
- human_v_bot.pyというのでランダムAIと対戦できるようなので、これをちょっといじれば自作AIと対戦できそう。
- 911 名前:535 mailto:sage [2019/06/15(土) 19:41:51.27 ID:ANVzDRfZ.net]
- ヤバイ、待ってる時間がじれったい。
やはり zen2 スレッドリッパー買うしか…
- 912 名前:535 mailto:sage [2019/06/15(土) 21:21:58.56 ID:ANVzDRfZ.net]
- LifeGameGoのルールを早く移植したいけど、もうちょっとgithubコードの感触つかんでからかな。
- 913 名前:535 mailto:sage [2019/06/15(土) 22:03:51.50 ID:ANVzDRfZ.net]
- ふーむ、まじで>>891の状態から抜け出せないな。
ネットワークが小さすぎるんだろうか?
- 914 名前:535 [2019/06/16(日) 19:35:53.70 ID:OMA3ZwQu.net]
- あかんな、遅すぎる。
うーん。アルファゼロに幻想持ちすぎかも知れんな。
- 915 名前:535 mailto:sage [2019/06/16(日) 20:37:51.38 ID:qjgvbRbv.net]
- 囲碁よりもシンプルなLifeGameGoならもっと速く学習できるという可能背もありますが…
とりあえず、GPUを使えるように頑張るのが先かなぁ?
- 916 名前:310 mailto:sage [2019/06/17(月) 17:09:51.93 ID:pTM6WQ3W.net]
- Surface Pro2の液晶が割れたorz
仕事で使うPCなので慌ててPro6の発注をかけました。 一応コア数2倍の4コア8スレッド、メモリーも16Gになる予定。 そろそろスピードの限界を感じていたので、痛しかゆしなところ。 ようやくIntelの呪縛から解放されるAVX2対応のCPUがAMDから出るというのに、 専用新型PCが遠のきました。 どのくらいスピードアップするかなぁ…。
- 917 名前:535 mailto:sage [2019/06/17(月) 19:55:14.11 ID:KSoga8dR.net]
- 仕事で使うpcが自腹なんかよ?
乙です
- 918 名前:535 mailto:sage [2019/06/21(金) 20:05:05.51 ID:wxbtZaxz.net]
- なんかちょっとモチベが落ちてます。
せっかく週末なのになぁ。
- 919 名前:535 mailto:sage [2019/06/22(土) 20:40:40.51 ID:s675JLMo.net]
- あああああ、だめだ完全に気持ちがしぼんでしまった。
- 920 名前:535 mailto:sage [2019/06/23(日) 23:02:35.16 ID:wqGRreNQ.net]
- つかやっぱpythonはちょっと厳しいんだよなぁ…
- 921 名前:310 mailto:sage [2019/06/25(火) 22:00:54.87 ID:i36dK7DH.net]
- あ、会社のPCです。流石に性能2倍なので、買うモチベーションが下がったのです。
現在液晶の表面パネルバキバキで、タブレット機能止めて、 セロテープで補強してだましだまし使ってますが、発熱によって 内部が歪んじゃっているみたいで、通常状態でも液晶が湾曲してます。 で、将棋の探索の深さが意味不明だったので、色々考えていましたが、 なんとなく想像がついてきました。多腕バンディット使って、反復深化と 絞り込みを行っているのではないかと思います。 現状中盤探索の速度がいまいち遅く、シングルプローブカットすると 何故かさらに遅くなるという状態。棋譜作成メインだったので、あまり 気にしていなかったのですが、新しいPC来たらちょっとトライしてみよう かなと思っています。
- 922 名前:310 mailto:sage [2019/06/28(金) 22:23:55.68 ID:jdIE39If.net]
- 新PCセットアップ中。
前回思いついた中盤探索ロジック。具体的に実装を考え始めたら、 MCTSでいいじゃんということに(汗 これからVisual Studioのダウンロードです。
- 923 名前:名前は開発中のものです。 mailto:sage [2019/06/29(土) 09:41:43.34 ID:aAhzQFUl.net]
- セットアップ完了して、開発環境の移行も終わりました。
VS2017→VS2019でエラーチェックが厳格化したものがあったようで、ソース修正。 Win8→Win10でコマンドプロンプトがなんか変わって、CTRL-Sの動作がよくわからない。 などなど、細かい点はいくつかありますが、速度的には思いのほか効果が出ていて、 ほぼ倍速くらいな感じです。並列のオーバーヘッド増加分を、クロック他CPU単体の パフォーマンスアップで吸収していると思われます。
- 924 名前:310 mailto:sage [2019/06/29(土) 09:42:10.63 ID:aAhzQFUl.net]
- ↑は僕です。
- 925 名前:535 mailto:sage [2019/06/29(土) 17:06:05.94 ID:6alt1Zxx.net]
- 倍速はなかなかいいですね。おめでとうございます。
俺も頑張らねば。。。
- 926 名前:535 mailto:sage [2019/06/30(日) 17:26:00.32 ID:5SElYd7b.net]
- 逃げちゃだめだ、逃げちゃだめだ、逃げちゃだめだ(pythonから)
- 927 名前:535 mailto:sage [2019/07/04(木) 18:51:35.21 ID:JLZZWsF4.net]
- VMWareだとどうにもtensorflow-gpuが使えないのでネイティブubuntuを入れるか迷い中
SSD丸ごと1個あけて別ドライブにインストールすればwin10とも干渉しないはず…
- 928 名前:535 mailto:sage [2019/07/05(金) 20:11:11.37 ID:gv5AG18i.net]
- 一応ubuntu入ったっぽい。
でも環境構築する根性が湧いてこない。 あしたにするか。。。
- 929 名前:535 mailto:sage [2019/07/06(土) 17:14:44.78 ID:YqSGwJgi.net]
- あかん、ubuntuすっごい固まるorz
今日だけで4回フリーズしたorz
- 930 名前:535 mailto:sage [2019/07/07(日) 19:22:27.22 ID:8kGyRN1E.net]
- ここまで固まられるとネイティブubuntuは正直、撤退かなぁ
うーん。惜しいなぁ。
- 931 名前:535 mailto:sage [2019/07/07(日) 22:36:19.30 ID:8kGyRN1E.net]
- VMWareのubuntuは固まらないんだよなぁ
バージョンが違うからかなぁ
- 932 名前:535 mailto:sage [2019/07/08(月) 23:58:39.11 ID:J+Oysvfm.net]
- 50万局学習させても知性とは程遠い打ち筋orz
絶望した!
- 933 名前:535 mailto:sage [2019/07/12(金) 20:02:35.26 ID:5KSDfXOV.net]
- さんれんきう
- 934 名前:535 mailto:sage [2019/07/14(日) 01:02:14.40 ID:BHfYEZqG.net]
- AQZという囲碁AIが50万局の学習でプロに勝ったそうな。
なんで俺が試したプログラムとそんなに違うんだ?
- 935 名前:535 mailto:sage [2019/07/15(月) 07:10:16.79 ID:U2als8ec.net]
- 徹夜してしまった
反省(反省するとは言っていない)
- 936 名前:535 mailto:sage [2019/07/21(日) 20:03:14.96 ID:E/xzPLNe.net]
- 二進も三進もいかないorz
しばらく休憩するか…
- 937 名前:535 mailto:sage [2019/07/21(日) 21:27:54.74 ID:E/xzPLNe.net]
- https://github.com/xuetf/AlphaZero_Gobang
気分を変えてこれに手を出そうかと思ってます。
- 938 名前:535 mailto:sage [2019/07/28(日) 15:53:29.60 ID:afiNgtjO.net]
- すっかりさぼってしまっています。
- 939 名前:310 mailto:sage [2019/07/31(水) 22:58:56.92 ID:RoaGFb2p.net]
- 地味に改良&棋譜作成継続中。
評価値で黒番+2、白番−1くらいの差が生じているので、 評価関数にバイアス項を導入しました。 他、若干の高速化ネタ。 中盤探索でProbcutすると遅くなる問題を回避。本格修正するか悩み中。 というか、そもそもZebraより圧倒的に遅い原因がわからん。
- 940 名前:535 mailto:sage [2019/08/04(日) 00:47:49.68 ID:kSURYkNt.net]
- ようやっと>>920のプログラムにライフゲーム囲碁のルールを実装しました。
python 超つらい…
- 941 名前:535 mailto:sage [2019/08/04(日) 01:56:43.25 ID:kSURYkNt.net]
- CPU使用率10%か。。。切ない。。。
- 942 名前:535 mailto:sage [2019/08/04(日) 20:02:48.59 ID:kSURYkNt.net]
- 計算がある程度進むと必ずOSごとフリーズするorz
きょうびOSごと落ちるってどういうことだよ?
- 943 名前:535 mailto:sage [2019/08/04(日) 20:18:18.16 ID:kSURYkNt.net]
- これはもうアルファゼロには手を出すなという神のお告げかもorz orz orz
- 944 名前:535 mailto:sage [2019/08/07(水) 20:34:05.86 ID:cRW9S7xJ.net]
- そもそも、気温が高すぎて留守にしてる最中計算回しっぱなしにするの怖いってのもあるんだよなぁ
- 945 名前:310 mailto:sage [2019/08/10(土) 21:39:26.19 ID:iTdjAaDm.net]
- 中盤探索を改良。
一つは、普通に無駄な処理を見つけて修正。 もう一つは、評価値の計算に差分計算を取り入れました。 今まで並列処理で差分ってどうやるんだろうと思っていましたが、 単にDepth=1のところ(次がLeaf)で、順次評価値計算するのを 差分すればよかったのね。 この2つで、中盤探索で2手ほど深く読めるようになりました。
- 946 名前:535 mailto:sage [2019/08/13(火) 19:47:02.79 ID:wzsq2qR8.net]
- 今、実家に帰省してるんですが>>865のAIを動かしてみようとしたけどdllが認識されませんね?
何が悪いんだろう?
- 947 名前:310 mailto:sage [2019/08/15(木) 23:44:11.68 ID:NhTCTcJa.net]
- 小人閑居して不善をなす…。
思い切って、不要そうに思える棋譜をバッサリ削除してみました。 削除しすぎたかも。 いろいろ細かく修正と、デバッグ用表示の改良。 とかやっていたら、丸1日近く動かしたところで、なぜか急激にパフォーマンス低下。 もともと空きが少なかったSDDが一杯になっている…。とはいえ30Gはあったはず。 再起動していたらもとに戻った。原因不明。 対症療法で不要プログラムアンインストールしていたら、使っているOfficeを間違えて アンインストールしてしまった。 HDD一杯が原因なのか、評価値のファイルが壊れていた。 ギリギリ間に合ってバックアップから復旧できた…と思う。
- 948 名前:310 mailto:sage [2019/08/16(金) 14:28:22.00 ID:MY5mY5kZ.net]
- SDD一杯の犯人判明。
セキュリティー対策ソフトの監視対象管理DBのファイルが合計で400G越え(汗 ところが、管理者権限ないと停止できず、ファイル掴んでいるため削除できない。 今日は管理者休暇中。 logファイルを頻繁に追記しすぎて、ファイルサイズ変化する都度DBファイルが 作られているのではないかと想像。棋譜バッサリ削除して、一気に遡り探索やり直し していて、これまでと比較にならないペースと数で追記処理が起きているので、 その影響の可能性が。 Officeは再インストールしてもらったけど、何故かセキュリティ解除キーの入力ができない。 来週月曜日は出張なので、来週火曜日までだましだまし行きます。 古い方のPCがまだ生きているので、Excel作業はそちらでやる事にしました。
- 949 名前:535 mailto:sage [2019/08/23(金) 19:05:38.98 ID:KljXhF7+.net]
- AQZ敗退か
残念
- 950 名前:名前は開発中のものです。 mailto:sage [2019/08/23(金) 19:13:36.62 ID:KljXhF7+.net]
- 囲碁は現在のコミで白番有利説もあるようですがどうなのか
- 951 名前:310 mailto:sage [2019/09/05(木) 22:24:16.41 ID:NIzTzKyA.net]
- 棋譜の作り方全面改訂。
分岐のチェックで、以前は全ての分岐を棋譜化していたけど、今度のは軽い探索で 怪しい評価値(同一評価値〜−4程度まで)のものだけ棋譜化するようにして、 棋譜数を大幅節約。学習が楽になるという算段です。 棋譜づくりが順調になり暇ができると、細かく気になっていた、どーでもよいところを 改良し始めて、バグとりで棋譜づくりが滞るという悪循環orz よくよく考えたら、PCのパワーアップしたので、またDCNNトライとかしてみようかな とか思い始めた。tiny-dnnしか選択肢無いんだけど。
- 952 名前:535 mailto:sage [2019/09/11(水) 20:42:08.54 ID:EGEM/7RV.net]
- googleがminigoというオープンソースやってるらしいですね。
最近さぼりっぱなしだったけど、ちょっと見てみるか。
- 953 名前:535 mailto:sage [2019/09/12(木) 19:49:22.62 ID:qOi8eRBu.net]
- すげー難しそう
まだちゃんと見てないけど
- 954 名前:310 mailto:sage [2019/09/17(火) 23:33:38.68 ID:KoOw8EHX.net]
- 相変わらずしこしこ棋譜作って学習繰り返してます。
もう無いだろうと思いつつ、ちょこっとした事に気づいて修正を繰り返してます。 置換表のハッシュ関数を改良。 格納効率が結構良くなったので、衝突が減ったはず。 終盤探索の時にBOOK(確定)も参照して余計な探索を減らしました。 基本遡りで確定させているので、運が良い時に滅茶苦茶早くなりました。 無い時は今まで通り(汗 学習データが不足しているのではないかと、置換表内に残っているスコアが確定 した局面FIFOで貯めて、折々に学習に回してみました。1回探索で100〜500件 程度。これをFIFOで500万件。棋譜に残っていない局面で学習する事で、過学習 が防止できるかなと思っていますが…。 現在、27手確定局面で大体14000件の棋譜とその分岐で合計23万件ほどですが、 まだ棋譜が足りていない感じです。が、件数が増えすぎて手に負えません。 BOOKの確認ができるWindowsアプリ作ろうかと思い始めています。
- 955 名前:535 mailto:sage [2019/09/22(日) 19:52:21.38 ID:ctBLCdpw.net]
- このまま失踪しそうな感じです。
やっぱアルファゼロは手を出してはいけないかったんや。
- 956 名前:310 mailto:sage [2019/09/22(日) 19:56:33.01 ID:x3eDgHtk.net]
- DCNNになってから、一般人のPCでは手が出せなくなってるからね。
計算プロセス自体は、NNを極端に単純化したものが線形回帰だと思えば、 NNで生まれた計算ノウハウが流用できますよ。 というか、今の時代、ただのLRでDCNNとほぼ同じ強さ、とかの方がオシャレ ではないかと思う、ひねくれものの僕。
- 957 名前:310 mailto:sage [2019/09/23(月) 19:34:01.85 ID:taOqGsoO.net]
- 所詮趣味なので、あまり無理せず、やる気になるときにやればよいかと思います。
- 958 名前:535 mailto:sage [2019/09/23(月) 20:58:22.95 ID:T5ohU9uM.net]
- うーむ、やりたい気持ちはあるのですが、いかんせん難しすぎて…
githubにもっと易しそうなのでてくるまで待つか?うーん。
- 959 名前:535 mailto:sage [2019/09/25(水) 21:31:58.87 ID:/O9j0jn/.net]
- 気温が徐々に下がってますね。
そろそろ計算回しっぱなしにしてもいいかな。 つっても回せるプログラムがないけど。
- 960 名前:535 mailto:age [2019/09/28(土) 22:43:07.40 ID:upFNPupL.net]
- またgithub漁ってます。
https://github.com/yangrc1234/Gomoku-Zero
- 961 名前:535 mailto:sage [2019/10/01(火) 22:13:53.83 ID:r/X1idNR.net]
- 3日くらい計算回したけど全く強くなる気配がないなorz
もしかしたら微妙に強くなってるのかもしれないけどあまりに成長速度が遅すぎる やっぱアルファゼロは計算時間が半端ないのかも?
- 962 名前:535 mailto:sage [2019/10/01(火) 23:21:06.21 ID:r/X1idNR.net]
- やっぱアルファゼロはいったん諦めて、囲連星でやったようにモンテカルロAIの棋譜取り&勝率DB作り&教師ありDNNでライフゲーム囲碁やるべきか?
うーむ
- 963 名前:310 mailto:sage [2019/10/02(水) 01:57:09.42 ID:FIHYKLNY.net]
- DCNN強化学習はマシンパワーが恐ろしいほど必要だからね。
満足できる教師データがそろってから評価関数に使ってみる程度にしないと…。 自由度が高すぎるので、まともな評価関数に収束するまでに、相当な試行回数が 必要なんじゃないかと思う。 自分は棋譜作成をずーっとやっていますが、現在は棋譜作りの目的がBook充実 になりつつあります。なんというか、現在の形はいつの間にかQ学習+ε-Greedy っぽくなってきています。 アルファ様のお陰で、目標を見失いましたので、手段のためなら目的を選ばない感じ で、プログラム作る楽しみという方向になっています(^^;
- 964 名前:535 mailto:sage [2019/10/02(水) 22:58:01.64 ID:BtKMO/4x.net]
- ライフゲーム囲碁、モンテカルロAIの棋譜取り始めました。
ヒューリスティックなしのモンテカルロで1手10000プレイアウトで1局に約1分かかります。 それを16並列で1分当たり約16局採取できる予定。 棋譜の質があまりよくないのが難点ですがとりあえず、これでやってみます。
- 965 名前:535 mailto:sage [2019/10/03(木) 21:37:56.85 ID:tdDOcoA1.net]
- 18257局分棋譜が取れたようです。大体13.2局/分くらい取れるっぽい。
全コア動かすとシングルよりやっぱ少し遅くなるみたいですね。
- 966 名前:535 mailto:sage [2019/10/06(日) 00:55:35.61 ID:V0Jk6SKR.net]
- DB作成まで来ました。
ライフゲーム囲碁は囲連星と比べてもっと沢山の棋譜が必要になるかもしれません。 オープニングのバリエーション的に。
- 967 名前:310 mailto:sage [2019/10/11(金) 20:52:12.13 ID:Tdz7win8.net]
- 評価関数を変えたくなってきた。
偶数手番と奇数手番の癖が顕著になってきたので、スムージングをしたく なったのだけど、キーを手番優先にしているので、1手進むと盤面がひっくり 返ってしまい、連続性が無くなってしまう。 キーを黒番優先にして、評価値も黒番サイド(白番の場合は−1を掛ける)に 統一するとスムージングしやすくなる。 ただし、評価関数からBookから、あちこち影響が出る。 そろそろソースの整理がしたくなってきていたので、バッサリやっちゃおうかな。 台風で暇だし。
- 968 名前: mailto:sage [2019/10/12(Sat) 09:18:22 ID:acZ84t7K.net]
- 一晩考えてやっぱ辞めました(^^;
単純じゃない。
- 969 名前: mailto:sage [2019/10/12(Sat) 19:26:22 ID:pRNoi8N2.net]
- あ〜なんか情熱が湧いてこないな。
プログラム書くのがすごい億劫。
- 970 名前: mailto:sage [2019/10/13(Sun) 05:54:00 ID:ZL98wLBj.net]
- とりあえず、囲連星のコード流用してDNN学習回せるところまで来ました。
あとはAIプレイヤーのコードを移植すればひと段落かな。
- 971 名前: mailto:sage [2019/10/13(Sun) 07:51:43 ID:ZL98wLBj.net]
- モンテカルロAIとDNNAIで対戦できるところまで来ました。
DNNAIの動きはまあ第一弾にしては悪くない感じ。
- 972 名前: mailto:sage [2019/10/13(Sun) 08:07:20 ID:ZL98wLBj.net]
- パッと見DNNAIには知性の芽生えのようなものを感じる。
勝率に結びつくかは微妙だけど。
- 973 名前:535 mailto:sage [2019/10/13(日) 08:47:17.90 ID:ZL98wLBj.net]
- 勝率に結びついてませんね…。
残念過ぎる…。 寝るか。。。
- 974 名前: mailto:sage [2019/10/13(Sun) 10:43:15 ID:ZL98wLBj.net]
- うーん、ハッキリと弱くなってますね。
ライフゲーム囲碁って昔勝率DB使った時も勝率落ちたし何でだろう?
- 975 名前:535 mailto:sage [2019/10/13(日) 10:48:13.56 ID:ZL98wLBj.net]
- モンテカルロAIにトリプルスコアで負けてますね〜
かなc
- 976 名前: mailto:sage [2019/10/14(Mon) 19:34:30 ID:+gotlTkI.net]
- ここからどうしていけばいいのかわからんなぁ。
負けるDNNAIで棋譜取りして勝てるようになるのかといえばかなり期待薄。 でもやれることもないし一応やってみるか。
- 977 名前: mailto:sage [2019/10/15(Tue) 23:46:30 ID:ttnyLWCi.net]
- DNNの評価値を得点差から勝率と得点差/81の平均にしたところ
トリプルスコアで負けてたのがダブルスコアになったようです。 まだ負けてるけど。 囲碁では得点差で評価値を付けるのはほぼタブーで勝率を評価値にするのがセオリーなのですが、試してみたかった。
- 978 名前:535 mailto:sage [2019/10/17(木) 22:06:11.66 ID:AT1bNTwz.net]
- やっぱ、負けてるなぁ。
- 979 名前:535 mailto:sage [2019/10/22(火) 14:18:39.16 ID:Mqr1tYDA.net]
- うーむ相手から攻撃されたときに反撃しない癖があるようだ。
反撃さえすれば楽に勝てるはずなんだが…。
- 980 名前:535 mailto:sage [2019/10/22(火) 16:38:49.29 ID:Mqr1tYDA.net]
- DNNの入力にに盤面の情報だけじゃなくて、石がぶつかってるところの情報も与えてみるか。
かなり肝になる情報のはずだから。
- 981 名前:535 mailto:sage [2019/10/22(火) 17:02:51.95 ID:Mqr1tYDA.net]
- うお、メモリがパンクしたorz
もー新スレッドリッパーにメモリ1TB載せたいorz
- 982 名前:535 mailto:sage [2019/10/22(火) 17:31:13.35 ID:Mqr1tYDA.net]
- データベースがでかすぎるのかなぁ。
500万局面を4対称で2000万局面分くらいあるんだが、初期アルファ碁でも3000万局面くらいだったっていうし減らそういかなぁ。 うーん。
- 983 名前:535 mailto:sage [2019/10/23(水) 20:19:32.52 ID:VmufmFSW.net]
- 前も言ったかもしれないけどいたずらにネットワークを巨大化するよりコンパクトにしてエポック数を稼いだほうがいいかもしれないな。
- 984 名前:535 mailto:sage [2019/10/26(土) 19:36:09.88 ID:4XMH/3Nj.net]
- 学習するほどに弱くなる理由がさっぱりわからんorz
ちょっと休憩
- 985 名前:535 mailto:sage [2019/10/27(日) 18:41:08.53 ID:OnknjOzZ.net]
- またgithubでアルファゼロ探ししようかなぁ(懲りてない)
- 986 名前:535 mailto:sage [2019/11/05(火) 18:52:29.53 ID:F2Rnn9oI.net]
- 新スレッドリッパー今日発表見たいですね
ワクワク
- 987 名前:535 mailto:sage [2019/11/05(火) 22:09:32.07 ID:GKFgjg5l.net]
- あれ、今日じゃないのか…
- 988 名前:535 mailto:sage [2019/11/07(木) 23:17:24.41 ID:OiCk9RdB.net]
- スレッドリッパー 32コア ベース3.7GHz ターボ4.5GHz 1999$
素晴らしい 金がないけど
- 989 名前:535 mailto:sage [2019/11/09(土) 22:53:36.89 ID:rF2mt5AD.net]
- https://github.com/suragnair/alpha-zero-general
これwindowsでも動くっぽい
- 990 名前:535 mailto:sage [2019/11/10(日) 20:01:17.40 ID:KZcBl7Ju.net]
- せっかく良さそうなの見つけたのに、イマイチモチベーション上がんないな〜
なんでだろ。ホントよさそうなのに。
- 991 名前:535 mailto:sage [2019/11/17(日) 21:06:42.27 ID:eK7f1inq.net]
- コツコツpythonやってます。
リストの使い方がわかってくると書く速度あがりそう。
- 992 名前:535 mailto:sage [2019/11/17(日) 21:48:33.74 ID:eK7f1inq.net]
- >>972にライフゲーム碁のロジックを実装しました。
ランダムプレーヤーと対戦できるところまで確認しました。 意外と拡張しやすい作りになってるっぽい。
- 993 名前:535 mailto:sage [2019/11/17(日) 22:00:36.51 ID:eK7f1inq.net]
- インターフェースの作りがうまいプログラムは心が躍りますね。
見習いたい。
- 994 名前:535 mailto:sage [2019/11/17(日) 22:24:52.29 ID:eK7f1inq.net]
- うおおお、遅えええええええ
6x6オセロだと結構速いけど9x9ライフゲーム囲碁だとめちゃ遅いorz なにか高速化策を考えねば…
- 995 名前:535 mailto:sage [2019/11/17(日) 22:33:57.28 ID:eK7f1inq.net]
- 並列化されてないっぽいな。うーむ
並列化狙うか…
- 996 名前:535 mailto:sage [2019/11/18(月) 20:52:01.98 ID:mPMMCB5I.net]
- 今日一日、強化学習回してたんですが途中でOS固まってたorz
でも一応、3回ベストポリシー更新されたみたい。 ランダムボットと対戦させてみます。
- 997 名前:535 mailto:sage [2019/11/18(月) 21:16:14.14 ID:mPMMCB5I.net]
- ランダムボットと黒白25戦づつやってディープラーニングAIの39勝11敗
でだしとしてはまあまあかな。 純モンテカルロAIともやってみよう。
- 998 名前:535 mailto:sage [2019/11/18(月) 21:19:24.26 ID:mPMMCB5I.net]
- あれ、純モンテカルロAIないのか?
うーん。
- 999 名前:535 mailto:sage [2019/11/19(火) 19:48:59.11 ID:EOzKZ0AX.net]
- うーむOS固まるなぁ。
今日も固まった。 グラボの熱が悪いのだろうか?
- 1000 名前:535 mailto:sage [2019/11/19(火) 20:34:57.86 ID:EOzKZ0AX.net]
- パソコンの調子が悪いのならいっそAWSとか検討するという手も…
でも金が…
- 1001 名前:名前は開発中のものです。 mailto:sage [2019/11/20(水) 21:49:18.08 ID:lMEK9Bn7.net]
- 今日も固まったorz
ほんまどーなってるの?
- 1002 名前:535 mailto:sage [2019/11/20(水) 21:49:44.28 ID:lMEK9Bn7.net]
- 名前忘れた
- 1003 名前:535 mailto:sage [2019/11/20(水) 22:46:44.07 ID:lMEK9Bn7.net]
- 固まったけど少し更新されてたようです
ランダムボットと対戦したら48勝2敗 結構ハッキリ強くなってるな。
- 1004 名前:535 mailto:sage [2019/11/21(木) 19:44:58.21 ID:xK6B/ksk.net]
- 今日も当たり前のように固まってるorz
どうすりゃいいんだ?
- 1005 名前:535 mailto:sage [2019/11/21(木) 21:11:44.62 ID:xK6B/ksk.net]
- そろそろ次スレの季節ですね。
順番的に私の番か。 995くらいで立てたらいいですかね。
- 1006 名前:535 mailto:sage [2019/11/22(金) 19:54:12.78 ID:nusik7MY.net]
- 今日も固まった
いまのところ100%
- 1007 名前:310 mailto:sage [2019/11/22(金) 20:03:28.74 ID:bJtjxKyJ.net]
- どもです。そろそろ次スレですね。
相変わらず、色々小改造しながら相変わらず棋譜作り続けています。 Book確認のデバッグ用プログラム作って、棋譜の間違い特定が飛躍的に早くなり、 その分、訂正用の棋譜が膨れて遡り探索がおろそかになっています。 評価関数の学習は進めていますが、どちらかというと評価関数が怪しくて間違えて いそうなところで、わざと分岐させてBookで正解手順(に近い)の分岐を登録していく 事で、棋譜の精度を上げようとしています。BookをQ値と考えると、選択的なε-Greedy でQ学習しているような感じになりつつあります。 もちろん、最終的には評価関数に反映しますが、今はBook構築が先みたいな。 VC++のバージョンアップ通知が来たので更新したら、あちこちワーニングや エラーが出て来まして、ソースの整理をしながら、ワーニングにならないソース に書き換え中です。急いでも仕方がないので、裏で棋譜作り動かしながら、 ちんたらやってます。 久々にMCTS部分を見たら、バグだらけだったので、直したところ、マシンパワーが 上がったことからか、残り30手程度ならすぐに終局まで枝が伸びて比較的正確に 最善手順が生成できそうかなと思っています。全てのプログラムの書き換えが 終わったところで、テストしてみたいと思っています。
- 1008 名前:535 mailto:sage [2019/11/23(土) 14:12:48.21 ID:0YM91Vba.net]
- 昨日の晩からいままで連続で動いてます。
なかなかベストポリシーが更新されなくて焦れる
- 1009 名前:535 mailto:sage [2019/11/23(土) 17:50:36.12 ID:0YM91Vba.net]
- ランダムボットに白黒25戦づつやって50勝0敗来ました!
このゲームはほかのゲームと比べてランダムボットが比較的強いから素晴らしいですね。
- 1010 名前:535 mailto:sage [2019/11/23(土) 18:12:06.28 ID:0YM91Vba.net]
- うーん、人間に勝てるほどは強くないな
- 1011 名前:535 mailto:sage [2019/11/23(土) 19:11:14.10 ID:0YM91Vba.net]
- 次スレ
【オセロ,将棋】ボードゲーム Part3【囲碁,War】 https://mevius.5ch.net/test/read.cgi/gamedev/1574503798/l50
- 1012 名前:535 mailto:sage [2019/11/23(土) 20:58:35.29 ID:0YM91Vba.net]
- こっち埋めちゃいますね。
- 1013 名前:535 mailto:sage [2019/11/23(土) 20:59:10.47 ID:0YM91Vba.net]
- 梅
- 1014 名前:535 mailto:sage [2019/11/23(土) 21:00:52.15 ID:0YM91Vba.net]
- AWSでいいマシンを使うというのも憧れるが、
買うのとどっちが安いかは微妙かな。
- 1015 名前:535 mailto:sage [2019/11/23(土) 21:02:40.43 ID:0YM91Vba.net]
- スレッドリッパー11月30日発売。
コア数はいわずもがなベースクロックもかなり高い。
- 1016 名前:535 mailto:sage [2019/11/23(土) 21:05:07.92 ID:0YM91Vba.net]
- pythonの文法は結局何がいいのかよくわからんな。
ライブラリが充実してるってのはそうなんだろうけど。
- 1017 名前:535 mailto:sage [2019/11/23(土) 21:05:51.11 ID:0YM91Vba.net]
- 1000 !
お疲れさまでした。 次スレでまたお会いしましょう。
- 1018 名前:1001 [Over 1000 Thread.net]
- このスレッドは1000を超えました。
新しいスレッドを立ててください。 life time: 769日 3時間 30分 53秒
- 1019 名前:1002 [Over 1000 Thread.net]
- 5ちゃんねるの運営はプレミアム会員の皆さまに支えられています。
運営にご協力お願いいたします。 ─────────────────── 《プレミアム会員の主な特典》 ★ 5ちゃんねる専用ブラウザからの広告除去 ★ 5ちゃんねるの過去ログを取得 ★ 書き込み規制の緩和 ─────────────────── 会員登録には個人情報は一切必要ありません。 月300円から匿名でご購入いただけます。 ▼ プレミアム会員登録はこちら ▼ https://premium.5ch.net/ ▼ 浪人ログインはこちら ▼ https://login.5ch.net/login.php
- 1020 名前:過去ログ ★ [[過去ログ]]
- ■ このスレッドは過去ログ倉庫に格納されています
|

|