[表示 : 全て 最新50 1-99 101- 201- 301- 401- 501- 601- 701- 2ch.scのread.cgiへ]
Update time : 12/28 16:26 / Filesize : 202 KB / Number-of Response : 776
[このスレッドの書き込みを削除する]
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

▲コンピュータ将棋スレッド145



253 名前:名無し名人 mailto:sage [2018/12/09(日) 13:57:28.44 ID:RHPzR7XO0.net]
AlphaZeroは、全くの自力の学習で強くなるよと示す論文であって、縛りプレイしてるから、
もっと効率的に学習することそのものは可能。
たとえば、最初はElmoの出す教師局面の評価値から学習して、その後自己対戦で学習、
とするだけで基本的な戦略の獲得のところはすっ飛ばせて、
最終レート到達までの時間やステップ数は早められる。
ただ、学術的にはそんな将棋ソフト用の特殊な学習の仕方をしても意味が無くて、むしろ、汎用的に学習できるよと示すために
あえて多少非効率でも自己対戦のみという縛りプレイでやってるんだよ。
強くすることそのものが目的の各種将棋ソフトとはその点で成り立ちが違う。






[ 続きを読む ] / [ 携帯版 ]

全部読む 前100 次100 最新50 [ このスレをブックマーク! 携帯に送る ] 2chのread.cgiへ
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧]( ´∀`)<202KB

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef