おまいら最強の将棋プログラムしてみろよ part6

[表示 : 全て最新50 1-99 101- 201- 301- 401- 501- 601- 701- 801- 901- 2chのread.cgiへ]
Update time : 05/09 15:39 / Filesize : 284 KB / Number-of Response : 966
[このスレッドの書き込みを削除する]
[＋板最近立ったスレ＆熱いスレ一覧 : ＋板最近立ったスレ／記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

おまいら最強の将棋プログラムしてみろよ part6

51 名前：デフォルトの名無しさん [2007/05/03(木) 21:17:55 ]: >>7

強化学習と機械学習の差を強調して書くなら、こんな感じ。

最適（と思われる）行動が教示されるのが機械学習で、Bonanzaはこれ。
将棋で言うと最善手が教示される（実際にはプロが指した手＝最善手と見なしているが）。

過去の（≠直前の）行動に対して報酬が与えられるのが強化学習で、実現したソフトは（選手権参加ソフトが公開している情報を見る限りでは）まだ無い。
将棋で言うと勝ったから100点の報酬をあげる、とかそんな感じ。

まぁ、実際には他にも色々差があるわけですが。詳しい事は7氏の買った本に載ってます。

ちなみに私は構想中。来年の選手権はそれで出ます。

[ 続きを読む ] / [ 携帯版 ]

全部読む次100 最新50 ▲ [ このスレをブックマーク！携帯に送る ] 2chのread.cgiへ
[＋板最近立ったスレ＆熱いスレ一覧 : ＋板最近立ったスレ／記者別一覧]（ ´∀｀）＜284KB

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef