【IT】「AlphaZero」がチェス、将棋、囲碁の各世界最強AIを打ち負かす

【IT】「AlphaZero」がチェス、将棋、囲碁の各世界最強AIを打ち負かす at BIZPLUS

1:ムヒタ ★
18/12/09 10:34:18.81 CAP_USER.net
　米Alphabet傘下の英DeepMindは12月6日（現地時間）、「AlphaGo Zero」から進化させた強化学習採用のAI「AlphaZero」が、チェス、将棋、囲碁のそれぞれの世界最強AIを打ち負かしたと発表した。
　強化学習（reinforcement learning）は大まかに言うと、学習用のデータを使わずに、AIが選択した行動が正しければ報酬を与えることで、AIの状況判断能力を上げていく機械学習方式。AlphaZeroはまた、行動の選択に「モンテカルロ木探索（MCTS）」と呼ばれる検索アルゴリズムを使う。
　AlphaZeroはこの方法で、チェスを9時間学習した後チェスの世界チャンピオンAI「Stockfish」を、将棋を12時間学習した後世界コンピュータ将棋選手権の2017年の勝者「elmo」に、囲碁を13日間学習した後AlphaGo Zeroに勝利した。
　AlphaZeroはMCTSを使うことで、例えばチェスではチャンピオンのStockfishが1秒当たり約6000万のポジションを検索するのに対し、わずか6万しか検索せずに済むという。
　また、AlphaZeroは、系列である米Googleのオリジナルプロセッサ「TPU」を5000基使っている。ちなみに、TPUは1基だけで1日当たり1億点のGoogleフォトを処理する能力がある。
　DeepMindは、AlphaZeroの目的はチェスや将棋、囲碁に勝つことの先にあり、様々な実世界の問題を解決するシステムを構築することにあると語った。AlphaZeroは、単一のアルゴリズムが一連の設定で新しい知識を発見する方法を学べることを示しており、まだ初期段階ではあるが「複雑な問題に対する斬新な解決策を見いだす汎用的な学習システムを構築するというわれわれのミッションに自信を与えてくれた」という。
2018年12月09日 08時18分
URLﾘﾝｸ(www.itmedia.co.jp)

104:名刺は切らしておりまして
18/12/10 08:59:13.40 uIRO1LxQ.net
>>102
一応世界中で知られてるとはなってるが主に日本と一部アジア中心のマイナー気味ゲームだから当たり前だね
欧米で特に盛んなポーカーとはわけが違う。本気でやればすぐに勝率で世界チャンプ以上のを作れるだろうが
欧米じゃ知名度が低いから。日本が作るのだと囲碁のていたらくを見る限り大したものは作れんだろう

105:名刺は切らしておりまして
18/12/10 08:59:38.56 AbGMjtZx.net
「なお、各最強ソフトは公開されてるから俺たちは検証できたけど、AlphaZeroは公開しないし検証もさせません」
Googleの論文はこのパターン多くね？

106:名刺は切らしておりまして
18/12/10 09:08:26.83 uIRO1LxQ.net
あまり内容知られたくないのだろ
そういうの発表するだけで何をどうしてるか、ある程度わかっちゃうからね
おおげさに言えばAI技術を盗まれることになる

2から表示