- 201 名前:とは対照的に、DeepMindは自身のシステムが事前にプログラムされていないと主張している。DeepMindのシステムは、データ入力として生のピクセルのみを使用し、経験から学ぶ。
技術的には、畳み込みニューラルネットワーク上での深層学習(ディープラーニング)と新たな形式のQ学習(モデルフリー強化学習の一形式)を使用する[1][31]。DeepMindは、ビデオゲーム、特にスペースインベーダーやブロックくずし(ブレイクアウト)といった初期のアーケードゲーム上でこのシステムを試験した[31][32]。 コードを変更することなしに、このAIはゲームをどうやってプレーするかを理解し始め、ある程度プレーした後、いくつかのゲーム(中でも特にブレイクアウト)については、どの人間よりも効率的にプレーできるようになった[32]。しかし、ほとんどのゲーム(例えばスペースインベーダー、パックマン、Qバート)については、DeepMindは現在の世界記録を下回っている。 DeepMindのAiのビデオゲームへの応用は、現在1970年代と1980年代に作られたゲームへのものであり、1990年代初頭に初めて登場したDOOMといったより複雑な3Dゲームへ作業も行われている[32]。 [] - [ここ壊れてます]
|

|