【テクノロジー】東大、２次元画像から３次元の形を認識　ＡＩで高精度に

【テクノロジー】東大、２次元画像から３次元の形を認識　ＡＩで高精度に at SCIENCEPLUS

1:しじみ ★
18/01/18 02:58:09.92 CAP_USER.net
東京大学の原田達也教授らは人工知能（ＡＩ）を使って２次元の画像から３次元の物の形を高精度で認識する技術を開発した。
深層学習（ディープラーニング）で多くの画像を学ばせると、１枚の画像から物の形を推測できるようになり、
実物との表面の一致率が６割と世界最高水準になった。空間を認識できるロボットなどに応用し、
作業の精度を高める用途を想定する。
　原田教授らは様々な角度から表示した飛行機やイスなど13種類の被写体の画像約３万枚を学習データに使った。
画像が推測した形と本当の形との差が小さくなるように、
人の脳をまねたニューラルネットワーク（神経回路網）の計算モデルを構築した。
　２次元画像から３次元に落とし込む際は、
これまで「ボクセル」と呼ばれる多くの立方体を積み重ねる手法が多く使われていた。
深層学習を使うのは比較的簡単にできるが、立方体にでこぼこがある分、精度を上げるのが難しい。
　原田教授らはＣＧ（コンピューターグラフィックス）では主流となっている、
表面を無数の三角形で表すメッシュという手法を使った。同手法を使うと物体の表面は滑らかだが、
つくった３次元の形をもとに、再び２次元画像を推測し直すのが難しかった。
　ニューラルネットワークの改良により、３次元の形から２次元画像を推測し直す技術を確立した。
実際の２次元画像に似るように３次元の形を構成したところ、精度が高まった。実物と一致する比率は、
飛行機やイスなど13種類のうち10種類で従来の手法を上回った。
　新技術を使えば、物の形に絵画の画風を付け加えることもできる。
例えば、ティーポットの画像とピカソやムンクの絵を合わせることで、
表面がピカソやムンクの画風をしたティーポットを、３次元の物体として作り出せる。
　これらの技術を応用すれば、ロボットにおいて、撮影した画像から奥行きを推測できるようになるため、
物を運んだりつかんだりするのが容易になる。
　現在は物の形を推測できるのは背景のない画像に限定されるが、
背景がある画像から推測する研究も進めて、さらに利用しやすくする。
画像：絵画の画風をティーポットの３Ｄの物体に加えた
URLﾘﾝｸ(www.nikkei.com)
日本経済新聞
URLﾘﾝｸ(www.nikkei.com)

レスを読む