・たった数秒でルービックキューブを完成させることの出来る、ディープラーニング機能を備えたDeepCubeAが新たに誕生
・ロボット工学や自然科学など、あらゆる分野に対応
人工知能(AI)の性能は、既にchess and Goで実証済みです。しかし、機械知能を通じたルービックキューブなどのパズルでは、まだ成果が報告されていません。組み合わせパズルは昔からありますが、機械学習にとっては面白い実験でもあるのです。
機械学習の技術はもともと、ルービックキューブを完成させるために使用されてきました。にも関わらず、効率的かつ正確にパズルを解くことには成功していません。また、これらの技術は特殊なドメイン知識に頼る部分が大きかったことも事実です。
現在、アーバインにあるカリフォルニア大学の研究者たちによって、非常に複雑なパズルを特殊なドメイン知識なしで完成させる、DeepCubeAと呼ばれるディープラーニング機能が開発されています。人間が実際に操作を教えなくても、数秒でルービックキューブを完成させる機能です。
面の数が増えるだけで、パズルの難易度は一気に上がります。例えば15ピースのパズルであれば、通常のコンピュータで解き方を割り出すのに数秒ちょっとかかりますが、これが24ピースとなると、同じコンピュータでも数日かかります。
そこで研究者たちは、人間の持つ特殊ドメインがなくても様々なパズルを解くことの出来る機械学習モデルの開発を試みました。DeepCubeAは、次の3つの最先端アプローチを組み合わせて開発されました。
1. ディープラーニング
2. 従来の機能強化(類似値の反復)
3. 経路探索メソッド(A検索の測定)
またDeepCubeAは、ポリシーとバリュー機能を組み合わせたディープラーニングのアルゴリズムで出来ている機能であり、ルービックキューブを完成させるためのMonte Carlo Tree Searchを搭載しています。
そして研究者たちは、ネットワークを検証するためにTensorFlowのフレームワークを使用し、約10億通りものシミュレーションを複雑なパズルに対して行いました。全体の流れを100万回反復するのにかかった時間は、36時間です。
一度学習すると、DeeoCubeAは何回テストを行っても100%正確にルービックキューブを完成させ、最後にかかった時間の60.3%になるような最短完成経路を割り出します。
最短経路の割り出しにも機械学習が利用されますが、実際かかった時間がそれより長くなることはありません。測定されたA検索には、最適解の長さとルービックキューブを完成させる長さの違いに、一定の限界があるからです。
組み合わせパズル用のアプリケーション
また研究チームでは、24ピースのパズルやLights Out、Sokobanなど他のパズルにも、DeepCubeAを使った実験が行われました。その結果、ほとんどのケースで最短経路が割り出されました。
今回のような研究の最終目標は、組み合わせパズルの分野を超えたロボット工学や自然科学にも応用可能な、次世代のディープラーニングモデルを開発することです。
我々は既に、AlexaやSiriのようなAIベースの検索エンジンと日々の生活を共にしています。しかし、これらのシステムは完全ではなく、簡単に操作されたり乗っ取られたりする可能性もあります。
今後は、さらに強くて賢く、また理解度の高い、論理的思考が出来る計画的なAIを展開していく必要がありそうです。今回の研究は、そんな大きな目標の第一歩に過ぎません。