人工知能(AI)、機械学習、そしてディープラーニングという言葉は、ここ最近非常に一般的なものになりました。特にビッグデータや解析、検索、インデックスといった話題において、これらの言葉が混同されて使われることがよくあります。確かにこの3つの言葉はきわめて関連性の深い用語ではあるものの、まったく同じというわけではありません。
この記事では、AI、機械学習、そしてディープラーニングが具体的にどのようなものなのか、そしてどういう違いがあるのかをご説明していきます。難しい科学用語を使うつもりはありません。できるだけ短く、シンプルに説明しますので、どうか心配しないでくださいね。
人工知能(AI)
AIはコンピュータサイエンスの一分野で、1956年にジョン・マッカーシーがこの用語を生み出しました。コンピュータというのは、通常人間が命令したタスクを行います。しかしAIというのは、マシンやソフトウェアそれ自体が人間と同じように知的にものを考え、実行することができるようになる技術のことを指します。つまり、コンピュータが言語を理解したり、音や視覚を認識したり、学習、計画、問題解決まで自ら行うということです。
たとえば、従来のプログラムは限定された質問にしか答えることができませんでしたが、AIは一般的な質問にも答えることができます。
AIは4つのタイプに分けることができます。
1. 完全な反応型タイプ:基本形。自分で結論を下すことはできない。
例:GoogleのAlphaGo、IBMのDeepBlueなど
2. 限定型メモリータイプ:適切な決断を下して実行することができる。
例:チャットボット、自動運転の乗り物など
3. 思考理論タイプ:思考や感情を理解して、社交的に交流することができる。
まだ実現していません。※
4. 自己意識タイプ:自分自身を表現し、自己の状態を認識し、他者の感情をも推測することができる。
こちらもまだ実現していません。※
※タイプ3とタイプ4はまだ現実には存在しないものの、SF映画の中には登場しています。たとえば「スター・ウォーズ」のR2-D2(タイプ3)や、「エクス・マキナ」のエヴァ(タイプ4)などが挙げられます。
機械学習
機械学習はAIの技術のひとつで、明示的にプログラムするのではなく、自ら学習し、実行し、経験をもとに改善する能力をシステムに与えるというものです。すなわち、あるタスクを遂行するためのすべての手順と具体的な指示を明示的に書き込むのではなく、過去の経験から学ぶことができるようにプログラムをトレーニングするという手法が機械学習なのです。ここで言うトレーニングとは、大量のデータをプログラムに与えることによって、プログラムに自らを設計させ、改善させることを意味します。
たとえば、機械学習のアルゴリズムに何千枚もの猫の写真を見せます。するとプログラムが、猫とはどういう外見をしているのか - 体長や色、顔の形などを認識し始めます。すると最終的には、写真に写っている猫を識別できるようになり、自動的にタグ付けできるようになるというわけです。精度が十分に上がると、アルゴリズムは猫の姿を正確に見分けることができるようになります。
機械学習には次のようなタイプがあります。
1. 教師あり学習:データと明確な正解をあらかじめコンピュータに提示して、明示的に学習させるというもの。
2. 教師なし学習:コンピュータがデータ(パターンや構造)を理解し、データの集合の中から自ら推論を導き出すというもの。
3. 強化学習:AIのアプローチ法のひとつで、試行錯誤のやりとりによって学習させ、良い結果が出たら報酬を与えるというもの。
ディープラーニング
ディープラーニングは機械学習のサブ領域のひとつ。人間の脳の構造と機能や、無数のニューロン(神経細胞)が相互接続している様子からインスピレーションを受けて作られたアルゴリズムを用います。このアルゴリズムは「人工ニューラルネットワーク(ANN)」と呼ばれ、脳の生物学的構造を模したものです。
人工ニューロンはいくつかの層に分かれており、別の人工ニューロンと接続しています。ある概念が入れ子状に階層に分かれている様子や、決定木のようなものをイメージするといいでしょう。各層は、学習したり特定の経路をたどるために、データの特徴を選別することができます。層がたくさんあると深さが生まれます。層が多ければ多いほど、ネットワークはより深く、複雑になるのです。
ディープラーニングによって十分に学習させるためには、大量の情報を必要とします。ものごとを定義する要素をひとつずつコードとして書き込むのではなく、何百万ものデータポイントに触れさせることによって、システムに学習させるのです。
Google Brainは、1000万枚以上のイメージサンプルをもとに猫を認識するディープラーニングの完璧な例と言えるでしょう。こういったネットワークには、ものごとを定義する具体的な基準をコーディングする必要がありません。たくさんのサンプルに触れることで、自ら違いを識別できるようになるからです。
2017年10月、Google Brainのトップであるジェフ・ディーンは、バークレーで行われたVBサミットで次のように述べています。
もしサンプルが10個しかなかったら、ディープラーニングを機能させるのは非常に難しいでしょう。しかし、10万件の記録データなどを用意できる規模であれば、ディープラーニング技術の効果が期待できます。
今日、ディープラーニングによって向上した画像認識システムは人間の能力を上回っています。猫の識別から、MRIスキャンに写っている血液のがんや腫瘍の発見まで、その範囲は多岐にわたります。
GoogleのAlphaGoは、囲碁(チェスよりもずっと複雑なゲームです)のトレーニングを通じて、何度も自分自身と対戦することでニューラルネットワークを向上させました。2016年3月には、コンピュータプログラムが初めて人間の囲碁棋士を破るという快挙を達成しました。
AI・機械学習・ディープラーニングのイメージ
出典: Nvidia
AI・機械学習・ディープラーニングの関係をもっともシンプルに考えるには、3つが同心円状になっているのをイメージすることです。AIが一番外側に来て、次に機械学習、そして一番中心に、今日のAIの爆発的進歩をけん引しているディープラーニングが来ます。
失敗から急成長へ
AIは、人間の想像力の一端であり、1956年以来、研究室の中でずっと温められ続けてきました。2012年以降の7年間で、文字認識や信号処理、さらには音声やの画像認識(これは難しい仕事でした)といったAIのキーとも言える数々の問題に関して、私たちは大きな進歩を遂げました。その成果は、それ以前の25年間の成果を上回っています。
過去数年間でAIが爆発的進歩を遂げた大きな理由は、GPUが広く普及して、より高速かつ安価での並列処理が可能になったことです。また、データの保存領域が実質的に無限になったことや、ビッグデータの動向全般もこの進歩に関係しています。
今日、あらゆる大手ハイテク企業がAIプロジェクトに莫大な資金を投じ、何百億もの人々が検索エンジンやソーシャルメディア、ECプラットフォームなどを通じて日常的にAIソフトウェアに接しています。そのAIの中でも、私たちがもっともよく接している(唯一接していると言ってもいいかもしれません)のは、機械学習です。
統計調査データプラットフォーム「statista」によれば、世界全体のAI市場の収益は2025年までに59兆ドルを超えると言われています。
ディープラーニングがAIの未来をもたらす
革命的なディープラーニングの登場によって、あらゆるものごとを機械でアシストすることが可能と思えるようになり、機械学習の実用化が実現しました。最適な商品を勧めたり、物語を考えたり、予防治療の向上や、ドライバーいらずの乗り物まで - 今日では、これらが全て可能になったのです。ディープラーニングのおかげで、AIは私たちが長い間想像していたSFの世界にまで到達するかもしれません。