デザイン

デザイン

PR

【「モバイル」の未来】2018年、モバイルデバイスは新たな次元に?音声、視覚、AIの最新動向

2,610 views

読了時間 : 約6分0秒

今、ポケットコンピュータはこれまで以上に強力かつインタラクティブになっています。 2017年後半には、モバイルデバイスで使用可能なハードウェアが大幅に改善されました。これにより、インテラクションのためのデザインの機会がますます増えてきています。カメラは、入力デバイスからインテリジェントなインタラクティブメディアに進化しています。マイクロホンは人工知能への直接され、NFCはIoTの考え方をますます現実化しつつあります。

実際ピクセル2、iPhone X、サムスンS8などのフラッグシップデバイスは、これをすべて利用可能にしており、かくしてインタラクションデザイナーやソフトウェアエンジニアに対し、ユーザーにとってさらに意味のある新しいエクスペリエンスを生み出すという仕事の機会を提供しています。

さて、これらの新しいデバイスは、単に最新のクールなガジェットというにすぎないでしょうか。

それともこれらは、「デバイス」というものの次世代を先取りする、高度に洗練されたプロトタイプと考えるべきなのでしょうか。

本記事では、「モバイルデバイス」の未来を、現状を踏まえて考えてみます。

 

1.ユーザーインタラクションから見た「モバイルデバイス」の動向

 

従来の入力エレメントは、今日のデバイスでも当然のことながら依然として利用されています。タッピングやジェスチャーなどの触覚動作は、モバイルデバイス上のコンテンツとやりとりする方法において、まだ主流であり続けています。

しかし、聴覚的要素と視覚的要素によるインタラクションの改善によって引き出されるAIの潜勢力が、いまゲームチェンジャーとして台頭してきているのです。

 

(1)音声インタラクション

マイクは、電話機の中で最も重要な入力デバイスの1つです。しかし一般的に、電話意外でのその適切な使用場面はこれまでほとんど考えられませんでした。 Google AssistantやSiriなどのボイス駆動のAIエージェントが増えたことで、このマイクは人工知能に直接する媒体になったのです。

近年進化が顕著なのは、VUI(Voice User Interface)です。それはキーボードに代わるものとして始まり、マシンにコマンドを与えられる媒体と見なされました。その後、SiriとGoogle Voiceの初期バージョンでは、検索エンジンの糸口にもなり、これによってユーザーがWebを検索する別の方法が提供されました。

過去1年間でこれらのテクニックはより洗練され、ポケット・アシスタントという考えを現実化させつつあります。このソフトウェアは今では、カレンダーやその他のアプリケーションにリンクすることで、より適切で複雑なコンテキストで動作することができます。また、IoTとつながるインターフェースとしても機能し、ユーザーはエージェントとの簡単な会話やゲームをすることができます。下の動画では、Google Assistantの一部の機能の概要が説明されています。

 

(2)スマート(スマートフォン)ビジョン

1990年代後半に、モバイルデバイスが実用化されたとき、それはもっぱら電話とSMSを送受信できるデバイスでした。次の10年間では、カラーディスプレイが付属し、それらの中にカメラが組み込まれていました。近年までは、スマートフォンのカメラは、デジタルカメラというほとんど単一の役割を、パーソナル・デバイスのほんの一部分として果たすという利便性を実現しました。ユーザーは、電話とカメラを別々に携帯する必要なく、単一のデバイスだけ携帯すればよいというようになったのです。

最新の携帯電話:Pixel2、iPhoneX、Samsung S8(BGR)

しかし、この豊かで強力な入力デバイスを私たちの電話機でより使いやすくしようとする努力が重ねられていました。それは現在、私たちの携帯電話の別の主要な対話デバイスになっています。

といっても、電話カメラという形を維持したままではありません。最新の携帯電話には複数のカメラがあり、ソフトウェア技術者がモバイルアプリケーションにコンピュータビジョン技術を統合するためのハードウェアが今では利用可能になっています。これらの複数のカメラには、電話の背面にステレオカメラを搭載するという最新の傾向も含まれているため、ステレオビジョンとそれによる深度計算ができるようになっています。

これまでメーカーやOSデザイナーが、この強力な機能をほんのわずかしか利用できていないことは明らかです。その最も一般的な使用例は、計算写真のアプリケーションでしょう。それでけでも結果は印象に残るものであり、完全な実装によるより実際的な拡張現実(Augumented Reality)の実現が待たれます。これは、ARCoreとARKitのリリースによっておそらく達成されるでしょう。

iPhone Xを使って、Appleはフロントカメラシステムの構造にも革命を起こしました。フロントカメラには赤外線カメラ、ドットプロジェクタ、3つの光センサが付いており、顔の表情を正確に追跡できます。これは顔認証の機能で一般的に使用されており、ユーザーは電話を見るだけで電話機のロックを解除できます。 Appleのエンジニアは、Animojiのこの洗練された技術を使った遊び心のあるアプリケーションも開発しました。しかし、これはその下に待機している可能性に対して氷山の一角にすぎません。 AI技術により、開発者はアプリケーションを使用しながらユーザーの表現を検出し、ユーザーに表示されるコンテンツの特徴に表情を関連付けることができます。可能性は無限です。

AppleのAnimoji(Steemit)のデモ

近年のディープ・ラーニングの進展は、モバイルデバイスで使用できる豊富な機能も実現しつつあります。 TensorFlowなどのオープンソースのフレームワークでは、開発者がスマートフォンに適用できるようにライト版を提供しています。

これにより、対象検出・認識のような新しい機能が可能になります。 Google Lensのプロジェクトでは、すでに絵画、OCR、画像での製品検出などの機能を紹介しています。このすべては、より実効的な拡張現実への道を開いています。

TensorFlowオブジェクト検出器(Racoon Detector)

 

(3)ハンドヘルドコントローラ

高性能モバイルデバイスは、バーチャルリアリティにアクセス可能にする機会を提供しています。これはSamsungのGearVRやDaydream VRのようなヘッドセットを通して行われます。このようなVRとの統合の唯一の課題は、デバイスがヘッドセットで使用されるため、ディスプレイとしてしか機能しないことです。ここには当然、インタラクションの限界があります。

最初に、Google Cardboardなどのヘッドセットには、ユーザーが交流できるタップボタンに進化した組み込み磁気トリガーが搭載されていました。けれどもこれは単一のボタンに限定され、インタラクションは限られていました。

デイドリームのコントローラとともに、状況が変わります。このセンサー内蔵コントローラにより、ユーザーは、かつてないほど仮想世界内で相互に交流することができるのです。このコントローラーには、アプリから外に出るボタンやスイッチがありますが、細かい動きややりとりのためのクリック式のトラックパッドもありまし、さらに仮想世界を探索する際の手の動きを追跡するジャイロスコープと加速度計もあります。

 

(4)その他のセンサー

私たちはモバイルデバイスで上記の最先端のインタラクションメディアを体験していますが、アプリにさらなるコンテキストを追加する他のセンサーも忘れがたいでしょう。上記のすべては、GPSまたはガリレオ信号から出てくる位置データと統合されることができます。これはコンパスの読み取り値と加速度計/ジャイロスコープのデータと組み合わせることによりさらに豊かになりえます。

 

 

2.「モバイル」の新時代?

 

さて、私たちが知っているような形の「モバイル」はもうすぐ終わろうとしているのでしょうか。

蓋然性から言って、上述してきた動向はまさにその方向を向いているということは言えるでしょう。近く今日の最新の携帯電話は、次世代デバイスのプロトタイプとして回顧されることになるでしょう。これらの新しいデバイスは、おそらく従来の触覚的インタラクションから独立しようとするGoogle Glassの線上にあるものです。 vuiエージェントとデバイスの人工ビジョンによって達成されたパフォーマンスのレベルが、それらを確証しているように思われます。

FacebookのARティーザー、F8(Business Insider)

2017年のF8カンファレンスでMark Zuckerbergは、Facebookの戦略が、メガネのようなデバイスを介した拡張現実Augmented Realityを通じて世界に新しいビューをもたらすというものであることを明確に示しました※。

※参照:Mark Zuckerberg just signed the death warrant for the smartphone

Google Glass(The X Company)

数ヶ月後、GoogleはGlassプロジェクトをX社を通じて再出発させました※。今回は、このハンズオンデバイスを利用して社員がより効果的に働けるような、企業向けアプリケーションに重点を置いています。興味深いのは、オフィシャルページによると媒体が音声、視覚、AIであることがさらに明確になっていることです。

※参照:Google Glass is officially back with a clearer vision

すべての項目が一方向を指しています。今日の最新の携帯電話は、次世代のデバイスにたいするプロトタイプとなっているのです。

 

 

※本記事は、Is 2018 pointing towards the end of mobile as we know it?を翻訳・再構成したものです。

 

 

関連記事

 

おすすめ新着記事

おすすめタグ