日本経済新聞 関連サイト

OK
liberal arts-大学生の常識

相次ぐAIスピーカー、覇者の条件は

相次ぐAIスピーカー、覇者の条件は

 アマゾンジャパン(東京・目黒)が11月8日、人工知能(AI)を搭載したスマートスピーカーの「エコー」を日本で発売した。グーグルやLINEも先月、AIスピーカーを発表。年内にはソニーも加わる。パソコンからスマートフォン(スマホ)やタブレットへと進化してきた個人向け情報端末に新たな顔が加わった。

日本で便利?

AIスピーカー「エコー」の日本発売を発表するアマゾンジャパンのジャスパー・チャン社長(中央)ら

 米国ではすでに1000万台以上を売るヒット商品に成長しており、日本でもAI家電市場の重要なけん引役となりそうだ。ただ言語の壁や生活様式の違いなど普及には様々な課題もある。覇者となるのは誰なのか、各社の戦略や市場のニーズを追ってみた。

 東京・有楽町のJR駅前にあるビックカメラ有楽町店。グーグルのAIスピーカー「グーグルホーム」の発売に合わせ、1階の携帯売り場の隣に体験コーナーが設けられた。かつてはテレビの売り場だったところがスマホの売り場に替わり、今度はAIスピーカーが並ぶ姿を見ると、デジタル製品の変わり身の速さに驚きを禁じ得ないが、記者も早速、試してみた。

 「オッケー(OK)、グーグル、部屋の灯りをみんな消して」――。円筒形のスピーカーに語りかけると、音声認識を表すサインが点滅し、シーリングライトやスタンドライトが一斉に消灯した。グーグルのロゴが入ったTシャツ姿の説明員は自慢げだが、果たしてこれが本当に便利なのかと首を傾げた。というのも日本では壁のスイッチ1つで部屋の照明を操作できるのは当たり前。米国ではなぜ人気を呼んでいるのかと考えるうち、昔の駐在記者時代を思い起こした。

 米国では部屋全体を明るくするシーリングライトよりもテーブルや枕元などを照らす部分照明が好まれる。操作するにはいちいち照明のところに行かなければならず、部屋が広ければ広い分、手間もかかる。音声操作ですべての灯りを操作できれば、年配者などには便利だということがようやく理解できた。

Siriはいまひとつパッとせず

 ビッグデータ分析のホットリンクが「AIスピーカー」に関するツイッターの投稿を分析したところによると、グーグルの製品発表を受け、男性を中心にたくさんのツイートがあったという。

 一方、「スマホでもいいんじゃない?」「オッケー、グーグルというのは恥ずかしくない?」といったやや否定的な意見もあったそうだ。車での移動が多い米国では、音声によるカーナビやスマホの操作が広がっているが、電車で移動する日本の都市部では車内での発声は御法度。携帯電話が鳴るだけでも白い目で見られる。

 スマホはイヤホンをしながら1人でじっと眺めるものであり、アップルの音声認識技術「Siri(シリ)」がいまひとつパッとしないのも、そうした文化や生活習慣の違いに要因があるといえる。

 そんな中、部屋も狭い日本の市場でAIスピーカーは本当に売れるのだろうか。

日本勢、商品化に遅れた3つの理由

東芝が開発したAIスピーカー(シーテックの会場で)

 実は半年以上前にこの欄で「世界から置き去りにされる日本の家電」(2017年4月25日)というコラムを書き、日本の家電メーカーがAIスピーカーの商品化に出遅れた理由を指摘した。ハードウエア技術では日本は世界をリードするが、背後にあるAIの開発に出遅れたというのが1つめの理由。2つめは「技適」と呼ばれる技術の規制だ。3つめは日本メーカーの縦割り構造や自前主義である。今回もLINEやソニーに加え、オンキヨーやパナソニック、東芝などが遅ればせながらAIスピーカー市場に参入してきた。

 「見た目は同じだが、エンジンが違います」。グーグルホームの発表の際、日本では家電IT(情報技術)見本市の「CEATEC(シーテック)」が千葉市の幕張メッセで開かれた。東芝は北米向けに発表したばかりのAIスピーカーを展示、説明員が発したのがこの言葉だ。音声認識技術はエコーと同じアマゾンの「アレクサ」を採用しているが、国内向けには同社独自開発の音声認識技術「リカイアス(「私たちを理解する」の意)を搭載する計画だという。

アマゾン、日本発売に周到な準備

スマートスピーカーの新製品を発表するソニーヨーロッパの粂川滋社長(9月の独ベルリン「IFA」で)

 北米や欧州向けにAIスピーカーを発表したソニーやパナソニックも、海外向けにはグーグルの音声認識技術「グーグルアシスタント」を採用するが、国内向けや法人向けには独自技術を採用することも検討しているようだ。というのもグーグルやアマゾンが得意とするディープラーニング(深層学習)の手法は言語を問わないが、厳密な言語解析や名前や地名など日本の固有名詞が重要なサービスでは、国産技術に一日の長があるというわけだ。もちろん背後には音声認識技術に長年携わってきた技術者のプライドや思いもあるに違いない。

 その点、今回のアマゾンの製品発表は、グーグルやLINEに1カ月遅れたとはいえ、その分、サービスメニューの充実に周到な準備を重ねてきた。アマゾンは外部の企業が自社の情報サービスをアマゾンエコーに簡単に連携できる「スキル」と呼ぶ機能を提供しており、発表段階で265種類ものサービスを用意したからだ。

 例えば、野村証券とは投資情報を音声で聞けるようにし、京王電鉄とは鉄道やバスの運行情報をアマゾンエコーで入手できるようにした。関西電力とは電気やガスの使用量や料金などを音声で確認できるようにした。

エレクトロニクスの規格争いの系譜

 今後の出方が注目されるのが米アップルや米マイクロソフトだ。アップルは「iPhone(アイフォーン)」への「シリ」の搭載で音声認識技術の採用に先陣を切ったが、用途がスマホやタブレット向けに限られ、AIスピーカーやAI家電といった横展開が遅れている。マイクロソフトの音声認識技術「コルタナ」もパソコンやタブレット向けで、それ以上の広がりを見せていない。逆にマイクロソフトはアマゾンと提携し、アレクサを「ウィンドウズ10」上でも使えるようにした。

 実はこうした技術の規格争いは、エレクトロニクス業界では昔から展開されてきた。古くは1980年代の「ベータ対VHS」のVTR戦争にさかのぼる。画質や性能はソニーのベータ方式が上だといわれたが、レンタルビデオ店などの仲間作りに成功した松下電器産業(現パナソニック)と日本ビクター(現JVCケンウッド)のVHS陣営に軍配が上がった。90年代には「マック対ウィンドウズ」のパソコン基本ソフト(OS)の戦いが繰り広げられ、自らは製品を持たないマイクロソフトがメーカーの仲間作りで優位に立った。

 その構図は「iOS対Android(アンドロイド)」のスマホOSの攻防にも引き継がれている。セキュリティーや操作性ではアップルの製品が好まれるが、製品を持たないグーグルの方が世界の端末メーカーやソフトメーカーを上手に取り込み、世界市場の7割以上を獲得することに成功した。その流れからAIスピーカーを新しい消費者向けのユーザーインターフェースととらえれば、今回もオープン戦略を掲げ仲間作りに成功した企業が優位に立つと予想できそうだ。

グーグル優位の見方も

 現在の構図は14年にAIスピーカーをいち早く商品化したアマゾンが米国で7割以上のシェアを押さえ、それをグーグルが追い上げている状況だ。アップルは今回は我が道を行っている。しかし英調査会社のIHSによれば、2020年にはグーグルがアマゾンを追い抜くというシナリオを描いている。

 音楽配信など情報や流通サービスの分野ではアマゾンが強いが、グーグルは住宅設備のネスト・ラボや医療関連のベリリーなど様々な企業を傘下に抱えており、あらゆるモノがネットにつながる「IoT」分野のユーザーインターフェースとしては「グーグルアシスタント」の方が広く普及していくとみているためだろう。

 日本でも音声認識技術はエンターテインメントや個人向けの情報サービスよりも、医療や製造現場など両手がふさがっている仕事や、端末操作に慣れない高齢者を対象にした介護サービスなどで高い関心が持たれている。情報通信研究機構(NICT)の音声翻訳技術を使って富士通が開発したIDカード型のハンズフリー音声翻訳端末は、医師が端末を胸に付けているだけで外国人患者と様々な言語で会話できるという代物で、今年の「シーテックアワード」にも選ばれた。

 スマホやタブレットの後に登場した端末としては、スマートウオッチなどのウエアラブル端末も大きな関心を集めた。しかしスマホの機能を単に置き換えただけでは大きな市場にはなりにくい。AIスピーカーもスマホの代替品としての機能しか果たさなければ、一部のアーリーアダプター(新しもの好き)向けの商品にとどまってしまうだろう。

 その意味では、AIスピーカーの覇者となるためには、製品や音声認識の技術の高さだけでなく、金融や流通、教育、介護、医療、住宅など様々なサービスメニューをどれだけ取りそろえられるかが決め手となるに違いない。新たな仲間作りが問われているといえよう。
(編集委員 関口和一)[日経電子版2017年11月10日付]

「日経College Cafe」のお勧め記事はこちら>>