Main content

AIは人間の心を見抜けるのか

=感情計測ビジネスの現状と課題=

2019年07月04日

最先端技術

研究員
相澤 宏行

 Light My Fire(ハートに火をつけて)―。米国のロックバンド、ザ・ドアーズの代表曲である。燃え上がる恋や欲望を抑えられない人間の性(さが)を、ボーカルのジム・モリソンがわずか3分7秒の曲の中に凝縮して歌い上げ、世界的にヒットを飛ばした。1967年の発売から半世紀余。今でも色あせることはなく、この曲を聴くとベトナム戦争当時のすさんだ人々の心を励ます、モリソンの熱い感情が聴く者の胸を打つ。

 こうした人間の感情を目で見ることはできなかった。しかし、急速に進化するAI(人工知能)の力により、今や感情でさえ可視化されつつある。今回は感情を計測するAIの概要とビジネスへの利用、その課題を考えてみたい。

 そもそも感情とは何だろうか。岩波国語辞典(第6版)によると、「①気持。心持。②快・不快を主とする意識のもっとも主観的な側面」と定義されている。つまり、自己の外部にある対象への快・不快、恐怖・怒り、好き・嫌いといった心の動きを指す言葉である。

 感情計測AIの開発者は感情をより細分化して定義し、「情動」と呼ばれる概念を使う。それは怒りや喜び、恐怖などの一時的な心の動きの中で、同時に表情や声色の変化といった身体的な反応が起こる現象を指す。感情計測はこの急激かつ一時的な心の動きを捉える技術である。ただし、人の性格や思考、記憶が入り交じりながら、形成される複雑な心の動き(例えば「尊敬」や「憧れ」など)とは別のものである。

 感情計測AIには、現代のAIの中核技術である深層学習(ディープラーニング)が使われる。大量のデータから共通する特徴を学習・抽出し、新たな入力データへの評価軸を創り出すものだ。感情計測の場合には、AIが人間の喜怒哀楽を表現した顔・声のデータを大量に学習。その上で、さまざまな感情に伴う顔・声の特徴を抽出し、評価軸を形成する。カメラやマイクを通して特定の人間の顔・声を入力すると、評価軸に基づいて心の一時的な状態が計測される。

 この感情計測AIは既にビジネスに応用されている。日本のベンチャー企業エムパス(本社東京)のAIは声の音声波形だけで、人間の喜怒哀楽を計測できる。音声波形には人間の心理状態が現われるという神経生理学の知見を基に、さまざまな感情に伴う声を学習する。このAIはコールセンターの顧客対応向上などに利用されていて、既に40カ国500社以上の実績がある。コールセンターに電話した時、自分の顔が見えなくても心の内を見られているというわけだ。

 米国ではさらに開発と応用が進んでいる。ベンチャー企業Affectivaは投資家から60億円以上を調達し、顔の表情から感情を計測するAIを独自開発した。このAIは人種や性別、年齢層の異なる400万以上の表情と、その時の喜怒哀楽を結び付けたデータを学習済み。例えば、映像を見る人の表情をカメラで撮影し、場面ごとに心の状態を計測する。その結果を基にストーリーや登場人物を変更し、より人の心に刺さる映像作りを支援する。既に1000以上のブランドの広告評価や映画の予告編制作で利用されている。将来、視聴者反応をリアルタイムで確認しながら、内容がカスタマイズされるCMが当たり前になるかもしれない。

 顔・声のデータを組合わせ、より多面的に心の状態を測るソリューションも登場している。米国のベンチャー企業HireVueが開発したデジタル面接サービスは感情計測AIを導入している。同社のサービスを利用する企業は、①入社面接の応募者にスマートフォンで録画した自己PR動画を提出させる②AIで自己PR動画の顔・声などを分析し、やる気があるかどうか判断する③結果はランク付けされ、採否の判断材料になる。このサービスはリコージャパンほか、日本の大企業でも導入が進む。将来、「AI面接官」が求職者の命運を握る日が訪れるかもしれない。

20190702_01.JPG「AI面接官」が求職者の命運を握る日が...(イメージ写真=東京・渋谷)
(写真)中野 哲也 PENTAX K-S2

 その一方で、感情計測AIにも課題は少なくない。先に述べた通り、計測できるのは顔・声に現われる一時的な心の動きにとどまる。その記録を積み重ねていけば、果たして人の心の全体像を理解できるのか。前述したように、嗜好や体験が絡む尊敬や憧れといった複雑な感情は、現時点では計測が難しい。

 また、AIが個人の同意なく顔・声を捉え、勝手に心の内をのぞくようになると、プライバシー上の問題も深刻になる。AIの評価で採用などの重要なライフイベントが左右されることへの懸念も拭い去れない。

 だが、感情計測AIの発展はもはや止められそうにない。なぜならパソコンやスマートフォンにはカメラやマイクが標準搭載されるほか、声で操作するスマートスピーカーも浸透し始めているからだ。すなわち顔・声のデータを取得できる環境の整備が加速することは必至であり、それならば「陰」の側面も把握しながら応用の是非を議論するべきではないかと思う。

相澤 宏行

TAG:

※本記事・写真の無断複製・転載・引用を禁じます。
※本サイトに掲載された論文・コラムなどの記事の内容や意見は執筆者個人の見解であり、当研究所または(株)リコーの見解を示すものではありません。
※ご意見やご提案は、お問い合わせフォームからお願いいたします。

戻る