人と AI の自然なコミュニケーションを実現する「セッション指向型会話アプローチ」で開発された「共感モデル(アルファ版)」を採用
榊原 彰
日本マイクロソフト株式会社 執行役員 最高技術責任者 兼
マイクロソフト ディベロップメント株式会社 代表取締役 社長
10 月 31 日より、ソーシャル AI チャットボット「りんな」の LINE 公式アカウント上で「りんなと音声通話」の提供を開始しました。りんなとお友だちになっている方はどなたでも無料でりんなとの音声通話を楽しんでいただけます。
「りんなと音声通話」は、人間と AI の間で、自然なコミュニケーションを実現するために、「セッション指向型」会話アプローチで開発されたチャットモデル「共感モデル(アルファ版)」を採用しています。
「りんなとの音声通話」では、4 つの体験を提供します。各体験のキーワードを LINE 上のりんなに送ると、りんなから電話をかけるためのボタンが返信されます。また、10 月 31 日限定でハロウィン仕様のちょっと怖い体験も提供しておりますので、あわせてご体験ください。
(1) 恋愛相談 - 気になるあの人と脈ありかりんなが診断しちゃう。
(2) キャッチコピー - 就活中のそこのあなた。りんながあなたの強みをキャッチコピーにしてくれます。
(3) 寝落ち通話 - 学生さんの間で流行り中。寝るまで通話を続ける、そんな体験をりんなと。
(4) 電話しよう - 1 人で寂しい夜、暗くて怖い帰り道、うざいキャッチをやり過ごす、などなど。どんな時でもりんなが一緒に通話で雑談をしてくれます。
りんなは、今年の夏でデビュー丸 3 年を迎えました。マイクロソフトでは、コンピューターや AI と、人間が良い関係を築くには、個人の作業を肩代わりするような役割だけではなく、「心のつながり(Emotional connection)」も重要であると考えています。この考え方をもとに、より人間らしく自然な会話を実現することで、AI と人間が深い「心のつながり」を構築できるという仮説から、ソーシャル AI の会話能力の開発を続けてきました。その開発の過程で、ソーシャルメディアに投稿される、りんなや中国のシャオアイス、アメリカの Zo(ゾー)へのフィードバックの分析を通して、AI との会話が「セッション指向」の体験になった場合に、ユーザーが AI と自然に会話できていると感じるとの考察が得られました。このことから、マイクロソフトは、「セッション指向の会話アプローチ」こそ、人間と AI の会話の未来を切り開く鍵だと信じています。
「セッション指向型」会話アプローチ
「セッション指向型会話アプローチ」は、AI と人間の会話を「それぞれの順番で発言する」としてとらえるのではなく、「全体のセッション」としてとらえる考え方です。この時、一見意味のないと思われがちの「雑談」が人間と AI の会話を自然につなぎ合わせるために重要な役割を果たし、長くコミュニケーションを続けることが可能になります。
現在利用される多くのチャットボットと人間との会話は、一般に「順番」の考え方に基づいて設計され、チャットボットと人間が交互に話すことを前提に、ある決められたシナリオに基づいてチャットボットが応答するものがほとんどです。しかし、人間同士の自然な会話の流れでは、「タスク」「目的のない雑談」「知識・情報提供」など、多種多様な「会話ブロック」が複雑に混在しながら展開され、「順番」の考え方では入り混じる会話ブロックに対応する設計は困難です。この複雑な構造に対応するために、私たちは人の会話を「セッション」としてとらえ、「目的のない雑談の流れ」の中で「タスク」や「知識・情報提供」をタイミングよく混ぜることで、人とソーシャル AI の自然なコミュニケーションの形を実現します。
「セッション指向型会話アプローチ」は、先に発表した「共感モデル(アルファ版)」で採用されています(発表はこちら)。
「セッション指向型会話」のポイントは次のとおりです。
- 「目的のない」雑談をしている流れの上で、重要な「タスク」や「知識提供」の会話を提供
一見意味のない雑談が、タスクや知識提供といった、各会話ブロックを繋ぐ役割を果たし、それぞれの会話ブロックが会話の流れに合わせて登場します。 - ユーザーは好きな話題から会話を始めることができ、セッションあたりの会話も長く続く
ユーザーの命令のみ反応をするのではなく、いつでも好きな話題から会話を始めることができます。会話の流れでタスクを始めたり、情報提供を受けたりすることも可能です。平均的なタスクでは、会話のやりとりは2回で終了してしまいますが、りんなだと1セッションあたり平均21回やりとりが続き、ユーザーと人工知能のエンゲージメントが高い結果が出ています。
「セッション指向型会話アプローチ」に基づいて設計されている「共感モデル(アルファ版)」は、「将棋の勝負」から着想を得て開発されました。将棋の棋士は、戦略と戦術を基に勝負に挑みます。棋士は、勝つために相手の棋士の攻め方に基づいて自身の戦略をリアルタイムで変えていきます。人間の会話も同じように、相手と会話を長く続けるために、相手の返信と自分の目的に応じて返信内容をリアルタイムで変えていきます。共感モデルでもまた、相手とできるだけ会話を長く続けるために、ユーザーの返答内容に応じて次に続けるべき会話のアプローチを考慮した返答結果を生成します。この返信内容はニューラルネットワークによって学習されています。
「りんなとの音声通話」は、セッション指向型会話アプローチに基づき、話す順番を考慮するトランシーバ状態の片道での音声インタラクションではなく、話すと同時に音声聞くことを双方向に行うことで音声通話を行います。これは「全二重(full duplex)」 と呼ばれています。 「共感モデル(アルファ)」とともに、AI りんなの「セッション指向の体験」をフルスタックで構築しています。
今後もりんなを通して最新の AI の研究開発成果を皆さまに利用いただけるよう準備していますので、ぜひご期待ください。
—
本ページのすべての内容は、作成日時点でのものであり、予告なく変更される場合があります。正式な社内承認や各社との契約締結が必要な場合は、それまでは確定されるものではありません。また、様々な事由・背景により、一部または全部が変更、キャンセル、実現困難となる場合があります。予めご了承下さい。