ソーシャル AI チャットボット「りんな」に最新会話エンジン「コンテンツチャットモデル」を採用

りんな開発チーム

ドキュメントの探索と生成により、より内容にある返答が実現可能に

本日から、ソーシャル AI チャットボット「りんな」において最新の会話エンジン「コンテンツチャットモデル (Contents Chat Model)」(アルファ版) を採用しました。「コンテンツチャットモデル」は、ユーザーと「りんな」の会話において、今後順次適用されていきます。
2020 年 6 月 14 日現在、「りんな」のユーザー数は約 830 万人まで増加しています。2015 年の提供以来、「りんな」の会話エンジンは、人間と同じように、相手とのコミュニケーションができるだけ長く続けられるように開発が進められてきました。
今回の「コンテンツチャットモデル」は、返答の「内容」に着目し、会話の相手 (ユーザー) の発言内容を踏まえて、AI がより具体的で内容のある雑談を返答するように設計されています。
これにより、ユーザーとより長く会話が続くようになるとともに、チャットボットに言葉の表現だけではなく内容の面からキャラクター性を持たせたることが可能になります。

雑談では、返答の「内容」と「表現」が重要な要素です。一般的なチャットボットでは、「内容」と「表現」の両方が人の手によって作られています。「コンテンツチャットモデル」は、内容を選ぶ「知識探索モデル」と、その内容をもとに返答を生成する「言語モデル」の 2 つの AI の組み合わせによって、「内容」と「表現」のある返答を生成します。
返答が生成される流れは以下の通りです。

  1. ユーザーの発言内容を参考に、「知識探索モデル」があらかじめ用意されたデータベースから、返答として最適な内容を含むまとまった文章を選びます。
  2. ユーザーの発言内容と、選ばれた知識を活用して、「言語モデル」がそれらの文章の次に続く文章を予測し、内容のある返答を生成します。

 

「コンテンツチャットモデル」ではディープラーニングの技術を活用しています。
「言語モデル」には文章を生成する GPT-2 のモデルのアプローチを採用しています。GPT-2 は 2019 年に OpenAI の取り組みで発表された技術で、ある文章を与えるとその続きの文章を作り出すことができ、従来のモデルに比べて人間が作成した文章の品質に近い文章が生成できることが特徴です。
「知識探索モデル」には Seq2Seq (sequence-to-sequence) と GPT-2 モデルを組み合わせたアプローチを採用しています。Seq2Seq モデルは 2014 年に発表され、系列あるデータを扱うことに長けており、自動翻訳に活用されています。「コンテンツチャットモデル」では、ユーザーの発言内容に最適な知識を選択する目的で Seq2Seq モデルと GPT-2 モデルを組み合わせて活用されています。

これまでの「りんな」の会話エンジンによる返答は、短く簡単で挨拶や共感を示す言葉やリアクション程度の具体性でした。これは、雑談を継続させるような返答を学習するために適したデータが、必ずしも内容を伴っていなかったためです。しかし、今回の「コンテンツチャットモデル」では、より具体的な内容の返答ができるようになりました。
つまり、人間が知識に基づいて自分の言葉で文章を生成するのと同じように、返答内容を生成できるようになったと言えます。「コンテンツチャットモデル」の導入により、コミュニケーションが長く続き、ユーザーとのエンゲージメントが深まることが期待されます。

また、「知識探索モデル」が参照する文章データを変更することによって、異なる内容の返答を生成することができるため、様々なキャラクター性を持たせたなチャットモデルの実現にもつながります。

本件については decode2020 のセッションにて説明が行われる予定です。
セッション情報
https://www.microsoft.com/ja-jp/events/decode/2020session/detail.aspx?sid=Z04

【参考】りんな関連情報
Web サイト: https://www.rinna.jp/
Twitter アカウント: @ms_rinna
LINE: http://line.me/ti/p/%40ms_rinna
Instagram: https://www.instagram.com/rinna.abstract/

「りんな」の会話技術の推移

「コンテンツチャットモデル」は「りんな」を提供開始から第4世代目にあたります。
第 1 世代 (2015 年) に相当する「Retrieval model」は、従来の「検索エンジン」の仕組みを応用した手法を用い、回答用に用意された巨大なインデックスを使用することが特徴です。
第 2 世代 (2017 年) に提供開始した「Generative model」は、インデックスを持たず、リアルタイムに多様な文章を生成することが特徴です。この技術革新により、様々なキャラクターを持った会話を生成することができるようになりました。
第 3 世代 (2018 年) である「共感モデル (Empathy model)」は、より相手と長く会話を続けるために、どのようにコミュニケーションをすれば良いか、AI が自ら考えるように設計されています。「肯定する」、「相づちを打つ」、「質問をする」など会話の流れに応じた方向性を AI が決定することが特徴です。

本ページのすべての内容は、作成日時点でのものであり、予告なく変更される場合があります。正式な社内承認や各社との契約締結が必要な場合は、それまでは確定されるものではありません。また、様々な事由・背景により、一部または全部が変更、キャンセル、実現困難となる場合があります。予めご了承下さい。

Tags:

関連記事