マイクロソフトの AI でシェイクスピアのすばらしい作品を読み解く

MS_AI_matt-riches

2019 年 4 月 23 日に英国で発表されたプレスリリースの抄訳をベースにしています

 

注意:ロミオとジュリエットは、最後に両者とも亡くなってしまいます。

上記の注意はたいしたネタバレではないですね。ほとんどの人がロミオとジュリエットを読んだか、映画を見たか、学校の授業で何度もウイリアム シェイクスピア (William Shakespeare) や彼の作品について学んだことがあるでしょうから。ヴェローナで最も有名なカップルが、不幸な最期を迎えることは皆知っていると思います。

実は、ここで難しいのは、この世界的に有名な 300 年前の戯曲の中で誰も知らないことを見つけることなのです。そこで役立つのが人工知能です。

イギリスのマイクロソフトでクラウドソリューションアーキテクトを務めるフィル ハービー (Phil Harvey) は、シェイクスピアの戯曲のうち 19 作品にマイクロソフトの Text Analytics API を利用しました。この API は Microsoft Azure Cognitive Services の一部として誰でも利用でき、文章内の感情やトピックを識別したり、キーフレーズや実体を見つけたりする際に使われます。同 API は、Azure で利用可能な自然言語処理 (NLP) ツールのひとつなのです。

Power BI のカラフルなグラフ (下図) は、シェイクスピア作品の登場人物が使用している言語がどの程度否定的 (赤) か肯定的 (緑) かを示しています。このグラフを作成することで、ハービーは偉大な文学作品に新たな光を当てるとともに、シェイクスピアの戯曲が難しすぎてわかりにくいと感じている人にも作品をより身近に感じてもらいたいと考えました。

ハービーは次のように述べています。「言語感情のグラフを見るだけで、全体の筋書きが把握できます。ビジュアル化された例は理解しやすいため、シェイクスピアとその戯曲がより身近なものとなります。16 世紀や 17 世紀の言語を読むのは難しいかもしれません。そこで、このグラフでシェイクスピアが伝えたいことを簡単に見せているのです」

「これは、データが新たな手法で私たちに新しい知識を与えてくれているすばらしい例です。人が身の回りの世界のことを処理する方法が根本的に変わってきたということです。今ではシェイクスピアを手に取ってデータセットに変換し、アルゴリズムで処理するという新たな方法が可能です。こうして過去には知らなかったことを学ぶことができるのです」

ハービーのグラフでは、ジュリエットよりもロミオの方が激しい感情で苦しんでいることがわかります。恋愛による影響が大きかったのはロミオの方で、より美しい性とされる女性の方が恋愛関係では感情の起伏が大きくなりがちだという当時の固定観念に挑んでいます。

「興味深いのは、男性主人公の方がより激しく感情的になっていることです」とハービーは話します。「一番長いセリフは、肯定的なセリフも否定的なセリフもロミオによって語られています。ジュリエットはロミオより安定していて、肯定的にも否定的にもなるのですが、セリフはそこまで激しくありません。感情が激しいのはロミオの方で、あちこち動き回っています」

「『マクベス (Macbeth)』も面白くて、肯定的・否定的な感情のピークが2カ所あります。シェイクスピアはそのピークで妻を利用し、物語を展開しています。また、『真夏の夜の夢 (A Midsummer Night’s Dream)』のヘレナとハーミアも見てみました。2 人が複雑なラブストーリーに巻き込まれているためです。最初 2 人は肯定的なのですが、あることがわかって、だんだん否定的になっていきます」

このプロジェクトでは、シェイクスピアの戯曲を真に理解して十分に楽しむことを目指すにあたり、AI と人間が共同作業する必要がありました。
このプロジェクトでは、シェイクスピアの戯曲を真に理解して十分に楽しむことを目指すにあたり、AI と人間が共同作業する必要がありました。

ハービーが作成したシェイクスピアのグラフは、長いプロセスの最終ステップです。ハービーは、シェイクスピアの戯曲のテキストファイルをインターネットからダウンロードし、データを処理してマイクロソフトの AI アルゴリズム用に準備を整える必要がありました。幕やシーンの番号、登場人物の名前とセリフは残しつつ、演技の指示はすべて削除。その後、そのテキストを Microsoft Cognitive Services API にアップロードしました。Microsoft Cognitive Services API は、アプリやウェブサイト、ボットで利用できるツール群で、自然なコミュニケーション方法でユーザーを見たり、聞いたり、話したり、理解したり、解釈したりするものです。

Text Analytics API は、感情に関連づいた膨大なテキストによって事前トレーニングされています。このモデルはテキストを分析するにあたり、テキスト処理や品詞分析、語彙の配置や関連づけといったテクニックを組み合わせて使っています。

シェイクスピアの戯曲をスキャンした後は、マイクロソフトの NLP ツールが会話を 0 から 1 の間でスコアづけします。1 に近いスコアは肯定的な感情を、0 に近いスコアは否定的な感情を示します。

ロボットだけが本を読み、起こったことの要点を人間に伝えるといった世界が想像できそうですが、ハービーはテスト中に予期せぬ課題を発見しました。

AI システムは、直接的な筋書きや会話が含まれたシェイクスピアの戯曲ではうまく機能したのですが、微妙な発言が肯定的か否定的かを判断するのは苦手だったのです。このアルゴリズムでは、ハムレットの狂気的な妄言が本当なのか想像上のものなのか、登場人物が人をだまそうとしているのか真実を伝えているのか、解明できませんでした。つまり、AI は否定的な出来事を肯定的だと分類し、肯定的な出来事を否定的だと分類することもあるということです。AI は「間違いの喜劇 (The Comedy of Errors)」を悲劇だと判断していました。劇中に物理的なドタバタシーンがあったためです。

MS_AI_cloud

ハービーは、人がまさに人であるが故の特徴を見せる戯曲の場面については、人間の読者でなければ把握して解釈することができないことに気づきました。人であるが故の特徴とは、冗談を言ったり、意気揚々としていたり、嘘をついたり、二重の意味があることを言ったり、ごまかしたり、皮肉を言ったりすることです。ハービーのプロジェクトにおいて、シェイクスピアを真に理解し十分に楽しむには、AI と人間が共同で作業する必要があったのです。

ハービーは、シェイクスピアの戯曲での実験はほんの出発点に過ぎないとして、こうした AI と人間の組み合わせは、最終的に企業やその社員にも応用できると主張しています。

「お客様がエネルギー会社に電話している例を考えてみましょう」とハービーは話します。「マイクロソフトの NLP ツールを使えば、午後 5 時の会話が午前 9 時の会話よりも否定的であることが把握でき、その状況に応じてスタッフを配置できます。また、コールセンター担当者の会話が、最初肯定的だったにも関わらず否定的な内容になってしまった場合、その担当者と今後同じようなことが起こらないよう取り組むことも可能です」

「この技術によって、企業はデータを異なる方法で扱えるようになり、日々の作業に役立てることができるのです」

またハービーは、ジャーナリストがこのツールを使って記事に対する読者の反応を把握したり、ソーシャルメディア専門家がブランドに対する消費者の視点を理解したりすることも可能だとしています。

いまのところハービーは古典文学に注力しています。今度はチャールズ ディケンズ (Charles Dickens) に目を向けており、ロンドンのビクトリア&アルバート博物館 (V&A) に対し、ディケンズの手書き原稿を研究させてもらうべく交渉中です。

「V&A の原稿では、ディケンズが消した言葉を見ることができるので、カスタムビジョンモデルを訓練し、ディケンズが変更を加えた部分をページごとに把握したいと考えています。そうすれば、出版後の本文を見て、ディケンズが最も熱心に取り組んだ部分がどこかわかります。その部分はうまくいったかもしれませんが、彼が少し苦労したこともわかります。ディケンズの作品は新聞に連載されていたので、私たちの知らないところで編集者からフィードバックをもらっていたかどうかも推測できるかもしれません。そんなことができるなんてすばらしいと思います」

 

マイクロソフトに関する詳細な情報は、下記マイクロソフトWebサイトを通じて入手できます。

日本マイクロソフト株式会社 Webサイト http://www.microsoft.com/ja-jp/
マイクロソフトコーポレーション Webサイト http://www.microsoft.com/

* Microsoft、Azure、Power BI は、米国 Microsoft Corporation の米国及びその他の国における登録商標または商標です。
* その他、記載されている会社名、製品名は、各社の登録商標または商標です。

本プレスリリースのすべての内容は、作成日時点でのものであり、予告なく変更される場合があります。正式な社内承認や各社との契約締結が必要な場合は、それまでは確定されるものではありません。また、様々な事由・背景により、一部または全部が変更、キャンセル、実現困難となる場合があります。予めご了承下さい。

Tags: ,

関連記事