コンテンツへ移動
メイン コンテンツへスキップ
News Center
モデルカーからコンテンツ処理まで: ブランド企業が生産性と創造性の向上にマイクロソフトの AI を活用

モデルカーからコンテンツ処理まで: ブランド企業が生産性と創造性の向上にマイクロソフトの AI を活用

ジョン ローチ John Roach)

※本ブログは、米国時間 10 月 12 日に公開された ”From Hot Wheels to handling content: How brands are using Microsoft AI to be more productive and imaginative” の抄訳を基に掲載しています。

Hot Wheels ブランドの新しいモデルカーの開発を依頼されたマテル社のデザイナーは、OpenAI が開発した、平易な話し言葉で説明した内容を基にカスタムイメージやアートを作成してくれる AI システム DALL E 2 からインスピレーションを得ようとしました。

DALL E 2 は、たとえば、「クラシックカーのスケールモデル」と入力すると、ホワイトウォールタイヤを履いた銀色のビンテージカーのイメージを生成してくれます。

次のステップとして、デザイナーが車の幌を消し「コンバーチブルにして」と入力すると、DALL E 2は車のイメージをオープンカーに更新してくれます。DALL E 2に、色をピンクやブルーに変更して、ソフトトップを付けてなど、命令することで、何度でもデザインを調整できます。

マイクロソフトの Azure OpenAI Service に DALL E 2 が招待制で提供開始され、Azure AI の一部のお客様がテキストや画像を使ってカスタムイメージを生成できるようになることが、開発者と IT プロフェッショナル向けのカンファレンス Microsoft Ignite で発表されました。

Azure OpenAI Service を通じて DALL E 2 が利用可能になることで、マテル社のようなお客様に、テキストから画像への生成という最先端のイノベーション、Azure が提供するコンプライアンス、責任ある AI 基準を融合したクラウド AI インフラを提供できる、とマイクロソフトは述べています。

マテル社のデザイナーは、何十枚もの画像を作成し、アイデアを練り上げて、新しい Hot Wheels の最終的なデザイン作業に役立てることができました。

「『その発想はなかった!』という気付きが得られます。最終的には質が最も重要になりますが、時には、大量のアイデアを検討することで高品質のデザインが得られることもあります」とカリフォルニア州エルセグンド市にある Mattel Future Lab のプロダクトデザイン担当ディレクター、キャリー ビューズ (Carrie Buse) 氏は述べています。彼女は、AI テクノロジを、デザイナーがより多くのアイデアを生み出すためのツールと捉えています。

マイクロソフトは、DALL E 2 をコンシューマー向けアプリやサービスにも組み込んでいく予定であり、新しく発表された Microsoft Designer アプリを皮切りに、Microsoft Bing の Image Creator にも近々組み込む予定です。

マイクロソフトの製品およびサービスにおける DALL E 2 の展開は、同社の AI 研究への投資により、構築、開発、提供する全てのものに生産性と革新性を高めるための AI が浸透していくことを示しています。

この 1 年半の間に、AIでできることを証明する技術から、AI  を実際のシナリオやプロセスにマッピングしてエンドユーザーに役立てる技術への移行が見られました。

マイクロソフトの AI プラットフォーム担当コーポレートバイスプレジデント、エリック ボイド (Eric Boyd) によると、このトレンドは、より多くのデータに、より多くの計算量を適用し、よりリッチでパワフルなモデルをトレーニングすることによって達成される AI 能力の非線形なブレークスルーの結果です。

「モデルのパワーは、品質の閾値を超え、今ではより多くの用途で役立っています。もう一つのトレンドは、すべての製品開発者が、使いやすさだけでなく、『AI を使えば自分の製品をもっとうまく使えるようになる』と、自分の製品に AI 適用する方法を考え、理解していることです」とボイドは述べます。

DALL E 2 は、マイクロソフトが OpenAI 専用に構築した、Azure 上のスーパーコンピューターで学習を行っています。Azure OpenAI Service 上で動作する、OpenAI の自然言語モデル GPT-3、そして、GitHub Copilot や Microsoft Power Apps の一部機能を支えるモデル である Codex の学習にも、同じAzureのスーパーコンピューターが使用されています。また、Azure は、これらの AI ツールが、画像、テキスト、コードの提案を迅速に生成し、人間がレビューして利用を検討できるようにしてくれます。

DALL E 2 の追加は、マイクロソフトと OpenAI の継続的パートナーシップを基盤とし、Azure OpenAI Service のユースケースの幅を広げます。Azure OpenAI Service は現在プレビュー中の Azure Cognitive Services ファミリーの最新サービスであり、セキュリティ、信頼性、コンプライアンス、データプライバシーなど、Microsoft Azure に組み込まれているエンタープライズ級機能を提供します。

その他、言語翻訳、音声トランスクリプト、文字認識、文書要約など、マイクロソフトが開発し、Azure Cognitive Services で利用できる AI テクノロジが、Microsoft TeamsMicrosoft Power PlatformMicrosoft 365 などの製品やサービスで段階的に利用可能になっていく予定です。

「この 1 年半の間に、AI はできることの実証段階から、実際にエンドユーザーに役立つシナリオやプロセスに対応でいる段階への移行が見られました。巨大な言語モデルの製品化が進行しています」とマイクロソフトのビジネスアプリケーション & プラットフォーム担当コーポレートバイスプレジデントのチャールズ ラマナ (Charles Lamanna) は述べています。

「上司からメールが届いたら、携帯にメールを送ってください」

これらの AI 機能は、面倒な作業を排除し、従業員がより価値の高い作業に集中できるようにすることを目的としています。たとえば、営業担当者はメモを取ることなく顧客と会話できると、ラマナは言います。また、営業電話の要約を書き、顧客データベースに追加するなど、現在何時間もかかっているプロセスを自動化することも可能です。

「私たちの会話に耳を傾ける AI を活用し、トランスクリプトの作成、アクションアイテムの取得、会議の要約、共通フレーズの特定、あるいは『私は聞き上手か』についての分析を行い、人々の生産性を高める手助けができるようになりました。そのためには、最先端の AI の進化と、デジタルコラボレーションツールの進化が必要でした」とラマナは述べています。

ラマナは、コンピューティングデバイスを持つ誰もが、Microsoft Power Platform を使用して独自の AI 搭載アプリケーションを作成できるようにするツールの作成にフォーカスしています。たとえば、彼のチームは、自然言語を使ってマイクロソフトのクラウドで稼働するさまざまなサービスをつなぐワークフロープロセスを構築できるようにするために、Power Automate に AI を搭載したコパイロット機能を展開する予定です。

「『上司からメールが来たら、スマホにメールを送って、Outlook に ToDo 項目を入れておいて』と、普通の言葉でユーザーが言うだけで、自動的に処理が行われます」とラマナは説明します。

このように文章をワークフロー化できるようになったことで、AI を活用したソフトウェアソリューションを作れる人の数が飛躍的に増えたと彼は言います。そして、技術的なノウハウを持っている人であれば、AI Builder のインテリジェントな文書処理テクノロジなど、Power Platform で利用できるローコードツールやグラフィカルインターフェースを使用して、アプリケーションをさらにカスタマイズし、洗練させることができる、と付け加えました。

たとえば、弁護士はこのテクノロジを利用して、新しい契約書が SharePoint サイトにアップロードされるたびに起動するカスタムアプリケーションを構築できます。このアプリケーションは、契約書の執筆者、関係者、業界分野などの重要な情報を抽出し、これらの情報を含む契約の概要を、その分野やクライアントを担当する所内の弁護士にメールで送信できます。

「これは、一種のマジックです。今までは、SharePoint のサイトをチェックし、新しいファイルを開き、それをざっと読んで、何か必要な作業はないかをまとめなければなりませんでした。AI は、この単調な作業から人々を解放し、元々コンピュータに適していた作業を行ってくれます」と、ラマナは、今日の典型的な仕事方法と AI により自動化されたワークフローを比較します。

コンテンツ AI

ここ数年のデジタルトランスフォーメーションにより、世界中の人々が生み出すコンテンツは洪水のように増え続けています。たとえば、マイクロソフトのお客様は、現在、1 日あたり約 16 億個のコンテンツを Microsoft 365 に追加しています。マーケティングプレゼンテーションや契約書、請求書、作業指示書、Teams 会議のビデオ録画やトランスクリプトなどがそれにあたります。

マイクロソフトのコラボレーティブアプリとプラットフォーム担当プレジデントのジェフ テパー (Jeff Teper) は次のように述べています。「お客様はドキュメントを作成し、そのドキュメントに基づき Teams でコラボレーションし、SharePoint でドキュメントを保存しているのです。マイクロソフトがやりたいことは、このコンテンツに AI テクノロジを統合し、お客様が契約承認、請求書管理、規制当局への提出など、より体系的な活動を行えるように支援することです。」

これが、マイクロソフトが、Azure Cognitive Services などの AI テクノロジを活用し、コンテンツの作成、処理、発見方法を変革する Microsoft 365 向けの新しいコンテンツ AI サービス Microsoft Syntex を開発した理由です。Microsoft Syntex は、デジタルか紙かを問わず、コンテンツの読み取り、タグ付け、インデックス付けを行い、検索可能にし、特定のアプリケーション内や再利用可能な知識として利用できるようにします。また、セキュリティやリテンション設定により、コンテンツのライフサイクルを管理することも可能です。

たとえば、TaylorMade Golf Company は、知的財産管理や特許出願のための電子メールや添付ファイルなどの文書を整理して安全に管理するための、総合的文書管理システムとして Microsoft Syntex を採用しました。当時は、同社の弁護士が手作業でこれらのコンテンツを管理し、後に共有・処理するために何時間もかけて書類をファイリングし、移動していました。

Microsoft Syntex により、これらの文書が自動的に分類、タグ付け、フィルタリングされるようになったため、安全性が向上し、従来のファイルやフォルダーシステムを掘り下げることなく、検索によって容易にコンテンツを見つけられるようになりました。また、TaylorMade は、Microsoft Syntex を活用して、注文書、領収書、買掛金書類などの取引書類を自動的に処理する方法も検討しています。

他のお客様でも、契約管理や契約書作成に Microsoft Syntex を使用しているとテパーは述べています。契約書にはそれぞれ独自の要素がありますが、財務条件、変更管理、スケジュールなどに関する共通の条項が含まれています。それらの共通条項を毎回ゼロから書くのではなく、Syntex を使ってさまざまな文書から組み立て、変更を加えることができるのです。

「AI や機械学習によって、『この段落は、弊所の標準的語法とはかなり異なっている、入念なチェックが必要だ』と見抜くことができます」とテパーは言います。

「100 ページの契約書を読んで、大きな変更点を探すのは大変な作業ですが、AI がそれを助けてくれます。そして、その契約にまつわるワークフローがあります。誰が承認するのか?契約書はどこに保存されるのか? 後でどうやって見つけるのか?ここで重要な役割を果たすのがメタデータです」とテパーは説明します。

DALL E 2がパーソナルになる時

Azure OpenAI Service で DALL E 2 が利用可能になったことで、ドイツ最大の株式非公開クロスメディア企業である RTL Deutschland では、顧客の興味に基づきパーソナライズした画像を生成する方法に関する探求が始まりました。たとえば、RTLのデータ、リサーチ、AI コンピテンスセンターでは、データサイエンティストが自動生成されたイメージによってユーザー体験を向上させるためのさまざまな戦略を検証しています。

RTL Deutschland のストリーミングサービス RTL+ は、数百万タイトルのビデオ、音楽アルバム、ポッドキャスト、オーディオブック、電子書籍へのオンデマンドアクセスを提供し、拡張を続けています。RTLデータチームのデータプロダクト & テクノロジ担当シニアバイスプレジデント、マーク エガー (Marc Egger) は、「このプラットフォームは、人々の注目を集めるための画像に大きく依存しています」と述べています。

「完璧なレコメンドがあったとしても、ユーザーがそれをクリックするかどうかはわかりません。なぜなら、ユーザーは視覚的な手がかりをもとに、何を視聴するかを判断しているからです。ですから、アートワークはきわめて重要であり、適材適所のアートワークを用意しなければなりません」とエガーは言います。」

プロのサッカー選手がパリに移籍になり、フランスのスポーツライターと恋に落ちるロマンス映画があるとします。スポーツ好きな人は、サッカーの試合の映像があれば、その映画をチェックしたくなるかもしれません。恋愛小説や旅行が好きな人なら、エッフェル塔の下でキスをしている画像の方に興味を惹かれるかもしれません。

DALL E 2 のパワーとユーザーが過去にどのようなコンテンツに接したかというメタデータを組み合わせることで、これまで考えられなかったような規模のパーソナライズされた画像の提供が可能になるとエガーは言います。

「何百万人ものユーザーと何百万ものコンテンツ資産がある場合、単純に規模に対応できないという問題があります。人手が足りないのです。すべてのパーソナライズされた画像を作成するに十分なグラフィックデザイナーを雇うことはできません。このできなかったことを実現するためのテクノロジなのです。」

エガーのチームは、Azure Open AI Service の DALL E 2 を使って、ポッドキャストのエピソードやオーディオブックのシーンなど、現時点では画像がないコンテンツのビジュアルを作成する方法も検討しています。たとえば、ポッドキャストに同じ画像を何度も流用するのではなく、エピソード内のメタデータを使用して、そのエピソードに関連した独自の画像を生成できます。

ドイツ最大のプライベート クロスメディア企業、Deutchland は、Azure Open AI Service の DALL E 2 を活用して同社のストリーミングサービス RTL+ に人々を誘導する方法を模索しています。アイデアのうちの 1 つは、同一のカバーアートに依存するのではなく、DALL E 2 を使って各ポッドキャストに対する独自の画像を生成することです。
ドイツ最大のプライベート クロスメディア企業、Deutchland は、Azure Open AI Service の DALL E 2 を活用して同社のストリーミングサービス RTL+ に人々を誘導する方法を模索しています。アイデアのうちの 1 つは、同一のカバーアートに依存するのではなく、DALL E 2 を使って各ポッドキャストに対する独自の画像を生成することです。

同様に、スマートフォンでオーディオブックを聴いている場合は、章ごとに同じブックカバーアートが表示されるのが普通ですが、DALL E 2 を使えば、各章の各シーンに合わせた独自の画像を生成することができます。

Azure OpenAI Service を通じて DALL E 2 を使用することで、他の Azure サービスやツールに一箇所からアクセスでき、チームが効率的かつシームレスに作業できるようになるとエガーは付け加えます。「他のアズアサービス型製品と同様に、DALL E 2 で作成された大量の画像が必要な場合、オンライン保存することに不安はありません。」

DALL E 2の適切かつ責任ある使用

マイクロソフトの Azure AI 担当プリンシパルグループプロジェクトマネージャー、サラ バード (Sarah Bird) によれば、自然言語による記述から画像を生成できる DALL∙2 などのシステムほど、エキサイティングな AI テクノロジはありません。

「人はイメージが大好きです。そして、私のような視覚的芸術の才能がまったくない者でも、他の視覚的なツールを使うよりもはるかに美しいイメージを作ることができます。DALL E 2 は、クリエイティブに自分を表現し、説得力があり、楽しく魅力的な方法でコミュニケーションするための新しいツールを人間にもたらしてくれます」と、彼女は評価しています。

彼女のチームは、Azure AI の DALL E 2 などの AI ツールの適切で責任ある使用へと人々を導き、害をもたらすような使い方を制限するツールや手法の開発にフォーカスしています。

DALL E 2 が Azure OpenAI Service で不適切な出力をしないように、OpenAI はモデルのトレーニングに使用するデータセットからきわめて露骨な性的・暴力的コンテンツを削除しており、Azure AI はコンテンツポリシーに違反するプロンプトを拒否するフィルターを導入しています。

さらに、システムに性的・暴力的なコンテンツを生成させるためによく使われる有名人の画像やオブジェクトを DALL E 2 が作成できないようにする手法も組み込みました。出力側では、アダルトやグロなどの不適切なコンテンツが含まれていると思われる AI 生成画像を削除するモデルを追加しています。

私たちは、ユーザーが使いやすいように…このツールを使って思い通りの表現ができるように、インターフェイスをデザインしています

DALL E 2 も、多くの AI システムが直面する課題を抱えています。システムの品質が学習データ次第であるということです。ユーザーの意図を理解するためのコンテキストがなければ、DALL E 2 のプロンプトは、インターネット上のテキストや画像などの学習データに埋め込まれたバイアスを浮き彫りにしてしまう可能性があります。

そのため、バードはマイクロソフトの製品チームと協力し、AI システムがユーザーの求める結果をより理解しやすくなるように、より説明的なプロンプトを使用するなど、ユーザーの目標達成に役立つ DALL E 2 の使用方法を指導しています。

「私たちは、ユーザーがこのツールを使って、インターネット上でよくある表現ではなく、自分の望む表現を得られるようにするために、インターフェースを設計すると共に、現時点での制限を共有しているのです。」

「未来をどう予測するか?」

ビューズは最近、Mattel Future Lab に参加し、メタバースや NFT (Non-Fungible Token) など、玩具ビジネスの領域を広げるためのアイデアを探求しています。彼女は、このようなバーチャル体験がどのようなものになるかを想像するためのツールとして DALL E 2 を使っています。

「森、人魚など、何でも好きな言葉を選んで、バーチャルな世界で何が出てくるか考えてみるのも楽しいことです。未来を予測するにはどうしたらよいでしょうか? より多くの情報、イメージ、思考を自分に与え続け、どのようにそれが実現されるかを想像するのです」と、ブースは DALL・E 2 が、彼女のチームの未来予測に役立っていることを説明しました。

Microsoft Azure Platform 担当コーポレートバイスプレジデントのボイドは、DALL E 2 とそれを支える大規模言語モデルファミリーが、多数のお客様の創造力を解放していると述べています。AI システムが、想像力の燃料となり、ユーザーは斬新で面白いアイデアを考え、プレゼンテーションや文書に活かすことができるようになります。

「最もエキサイティングなことは、私たちがこうした大規模な言語モデルの力のまだ表面しか見ていないことだと思います」とボイドは述べています。

関連情報:

サインアップして Azure Open AI Service およびマイクロソフト全体での DALL E 2 活用事例に関する最新情報をご覧ください。

Microsoft Syntex および Power Automate についてはこちらをご覧ください。

関連ブログ:

How AI makes developers’ lives easier, and helps everybody learn to develop software

New Z-code Mixture of Experts models improve quality, efficiency in Translator and Azure AI

New Azure OpenAI Service combines access to powerful GPT-3 language models with Azure’s enterprise capabilities

トップイメージ: マテル社のデザイナーが、Azure Open AI Service DALL E 2 を使ってイメージを生成している様子。平易な話し言葉で「ホット ロッドのような DTM レースカー」や「DTM レースカーのようなボンネビルソルトフラッツ レースカー」といったプロンプトを打ち込むと、創造を搔き立て最終デザインの形成に役立つ複数のイメージを生成します。

 

ジョン ローチはマイクロソフトのリサーチとイノベーションを専門とするライターです。ツイッターアカウントはこちらです。

本ページのすべての内容は、作成日時点でのものであり、予告なく変更される場合があります。正式な社内承認や各社との契約締結が必要な場合は、それまでは確定されるものではありません。また、様々な事由・背景により、一部または全部が変更、キャンセル、実現困難となる場合があります。予めご了承下さい。