コンテンツへ移動
メイン コンテンツへスキップ
News Center
マイクロソフト、AI アプリや Copilot の構築フレームワークを明らかにし、AI プラグインエコシステムを拡充

マイクロソフト、AI アプリや Copilot の構築フレームワークを明らかにし、AI プラグインエコシステムを拡充

ジョン ローチ (John Roach)

※本ブログは、米国時間 2023 年 5 月 23 日に公開された ”Microsoft outlines framework for building AI apps and copilots; expands AI plugin ecosystem” の抄訳を基に掲載しています。

ソフトウェアがインターネットに接続されていなかった頃を覚えていますか?もう覚えていないのではないでしょうか。マイクロソフトのチーフテクノロジオフィサー、ケビン スコット (Kevin Scott) によれば、数年後には、インテリジェントなコパイロットアシスタントが付属していないソフトウェアにも同じことが当てはまるようになるでしょう。

コパイロット (copilot、副操縦士) とは、最新の AI と大規模言語モデルを使って、複雑なタスクを支援してくれるアプリケーションです。セールストークの執筆、欠席した会議のキャッチアップ、プレゼンテーション用の画像生成、テーマに沿ったディナーパーティの計画など、さまざまなタスクに対応してくれます。

マイクロソフトは、2 年前に、開発者のコード作成を支援する AI ペアプログラマー GitHub Copilot により、コパイロットの概念を導入しました。そして今年、インターネット検索の方法を変えつつある Bing の AI 搭載チャットMicrosoft 365 Copilot、GitHub Copilot XDynamics 365 CopilotCopilot in Microsoft VivaMicrosoft Security Copilot など、主力製品とサービス全体でコパイロットの体験を展開しています。

本日、マイクロソフトは、年次開催の開発者会議 Build において、この Microsoft Copilots のエコシステムを拡大し、プレビュー版の Copilot in Power BICopilot in Power Pages、まもなくプレビュー版が提供される Copilot in Microsoft Fabric、そして、6 月にプレビュー版の提供が始まる Windows Copilot を発表しました。また、開発者が独自のコパイロットや次世代 AI アプリケーションを構築できるようにするための新機能も紹介されました。これには、他のソフトウェアやサービスと相互運用することで、パイロットの有用性を高める、プラグインと呼ばれる新たなツールが含まれています。

スコットは、「Bing Chat を見た人は複雑な魔法のようなものだと思うかもしれません。しかし、マイクロソフトは、開発者が自分たちの副操縦士を作るために必要なものをすべて提供しています。これは、今後数年間で、すべてのソフトウェアにおいて当たり前の存在になると思います」と述べています。

プラグインエコシステムの拡張

OpenAI は、3 月に ChatGPT プラグインを発表しました。そして、今月初めに、マイクロソフトは Bing 用プラグインを発表しました。これらの技術により、ChatGPT や Bing Chat は、たとえば OpenTable のプラグインを使ってレストランの検索や予約を支援することができるようになります。

マイクロソフトは、OpenAI が ChatGPT に採用したものと同じオープンなプラグイン規格を採用し、ChatGPT とマイクロソフトが提供する多様なコパイロット機能との間の相互運用性を保証しています。すなわち、開発者は 1 つのプラットフォームを使って、ChatGPT、Bing、Dynamics 365 Copilot、Microsoft 365 Copilot、Windows Copilot など、ビジネス向けとコンシューマー向けの両分野で動作するプラグインを構築できるようになったのです。また、マイクロソフトは、Bingを ChatGPT のデフォルトの検索エンジンとして提供することも発表しました。

この共有プラグインプラットフォームの一環として、Bing にプラグインのサポートが追加されます。これまで発表された OpenTable や Wolfram Alpha に加え、Expedia、Instacart、Kayak、Klarna、Redfin、TripAdvisor、Zillowなど、多くの企業が Bing エコシステムに参加することになります。

加えて、開発者は Microsoft 365 Copilot をプラグインで拡張できるようになる予定です。Microsoft 365 のプラグインには、ChatGPT や Bing プラグイン、Teamsメッセージ拡張、Power Platform コネクターなどがあり、開発者は既存の投資を活用できます。また、開発者は、Microsoft Teams Toolkit for Visual Studio Code と Visual Studio を使って、新しいプラグインを容易に構築できるようになります。

プラグインの仕組み

Build では、開発者が独自のコパイロットを構築できるようにするための AI 開発フレームワークが紹介されました。このスタックでは、ユーザーの代わりにリアルタイム情報を取得、企業データなどのビジネスデータの取り込み、新たなタイプの計算の実行、安全な処理の実行などを行える、AI システムの能力を増強するプラグインがサポートされています。

本質的には、プラグインは橋のような存在です。インターネット上の公開データで学習させた大規模言語モデルと、企業の非公開データとの間の橋渡しを提供します。プラグインは、会社の従業員からの質問に答える際に、コパイロットがそれらの非公開データにアクセスできるようにしてくれます。

同様に、プラグインは、たとえば、大規模言語モデルと、企業が出張の予約に使用するウェブサイトやバックエンドシステムとの橋渡しをすることができ、コパイロットは、企業の出張ポリシーに沿ったサンフランシスコへの営業担当者の出張を手配することなどができるようになります。

プラグインは、他のソフトウェアやサービスとの相互作用を提供することで、コパイロットをより便利にします。
プラグインは、他のソフトウェアやサービスとの相互作用を提供することで、コパイロットをより便利にします。

スコットは、「プラグインは、開発者に、コパイロットや AI システムに不足している機能を追加し、データに接続し、構築中のシステムに接続する方法を提供します。最終的には、充実したプラグインのエコシステムになるでしょう」と述べています。

プラグインエコシステムの拡張

また、開発者は、最終的に Microsoft Copilots で使用するために展開したり、生成 AI テクノロジで構築された独自アプリケーションの機能を増強したりするために、さまざまな方法で独自のプラグインを作成、テスト、展開することができるようになる予定です。

たとえば、大企業の開発者は、Microsoft 365 Copilot で顧客やベンダーとの契約書にアクセスし、特定の法的問題が過去にどのように処理されたかについて質問したいと考えるかもしれません。そのためには、開発者は Microsoft 365 Copilot を、文書がエンコードされ、インデックスを付けられ、検索できるように保存された法務部門のプライベートデータベースと接続する必要があります。

マイクロソフトの AI プラットフォーム プログラムマネジメント担当コーポレートバイスプレジデント、ジョン モンゴメリー (John Montgomery)は、「このようなケースが、モデルに情報を読み込ませ、データを利用するのに最適な場面です。そこで登場するのがプラグインです。プラグインは、『この処理パターンを再利用できるようにして、どのような場合には適さないか、条件を定義してください』と反応するでしょう」と述べています。

マイクロソフトは、コパイロットの複数領域を横断して動作するプラグインの作成を容易にするための一連の機能をリリースしています。たとえば、Visual Studio Code、GitHub Copilot、GitHub Codespaces は、開発者による新しいプラグインを作成、デバッグ、デプロイを支援し、Azure AI は企業のプライベートデータ上でプラグインを実行、テストする機能を追加します。一度作成されたプラグインは、マイクロソフトの Copilot 体験全体で動作します。

モンゴメリーは、プラグインの追加により、マイクロソフトのお客様がAzure OpenAI Service で構築する革新的アプリケーションの開発ペースもさらに加速されると考えています。これらのアプリケーションは、OpenAI の GPT-4 などの生成 AI モデルへのアクセスを提供し、現在4,500社を超える企業に使用されています。

「Build では、アーキテクチャの実践、必要なツール、新しいコパイロットアプリケーションの周囲に配置したいアプリのパターンやユーザーエクスペリエンスのデザインに関する、現時点での私たちの最善のアイデアをご覧いただけるでしょう」とモンゴメリーはイベント前のインタビューで語りました。

独自のコパイロットを構築するための新たなツール

スコットによれば、マイクロソフトが生成 AI テクノロジを自社の製品やサービスに展開している中、最終的には開発者が世の中のコパイロットのほとんどを自作することになります。

「開発者たちは、自分たちやユーザーが達成しようとしている特定の課題を理解し、この AI ソフトウェア開発パターンを使って、その解決策を構築していくでしょう。」

コパイロットの開発は、他のソフトウェアプロジェクトと同様に、アイデアから始まります。違うのは、この AI 開発プラットフォームの可能性の大きさだと、スコットは言います。

スコットは、このことを、スマートフォンの登場で登場した新しい体験やサービスになぞらえています。想像もつかないような多くのことが、可能になりました。有名カジュアルゲームアプリのように、容易に開発できるものもありました。また、タクシー業界や旅行業界に革新を起こしたサービスなど、スマートフォンというプラットフォームの能力をフルに活用しながらも、新しいタイプの体験を生み出すと同時に様々な形で困難に直面したり、規制されたりするものもありました。

「彼らは不可能なものを、困難であっても達成できるものに変え、新しいプラットフォームの機能を十分に活用したからこそ、永続的な成功を手にすることができたのです」と、スコットは、コパイロットのスタックにおいても同じような画期的アプリケーションが生まれることを示唆します。

開発者が独自のコパイロットを構築するための AI 開発フレームワークの概説
開発者が独自のコパイロットを構築するための AI 開発フレームワークの概説

アプリケーションの確固たるアイデアさえあれば、開発者はその実現に着手できるとスコットは言います。プロセスの最初のステップは、Azure OpenAI Service で利用できる GPT-4 などの生成 AI モデルの選択です。次のステップは、コパイロットに、副操縦士の役割や操作方法を記述している、メタプロンプトを渡します。加えて、コパイロットには、ユーザーとの会話を把握し、適切な文脈と認識で応答するためのメモリーが必要です。最後に、コパイロットにはデータやその他のサービスにアクセスする機能が必要ですが、これはプラグインが提供できます。

また、本の執筆など複雑な作業をサポートするコパイロットでは、オーケストレーション、すなわち、作業を多段階の要素に分解し、生成された計画に従って作業を実行する能力が必要となります。

開発者は、マイクロソフトが 3 月にオープンソースとして公開した Semantic Kernel ソフトウェア開発キットのようなツールを使って、大規模言語モデルを従来のプログラミング言語と統合できます。モンゴメリーによれば、このキットにはメモリーやオーケストレーションのためのツールやプラグインのサポートが含まれており、コパイロットの開発が加速されます。

Build において、マイクロソフトは、コパイロットの開発を簡素化する新ツールを発表しました。たとえば、新しい Azure AI Studio を使うことで、開発者はより容易にプライベートデータを使った会話型 AI モデルを構築できるようになりました。Azure OpenAI Service と呼ばれる新機能をデータに適用することで、開発者は自然言語ベースのアプリケーションインターフェースを使用して、データ、テキスト、画像から組織固有の知見を明らかにできます。大規模言語モデルの機能をさらに拡張するために、マイクロソフトは、Azure OpenAI Service によるプラグインのサポートも発表しました。モンゴメリーによれば、Azure AI は、洗練されたプロンプト エンジニアリング ツールである Azure Machine Learning プロンプトフローにも対応しています。

「私たちは、このようなコパイロットを複数構築しました。他の情報を読み込む方法、再現可能なコンテンツを作る方法、正しい答を出すためにモデルに正しい情報を提供する方法など、さまざまなアーキテクチャを調査しました。Build は、私たちが学んだこと、作り上げたツールを紹介し、それを世に送り出すための祭典となるでしょう。」

Responsible AI の最新情報

重要な点として、開発者は、コパイロットが意図した結果を返し、偏見、性差別、人種差別、ヘイト、暴力、自傷行為を促すような出力を避けることも必要であると、マイクロソフトの基盤技術の責任ある AI を統率するパートナーグループ プロダクトマネージャーのサラ バード (Sarah Bird) は述べています。

本日、Build において、マイクロソフトは Azure AI Content Safety のプレビューを発表しました。この新しい Azure AI サービスは、画像やテキストに含まれる不適切なコンテンツを検出するように設計されたモデルにより、開発者がより安全なオンライン環境とコミュニティを構築できるよう支援します。フラグが立ったコンテンツには、モデルが深刻度のスコアを付与し、緊急に対応する必要があるコンテンツを人間のモデレーターに示します。

「これは、GitHub Copilot を支援する安全システムであり、新しい Bing を支援する安全システムの一部でもあります。これを、サードパーティのお客様が使える製品として提供していきます」とバードは述べています。

Azure AI Content Safety は Azure OpenAI Service に統合されており、生成 AI のお客様にシームレスなアクセスを提供します。また、このサービスは、オンラインコミュニティやゲームプラットフォームなど、AI 以外のシステムにも適用でき、文脈に応じてフィルターを細かく調整することも可能です。たとえば、ゲーム内で使用される「丘を乗り越えて攻撃せよ」というフレーズは、ゲームシステムが中程度の暴力的コンテンツをブロックするように構成されている場合にはブロックされるかもしれません。中程度の暴力的コンテンツを受け入れるように設定すれば、モデルがこのフレーズを許容するようになるとバードは説明します。

さらに、マイクロソフトは、画像や動画が AI によって生成されたかどうかを検証できる新しいメディア検証機能を Microsoft Designer と Bing Image Creator に提供することを発表しました。このテクノロジは、AI が生成したコンテンツに暗号的手法で、その出所に関するメタデータをマーキングして署名します。

新たな開発プラットフォーム

4 年前、スコットたちは、大規模言語モデルをベースにした生成 AI システムがプラットフォームになるという仮説を立てました。大規模言語モデルにより、データの取得、モデルの選択、トレーニング、テスト、デプロイなどの点で、より古典的な機械学習に比べ、開発者は比較的少ない労力で新しいアプリケーションやサービスを構築することができるようになります。

「私たちが今いる場所は、まさにファンタスティックです。GPT-4 のような大規模言語モデルを、アプリケーション構築に使い始めることができるのです。私たちは、この新しいアプリケーションプラットフォームであるコパイロットを確立したからです」とスコットは述べています。

マイクロソフトは、コパイロットが AI を搭載したソフトウェアの新しいパラダイムであると同時に、新しい製品シナリオの構想、ユーザー体験、アーキテクチャ、使用するサービス、安全性やセキュリティの考え方などにおける、ソフトウェア構築の大きな転換を意味していると考えています。マイクロソフトのエコシステムは、開発者がコパイロット構築するための総合的な支援が受けられる場所であるとスコットは付け加えます。

「コパイロットを作るために必要なものはすべて Azure で提供しています。これらはすべて適切に統合されているため、Azure 上であれば、アイデアの速やかな反復的な試行が他の方法より容易に実施できます。」

関連情報

BingMicrosoft 365 CopilotDynamics 365 CopilotCopilot in Microsoft VivaMicrosoft Security Copilot の詳細をご覧ください。

以下の関連ページもご覧ください。

6 人の専門家による次世代 AI の活用方法 (英語)

責任ある AI プログラムを振り返って: 前進するために大切な3つの要素 (英語)

Azure に賭けたマイクロソフトがAI革命を起こした理由 (英語)

本ページのすべての内容は、作成日時点でのものであり、予告なく変更される場合があります。正式な社内承認や各社との契約締結が必要な場合は、それまでは確定されるものではありません。また、様々な事由・背景により、一部または全部が変更、キャンセル、実現困難となる場合があります。予めご了承下さい。