
マイクロソフトの AI ビジョンを形作った 15 のマイルストーン
著: エリオット スミス (Elliott Smith)
※本ブログは、米国に公開された “15 milestones that shaped Microsoft’s vision for AI ” の抄訳を基に掲載しています。
AI は、ここ数年で私たちを取り巻く世界との関わり方を変える完璧なテクノロジーとして登場したように見えるかもしれません。しかし、実際には AI の開発には何十年もの時間が費やされており、それは機械学習や自然言語処理の分野での初期の進歩から始まりました。そして、今後、さらに多くの進展が期待されています。
ビル ゲイツ (Bill Gates) が 1975 年にオフィスに初めて出社したとき、彼は AI のことを具体的に考えてはいなかったでしょう。しかし、マイクロソフトが過去 50 年間にわたって推進してきた技術的なブレイクスルーとイノベーションが、今日の AI 時代へと続く道筋を作るために重要なステップであったことは間違いありません。
1985 年に最初のオペレーティングシステムを発売し、10 年後にはゲイツ (Gates) が「Tidal Wave」メモでインターネットの力を予測したことまで、マイクロソフトの強みは常に変化を受け入れ、未来を指し示すことにありました。この流れは、マイクロソフトリサーチによる Bayesian Networks や Z3 theorem prover に関する基礎論文にも見て取ることができ、これらがAI の発展の道を開くことになりました。
AI が日常生活に欠かせないものとなる中で、いくつかの重要なマイクロソフトのマイルストーンがどのように今日の礎を築いたか、そして将来のために最も信頼される AI プラットフォーム、ツール、インフラをどのように開発していくかを探ってみましょう。
Bing が自然言語機能を搭載してリリース
Windows Live Search から進化した Bing は、 2009 年に提供開始された際、検索クエリ入力中の検索候補の提案や「Explore パネル」として知られる関連検索リストなど、いくつかの注目すべき機械学習機能を導入しました。これらの機能は、マイクロソフトが 2008 年に買収した Powerset という会社のセマンティック技術を活用しています。
Project Oxford が広範囲な AI 機能の基盤を築く
マイクロソフトの技術的な進歩の多くは Azure の成功に基づいています。このコードネームを持つプロジェクトは 2015 年にリリースされ、開発者に顔認識、音声認識、言語理解などのスマートアプリを構築するための一連のインテリジェント技術を提供しました。このプロジェクトは現在、Azure AI Foundry として知られています。
「これらすべての基盤は Bing にまで遡ります」とマイクロソフトの Azure AI プラットフォーム担当バイスプレジデントのエリック ボイド (Eric Boyd) は言います。ボイドは Bing Ads の開発からマイクロソフトでのキャリアをスタートさせました。「AI モデルのトレーニング方法や、どの AI モデルが実際に最も優れたパフォーマンスを発揮するかを反復して実験、検証するための基盤を構築しました。この基盤のすべてが、現在 Azure AI を通じて提供しているさまざまなコンポーネントや要素になりました。」
Azure から生まれた重要な製品には、会話型 AI アプリ開発、Microsoft Cognitive Serivices、責任ある AI ツール群と、Azure OpenAI Service があります。Azure OpenAI Service は強力な言語モデルと Azure の法人向け機能を組み合わせています。現在、6 万社以上の組織が Azure AI Foundry を使用しており、Fortune 500 企業の 65 % が Azure OpenAI Service を採用しています。
ResNet
Subhead: 新しいフレームワークがディープニューラルネットワークのトレーニングと性能を向上
2015年にマイクロソフトリサーチから発表された画期的な技術、Deep Residual Networks (通称: ResNet) は、ディープニューラルネットワークのトレーニングを大幅に改善し、より深いアーキテクチャの開発と性能の向上を可能にしました。この残差学習のフレームワークは、現在の私たちの生活にとって非常に重要な多くの実用的なアプリケーションへの扉を開きました。
「ResNet は、現在あらゆる場所で使われているコンピュータービジョンの標準をつくりあげました」と、マイクロソフトリサーチのプレジデントであるピーター リー (Peter Lee) は語ります。「もし自動運転車を利用しているなら、それは ResNet に基づく AI を使用しています。クリニックで MRI を受ける際、その MRI マシンにも ResNet ベースの技術が搭載されています。」
マルチセンサリーおよび多言語学習の飛躍
2015 年からの 5 年間で、マイクロソフトは会話型音声認識、機械翻訳、会話型質問応答、機械読解、画像キャプションなど、いくつかのベンチマークで人間のパフォーマンスと同等の成果を達成しました。
これらの 5 つのブレークスルーは、AI 機能の飛躍的な向上に重要な役割を果たし、人間の学習や理解方法により近いマルチセンサリーおよび多言語学習を実現しました。これらのブレークスルーにより、マイクロソフトは XYZ コードを開発しました。これは、人間の認知の 3 つの属性である単一言語テキスト (X)、音声または視覚的感覚信号 (Y) 、多言語 (Z) の交差点であり、Azure AI サービスに統合され、顧客がより強力で統合的な AI システムを加速できるよう支援しています。
視覚的世界を音声で伝えることによるアクセシビリティの向上
マイクロソフトは 2016 年、アクセシビリティを向上させる技術として Seeing AI を発表しました。この実用的な AI の活用例は、コンピュータービジョンと自然言語処理を利用して、周囲の状況を説明したり、テキストを読み上げたり、質問に答えたり、通貨の識別、さらには周囲の人々や表情を説明することができます。
The Find My Things 機能は、視覚に障碍のある方や弱視の方が、自分の使用する見失いやすいアイテム (家の鍵やイヤホンなど) を認識する方法をツールに教えることで、体験をパーソナライズできるよう支援します。
アクセシビリティにより、マイクロソフトのツールや技術がすべての人にとって使いやすくなり、世界中でのイノベーションを加速させています。例えば、Reading Coach のような製品は、生徒の読書学習を支援し、ディスレクシア (読み書きに困難がある人) を持つ人々をサポートします。
AI 処理速度の変革
2017 年には Project Brainwave を発表しました。これは、マイクロソフト のクラウドインフラ上で、大規模なリアルタイム AI ワークロードを実行するために設計されたディープラーニング加速プラットフォームです。Brainwave は、FPGA (フィールドプログラマブルゲートアレイ) と高性能ソフトウェアを組み合わせることで、特に画像認識や自然言語処理のようなタスクにおいて、AI モデルのパフォーマンスを大幅に向上させます。Brainwave は、マイクロソフト が AI ハードウェアとクラウドベース の AI 推論に取り組む上での重要な飛躍を遂げたことを示しました。
大規模言語モデルの革新の舞台設定
2020 年、マイクロソフトは当時最大規模の自然言語生成モデル Turing-NLG をリリースしました。これは当時最大級の言語モデルで、パラメータ数は 170 億にのぼりました。Turing-NLG は、自然言語理解におけるAI開発での マイクロソフト のリーダーシップを示すものであり、視覚認識向けの基盤モデル「Florence」 の開発に先立つものでした。
Nuance が医療分野で初のアンビエント クリニカル インテリジェンス ソリューションを導入
現在 Dragon Copilot に組み込まれている DAX Copilot は、医療分野における大きな前進でした。音声対応の AI を活用することで、医師が患者や家族との自然な会話の中で診察を記録することができるようになり、医師が患者との時間に集中できるよう支援するとともに、勤務時間外の作業量も削減されました。
2020 年に DAX は一般提供され、2023 年には DAX Express が GPT-4 と会話型アンビエントAI組み合わせた最初のソリューションとなりました。このアンビエント AI ソリューションは、現在 600 以上の主要な医療機関に採用されており、月間 300 万件以上の診療記録を生成し、さらに成長を続けています。
Azure による前例のないスーパーコンピューティングインフラが OpenAI の進展を加速
同じく 2020 年に、マイクロソフトは OpenAI のために Azure 上に新たなスーパーコンピュータを導入し、大規模な AI モデルをトレーニングするための新しいインフラを構築しました。これは、それらのモデルをプラットフォームとして利用可能にするための第一歩でした。リリース時、このスーパーコンピュータは、世界の TOP500 スーパーコンピュータの中でトップ 5 にランクインしました。その後の数年間で、マイクロソフトは AI トレーニングと推論のアプリケーション性能を飛躍的に向上させるために、前例のない規模の AI スーパーコンピュータインフラを拡張しました。
OpenAI とのパートナーシップは、共通の理想と、最先端のAIを責任を持って進化させるという強い意志の上に築かれました。両社は協力して、OpenAIの画期的な革新を加速するために、Azure上に前例のないスーパーコンピュータインフラを構築しました。この協力を通じて、世界最高のAIプラットフォームを構築する方法だけでなく、より重要なことに、顧客や世界にその利益を提供する方法をより良く理解することができました。
AI を活用した新しいコード作成方法の開拓
マイクロソフトが GitHub を買収したことにより、2021 年に GitHub Copilot が誕生しました。この AIドリブン型のコーディングアシスタントは、Anthropic の Claude 3.5 Sonnet、Google Gemini 2.0 Flash、OpenAI の o3-mini や GPT-4o などのモデルを選択でき、開発者がコードスニペットや文脈に基づいたチャットレスポンスを通じて効率的にコードを書くことを支援します。これは顧客、個人、クリエイターを支援するための世界クラスの AI プラットフォームを提供するための一歩でした。それ以来、GitHub Copilot はあらゆる地域と業界で 77,000 以上の組織が採用する AI コーディングツールとなり、エージェントモードやコードレビューなどの機能を備えたエージェント的なペアプログラマーとして急速に進化しています。
AI による検索の再発明と生活、仕事のイノベーションの波を引き起こす
2023 年、Bing と Edge に AI が搭載され、人々が検索を利用する方法に大きな変化をもたらしました。この変化は、次の年にかけてマイクロソフトの製品群全体にわたる Copilot の急速な進化と統合へとつながりました。Copilot は情報提供ツールとしてだけでなく、消費者向けに更新された Copilot アプリのリリースにより、真の AI アシスタントへと進化し続けました。Voice (音声) や Vision (視覚) の導入により、Copilot はユーザーに応え、日常の課題を乗り越える際に回答、励まし、アドバイスを提供することができるようになりました。
2023 年の Bing での最初の提供開始を経て、マイクロソフトは急速にさまざまな製品ポートフォリオに Copilot を統合しました。Microsoft 365 Copilot は人々の生産性を向上させ、Dynamics 365 や Power Platform はビジネスプロセスの変革に役立ちました。
Copilot がもたらした迅速なイノベーション
―February 7, 2023 |
―March 6, 2023 |
Copilot in Bing | Microsoft Dynamics 365 Copilot |
―March 16, 2023 |
―March 16, 2023 |
Microsoft 365 Copilot | Copilot in Power Platform |
―March 22, 2023 |
―March 28, 2023 |
GitHub Copilot X | Microsoft Security Copilot |
―April 20, 2023 |
―May 23, 2023 |
Copilot in Microsoft Viva | Copilot on Windows |
―January 4, 2024 |
―January 15, 2024 |
Copilot キーを Windows 11 デバイスに搭載 | Copilot Pro |
―May 21, 2024 |
―October 1, 2024 |
自律エージェントを構築するための Copilot Studio ツール | Vision と Voice を活用していた最新の Copilot エクスペリエンス |
―January 15, 2025 |
―January 16, 2025 |
Microsoft 365 Copilot Chat + エージェント | Copilot in Microsoft 365 Personal および Family サブスクリプション |
―March 25, 2025 |
|
Microsoft 365 における深層推論 |
AI のために設計された新しいカテゴリの Windows PC を紹介
2019 年に Surface Pro X の導入で始まった取り組みを基に、2024 年には Copilot+ PC が、CPU、GPU、新しい高性能ニューラルプロセッシングユニット (NPU) の力を結集する全く新しいシステムアーキテクチャを導入しました。NPU の機能を活用することで、Copilot+ PC はこれまでにないレベルのパフォーマンスを実現し、AI のワークロードの実行速度は最大 20 倍速く、作業効率は最大 100 倍に向上しました。これにより、これまでできなかった数々の新しい AI エクスペリエンスが実現し、PC での作業がこれまで以上に迅速、簡単、そして個人に寄り添うものとなりました。
AI エージェント構築のための新しいフレームワーク
2023 年にリリースされた AutoGen は、AI エージェントの構築と複数のエージェントが協力してタスクを解決するためのオープンソースプログラミングフレームワークです。AutoGen は、エージェント AI の開発と研究を加速させるために、使いやすく柔軟なフレームワークを提供することを目指しています。AutoGen に対する開発者コミュニティの反応は、Microsoft のエージェントサービスのユースケースを特定する上で重要な役割を果たしました。
小規模言語モデルのカテゴリを切り開く Phi
2024 年の研究から製品化にいたるイノベーションは、小規模言語モデルのカテゴリを切り開いた、コスト効果の高いカスタマイズモデルです。「エッジ」で動作し、クラウドに接続されていないスマートフォンやその他のモバイルデバイスなどでより多くの人々が AI にアクセスできるようにします。それ以来、マイクロソフト はさらに多くの Phi バージョンを Azure AI Foundry モデルカタログに導入し、特定のユースケースに対応する業界特化型モデルを提供しています。
ゲーム用の革新的な生成 AI モデル
2025 年にリリースされた Muse モデルは、ゲームプレイのアイデアに革命をもたらしました。環境の動態や行動に対する進化を含む深い理解を発展させることができます。ChatGPT や GPT-4 の人間の言語を学習する能力は、AI が物事の仕組みを学習する能力に匹敵し、実際の相互作用の理解を発展させます。これにより、ビデオゲームにおける迅速な反復、リミックス、クリエイションが可能になり、開発者は最終的に没入型の環境を作り出し、創造力を最大限に発揮することができます。
これらの進展は、AI に対するコミットメントと、コラボレーションとイノベーションを通じて、地球上のすべての人々と組織がより多くを達成できるようにするというマイクロソフトのミッションを達成するための取り組みのほんの一部に過ぎません。医療の改善から生物多様性の保護、学習の変革に至るまで、AIの可能性と影響は無限に広がっています。
「研究で本当に重要なのは、技術的な知識の向上だけでなく、これらのブレークスルーが広いエコシステムを活性化できるようにすることです」と、リー (Lee) は述べました。
「変化のペースが非常に速くなった今、そのようなブレークスルーがエコシステムに与える影響はこれまで以上に重要です。マイクロソフトがプラットフォーム企業として刺激的なのは、AI の進化を推進しながら、お客様がこの変革を実現するテクノロジーを活用できるよう支援している点なのです。」
—
本ページのすべての内容は、作成日時点でのものであり、予告なく変更される場合があります。正式な社内承認や各社との契約締結が必要な場合は、それまでは確定されるものではありません。また、様々な事由・背景により、一部または全部が変更、キャンセル、実現困難となる場合があります。予めご了承下さい。