ケビン スコットとの対話: AI の次の展開とは
※本ブログは、米国時間 12 月 6 日に公開された “A conversation with Kevin Scott: What’s next in AI” の抄訳を基に掲載しています。
今日、大規模な言語モデルを搭載した人工知能システムが、ソフトウェア開発者のためにコードを作成し、グラフィックデザイナーのためにスケッチを行うなど、人々の仕事と創造の方法を変革しています。
マイクロソフトの CTO ケビン スコット (Kevin Scott) は、今後もこれらの AI システムの高度化と大規模化は進み、気候変動や幼児教育などのグローバルな課題の解決に貢献し、医療、法律、材料科学、SF などの分野に革新を起こすと予測しています。
最近、スコットは、ナレッジワーカーにとっての AI の影響と、AI の次の展開について、自身の考えを話してくれました。重要なポイントは以下のとおりです。
- 大規模な AI モデルやジェネレーティブ AI の進歩が、生産性、創造性、満足度を高め続ける。
- AI が、科学的ブレークスルーを可能にし、世界が抱える最大の課題を解決するのに貢献する。
- マイクロソフトが、これらのモデルをプラットフォーム化し、お客様のために責任を持って AI の進化を拡大し続けるためには、クラウド、インフラ投資、そして、AI への強力な責任あるアプローチが不可欠である。
今年の AI における最も重要な進歩は何だったとお考えですか?
2022 年が始まろうとしていた時、AI 関係者の誰もが、今後 1 年の間に本当に素晴らしいことが起こると予想していたのではないでしょうか。しかし、2022 年も終わろうとしている今、さまざまな分野の AI のイノベーションの大きさを振り返ると、そのような高い期待すら上回っていることに驚かされます。研究者などの人々が、最先端の技術を進歩させるために行ってきたことは、数年前に私たちが予測していたことのはるか先を行っています。そして、そのほとんどが、大規模な AI モデルの急速な進歩の結果なのです。
今年最も印象に残った 3 つの事象の第 1 は GitHub Copilot です。自然言語のプロンプトをコードに変換する大規模な言語モデルベースのシステムであり、開発者の生産性に劇的な影響を与えられます。コーディングが、これまでよりもずっと幅広い層の人たちに開放されることになります。未来の多くは、ソフトウェアを書く能力に依存しているのですから、これは素晴らしいことです。
第 2 は、DALL∙E 2 のような画像生成モデルが広く普及し、より身近になったことです。グラフィックデザイン、イラストレーション、アート関係のすべてのツールを使いこなし、スケッチやデッサンをするためには、かなり高度な技術が要求されます。DALL・E 2のようなAIシステムは、普通の人をプロのアーティストに変えることはできませんが、多くの人に今まで持っていなかった視覚的ボキャブラリーを与えてくれます。これは、かつては手に入れられるとは思いもしなかった新しい超能力です。
(編集部注: この記事の画像は、ケビン スコットの写真を除き、すべてDALL∙E 2を使って作成したものです。)
第 3 に、AI モデルがより強力になり、今まで使われてきた用途においてもさらに大きな利益をもたらしていることも明らかです。今年、タンパク質の折り畳みに関する研究において、テクノロジ業界全体が大きな進展を示したと思います。たとえば、ワシントン大学のデイヴィッド ベイカー (David Baker) 教授の研究室との共同研究、RoseTTAFold によるInstitute for Protein Design、そして、その他のさまざまな先進的 AI による変革の支援の事例があります。
これだけでもとてもエキサイティングに感じられます。科学や医学の発展は、世界にとって有益なことです。なぜなら、それらは私たちが抱える最も深刻でやっかいな問題に関わるからです。
まさに印象的な 1 年でした。そして、来年はもっと素晴らしい 1 年になるでしょう。
来年以降に、AI テクノロジが最も大きな影響を与えると思われる領域はどこですか?
2023 年は、AI コミュニティにとってこれまでで最もエキサイティングな年になると、自信を持って言えます。2022 年がこれまでで最もエキサイティングな年だったことを踏まえて言っています。イノベーションのスピードはますます加速しています。
GitHub Copilot についてはすでにお話しましたが、本当にすごいことです。しかし、それは今後大規模な AI モデルができることのほんの一部に過ぎません。コーディング以外の知的労働の支援にために、同じアイデアがさまざまなシナリオに拡張されるでしょう。知識経済全体で、AI が仕事の反復的な側面を支援し、全体的により快適で充実したものにしてくれるような変革が起こるでしょう。これは、製薬のため新しい分子のデザイン、3D モデルからの製造「レシピ」の作成、そして、一般的な著述や編集など、ほとんどあらゆる領域に適用されることになるでしょう。
たとえば、私は、10 代の頃からずっとやりたかった SF を書くために、GPT-3 を使って自分用の実験システムを作って試行錯誤しています。私のノートには、物語のあらすじや舞台となる宇宙を記したアイデアがぎっしり詰まっていました。この実験的なツールで、行き詰まりを解消してもらえました。昔ながらの方法で本を書いていた時は、1 日に 2,000 ワードも書けたら、すごくいい気分でした。このツールを使うと、1 日に 6,000 ワード書けることもあります。私にとっては相当な分量と感じられますが、以前と比べて、質的により充実した作業になっています。
「あらゆる作業にコパイロットがいる」という夢が実現すれば、常に隣に副操縦士がいて、より多くの仕事をこなすだけでなく、新しい刺激的な方法で創造性を高める手助けをしてくれるのです。
生産性の向上については、明らかに満足されているようですが、これらのツールが仕事に喜びをもたらしてくれるのはなぜでしょうか?
私たちは皆、道具を使って仕事をしています。ツールを手に入れて使いこなし、自分がやろうとしていることを実現するために、きわめて効率的な方法でツールを活用する方法を見つけ出すのが、本当に好きな人もいます。今起きているのはそういう現象です。多くの場合、人々は今まで持っていたツールより新しく、面白く、根本的に効果が高いツールを手に入れることができるようになりました。マイクロソフトの調査では、ノーコードまたはローコードツールの使用により、ユーザーの仕事に対する満足度、全体の作業量、モラルが 80% 以上向上することが明らかになっています。特に、これらのツールが比較的初期の段階にあることを考えれば、これはまさに大きなメリットと言えるでしょう。
ある人々にとっては、AI はまさに仕事の流れを強化してくれる存在です。作業を加速してくれるのです。マラソンに行く時に、より良いランニングシューズを手に入れたようなものです。これはまさに、開発者が Copilot で体験していることと同じです。彼らは、Copilot が仕事に集中させてくれ、退屈な反復的作業でも集中力を維持させてくれると報告しています。AI ツールが仕事から雑務、つまりきわめて反復的で煩わしいもの、あるいは本当に楽しいことに向き合うのを邪魔していたものを取り除くのに役立つなら、満足度が向上するのは当然のことです。
個人的には、これらのツールを使うことで、以前よりも長く集中力を維持できるようになりました。クリエイティブな仕事の流れの敵は、気を散らす要素と行き詰まりです。次の問題をどう解決すべきか、さらには、そもそも次の問題は何なのかがよくわからないという状態になることがあります。「ちょっと調べてみなければ。今やっていることから離れて別の問題を解決しなければ」という状況です。これらのツールが副次的な問題をどんどん解決してくれることで、私は仕事の流れを維持できます。
GitHub Copilot や DALL∙E 2 以外でもの他にも、マイクロソフトの製品やサービスでは AI が採用されています。次世代 AI は、Teams や Word といった製品をどのように改善していくでしょうか?
AI にはまだ語られていない多くの話題があります。今日まで、AI の恩恵は 1,000 種類もの製品やサービスに広がっており、得ている製品体験のどこが機械学習によるものなのか、わかりにくいかもしれません。
たとえば、私たちは今、Teams を使ってビデオ通話をしていますが、システムの中には機械学習アルゴリズムによって学習されたさまざまなパラメーターが入っています。通信をスムーズにするための、オーディオシステムのジッターバッファにも使われています。画面上の背景ぼかしは、まさに機械学習アルゴリズムによるものです。通話体験をより快適にしてくれる機械学習システムが、十数種類も用意されています。そして、このことはマイクロソフト製品全体に共通しています。
数カ所の実験から始めて、今や、Outlook 電子メールクライアントの動作、Word の予測入力、Bing 検索の体験、Xbox Cloud Gaming や LinkedIn でのフィード表示など、さまざまな製品で、まさに 1,000 種もの機械学習が稼働しています。これらの製品をより良くするために、至る所で AI が活躍しているのです。
この 2 年間で大きく変わったことの 1 つは、以前は、マイクロソフトの全製品のタスクのそれぞれに特化したモデルがあったことです。現在は、広範な目的に有効な 1 つのモデルが多くの場所で使われています。規模拡大に伴いより強力になるモデルに投資し、あらゆるものをそのモデル上に構築し、改良によって同時に利益を得ることができるようにすることの効果は膨大です。
マイクロソフトは、AI4Science や AI for Good などの取り組みでも AI の研究開発を進めています。この分野で最も期待することは何ですか?
今、私たちが直面する社会的に最も困難な問題は、科学分野の問題です。どうすれば、きわめて複雑な疾病を治療できるのでしょうか? どうすれば、次のパンデミックに備えることができるのでしょうか? どうすれば、高齢化社会に向けて安価で高品質の医療を提供できるのでしょうか? どうすれば、未来に必要となるスキル育成のために子供たちへの大規模な教育を実施できるのでしょうか? どうすれば、大気に排出された二酸化炭素の悪影響を除去するためのテクノロジを開発できるのでしょうか? マイクロソフトは、こうした問題に対して、劇的に進化している AI をどのように取り入れていくかを探っています。
このような基礎科学の適用のモデルには、大規模な言語モデルと同じ規模拡大の特性があります。モデルを構築し、シミュレーションから学習したり、特定の領域を観察する能力から学習したりできるような自己教師モードにします。このモデルによって、計算流体力学のシミュレーションであれ、製薬のための分子動力学であれ、アプリケーションのパフォーマンスを劇的に向上できます。
ここには膨大な機会があり、より良い医薬品を提供できる可能性や、二酸化炭素排出問題を解決できる未知の触媒を発見できる可能性があります。そして、あらゆる分野で、科学者や素晴らしいアイデアを持つ人々による、社会の最大の課題を解決するための活動が加速されます。
コンピューティング手法やハードウェアのブレークスルーは、AI の進歩にどのように寄与しているのでしょうか?
最近の AI の進歩において、ほとんどの場合、根底にあるのは、規模がいかに重要かということです。より多くのデータとより多くの計算能力で学習させたモデルは、より豊富で一般化された能力を持つことが判明しています。はっきり言えば、今のところ、規模の拡大がもたらす恩恵に終わりはないと考えています。もし私たちがこの進歩をさらに推し進めたいのであれば、計算能力を可能な限り最適化し、スケールアップする必要があります。
マイクロソフトは、2 年前に最初の Azure AI スーパーコンピューターを発表し、今年の開発者イベント Build では、現在、世界で最大かつ最も強力であると考えられる AI スーパーコンピューターシステムを複数保有していることをお伝えしました。マイクロソフトと OpenAI は、このインフラを利用して、マイクロソフトの Turing、Z-code、Florence モデル、OpenAI のGPT、DALL∙E、Codex モデルなど、ほぼすべての最先端の大型モデルを学習させています。また、つい最近には、Azure のインフラと NVIDIA の GPU を組み合わせたスーパーコンピューターを構築するために NVIDIA とのコラボレーションを行うことを発表しています。
この進歩の一部は、GPU の大規模なクラスタによる物量的な計算規模拡大によってもたらされたものです。しかし、もっと重要なブレークスルーは、モデルの学習と顧客への提供の両面において、モデルとデータの巨大なシステムへの分散を最適化するソフトウェア階層でしょう。このような大規模なモデルを、人々が創造活動を行うためのプラットフォームとして提供すれば、AI は巨大なスーパーコンピューターを作れるリソースを持つ、世界のごく一部のテクノロジ企業だけがアクセスできる存在ではなくなります。
そのため、学習効率を高める DeepSpeed や推論用の ONNX Runtime などのソフトウェアに多大な投資をしてきました。これらは、コストやレイテンシーを最適化し、より大きなAIモデルを人々にとってより利用しやすく、価値のあるものにするために支援してくれます。私は、これらのテクノロジに取り組んでいるチームを非常に誇りに思っています。マイクロソフトは業界をリードしており、オープンソース化によって他社による改良も支援しているからです。
こうした進歩が進む中、AI が雇用に影響を与えるのではという懸念があります。AIと雇用の問題をどのようにお考えですか?
私たちは、マクロ経済が歴史的なペースで変化する、きわめて複雑な時代に生きています。5 年後、10 年後を考えると、世界全体でネットニュートラルなバランスを実現するためにも、私たち全員が進歩を享受できるような新たな形の生産性向上が必要になってくるでしょう。マイクロソフトは、これらの AI ツールをプラットフォームとして構築し、多くの人々がその上でビジネスを構築し、問題を解決するために利用できるようにしたいと考えています。これらのプラットフォームは、より多くの人々に向けて AI へのアクセスを民主化するものと信じています。これによって、より確実な問題解決が可能になり、さらに多様な人々がテクノロジの創造に参加できるようになるでしょう。
これまでの AI では、始めるだけでも多大な専門知識が必要でした。今では、Azure Cognitive Services や Azure OpenAI Service を活用して、複雑な製品を構築することができます。必ずしも AI の専門家である必要はなく、ゼロから独自の大規模モデルを訓練できます。
これらすべての巨大な AI システムが成長し、進化を続ける中で、仕事のあり方を根本的に変えることが予想されます。あるところではより大きな変化が起き、またあるところではこれまで存在しなかった新しい仕事が次々と生み出されるでしょう。歴史を振り返ると、電話、自動車、インターネットなどの重要なテクノロジのパラダイムシフトが起きた時に、関連するあらゆるものに同じようなことが起こってきたことがわかります。そして、これらの例のように、仕事についての新しい考え方、スキルについての新しい考え方、さらに、本当に重要な仕事のために十分な才能のある人々を確保し、訓練することに強くフォーカスすることが必要になってくると思います。
AI テクノロジに関連するもう一つの懸念として誤用や悪用の可能性があります。マイクロソフトは、自社の AI ツールやサービスが責任を持って開発・利用されるために、具体的にどのような取り組みをしているのでしょうか?
この点について、マイクロソフトはきわめて真剣に取り組んでいます。マイクロソフトは、責任ある AI プロセスを通じて AI システムを構築しており、そのプロセスを継続的に改善しています。マイクロソフトは、専門家からなる多角的なチームとともに、自分たちがやっていることを精査し、起こりうるすべての有害なことを理解し、それを可能な限り軽減するように努めています。たとえば、モデルの学習に使用するデータセットの改良、有害なコンテンツの生成を制限するフィルターの導入、悪意のある人物による悪用を防ぐためのセンシティブなトピックに関するクエリーブロックなどのテクノロジの統合、より親切で多様な応答や結果を返すテクノロジの適用などが挙げられます。また、サービス開始後に予想外の被害が発生した場合、AI システムで可能な限り迅速に検知し、軽減できるような計画を立てています。
もう一つの非常に重要な安全策は、意図的かつ反復的な展開です。マイクロソフトの取り組みのほとんどは、幅広い能力を持つモデルに対するものです。それを、自社のクラウドでホストし、API や製品を通じてアクセスできるようにしています。API については、開発者であれば誰でもアクセスできますが、利用するためには利用規約を遵守する必要があり、利用規約に違反するとアクセス権が剥奪されることもあります。また、製品については、ユースケースが明確に定義された一部のお客様を対象とした限定的プレビューから始めることもあります。このような初期のお客様とのコラボレーションは、責任ある AI セーフガードが実際に機能することを確認し、より広範囲に採用を拡大していくのに役立ちます。
マイクロソフトは、安全と責任が重要であると心から信じています。業界全体に少しでも貢献できることを望みます。そのため、マイクロソフトがソリューションの開発に費やしたすべてのリソースと専門知識を、Responsible AI Standard と AI の原則を通じて、幅広いコミュニティと共有しています。
タイトル画像: 中央はマイクロソフト CTO のケビン スコット (写真提供: マイクロソフト)。左と右は、テキストの説明文からリアルな画像やアートワークを作成できる OpenAI の AI システム、DALL∙E 2 を使用して生成。
—
本ページのすべての内容は、作成日時点でのものであり、予告なく変更される場合があります。正式な社内承認や各社との契約締結が必要な場合は、それまでは確定されるものではありません。また、様々な事由・背景により、一部または全部が変更、キャンセル、実現困難となる場合があります。予めご了承下さい。