科学的発見の第 5 のパラダイムを実現する AI4Science を設立

科学的発見の第 5 のパラダイムを実現する AI4Science を設立

クリストファー ビショップ (Christopher Bishop) テクニカルフェロー、マイクロソフトリサーチケンブリッジ ラボディレクター

※本ブログは、米国時間 7 月 7 日に公開された “AI4Science to empower the fifth paradigm of scientific discovery” の抄訳を基に掲載しています。

今後 10 年間で、ディープラーニングは自然科学に大きな影響を与えることになりそうです。その影響は広範囲に及ぶ可能性があり、空間と時間のスケールが大きく異なる自然現象をモデル化し、予測する能力を劇的に向上させる可能性があります。この能力は、科学的発見の新しいパラダイムの幕開けを意味するのでしょうか?

BOOK
The Fourth Paradigm 
Data-Intensive Scientific Discovery

チューリング賞受賞者で元マイクロソフトテクニカルフェローのジム グレイは、科学的発見の歴史的変遷を 4 つのパラダイムで特徴づけています。その起源は数千年前にさかのぼりますが、最初のパラダイムは、自然現象の直接観察に基づく純粋に経験的なものでした。このような観察には多くの規則性が見られますが、それを体系的に捉えたり表現したりする方法はありませんでした。第 2 のパラダイムは、17 世紀のニュートンの運動法則や 19 世紀のマクスウェルの電気力学の方程式のような、自然界の理論モデルによって特徴づけられたものです。経験的観察から帰納的に導き出されたこれらの方程式は、直接観測された状況よりもはるかに広い範囲に一般化することを可能にしました。これらの方程式は、シンプルなシナリオでは解析的に解くことができましたが、より一般的なケースで解くことができるようになったのは、20 世紀にデジタルコンピュータが開発されてからであり、それが数値計算に基づく第 3 のパラダイムが生まれることにつながりました。21 世紀に入ると、今度は大量のデータを収集、保存、処理できるようになり、データ集約的な科学的発見という第 4 のパラダイムをもたらし、計算機が再び科学を変革することになりました。マシンラーニング (機械学習) は、大量の実験科学データのモデリングと解析を可能にし、第 4 のパラダイムの重要な構成要素となりつつあります。これら 4 つのパラダイムは補完し合いながら共存しています。

量子物理学の先駆者であるポール ディラックは、1929 年に「物理学の大部分と化学全体の数学的理論に必要な基礎的物理法則は、このように完全に知られており、難点は、これらの法則を厳密に適用すると、方程式が複雑すぎて解けなくなることだけである」とコメントしています。たとえば、シュレーディンガー方程式は、分子や物質の振る舞いを素粒子レベルで精密に記述していますが、高精度の数値解法が可能なのは、数個の原子からなる非常に小さなシステムに限られます。より大きなシステムにスケールアップするためには、より思い切った近似が必要となり、スケールと精度の間で難しいトレードオフが生じます。それでも、量子化学計算はすでに実用的な価値は高く、スーパーコンピュータに搭載される計算負荷の中でも最大級のものです。

しかし、ここ 1、2 年の間に、科学的発見におけるスピードと精度のトレードオフを解決する強力なツールとして、ディープラーニング (深層学習) を活用する新しい方法が登場しています。これは、第 4 のパラダイムの特徴であるデータのモデリングとは全く異なるマシンラーニングの使い方です。なぜなら、ニューラルネットワークの学習に使われるデータ自体が、経験的な観察からではなく、科学の基礎方程式の数値解法から得られるものだからです。科学方程式の数値解法は、自然界のシミュレーターであり、高い計算コストをかけて、天気予報、銀河の衝突モデリング、核融合炉の設計最適化、薬剤候補分子の標的タンパク質への結合親和性計算などの用途に必要な量を計算するために使用することができる、と考えることができます。しかし、マシンラーニングの観点からは、シミュレーションの中間的な詳細を学習データと捉え、ディープラーニングエミュレータを学習させるために使用できると見なすことができます。このようなデータは完全にラベル付けされており、データ量は計算機の上限値によってのみ制限されます。一度学習させたエミュレータは、新しい計算を高い効率で実行できるようになり、時には数桁の速度向上を達成することができます。

この「第 5 のパラダイム」は、自然科学だけでなく、マシンラーニングにとっても最もエキサイティングなフロンティアの一つです。これらのエミュレータが主流となるにはまだ長い道のりがあり、十分な高速性、堅牢性、汎用性を備えている必要がありますが、実世界にインパクトを与える可能性があることは明らかです。たとえば、低分子の医薬品候補だけでも 1060 (10 の 60 乗) 種類、安定な物質の総数は約 10180 (10 の 180 乗) 種類 (既知の宇宙に存在する原子の数のほぼ 2 乗) と推定されています。この広大な空間をより効率的に探索する方法が見つかれば、病気を治療するためのより良い薬、大気中の二酸化炭素を捕捉するためのより良い基質、電池のより良い材料、水素エネルギー社会を支える燃料電池の新しい電極など、無数の新しい物質を発見する能力に変革をもたらすことでしょう。

“AI4Science は、マイクロソフトのミッションに深く根ざした取り組みで、私たち、そして科学界の人々が人類の最も重要な課題に立ち向かえるように、私たちの AI 能力のすべてを応用して科学的発見のための新しいツールを開発するものです。マイクロソフトリサーチには、30年以上にわたる好奇心と発見の歴史があり、地域や科学分野を超えた AI4Science チームは、その歴史に並外れた貢献をする可能性があると信じています。”(ケビン スコット、EVP & CTO)

本日、マイクロソフトリサーチにおいて、英国、中国、オランダにまたがる新しいグローバルチームを率い、この第 5 のパラダイムの実現に注力していくことを発表でき、うれしく思います。私たち AI4Science チームは、マシンラーニング、量子物理学、計算化学、分子生物学、流体力学、ソフトウェア工学、その他の分野の世界的な専門家を含み、この分野における最も差し迫った課題に協力して取り組んでいきます。

私の同僚である中国チームのティエヤン リウ (Tie-Yan Liu) が率いる「Graphormer」というプロジェクトが 1 つの例です。研究者や開発者が、材料科学や創薬などの分子モデリングタスクのためにカスタムモデルを学習することができるディープラーニングパッケージです。最近、Graphormer は、AI による触媒-吸収剤反応系のモデリングを目的とした分子動力学コンテスト「Open Catalyst Challenge」で優勝し、密度汎関数理論 (DFT) ソフトウェアによる 66 万以上の触媒-吸収剤緩和系 (構造-エネルギーフレーム数 1 億 4400 万) のシミュレーションを行っています。また、ケンブリッジのチームがノバルティス社と共同で行っているプロジェクト「Generative Chemistry」では、科学者を AI で支援し、画期的な医薬品の発見と開発を加速させています。

ノバルティス社 AI イノベーションラボのグローバルヘッドである Iya Khalil 氏は最近、この仕事はもはや SF ではなく、サイエンスインアクションである、と以下のように指摘しています。

“AI は過去の実験から学ぶだけでなく、研究室で設計とテストを繰り返すたびに、マシンラーニングアルゴリズムが新しいパターンを特定し、初期の創薬・開発プロセスを導くのに役立ちます。そうすることで、人間の科学者の専門性を増強し、より優れた分子をより早く設計できるようになればと願っています。”

その後、このプラットフォームを利用して、いくつかの有望な初期段階のさらなる探索のために合成された分子を生成しています。

私たちの中国や英国のチームと並んで、オランダでも世界的に有名なマシンラーニングの専門家であるマックス ウェリング (Max Welling) を採用するなど、チームを成長させてきました。また、本日、アムステルダムの真新しいラボが、アムステルダム・サイエンスパークに現在建設中の Matrix One に入居することを発表できることもうれしく思います。この特別な空間は、アムステルダム大学とアムステルダム自由大学に近接しており、博士課程の学生の共同指導を通じて、両大学と強い提携関係を維持していきます。

アムステルダムで建設中の Matrix One
アムステルダムで建設中の Matrix One

私たちは、地域を超えたチームとして次のステップに進み、これまでのパイオニアたちの足跡をたどり、科学的発見の次のパラダイムに貢献し、そうすることで多くの重要な社会的課題に影響を与えることに誇りと興奮を感じています。もしあなたが、私たちの興奮と志に共感し、私たちの仲間に加わりたい場合は、募集中の職種をご覧になるか、チームの誰かに連絡を取ってみてください。

本ページのすべての内容は、作成日時点でのものであり、予告なく変更される場合があります。正式な社内承認や各社との契約締結が必要な場合は、それまでは確定されるものではありません。また、様々な事由・背景により、一部または全部が変更、キャンセル、実現困難となる場合があります。予めご了承下さい。

Tags: ,

関連記事