コンテンツへ移動
海から空へ: 天気予報を超えるマイクロソフトの Aurora AI 基盤モデル

海から空へ: 天気予報を超えるマイクロソフトの Aurora AI 基盤モデル

著者: サリー・ビーティー

※本ブログは、米国時間 5 月 21 日に公開された “From sea to sky: Microsoft’s Aurora AI foundation model goes beyond weather forecasting” の抄訳を基に掲載しています。

破壊的なハリケーン。押し寄せる巨大な波。砂嵐や深刻なスモッグ。

極端な気象現象がますます一般的になるなか、それらが与える損害――命を奪ったり、家を破壊したり、電力網の混乱、農作物への被害に加え、航路への影響など――に備えるためのプレッシャーに、コミュニティがさらされています。

多くの強力な新しい AI モデルが天気をよりよく予測するための新しいツールを提供する一方で、Nature に掲載された新しい論文では、Aurora と 名付けられた基盤モデルが AI の最新の進歩を活用して、天気に加え、ハリケーンや台風から、さらに大気の質や海の波まで、さまざまな環境イベントをより正確に予測する方法を発表しました。Microsoft Research が開発した Aurora は、従来の数値予報や以前の AI アプローチと比較して、より高い精度と速度を実現しながらも、はるかに低い計算コストでこれらの大気現象の予測を実現しました。

基盤モデルは、さまざまなデータに基づいて訓練された大規模な AI モデルです。Aurora は AI 天気予報に限定されない点でユニークです。(天気予報は、Aurora が最先端のレベルで実現できることの一つに過ぎません。) Aurora の特徴は、基盤モデルとしてまずトレーニングされ、その後、微調整 (ファインチューニング) を通じて、大気質の予想といった従来の天気予報を超えた予測能力を得たことです。Aurora の開発過程で、研究者たちはモデルを微調整して、波浪や熱帯低気圧の予測など、さまざまな予測能力を持つように開発しました。これにより、Aurora は大気システムの基盤モデルとしてだけでなく、地球システムの基盤モデルとしての能力を示すことに成功しました。

Aurora

Aurora は、衛星、レーダー、気象観測所、シミュレーション、および予報から得られた 100 万時間以上のデータに基づいて、一般的な気象パターンを学習し、数秒で予報を生成する方法を最初に学びました。特に大気データについては、マイクロソフトの研究者たちは、これが AI 予測モデルを訓練するためにこれまでに集められた最大のコレクションであると考えています。その後、Aurora は独自の柔軟なアーキテクチャを活用して、波高や大気の質予測など、特定のタスクを実行するために「微調整」されました。

Aurora は、その規模と多様なデータでの訓練の力を活用して、天気やその他の環境イベントを予測します。これにより、Aurora は中期天気予報の 91% の予測ターゲットで既存の数値モデルや AI モデルを上回りました。中期天気予報は、通常、最大 14 日間の見通しを示します。

多様なデータソースを組み込むことで、「一般的により高い精度を実現するだけでなく、極端な気象現象の予測にも優れています」と、Aurora プロジェクトチームの一員である Microsoft Research のシニアリサーチャー、メーガン・スタンリーは述べています。

大気予報の分野の進展に貢献するべく、マイクロソフトは Aurora のソースコードとモデルの重みづけを公開し、開発者が Aurora をダウンロードして実行するだけでなく、さらに開発できるようにしています。

Aurora は、マイクロソフトの最新の AI 研究と実験のハブである Azure AI Foundry Labs にも掲載しています。ここでは、さまざまな業界の開発者やクリエイターが新しい可能性を発見し、複雑な問題を解決し、AI の未来を形作るための洞察を共有することができます。

マイクロソフトの MSN Weather も Aurora の高度な AI モデリングを取り入れています。MSN Weather チームは、より正確で最新の予報を提供できるように同モデルから専門バージョンを開発し、毎時予報の生成や、降水量や雲などの気象パラメータを追加しました。引き続き、ユーザーが天気に先んじて行動できるように支援しています。

サイクロンをより正確に予測する

2023 年に発生した台風 5 号 (トクスリ、DOKSURI) がフィリピンに上陸した際、大規模な洪水や停電を含む重大な被害を引き起こしました。

グアム台風警報センター(PGTW)の公式予報では、台風が台湾を通過することが示されていましたが、Aurora は台風 5 号がフィリピン北部に上陸することを正確に予測しました。実際の台風の進路を示すデータは、国際ベストトラックアーカイブ(IBTrACS)プロジェクトから提供されています。アニメーションはMicrosoftの提供です。
グアム台風警報センター (PGTW) の公式予報では、台風が台湾を通過することが示されていましたが、Aurora は台風 5 号がフィリピン北部に上陸することを正確に予測しました。実際の台風の進路を示すデータは、国際ベストトラックアーカイブ (IBTrACS) プロジェクトから提供されています。アニメーションは Microsoft の提供です。

Nature に報告されたように、Aurora は精度試験において、フィリピンに上陸する台風 5 号の進路を実際に台風が移動する 4 日前に正確に予測しました。一方、公式予測は誤って北台湾の海岸に台風の予測進路を配置していました。

この最新研究では、Aurora は 5 日間の熱帯低気圧の進路予測で米国国家ハリケーンセンターの予測を上回り、機械学習モデルとして初めての成果を達成しました。また、2022-2023 シーズンのすべてのサイクロン進路予測で 7 つの主要な予報センターの予測を上回り、研究者たちによりその成果は確認されています。

Aurora のサイクロン進路予測の精度は、膨大で多様なデータでの初期訓練の重要性を強調しています。

従来の方法よりも小さなコストで大気の質を予測する

2022 年 6 月 13 日、壊滅的な砂嵐がイラクを襲いました。その年に同国を襲った 10 回の砂嵐の一つであり、激しい干ばつ、土壌の劣化、高温の組み合わせによって引き起こされたものでした。嵐は首都バグダッドとその周辺地域を厚い砂埃の雲で覆い、数千人が呼吸困難で病院に運ばれました。地元の空港も閉鎖を余儀なくされました。

Nature に掲載した論文の別のケーススタディでは、Aurora は従来の大気質予報にかかるコストのほんの少しのリソースで、イラクの砂嵐を 1 日前に正確に予測しました。Aurora は、天気データと比較して大気質データが比較的限られているにもかかわらず、この成果を達成しました。モデルが最初に大規模で多様なデータセットから学習するため、少量の大気質データでも微調整できることが示されました。

大気の質を予測

研究者たちは、大気質の予測は天気の予測よりもはるかに複雑でリソース集約的であると述べています。これは、大気質の予測が複雑な化学反応のモデリングと、人間活動によるさまざまなレベルの世界的な排出量を考慮する必要があるためです。

Aurora は「大気化学について何も学ばなかったし、例えば二酸化窒素が日光とどのように相互作用するかも学ばなかった。それは元の訓練の一部ではなかった」とスタンリーは言います。「それでも、モデルの微調整では、Aurora は他のすべてのプロセスについて十分に学んでいたため、適応することができました。」

より高い精度がより良い波浪予報につながる

Aurora は現在、波の高さや方向をといった海の波の詳細を予測する能力にも優れていることを示しています。これにより、2022 年 9 月に日本に上陸した台風14号 (ナンマドル、 NANMADOL) のような海洋上での事象予測にも理想的です。この台風はその年で最も強力な台風であり、記録的な土砂崩れと洪水を引き起こし、極端な降雨量によって広範囲にわたる地域で停電が発生し、その被害は韓国にまで及びました。

別の試験では、Aurora は波浪の予測において、現在の標準的な予測モデルと比較して、86% のケースで同等、またはそれ以上の精度を示すなど、台風 14 号のような台風によって生成された波の高さを、現在の最良の予測モデルを上回る精度で予測することができました。

Aurora

特に、波を予測するためのモデルの訓練に必要なデータが 2016 年以降のものしか利用できなかったため、研究者たちはこの複雑なタスクに対して、短期間のデータで示された Aurora のパフォーマンスについて注目しています。これは、Aurora が追加の微調整データが少なくても予測を生成できる能力を示した、もう一つの指標です。

速度と精度

Aurora は、複数のソースから引き出された大量のデータを理解するために、柔軟な「エンコーダーアーキテクチャ」に依存しています。これにより、ローデータを標準形式に変換し、モデルが予測を行うために使用できるようにします。

研究者たちは、Aurora の運用方法を過度に規定しないように注意しました。これも精度と正確性を実現した要因のひとつと考えられています。「変数が互いにどのように相互作用するべきかについて厳密なルールを設定していません」とスタンリーは言います。「私たちはただ、大規模なディープラーニングモデルに最も役立つものを学習するオプションを与えています。これが、この種のシミュレーション問題におけるディープラーニングの力です。」

Aurora の初期トレーニングは高コストですが、完全に機能するようになると、その運用コストは従来の天気予報システムよりも大幅に低くなります。

高帯域幅の GPU を活用して、Aurora は数秒で予報を生成します。これは、同等の予測を生成するために数時間を要する従来のシステムに比べて約 5,000 倍もの速さです。

Aurora の次を”予測”する

Aurora の初期結果は、学界や産業界、気象予報に関連する機関・組織、エネルギー企業、さらにはトレーダーの間で関心を引き起こしました。特に、雨の予測を改善し、作物の物流を強化し、エネルギーグリッドを保護するために、Aurora が適応できるかに関心が集まっています。Aurora は、世界で最も広く使用されている天気予報システムの一つである 欧州中期予報センター (ECMWF) のウェブサイトで、大気科学や天気予報に関わる研究者、気象学者、その他の専門家がアクセスできるように公開されています。

マイクロソフトの機械学習研究者であり、Aurora チームのメンバーであるウェッセル・ブルインスマは、各ファインチューニングの試験に小さなエンジニアリングチームが約 4 ~ 8 週間携わったと述べています。「このタイムラインを、通常数年かかる従来の数値モデルの開発と比較してください」と彼は言います。

「(この発見は) 大きな影響を与える可能性があります。なぜなら、自分に関連するタスクで微調整きるからです」とスタンリーは言います。「たとえば、非常に局所的で高解像度のデータや、他の天気予報能力に恵まれていない国々での洪水モデリングなど、応用することができるのです。」

スタンリーは、Aurora は (今後発展していったものも含めて)、あくまで現在の予報システムを補完するものであり、置き換えるものではないと考えています。「(Aurora が)物理学を正しく学んでいるならば、これは異なる気候条件で予測を行うのに十分な堅牢性を持つべきものであることを意味します。Aurora はそういった意味で、初めての試みですが、最後のものではないでしょう」とスタンリーは付け加えました。

関連リンク:

Read more: A foundation model for the Earth system

Listen more: Abstracts: Aurora with Megan Stanley and Wessel Bruinsma

Read more: Project Aurora: The first large scale foundation model of the atmosphere

Read more: Aurora Forecasting: A flexible 3D foundation model of the atmosphere

Read more: From forecasting storms to designing molecules: how new AI foundation models can speed up scientific discovery

Photos from Getty Images, from top to bottom: Frank Ramspott / E+ / onurdongel / E+ / Pavliha / E+ / David Clapp / Stone.

本ページのすべての内容は、作成日時点でのものであり、予告なく変更される場合があります。正式な社内承認や各社との契約締結が必要な場合は、それまでは確定されるものではありません。また、様々な事由・背景により、一部または全部が変更、キャンセル、実現困難となる場合があります。予めご了承下さい。