Azure AI により、企業が 100 種以上の言語でユーザーにサービスを提供可能に

2 人の男性がウズベキスタンのフェルガナ地方にある伝統的な茶室「チャイカーナ」でお茶を飲んでいます。
ウズベキスタンの公用語であるウズベク語は、Translator で利用可能な言語・方言の一つです。この画像では、2 人の男性がウズベキスタンのフェルガナ地方にある伝統的な茶室「チャイカーナ」でお茶を飲んでいます。写真提供: Getty Images

ジョン ローチ (John Roach)

※ 本ブログは、米国時間 10 月 11 日に公開された “Azure AI empowers organizations to serve users in more than 100 languages” の抄訳を基に掲載しています。

本日、マイクロソフトは Translator に新たに 12 の言語と方言を追加したことを発表しました。これにより、100 種以上の言語と方言間での翻訳が可能となり、世界の 56 億 6 千万人の人々がテキストや文書による情報にアクセスできるようになりました。

話す言語に関係なくすべての人がコミュニケーションできるようにするというマイクロソフトの強い願いを達成する上で 100 言語は良いマイルストーンです」とマイクロソフトのテクニカルフェロー兼 Azure AI チーフテクノロジオフィサーのゼドン ファン (Xuedong Huang) は述べています。

現在、Translator は、英語、中国語、ヒンディー語、アラビア語、スペイン語など、世界で最も話されている言語をカバーしています。最近になり、AI テクノロジの進歩により、カナダの約 4 万人のイヌイットが使っているイヌクティトゥット語 (イヌクトゥット語の方言) など、情報量の少ない言語や絶滅が危惧される言語のライブラリーも増やしています。

新たに 100 言語を超える結果をもたらした追加言語は、バシキール語、ディベヒ語、グルジア語、キルギス語、マケドニア語、モンゴル語 (キリル文字)、モンゴル語 (繁体字)、タタール語、チベット語、トルクメン語、ウイグル語、ウズベク語 (ラテン) であり、これらの言語は合計 8,460 万の人々に母国語として使用されています。

言葉の壁をなくす

何千もの組織が、世界中のメンバー、従業員、顧客とのコミュニケーションに Translator を利用しています。たとえば、Volkswagen Group は機械翻訳の技術を使って、60 以上の言語で顧客にサービスを提供しており、年間で 10 億語以上を翻訳しています。同社では、まず Translator の標準的なモデルを作成し、Translator のカスタム機能を使って、業界特有の用語にモデルを微調整しています。

ファンによれば、2015 年に Azure Cognitive Services を提供開始した時に、すでにマイクロソフトのビジョンの中核には、企業が事前に学習させた AI モデルが自社の特定ニーズに合わせて微調整できる機能がありました。

Azure Cognitive Services には、言語に加えて、音声、画像、意思決定タスク用の AI モデルが含まれています。これらのモデルにより、企業は OCR (光学式文字認識) などの Computer Vision のテクノロジを活用できます。このサービスは、Translator がカバーする 100 種以上の言語のフォームに入力されたテキストを抽出し、そのテキストを使ってデータベースに入力するものです。

「100 言語のサポートに到達した翻訳に加えて、音声処理や OCR についても、言語の壁を取り除きたいと考えています」とファンは述べています。

モンゴルのバヤンホンゴル県で行われた伝統的なナーダム祭りで、女性が馬を走らせている様子を捉えた写真です。
モンゴル語 (キリル文字) とモンゴル語 (繁体字) は、Translator で利用可能な言語・方言のひとつです。モンゴルのバヤンホンゴル県で行われた伝統的なナーダム祭りで、女性が馬を走らせている様子を捉えた写真です。写真提供: Getty Images

多言語モデル

ファンによると、マイクロソフトにおける機械翻訳技術の最前線にあるのは Z-code と呼ばれる多言語 AI モデルです。このモデルは、インドのヒンディー語、マラーティー語、グジャラート語といった言語ファミリーから複数の言語を組み合わせたものです。こうすることで、個々の言語モデルが相互に学習でき、高品質な翻訳を実現するために必要なデータ量を減らすことができます。たとえば、ルーマニア語の翻訳において、関連するフランス語、ポルトガル語、スペイン語、イタリア語の翻訳モデルをグループ化することで品質を向上できました。

「共通点を活用し、その共有された伝達学習能力を使って、言語ファミリー全体を改善することができます」とファンは述べています。

また、必要なデータ量が少なくなったことで、Translator チームは、情報量が限られた言語や、ネイティブスピーカーの人口が減少して絶滅の危機に瀕している言語のモデルを構築することができるようになりました。Translator のサポート言語数 100 を達成させた言語の中には、リソースの少ない言語や絶滅の危機に瀕している言語もあります。

Z-code は、テキスト、画像、音声、言語の AI モデルを組み合わせることで、話す、見る、聞く、理解することができる AI システムを実現し、人間の能力をより効率的に強化するという広範な取り組みの一環であると、ファンは付け加えました。この XYZ-code ビジョンとでも言うべきビジョンが実現されつつある証拠として、多言語モデルの訓練テクノロジで作られた新しい言語が続々と登場しています。

「これにより人々の間の距離を縮めることができます。XYZ-code のビジョンによってすでにこの能力が実用化されています」とファンは述べています。

本ページのすべての内容は、作成日時点でのものであり、予告なく変更される場合があります。正式な社内承認や各社との契約締結が必要な場合は、それまでは確定されるものではありません。また、様々な事由・背景により、一部または全部が変更、キャンセル、実現困難となる場合があります。予めご了承下さい。

Tags: ,

関連記事