Microsoft Translator がニューラル ネットワークによる翻訳の提供を開始

Posted by: 榊原 彰
日本マイクロソフト株式会社 執行役員 最高技術責任者

先週開催した開発者向けオンラインイベント Connect(); で発表したとおり、Microsoft Translator は、最先端のニューラル ネットワークを利用することにより、すべての音声翻訳の品質を向上させています。

Skype Translator、Office、Bing翻訳 など、同サービスを利用するすべてのアプリでこの新しいテクノロジが活用されるだけでなく、開発者もエンド ユーザーも使い慣れたアプリやサービスで、テストしたり使用したりできるようになります。

Microsoft Translator Speech API でサポートされる 9 言語 (アラビア語、中国語 (北京語)、英語、フランス語、ドイツ語、イタリア語、ブラジル ポルトガル語、ロシア語、スペイン語) に加えて、ニューラル ネットワークを利用した日本語テキストの翻訳も可能になります(注)。これらの主要 10 言語が Microsoft Translator によって毎日行われている翻訳の 80% 以上を占めています。
(注)Speech APIの日本語サポートは近日中を予定しています。

この数年間、ニューラル ネットワーク テクノロジは、音声や画像の処理など、人工知能の新たな活用事例で多数採用されてきました。これらの機能の多くは、Microsoft Cognitive Services を通じて提供されています。ニューラル ネットワークは機械翻訳業界でも活用されつつあり、既存の業界標準の統計的機械翻訳 (SMT) テクノロジよりもはるかに高い翻訳品質を実現しています。ニューラル ネットワークによる翻訳では、そのしくみに基づき、文章を翻訳する前に全文の文脈をより適切に捉えることで、従来よりもはるかに品質が高い、より自然な翻訳を実現しています。

microsoft translator 01

マイクロソフトの音声翻訳やテキスト翻訳におけるニューラル ネットワークの活用はまだ初期段階にありますが、生成される翻訳の質は、既に SMT を超えています。マイクロソフトでは、この段階 (いわゆる S 字カーブの成長期) にあるその他の新しいテクノロジと同様に、現在のニューラル ネットワークによる品質向上は将来の大幅な品質向上に向けた第一歩に過ぎないものと考えています。ニューラル ネットワークを利用した翻訳の詳細については、こちら を参照してください。

スーパーコンピューター化するマイクロソフトの AI と 深層学習構築・実行フレームワークであるMicrosoft Cognitive Toolkit の規模および能力を活用することで、担当チームは 10 言語もの同時リリースを実現することができました。特に、複雑な構造を持つ日本語においては、ニューラルネットワークによる翻訳を実現したことで、品質を大幅に向上することができました。その他の言語についても、ニューラル ネットワークによる翻訳の品質が SMT モデルの翻訳品質を上回った時点でサポートされます。
これらの言語については既にサービスが提供されており、各国語に翻訳された Windows デスクトップ用 Skype 通話、Windows 10 用 Skype プレビュー アプリ、iOS および Android 用 Microsoft Translator アプリの会話機能のエンド ユーザーが使用できます。

microsoft translator 02

エンド ユーザーは、http://translator.microsoft.com/neuralで翻訳をテストし、品質が向上したこれらの新しいニューラル ネットワーク モデルを直接試して、生成された 2 つの訳文を比較することもできます。

さらに、Microsoft Translator API の開発者および企業のお客様のために、Azure ポータル上でのMicrosoft Translator の提供を開始すると同時に、これらの新しいモデルの本番環境への展開が実施されます。Azure のサブスクリプションを使用して Microsoft Translator を使い始めるには、こちらをクリックしてください。既に Microsoft Translator にサブスクライブ済みであり、Azure にサブスクリプションを移行する方法について知りたい場合は、こちらをクリックしてください(英語)。また、こちらのショート ビデオで、Microsoft Translator API に関する詳細、新しい Swagger ドキュメントの使用方法、サービスのサインアップ方法、およびアプリケーションまたはワークフローへの API の追加方法について知ることができます。

ニューラル ネットワークによる翻訳は、音声 API およびテキスト API を使用する開発者が使用できます。

  • 本日より、音声 API 呼び出しでは、すべてニューラル ネットワークが利用されます。
  • テキスト API 呼び出しでは、標準カテゴリー (標準カテゴリーの詳細についてはこちらを参照してください:英語)「generalnn」を使用し、サポートされている 10 言語の任意の組み合わせを使用することで、ニューラル ネットワークを利用できるようになります。

詳細情報:

本ページのすべての内容は、作成日時点でのものであり、予告なく変更される場合があります。正式な社内承認や各社との契約締結が必要な場合は、それまでは確定されるものではありません。また、様々な事由・背景により、一部または全部が変更、キャンセル、実現困難となる場合があります。予めご了承下さい。

Tags:

関連記事