微軟亞洲研究院於 2019 年 WMT 國際機器翻譯大賽勇奪八項冠軍

MSRA WMT

微軟亞洲研究院參與共 11 項機器翻譯任務挑戰

2019 5 21 日,香港 微軟亞洲研究院日前在國際享負盛名的機器翻譯比賽 WMT19(2019 Fourth Conference on Machine Translation)上取得一共 8 項機器翻譯挑戰的冠軍殊榮。今年, WMT 共設有 19 項機器翻譯類別,而微軟亞洲研究院參與了其中 11 項的機器翻譯挑戰。

微軟亞洲研究院奪得冠軍的 8 項翻譯挑戰為:中文-英語、英語-芬蘭語、英語 – 德語、英語 – 立陶宛語、法語 – 德語、德語 – 英語、德語 – 法語,和俄語 – 英語。此外,微軟亞洲研究院亦在另外 3 項挑戰中獲得第二名成績,包括:英語 – 哈薩克語、芬蘭語 – 英語、及立陶宛語 – 英語。

作為全球領先的機器翻譯比賽之一,WMT 是頂尖研究者展示其解決方案及了解機器翻譯技術持續發展的平台。2019 年第 14 屆 WMT 機器翻譯比賽吸引了全球超過 50 支隊伍參與,當中包括科技公司、領先學術機構及大學,務求一展他們機器翻譯的實力。

今年比賽旨在評估目前英語以外語言的機器翻譯技術,以及檢視翻譯歐洲語言所面臨的挑戰,例如較少資源和形態豐富的語言等。

改善多維算法達致更好的機器翻譯結果

微軟亞洲研究院副院長劉鐵岩指出:「今年,微軟亞洲研究院團隊在系統上運用創新算法,以顯著提升機器翻譯結果的質素。這些創新算法改善了平台的各方面,包括學習機制、預先訓練、優化網絡架構、數據增強等,令系統表現更佳。」

是次使用的創新算法包括:

  • 多體對偶學習(Multi-agent Dual Learning, MADL )
  • 屏蔽序列到序列預訓練(Masked sequence to sequence pre-training, MASS)
  • 自動神經網絡架構優化(Automatic neural architecture optimization, NAO)
  • 軟性上下文數據增強(Soft contextual data augmentation, SCA)

這是繼 2018 年微軟亞洲研究院和微軟研究院美國實驗室的研究人員,共同在一個稱為 newstest2017 的常用新聞報導測試集上達致人類翻譯水平後,再次取得重大成就。newstest2017 由業界和學術合作夥伴開發,並於 WMT17 上發布。微軟亞洲研究院和微軟研究院美國實驗室研發的系統,媲美人類翻譯的質素和準確度,將 newstest2017 新聞文章的句子從中文翻譯成英語。

劉鐵岩續指:「機器翻譯領域將繼續演變,並發展出更好的算法、數據集和技術。然而,我們今天大部分研究都是受到人類行事的方法啟發。語言即複雜又精細,人們可使用不同詞語來表達完全相同的概念。因此,開發多維算法對於發展機器翻譯系統非常重要。這樣才可確保機器翻譯能提供更精準的結果。我們在 WMT19 取得的成果將有助這領域的進一步發展,希望機器翻譯能在未來幾年間繼續進步。」

Microsoft Translator 是其中一個結合研究成果的例子。Microsoft Translator 是一種多語言機器翻譯雲端服務,當中結合部分由全球微軟研究團隊開發的解決方案,以提高其準確性。目前,研究團隊亦計劃整合在今年 WMT 挑戰賽上所運用的新算法,以改善其產品。

Microsoft Translator

圖片: Microsoft PowerPoint 內建的 Presentation Translator 利用 Microsoft Translator 提供超過 60 種語言的即時字幕

###

關於Microsoft

Microsoft (Nasdaq “MSFT” @microsoft) 致力於發展智能雲端與智能裝置時代的數碼轉型,其使命是幫助全球每個人和企業成就更多、實現更多。

Related Posts