微軟亞洲研究院(MSRA)在WMT 2019國際機器翻譯大賽中屢屢摘冠

12345

MSRA微軟亞洲研究院參加11 項機器翻譯任務挑戰 勇奪8項第一

微軟亞洲研究院(MSRA)在2019年第四屆機器翻譯大會(WMT19)中參加了 11 項機器翻譯任務,其中有8項摘下冠軍寶座。今年WMT總共設有19項機器翻譯類別。

MSRA在語言組合中文-英語、英語 – 芬蘭語、英語 – 德語、英語 – 立陶宛語、法語 – 德語、德語 – 英語、德語 – 法語和俄語 – 英語的機器翻譯任務中獲得第一名。其餘三項任務中獲得第二,包括:英語 – 哈薩克語、芬蘭語 – 英語和立陶宛語 – 英語。

作為全球領先的機器翻譯比賽之一,WMT是頂尖研究者展示其解決方案及了解機器翻譯技術持續發展的平台。全球超過50支隊伍參加了2019年第 14屆WMT機器翻譯比賽,包括科技公司、具領導地位的學術機構及大學,以展現自身的機器翻譯實力。

今年,主辦單位旨在評估目前英語以外語言的機器翻譯技術,以及檢視歐洲語言之間所面臨的挑戰,包括資源稀少和詞彙豐富的語言。

 改善多維算法以獲得更好的機器翻譯結果

「今年,MSRA團隊在系統中運用創新的算法,並顯著改善了機器翻譯結果的素質。這些算法用於改進平台的學習機制、預訓練、網絡架構優化、數據增強等方面,提升了機器翻譯結果的質量,」MSRA副院長劉鐵岩指出。

此次使用的創新算法包括:

  • MADL:多體對偶學習
  • MASS:屏蔽序列到序列的預訓練
  • NAO:自動神經網絡架構優化
  • SCA:軟性上下文數據增強

這是繼2018年MSRA和微軟研究院美國實驗室的研究人員在一個稱為newstest 2017的常用新聞報導測試集上實現了人類翻譯的水平後,又迎來一次重大成就 。newstest 2017由業界和學術合作夥伴開發,並在WMT17上發布。系統能夠利用與人類翻譯相同的素質和準確度,將新聞文章的句子從中文翻譯成英語。

劉鐵岩副院長表示:「機器翻譯領域將繼續演變,並產生更好的算法、數據集和技術。然而,我們今天大部分研究都是受到人類行事的方法啟發。語言即複雜又精細,人們藉由使用不同的詞語來表達完全相同的概念。因此,開發多維算法對於發展機器翻譯系統非常重要,如此一來才能確保機器翻譯能提供更精準的結果。我們在WMT19的成就有助於領域進一步發展,我們希望機器翻譯能在未來幾年間變得更好。」

Microsoft Translator 是一種多語言機器翻譯雲端服務,已結合了全球微軟研究團隊開發的部分先前解決方案,以提高其準確性。目前,研究團隊計劃整合今年WMT挑戰賽中所運用的新算法,以改善其產品。

12345

Tags:

相關文章