Microsoft Translator 让全世界听懂彼此

设想一个没有语言隔阂的世界——未来大学生使用翻译软件就可以流畅阅读外文论文;科技博客用翻译软件来实时翻译硅谷资讯;我们出国旅游只要使用手机中的翻译 APP,就能和当地居民进行无障碍交流;甚至当我们拿起电话与国际友人交流,只需要说出我们自己的母语,电话通过内在的语义识别功能和机器翻译技术,就能完成实时翻译……这样的未来,离我们还有多远?

其实,它已经近在咫尺。微软的翻译服务 Microsoft Translator,就是这样一个旨在消除人们交流语言障碍的人工智能工具,帮助全球各地的人们跨越语言的障碍,实现高效沟通与广泛协作。

Microsoft Translator:全面消除面对面交流的语言障碍

Microsoft Translator 是微软以机器学习、大数据、自然语言和云计算等前沿技术为基础打造的自动翻译服务,也是微软众多人工智能研究成果中投入使用最早也最广泛的应用之一。Microsoft Translator 提供了丰富多样的使用场景,解决了用户在面对面时由于语言不通而导致交流不畅的痛点。例如帮助身处异国的旅行者更方便地与酒店前台、出租车司机和博物馆导游等进行交流;在国际会议上帮助来自不同国家的与会者聆听演讲和进行学术讨论,教师也可借助该项技术与只会说其他语言的学生家长进行沟通。目前,Microsoft Translator 已经能够支持 60 多种语言的文本翻译、9 种语言的实时语音翻译和 18 种语言的语音识别和输出。最近,微软还宣布其研发的机器翻译系统在通用新闻报道测试集的中-英测试集上,已经达到了可与人工翻译媲美的水平,并成为了首个在新闻报道的翻译质量和准确率上可以比肩人工翻译的翻译系统。

众所周知,机器翻译技术涉及计算机、认知科学、语言学等学科,一直被科学界公认为是人工智能领域最难的课题之一。过去的几十年,受限于技术方法,计算力和训练数据等原因,一直未能有有效的突破口。近年来,人工智能技术的不断发展,让自然语言处理和语义分析技术,乃至深层网络技术都取得了长足的进步,而 Microsoft Translator 则正是基于这些人工智能领域的前沿技术,为用户提供优异的翻译服务,进而弥合人与人之间的沟通障碍。

早期,基于“统计机器翻译”技术,Microsoft Translator 就将“翻译”转变成了一个机器学习的课题,让计算机不断地对训练数据中的人工译文和语言转换结果进行判断与学习,在不断的纠错与改正中,促进系统算法的自我完善与优化。同时,Microsoft Translator 还能通过统计建模技术和高效的算法,不断学习优化的机器翻译系统能学会根据上下文的语境,而不是单词的意思和生硬的语法规则来匹配最恰当的翻译结果。

随着人工智能技术的不断发展,深度神经网络技术在过去的几年已经开始使用在许多人工智能领域, 而 Microsoft Translator 所有的翻译服务也已全部使用了最先进的深层神经网络技术。神经机器翻译,简言之就是对源语言的句子进行编码,转化为计算机可以“读懂”的形式,然后通过一个解码的过程输出译文。

此外,Microsoft Translator 背后的微软机器翻译系统,不仅应用了最新的神经网络技术,还加入了自己独有的技术。首先,它借鉴了人类在翻译的思维方式,并且应用了对偶学习(Dual Learning)。对偶学习能够保证翻译的一致性在中翻英、英翻中的过程中做到联合优化。其次,推敲网络(Deliberation Networks),当机器翻译完成翻译后,为了让其做的更好,研究人员使用推敲网络让机器不断推敲,不断修改,把翻译完的结果再输入,再全盘考虑,做到不断优化。第三,一致性规范(Agreement Regularization)。让翻译可以从左到右进行,也可以从右到左进行,最终让两个过程生成一致的翻译结果。

目前,在 Microsoft Translator 中已有 21 种语言应用了神经网络翻译,相比传统统计机器翻译,神经网络机器翻译在翻译质量上针对不同语言有着 6%至 43%不等的提升。借助深层神经网络,以及对数千小时不同语言的音频数据进行分析和学习,Microsoft Translator 已经可以“听懂”人类的自然语音,比如,去掉“嗯”、“啊”、“这个”、“那个”之类的赘词以及重复、口吃等语病,并添加断句、标点符号,从而让文本更贴近用户本来的意图,也更易阅读和翻译。

而在文本翻译基础上增强的语音翻译引擎,Microsoft Translator 还增加了更多口语文本语料库,从而为口语会话类翻译构建了更好的模型。而在文本到语音的转换过程,如果翻译的目标语言是 Microsoft Translator 目前所支持的 18 种转换语言之一,那么 Microsoft Translator 就能使用语音合成技术将翻译后的文本转换成语音播放出来。整个语音翻译过程中,深层神经网络技术的引入,极大程度的让 Microsoft Translator 更好的获取和理解上下文及完整句子,降低了翻译的错误率,提高了可靠性,从而输出更高质量和更自然的翻译结果。

如果说,Microsoft Translator 的智能来自于机器学习、深层神经网络、自然语言语义等技术,那么它的可靠运行与不断优化,则离不开微软在各领域的资源优势。例如,作为一项云服务,Microsoft Translator 运行于 Microsoft Azure 云平台,Azure 提供了机器学习等高级分析功能的运行平台,同时也确保了其作为 SaaS 云服务的高可用性和数据安全性,并且它还可以根据需要弹性扩展运算规模。另一方面,覆盖全球的必应搜索引擎,也为 Microsoft Translator 提供了全球规模的语言素材与学习资料,让机器学习系统得以不断地成长和完善。而微软旗下多样化的产品与服务,也为 Microsoft Translator 提供了施展才华的广阔天地。从 2006 年起,Microsoft Translator 便逐渐开始为越来越多的微软产品提供自动文本翻译功能,例如 Office、必应搜索、IE 和 Edge 浏览器、Skype、微软小娜(Cortana)等等。

向业界开放提供多种翻译服务 成为用户的多国语言实时翻译官

早在 2014 年,Microsoft Translator 就推出了语音翻译服务,2016 年 3 月又面向开发者开放了语音翻译的 API。目前,Microsoft Translator 支持对包括中文普通话在内的9种语言的实时语音翻译。在 Skype Translator 以及 Windows、iOS 或者 Android 版的 Microsoft Translator应用中,甚至在日常使用的 PowerPoint 中,用户都可以体验到这项私人实时口译服务。

在 2018 微软人工智能大会的现场,微软全球执行副总裁、微软人工智能及微软研究事业部负责人沈向洋博士接待了一位特殊的来宾——来自南京理工大学的硕士研究生宋昊旻。宋昊旻在一岁时失去了听力,被医生判定终生都会是聋哑人,坚强的昊旻在妈妈的支持下,坚持训练出发声能力,并成功考上了南京理工大学的本科和硕士研究生。在会议现场,昊旻在微软语音服务的帮助下,与沈向洋进行了顺畅的对话沟通。根据昊旻声音定制的语音识别模型能够以极高的准确度、近乎实时地将他略显吃力的语音转换为更加流畅的普通话,还能同步翻译成英语或其它语种,真正实现无障碍沟通。在大会现场,宋昊旻满含热泪激动地表示:“这些技术真的改变了我们的生活,让我们与这个世界的联系更多更广了,也变得更加自信了!”其实,微软已经让 Microsoft Translator 就走进了大学课堂,让听障学生帮助紧跟老师课堂的节奏、尽快掌握知识。在美国罗切斯特理工学院一堂普通的生物课上,除了有站在讲台上授课的教授,旁边还有负责将教授上课内容翻译为手语的翻译员,以及在课堂大屏幕上显示的实时字幕。坐在台下上课的有不少是有听力障碍的学生。罗切斯特理工学院有大约 1500 名听力存在障碍的学生,而其中的大约 700 名学生会和健听学生一起上课,他们通过综合利用手语翻译员和实时字幕中的信息来掌握课堂知识。而让课堂内容实时以字幕形式呈现的就是来自微软的 Microsoft Translator,该系统利用自动语音识别功能将教授原始用口语讲解的内容转化为流畅的、含标点符号的文字。

再如,Microsoft Translator 的现场翻译功能(Live Feature),就借助智能手机、平板电脑和个人计算机等设备为多人、多语言、面对面交谈提供现场翻译。其不但支持众多语言的翻译功能,而且还可以提供离线翻译选项。用户既可以用键盘输入或者粘贴文本,也可以利用麦克风直接录入语音,或者是将看到的外国文字拍摄下来,让软件自动识别并翻译。在最新版本中,Microsoft Translator 还加入了支持9种语言的实时语音翻译功能,让语言不通的两个人,仅凭一部手机就能进行面对面的实时语音交流。

在今年的微软全球开发者大会上,微软还展示了这项人工智能翻译服务在会议室中的应用。演示中,智能会议室搭配了360度全景摄像头和阵列麦克风,它们可以帮助会议组织者确定参加会议都有什么人,这些智能设备可以用不同的语言跟参会者打招呼,也能非常准确地复述他们所说的话,实现不同国家不同语言的无缝交流。微软多年以来都致力于翻译服务,也正是这些日积月累的研发,这项功能最终将会在这套智能会议室解决方案中扮演重要的角色。

此外,Microsoft Translator 移动端应用绝对是海外旅行必备的利器,它不但可以帮助海外旅行者问路,还能靠拍照辨认街道、商铺和没有图片的菜单,甚至可以让旅行者和五湖四海的新朋友进行一次真正有意义的谈话,每个人只需在各自的智能设备上打开 Microsoft Translator 应用程序,扫描二维码并进入聊天界面,即可开始交流,真正体会到四海一家的畅快沟通。

而“海淘”则是 Microsoft Translator 的另一个用武之地。基于 Microsoft Translator 技术的必应翻译提供了在线文本翻译和网站翻译功能,用户只需输入海淘网址,就能实现整个网页的机器翻译,这项功能同样支持 50 多种语言,让你的海外购物无障碍。

与此同时,Microsoft Translator 针对 PowerPoint 的 Presentation Translator 插件功能还能在幻灯片播放的过程中实时地显示翻译字幕,其支持包括中文普通话在内的 10 种语言的语音输入,并可翻译成 60 多种语言的文本字幕。不仅如此,在演讲中,观众们还可以通过 Microsoft Translator APP 加入会议,在智能手机、平板设备或电脑上看到各自选定的语言字幕。同时,Presentation Translator 功能还能将演讲者或老师的口语转化为实时字幕,并将翻译的文字结果保存在手机中,帮助听障碍人士理解演讲或讲课内容,更加轻松、高效地学习及参与讨论。

现在,Microsoft Translator 也更多的出现在了我们周围的产品之中。去年微软就与华为合作,首先在具有 AI 芯片的 Mate 10 手机上实现了 AI 驱动型离线翻译功能。而这一功能现在扩展到所有安卓、iOS 和亚马逊 Fire 设备。近日,搭载微软AI翻译系统的“AI 翻译机”也已经在国内的小米有品首发上架,不仅内置了来自微软的人工智能翻译引擎,还整合了微软语音、自然语言理解和机器翻译三大模块。在翻译过程中,可以将结果译回原文多次比对并进行学习优化,从而使翻译结果更加准确。而在我们最熟悉的微信中也有 Microsoft Translator 的身影。我们只需在对话界面中,长按对话气泡内出现的法语、日语或者阿拉伯语等文本,选择“翻译”,就会出现 Microsoft Translator 给你带来的中文译文。

未来,机器翻译技术的发展虽然面对着很多不同的挑战,但也会在前行的道路上解决迁移学习、通用领域学习、自适应等不同的难题,从而实现贴合用户的个性化对话定制等功能。Microsoft Translator 凝聚了微软研究院 20 多年自然语言处理领域的研究成果,汇集了机器学习、大数据、 语言学、云计算等几种前沿技术。目前全球已有数千间企业在使用微软自动翻译技术,提高业务效率和服务质量。

欢迎于各大应用商店搜索“微软翻译”或“Microsoft Translator”下载体验支持多人、多语言、跨设备的现场翻译功能的 Microsoft Translator 服务,即刻开启交流畅通无阻的全新世界吧!

相关文章