Microsoft Translator устраняет языковой барьер в межличностном общении

Для Джеймса Симмондса-Рида преодоление языкового барьера – повседневная необходимость. Он работает в Детском обществе в Лондоне с мигрантами и беженцами. В основном это молодые люди, ставшие жертвами торговли людьми.

«Они все ищут политическое убежище, у многих из них есть языковые трудности, – рассказывает он. – Очень часто нам приходится прибегать к услугам переводчиков».

Это сопряжено с определенными сложностями, потому что молодым людям приходится раскрывать личную информацию сторонним переводчикам.

Но недавно сотрудники Детского общества нашли более подходящее решение. Они начали использовать функцию синхронного перевода в Microsoft Translator –  новый инструмент, пока работающий в ознакомительном режиме и обеспечивающий перевод речи в процессе беседы в реальном времени с помощью смартфонов, планшетов и персональных компьютеров, подключенных к Интернету. Эта функция была представлена во вторник на мероприятии Microsoft AI в Сан-Франциско.

Симмондс-Рид говорит, что технологии позволяют ему напрямую общаться с молодыми людьми, которым помогает Детское общество, не прибегая к помощи сторонних переводчиков.

Технология машинного перевода при личном общении, разработанная командой машинного перевода исследовательского центра Microsoft в Редмонде, штат Вашингтон, может также помочь путешественникам общаться за рубежом с сотрудниками службы приема в отелях, с водителями такси и экскурсоводами в музеях. Учителя могут использовать их, чтобы вести диалог с родителями учеников, разговаривающими на других языках.

Во время проведения пилотного проекта в Нью-Йорке технология Microsoft помогала людям, не знающим английского, подавать документы на получение государственных удостоверений личности.

«Нашей конечной целью является полное устранение языковых барьеров», – сказал Оливье Фонтана, директор по продуктовой стратегии Microsoft Translator.

Эта технология применима для общения один на один, например, в случае, когда путешественнику нужно узнать информацию у консьержа, для выступления одного человека перед аудиторией, когда гид проводит экскурсию для большой группы туристов, и для разговора многих участников, например, в ситуации, когда иммигранты делятся опытом в группах поддержки.

Универсальный персональный переводчик

Функция построена на той же технологии перевода речи Microsoft Translator, которая используется в Skype Translator – сервисе, позволяющем людям общаться в режиме реального времени через Интернет, даже разговаривая на разных языках.

Skype Translator хорошо подходит для людей, разделенных не только языковым, но и географическим барьером, но «он не подходит для общения лицом к лицу», – говорит Арул Менезес, руководитель группы машинного перевода Microsoft AI and Research.

Вместе со своими коллегами он определил, что в очной коммуникации для преодоления языкового барьера необходима технология, которая наиболее соответствует концепции универсального переводчика, известная нам по «Звездному пути» и другим фантастическим фильмам.

Вместо того чтобы создавать отдельное устройство для перевода, группа решила воспользоваться уже широко распространенными мобильными устройствами.

Танви Сурти, программный менеджер команды Microsoft Translator. (Photo by Dan DeLong)
Танви Сурти, программный менеджер команды Microsoft Translator. (Photo by Dan DeLong)

«Сегодня практически у всех есть смартфоны», – говорит Танви Сурти, программный менеджер команды Microsoft Translator, которая руководит развитием функции синхронного перевода.

Команда приспособила эту технологию для интеграции в существующее приложение Microsoft Translator, а также в отдельный веб-сайт.

«Мы провели много времени, исследуя способы улучшения процесса коммуникации, – отмечает Сурти. – Например, если мы с вами разговариваем на двух разных языках, наша цель – быстро установить контакт, используя время не для отладки процессов, а для непосредственного общения».

Для начала пользователь авторизуется на сервис через приложение или веб-сайт, выбирает свой язык и нажимает кнопку начала нового разговора. Процесс генерирует код, который другие участники беседы могут ввести вручную, и QR-код, который можно отсканировать камерой устройства.

С этого момента начинается разговор.

Тот, кто говорит, зажимает клавишу «Пробел» или экранную кнопку мобильного устройства, так же, как в рации. Через несколько секунд произнесенные им слова появляются на экране устройства второго участника разговора – на его родном языке. Для некоторых языков также доступен синхронный голосовой перевод.

Как и большинство передовых технологий, это решение пока не совершенно.

«Идеально ли качество перевода? Нет. Возникают ли трудности в процессе настройки? Да. Но, тем не менее, после установки вы получите универсального переводчика, облегчающего общение с множеством людей, говорящих на разных языках», – говорит Фонтана.

Глубинные нейронные сети

Технология машинного перевода основана на алгоритмах, работающих в облаке на базе глубинных нейронных сетей. Они обеспечивают намного более беглый и идиоматичный перевод, чем предыдущая технология, известная как «статистический машинный перевод».

Arul Menezes photographed at Microsoft Building 99 in Redmond, Wash. on November 17, 2016. Photo by Dan DeLong
Арул Менезес, руководитель группы машинного перевода Microsoft AI and Research

Оба метода используют алгоритмы обучения на основе ранее профессионально переведенных документов, так что система может научиться тому, как слова и фразы одного языка представлены в другом языке. Тем не менее, статистический метод ограничивается выбором перевода слова в зависимости от контекста из одного или двух ближайших слов, поэтому получившиеся в результате фразы бывают странными и неестественными.

Концепция нейронных сетей появилась на базе теорий о том, как происходит процесс распознавания образов и элементов речи в сознании людей, говорящих на нескольких языках, в результате чего получается более естественный перевод.

Например, вне нейронного мира слова «кошка» и «кошки» распознаются как независимые единицы. Человеческий мозг, как и нейронные сети, распознает их как два очень близких слова. Сети могут «видеть» разницу, например, между месяцем июнем (June в английском) и женским английским именем Джун (также June в английском).

«Слово в этом случае не является обособленной единицей, оно представлено вектором из 500 направлений или, проще говоря, 500 наборами чисел, каждое из которых отражает какой-то из аспектов этого слова», – объясняет Менезес.

Прежде чем приступить к переводу, нейронные сети моделируют значение каждого слова в контексте всего предложения по вектору из 1000 направлений, неважно, пять или 20 слов в этом предложении. Эта модель из 1000 направлений, а не отдельные слова, уже переводится на другой язык.

Более того, Фонтана уточняет, что качество перевода улучшается по мере использования сервиса; он надеется, что Microsoft Translator обретет популярность у широкого круга пользователей, включая путешественников, экскурсоводов, учителей и социальных работников.

Симмондс-Рид из Детского общества говорит, что они с коллегами уже нашли несколько вариантов применения технологии, включая поездки с мигрантами и беженцами, не говорящими по-английски, на встречи с представителями государственной власти и потенциальными работодателями.

«Люди оказываются в изоляции, если не могут общаться», – говорит он.

Оригинальный текст статьи можно прочитать здесь.

Tags: ,

Связанные посты