Для Джеймса Симмондса-Рида преодоление языкового барьера – повседневная необходимость. Он работает в Детском обществе в Лондоне с мигрантами и беженцами. В основном это молодые люди, ставшие жертвами торговли людьми.
«Они все ищут политическое убежище, у многих из них есть языковые трудности, – рассказывает он. – Очень часто нам приходится прибегать к услугам переводчиков».
Это сопряжено с определенными сложностями, потому что молодым людям приходится раскрывать личную информацию сторонним переводчикам.
Но недавно сотрудники Детского общества нашли более подходящее решение. Они начали использовать функцию синхронного перевода в Microsoft Translator – новый инструмент, пока работающий в ознакомительном режиме и обеспечивающий перевод речи в процессе беседы в реальном времени с помощью смартфонов, планшетов и персональных компьютеров, подключенных к Интернету. Эта функция была представлена во вторник на мероприятии Microsoft AI в Сан-Франциско.
Симмондс-Рид говорит, что технологии позволяют ему напрямую общаться с молодыми людьми, которым помогает Детское общество, не прибегая к помощи сторонних переводчиков.
Технология машинного перевода при личном общении, разработанная командой машинного перевода исследовательского центра Microsoft в Редмонде, штат Вашингтон, может также помочь путешественникам общаться за рубежом с сотрудниками службы приема в отелях, с водителями такси и экскурсоводами в музеях. Учителя могут использовать их, чтобы вести диалог с родителями учеников, разговаривающими на других языках.
Во время проведения пилотного проекта в Нью-Йорке технология Microsoft помогала людям, не знающим английского, подавать документы на получение государственных удостоверений личности.
«Нашей конечной целью является полное устранение языковых барьеров», – сказал Оливье Фонтана, директор по продуктовой стратегии Microsoft Translator.
Эта технология применима для общения один на один, например, в случае, когда путешественнику нужно узнать информацию у консьержа, для выступления одного человека перед аудиторией, когда гид проводит экскурсию для большой группы туристов, и для разговора многих участников, например, в ситуации, когда иммигранты делятся опытом в группах поддержки.
Универсальный персональный переводчик
Функция построена на той же технологии перевода речи Microsoft Translator, которая используется в Skype Translator – сервисе, позволяющем людям общаться в режиме реального времени через Интернет, даже разговаривая на разных языках.
Skype Translator хорошо подходит для людей, разделенных не только языковым, но и географическим барьером, но «он не подходит для общения лицом к лицу», – говорит Арул Менезес, руководитель группы машинного перевода Microsoft AI and Research.
Вместе со своими коллегами он определил, что в очной коммуникации для преодоления языкового барьера необходима технология, которая наиболее соответствует концепции универсального переводчика, известная нам по «Звездному пути» и другим фантастическим фильмам.
Вместо того чтобы создавать отдельное устройство для перевода, группа решила воспользоваться уже широко распространенными мобильными устройствами.
«Сегодня практически у всех есть смартфоны», – говорит Танви Сурти, программный менеджер команды Microsoft Translator, которая руководит развитием функции синхронного перевода.
Команда приспособила эту технологию для интеграции в существующее приложение Microsoft Translator, а также в отдельный веб-сайт.
«Мы провели много времени, исследуя способы улучшения процесса коммуникации, – отмечает Сурти. – Например, если мы с вами разговариваем на двух разных языках, наша цель – быстро установить контакт, используя время не для отладки процессов, а для непосредственного общения».
Для начала пользователь авторизуется на сервис через приложение или веб-сайт, выбирает свой язык и нажимает кнопку начала нового разговора. Процесс генерирует код, который другие участники беседы могут ввести вручную, и QR-код, который можно отсканировать камерой устройства.
С этого момента начинается разговор.
Тот, кто говорит, зажимает клавишу «Пробел» или экранную кнопку мобильного устройства, так же, как в рации. Через несколько секунд произнесенные им слова появляются на экране устройства второго участника разговора – на его родном языке. Для некоторых языков также доступен синхронный голосовой перевод.
Как и большинство передовых технологий, это решение пока не совершенно.
«Идеально ли качество перевода? Нет. Возникают ли трудности в процессе настройки? Да. Но, тем не менее, после установки вы получите универсального переводчика, облегчающего общение с множеством людей, говорящих на разных языках», – говорит Фонтана.
Глубинные нейронные сети
Технология машинного перевода основана на алгоритмах, работающих в облаке на базе глубинных нейронных сетей. Они обеспечивают намного более беглый и идиоматичный перевод, чем предыдущая технология, известная как «статистический машинный перевод».
Оба метода используют алгоритмы обучения на основе ранее профессионально переведенных документов, так что система может научиться тому, как слова и фразы одного языка представлены в другом языке. Тем не менее, статистический метод ограничивается выбором перевода слова в зависимости от контекста из одного или двух ближайших слов, поэтому получившиеся в результате фразы бывают странными и неестественными.
Концепция нейронных сетей появилась на базе теорий о том, как происходит процесс распознавания образов и элементов речи в сознании людей, говорящих на нескольких языках, в результате чего получается более естественный перевод.
Например, вне нейронного мира слова «кошка» и «кошки» распознаются как независимые единицы. Человеческий мозг, как и нейронные сети, распознает их как два очень близких слова. Сети могут «видеть» разницу, например, между месяцем июнем (June в английском) и женским английским именем Джун (также June в английском).
«Слово в этом случае не является обособленной единицей, оно представлено вектором из 500 направлений или, проще говоря, 500 наборами чисел, каждое из которых отражает какой-то из аспектов этого слова», – объясняет Менезес.
Прежде чем приступить к переводу, нейронные сети моделируют значение каждого слова в контексте всего предложения по вектору из 1000 направлений, неважно, пять или 20 слов в этом предложении. Эта модель из 1000 направлений, а не отдельные слова, уже переводится на другой язык.
Более того, Фонтана уточняет, что качество перевода улучшается по мере использования сервиса; он надеется, что Microsoft Translator обретет популярность у широкого круга пользователей, включая путешественников, экскурсоводов, учителей и социальных работников.
Симмондс-Рид из Детского общества говорит, что они с коллегами уже нашли несколько вариантов применения технологии, включая поездки с мигрантами и беженцами, не говорящими по-английски, на встречи с представителями государственной власти и потенциальными работодателями.
«Люди оказываются в изоляции, если не могут общаться», – говорит он.
Оригинальный текст статьи можно прочитать здесь.