Por: John Roach.
Microsoft anunció que se han agregado 12 nuevos idiomas y dialectos a Translator. Estas adiciones significan que el servicio ahora puede traducir entre más de 100 idiomas y dialectos, para hacer que la información en texto y documentos sea accesible a 5.66 mil millones de personas en todo el mundo.
«Cien idiomas es un buen hito para que logremos nuestra ambición de que todos puedan comunicarse sin importar del idioma que hablen«, dijo Xuedong Huang, miembro técnico de Microsoft y director de tecnología de Azure AI.
Translator hoy cubre los idiomas más hablados del mundo, incluidos inglés, chino, hindi, árabe y español. En los últimos años, los avances en la tecnología de inteligencia artificial han permitido a la empresa ampliar su biblioteca de idiomas con idiomas en peligro de extinción y de bajos recursos, como el inuktitut, un dialecto del inuktut que hablan unos 40 mil inuit en Canadá.
Los nuevos idiomas y dialectos que llevan a Translator a superar el hito de los 100 idiomas son bashkir, dhivehi, georgiano, kirguís, macedonio, mongol (cirílico), mongol (tradicional), tártaro, tibetano, turcomano, uigur y uzbeko (latín), que en conjunto son hablados de forma nativa por 84.6 millones de personas.
Eliminar las barreras del idioma
Miles de organizaciones han recurrido a Translator para comunicarse con sus miembros, empleados y clientes de todo el mundo. El Grupo Volkswagen, por ejemplo, utiliza la tecnología de traducción automática para atender a sus clientes en más de 60 idiomas. La carga de trabajo implica traducir más de mil millones de palabras cada año. La empresa comenzó con modelos estándar de Translator y utiliza la función personalizada en Translator para ajustar estos modelos con términos específicos de la industria.
La capacidad de las organizaciones para ajustar los modelos de IA entrenados de manera previa a sus necesidades específicas fue fundamental para la visión de Microsoft cuando lanzó Azure Cognitive Services en 2015, según Huang.
Además del lenguaje, Azure Cognitive Services incluye modelos de inteligencia artificial para tareas de habla, visión y toma de decisiones. Estos modelos permiten a las organizaciones aprovechar las capacidades, como la tecnología Computer Vision, conocida como reconocimiento óptico de caracteres (OCR, por sus siglas en inglés). Este servicio extrae el texto ingresado en un formulario en cualquiera de los más de 100 idiomas cubiertos por Translator y utiliza el texto para completar una base de datos.
“No solo celebramos lo que hemos hecho en la traducción, alcanzar los 100 idiomas, sino también en el habla y el OCR”, dijo Huang. «Queremos eliminar las barreras del idioma».
Modelo multilingüe
La frontera de la tecnología de traducción automática en Microsoft es un modelo de inteligencia artificial multilingüe llamado código Z, según Huang. El modelo combina varios idiomas de una familia de idiomas como los idiomas indios hindi, marathi y gujarati. De esta manera, los modelos de idiomas individuales aprenden unos de otros, lo que reduce los requisitos de datos para lograr traducciones de alta calidad. Por ejemplo, la calidad de las traducciones hacia y desde el rumano mejoró cuando el modelo de traducción se entrena junto con datos relacionados en francés, portugués, español e italiano.
«Podemos aprovechar los puntos en común y utilizar esa capacidad de aprendizaje de transferencia compartida para mejorar toda la familia lingüística», dijo Huang.
Los requisitos de datos reducidos también permiten al equipo de Translator construir modelos para idiomas con recursos limitados o que están en peligro debido a la disminución de la población de hablantes nativos. Varios de los idiomas que llevan a Translator por encima del hito de los 100 idiomas son de escasos recursos o están en peligro de extinción.
El código Z, agregó Huang, es parte de una iniciativa más grande para combinar modelos de inteligencia artificial para texto, visión, audio e idioma a fin de habilitar sistemas de inteligencia artificial que puedan hablar, ver, escuchar y comprender y, por lo tanto, aumentar de manera más eficiente las capacidades humanas. La prueba de que esta llamada visión del código XYZ se ha puesto en foco se manifiesta en el despliegue continuo de nuevos lenguajes construidos con tecnología de entrenamiento de modelos multilingües, dijo.
«Esto acerca a la gente», dijo Huang. «Esta es la capacidad que ya está en producción debido a nuestra visión de código XYZ».
Contenido relacionado:
- Conozcan Translator
- Aprendan a crear una traducción personalizada para manejar términos exclusivos de su empresa.
- Obtengan más información sobre el hito de los 100 idiomas de Translator
- Más información sobre el uso de Microsoft Translator por parte del Grupo Volkswagen
- Leer: Una representación holística hacia la IA integradora
- Leer: Inuktitut ahora está disponible en Microsoft Translator
- Leer: La ola de inteligencia artificial avanza a través de las tecnologías de traducción de idiomas de Microsoft
John Roach escribe sobre investigación e innovación en Microsoft. Síganlo en Twitter.