Por John Roach //
Para James Simmonds-Read, superar a barreira do idioma é essencial. Ele trabalha na The Children’s Society, em Londres, com imigrantes e refugiados, a maioria composta por jovens que foram vítimas de tráfico humano.
“Todos eles buscam asilo e uma grande parte tem problemas com a linguagem”, ele explica. “Frequentemente, precisamos usar tradutores.”
Há desafios especiais nisso, pois esses jovens precisam informar dados sensíveis para terceiros, os intérpretes.
Recentemente, a The Children’s Society encontrou uma solução melhor. Eles começaram a usar o recurso de tradução ao vivo do Microsoft Translator, uma nova ferramenta disponível em prévia que proporciona tradução ao vivo e em pessoa por meio de smartphones, tablets e computadores pessoais conectados. Esse recurso foi apresentado durante o evento Microsoft AI, em São Francisco.
Essa tecnologia, esclarece Simmonds-Read, permite que o pessoal da The Children’s Society se comunique diretamente com esses jovens sem a necessidade de intérpretes.
A tecnologia de tradução em pessoa utilizando máquinas, desenvolvida pela equipe de tradução por máquinas do laboratório de pesquisas da Microsoft em Redmond, Washington, também pode facilitar a comunicação de turistas em países estrangeiros que precisam falar com recepcionistas de hotel, taxistas e guias de museus. Professores podem utilizá-la para se comunicar com pais de estudantes que falam línguas diferentes em casa.
Durante o projeto piloto em Nova York, a tecnologia ajudou não-falantes da língua inglesa a se candidatar a cartões de identificação emitidos pelo estado.
“No fim, nosso objetivo é quebrar a barreira da linguagem”, afirma Olivier Fontana, o diretor de estratégia de produto para o Microsoft Translator.
A tecnologia é aplicável para conversas um a um como no caso de um viajante pedindo informações, interações um para muitos como um guia de viagem falando para um grupo de turistas e comunicação muitos para muitos como em experiências de imigrantes em grupos de apoio.
O recurso é construído com a mesma tecnologia de tradução de fala do Microsoft Translator que alimenta o Skype Translator, um serviço que permite que as pessoas se comuniquem em tempo real pela internet ao falar idiomas diferentes.
O Skype Translator funciona bem para pessoas separadas pela geografia assim como pela barreira da linguagem, “mas não atendem necessidades cara a cara”, afirma Arul Menezes, gerente geral da Microsoft AI e da equipe de pesquisa de tradução por máquina.
Comunicação cara a cara para além das barreiras da linguagem, ele e seus colegas determinaram, requer uma tecnologia que lembra o conceito do tradutor universal popularizado pela série Star Trek e outros trabalhos de ficção científica.
Em vez de requerer um hardware dedicado à tradução, a equipe decidiu utilizar os dispositivos móveis que já possuem ampla circulação.
“Quase todo mundo tem um smartphone”, afirma Tanvi Surti, um gerente de programas da equipe do Microsoft Translator que está liderando o desenvolvimento dos recursos ao vivo do Microsoft Translator.
A equipe projetou a tecnologia para se integrar com o app Microsoft Translator que já existe, assim como no site.
“Investimos muito tempo pensando sobre a experiência de configuração”, ressaltou Surti. “Vamos dizer que você e eu falamos linguagens diferentes, e como podemos nos conectar rapidamente sem gastar muito tempo pensando em como realizar a conexão e passar mais tempo na conversa.”
Para começar, um usuário inscreve-se no serviço pelo app ou pelo site, seleciona sua língua e começa uma nova conversa. O processo gera um código e um QR code que outros participantes entram ou escaneiam com seus dispositivos, que definem a linguagem que quiserem.
A partir daí, a conversa acontece.
O usuário pressiona a barra de espaço no teclado ou um botão na tela ao falar. Segundos depois, o texto traduzido do que foi falado aparece nas telas dos dispositivos dos outros participantes – em suas línguas nativas. Para alguns idiomas, a tradução em áudio também está disponível.
Como a maioria das tecnologias de ponta, ainda não está perfeita.
“A qualidade é perfeita? Não. A configuração é totalmente simples? Não. Mas, de verdade, uma vez feita a configuração, você tem a experiência de um tradutor universal entre pessoas que falam múltiplas línguas”, afirma Fontana.
Redes neurais profundas
A tecnologia de tradução por máquinas em si é potencializada por algoritmos rodando na nuvem, utilizando traduções baseadas em redes neurais profundas, que oferecem traduções mais fluidas, que soam mais como a fala natural humana, que a tecnologia conhecida como tradução estatística de máquinas que a precede.
Ambos os métodos envolvem o treinamento de algoritmos nos textos de documentos previamente traduzidos por profissionais, de forma que o sistema possa aprender como palavras e frases em uma linguagem são representadas em outra linguagem. O método estatístico, no entanto, é limitado a traduzir uma palavra no contexto de uma ou duas palavras próximas, que pode levar a traduções truncadas ou empoladas.
Redes neurais são inspiradas pelas teorias sobre como o processo de reconhecimento de padrões que ocorre no cérebro de pessoas multilíngues funciona, levando a traduções que soem mais naturais.
No mundo não-neural, por exemplo, as palavras “gato” e “gatos” são tratadas como entidades distintas. Cérebros humanos – e redes neurais – veem as palavras relacionadas. Essas redes também podem analisar a distinção entre Rosa – como a flor ou o nome da garota.
“Em vez da palavra ser coisas, ela é representada por um vetor de 500 dimensões ou, basicamente, um conjunto de 500 números e cada um desses números captura algum aspecto da palavra”, explica Menezes.
Para criar uma tradução, redes neurais modelam o significado de cada palavra no contexto da sentença completa em um vetor de mil dimensões, quer a sentença tenha 5 ou 20 palavras, antes da tradução começar. Esse vetor – e não as palavras – é traduzido em outra linguagem.
E o melhor é que a qualidade das traduções melhora com a experiência, ressalta Fontana, que espera ver o Microsoft Translator adotado por uma grande parcela de usuários, incluindo viajantes, guias de turismo, professores e assistentes sociais.
Simmons-Read e a The Children’s Society afirmam que já veem múltiplos usos para a tecnologia, incluindo viagens com imigrantes e refugiados não-falantes do inglês até reuniões com funcionários do governo e potenciais empregadores.
“As pessoas ficam mais isoladas quando mal podem se comunicar”, afirma.
John Roach escreve sobre pesquisa e inovação na Microsoft.
Fotos: Dan DeLong