Microsoft cria IA que pode ler um documento e responder a perguntas sobre ele tão bem quanto uma pessoa

Pesquisadores da Microsoft criaram uma tecnologia que usa Inteligência Artificial (IA) para ler um documento e responder a perguntas sobre ele tão bem quanto um ser humano.

É um marco importante no esforço de ter mecanismos de busca, como o Bing, e assistentes inteligentes, como a Cortana, interagindo com pessoas e fornecendo informações de um jeito mais natural, mais próximo de como os humanos se comunicam.

Uma equipe da Microsoft Research Asia alcançou o marco da paridade humana usando o conjunto de dados de respostas a perguntas de Stanford, conhecido pelos pesquisadores como SQuAD. É um conjunto de dados de compreensão de leitura de máquina composto de perguntas sobre um grupo de artigos da Wikipédia.

De acordo com a tabela de classificação do SQuAD, em 3 de janeiro a Microsoft apresentou um modelo que atingiu a pontuação de 82.650 em correspondência exata. O desempenho humano no mesmo conjunto de perguntas e respostas é de 82.304. Em 5 de janeiro, pesquisadores da empresa chinesa de comércio eletrônico Alibaba apresentaram uma pontuação de 82.440, também equivalente à de um ser humano.

Atualmente, as duas empresas estão empatadas em primeiro lugar na tabela de classificação do SQuAD, que lista os resultados dos esforços das organizações de pesquisa.

A Microsoft fez um investimento significativo na compreensão da leitura de máquina como parte de seu esforço para criar mais tecnologias com as quais as pessoas possam interagir de maneira simples e intuitiva. Por exemplo, em vez de digitar uma consulta de pesquisa e obter uma lista de links, o mecanismo de pesquisa Bing, da Microsoft, está se movendo na direção dos esforços para fornecer às pessoas respostas mais simples ou com múltiplas fontes de informação sobre um tópico mais complexo ou controverso.

Com a compreensão da leitura de máquina, os pesquisadores dizem que os computadores também poderiam analisar rapidamente as informações encontradas nos livros e documentos e fornecer às pessoas a informação que elas mais precisam de uma forma facilmente compreensível.

Isso permitiria aos motoristas encontrar mais facilmente a resposta que desejam em um denso manual do carro, economizando tempo e esforço em situações tensas ou difíceis.

Essas ferramentas também poderiam permitir que médicos, advogados e outros especialistas passassem mais rapidamente pelo trabalho pesado de coisas como ler documentos extensos para achados médicos específicos ou precedentes legais raros. A tecnologia ajudaria em seu trabalho e os deixaria com mais tempo para aplicar o conhecimento no tratamento de pacientes ou formular opiniões legais.

A Microsoft já está aplicando versões recentes dos modelos que foram enviados para a tabela de classificação do conjunto de dados SQuAD em seu mecanismo de busca Bing e trabalha para aplicá-las a problemas mais complexos.

Por exemplo, a Microsoft trabalha em maneiras de um computador responder não apenas a uma pergunta original, mas também a um acompanhamento. Digamos que você perguntou a um sistema: “Em que ano nasceu a Primeira Ministra da Alemanha?”. Você pode querer que ele também entenda que ainda estava falando sobre a mesma coisa quando fez a pergunta de acompanhamento: “Em que cidade ela nasceu?”.

A empresa também está procurando maneiras pelas quais os computadores possam gerar respostas naturais quando a questão implicar informações em várias frases. Por exemplo, se for perguntado ao computador “John Smith é um cidadão americano?”, essa informação pode ser baseada em um parágrafo como “John Smith nasceu no Havaí. Esse estado fica nos EUA”.

Ming Zhou, diretor-gerente assistente da Microsoft Research Asia, disse que os resultados do conjunto de dados SQuAD são um marco importante, mas observou que, em geral, as pessoas ainda são muito melhores do que as máquinas na compreensão da complexidade e da nuance da linguagem.

“O processamento de linguagem natural ainda é uma área com muitos desafios em que todos nós precisamos continuar investindo e avançando”, disse Zhou. “Este marco é apenas um começo.”

Allison Linn é redatora sênior da Microsoft.

Tags: , ,

Posts Relacionados