‘Aha, agora entendi!’ A Microsoft constrói uma tecnologia para colocar números em perspectiva

Por John Roach //

Quando os americanos perguntam ao Bing, o buscador da Microsoft, qual é o tamanho da Síria, eles aprendem que o país tem 185.180 km², ou seja, é um pouco maior do que o estado da Flórida, nos Estados Unidos. Quando a pergunta é sobre a quantidade de calorias em uma porção de sorvete, o buscador informa que uma colher contém 137 calorias, quantidade que equivale a cerca de 11 minutos de corrida.

Essas respostas fornecidas pelo Bing são exemplos iniciais de uma tecnologia em desenvolvimento nos laboratórios de pesquisa da Microsoft. O objetivo é nos ajudar a entender o grande volume de números, que cada vez mais encontramos no mundo digital.

“Queremos reduzir a quantidade de vezes que as pessoas leem um número e não conseguem entendê-lo. E queremos fazer isso fornecendo um contexto, uma analogia ou perspectiva que simplifique, usando termos relacionados à experiência cotidiana”, disse Jake Hofman, pesquisador sênior no laboratório de pesquisa da Microsoft, em Nova York.

A necessidade de uma nova maneira de entender os números surge a partir da abundância de dados disponíveis para nos ajudar a tomar decisões sobre tudo, desde orçamentos federais até saúde pessoal e conservação ambiental, afirmou Dan Goldstein, pesquisador principal no laboratório de pesquisa da Microsoft, em Nova York.

“A solução é relativamente simples. Usar frases de perspectiva é fácil e ajuda muito”, disse ele. “Estamos descobrindo que criá-las é um desafio porque exige não só o entendimento dos números adequados para compará-los, mas também entender com o que as pessoas estão familiarizadas, que tipos de comparação as pessoas gostam e quais coisas as pessoas podem imaginar facilmente.”

Na estrada para a Inteligência Artificial

Os exemplos do Bing hoje só estão disponíveis para alguns assuntos específicos e exigem a interação humana para se desenvolver. Em última análise, os pesquisadores da Microsoft buscam construir um serviço que gere automaticamente perspectivas para qualquer número e as comunique com a facilidade de um contador de histórias ou um professor. Esse serviço poderia passar pelo teste de inteligência artificial, de 1950, do teórico britânico Alan Turing.

“Você teria certeza de que estava conversando com uma máquina se ela apenas dissesse 643.801 km² em vez de aproximadamente o tamanho do Texas quando você perguntasse qual é o tamanho da França”, disse Goldstein. “Para passar no teste de Turing, você deve falar como um ser humano; alguém que pode explicar algo de uma forma personalizada para o público.”

O caminho para essa tecnologia automatizada, que busca números brutos de fontes como e-mail, feeds de mídia social e resultados de pesquisa e coloca-os em um contexto personalizado, é cheio de obstáculos. Para limpá-los, exige uma compreensão profunda da nuance e da complexidade do que faz um humano realmente humano.

O laboratório de pesquisa da Microsoft, em Nova York, onde Hofman e Goldstein estão, é adequado para eliminar esse obstáculo, observou David Pennock, pesquisador principal e diretor-assistente do laboratório. O lugar reúne cientistas sociais e da computação para estudar não apenas computadores, mas pessoas e como elas se comportam com eles.

“Há uma peça extra, que é importante para a Inteligência Artificial (IA), que consegue o resultado de um algoritmo complexo, que faz toda a mágica e, em seguida, coloca de forma apresentável para as pessoas”, disse Pennock. “Se você deseja gerenciar uma empresa baseada em dados, sim, você quer todos os dados; sim, você quer executar todos os experimentos corretos; e sim, você quer tomar decisões com base em dados. Mas, em última análise, você precisa disso em uma forma apresentável que, no final, serve para tomar a decisão.”

Números nas notícias

Hofman e Goldstein começaram a caminhar por essa estrada em 30 de outubro de 2012. Os pesquisadores se lembram do dia porque o furacão Sandy atingiu a costa leste no dia seguinte. Eles lutaram no trânsito carregado para chegar a uma reunião fora do local onde eles tiveram uma sessão de brainstorming sobre novas orientações de pesquisa.

“Propusemos tentar fazer com que os números nas notícias fizessem sentido para uma pessoa comum”, disse Hofman. “Todos assentiram com a cabeça e disseram: ‘Sim, isso parece uma boa ideia’. Não tínhamos noção de quão boa era, ou não era, essa ideia, ou o quão difícil de resolver.”

Para começar, os pesquisadores recrutaram pessoas para participar de um experimento online projetado para quantificar o valor das perspectivas na compreensão de números desconhecidos. Alguns participantes geraram frases em perspectiva para números tirados de notícias e outros fizeram uma série de testes randomizados para determinar se as perspectivas melhoraram a recuperação, estimativa e detecção de erros.

Por exemplo, um artigo observou que “os americanos possuem quase 300 milhões de armas de fogo”. Esse fato sozinho pode ser difícil de estimar, acreditar ou lembrar, mesmo que tenha sido visto no passado. Os pesquisadores descobriram que a compreensão da posse de armas nos Estados Unidos melhorou com a perspectiva de que “300 milhões de armas de fogo são cerca de uma arma de fogo para cada pessoa nos Estados Unidos”.

A descoberta de que as frases de perspectiva ajudam as pessoas a entender os números nas notícias levou os pesquisadores a começarem a estudar por que elas funcionam. A simples repetição de números aumenta a memória? As perspectivas adicionam uma camada para nossos cérebros entenderem e criarem uma associação, levando a trazer mais informações quando chega a hora de se lembrar? As perspectivas envolvem sinalizadores mentais?

Além disso, algumas perspectivas são melhores do que outras? Considere a área do Paquistão, por exemplo, que é de 796.095 km². Qual classificação ou medida comparativa ajudaria as pessoas a entender melhor o tamanho – quanta terra 796.095 km² significa? Talvez, quanto tempo demoraria para atravessar? Ou o tamanho comparado com os estados dos EUA? Se comparado aos estados, qual estado? O dobro do tamanho da Califórnia é mais útil do que cinco vezes maior do que a Geórgia?

“Como você descobre qual desses é melhor? Como você faz isso usando princípios?”, questiona Chris Riederer, que foi estagiário com Hofman e Goldstein enquanto estudava para seu Ph.D. na Universidade de Columbia e foi coautor de um artigo que descreve essa fase da pesquisa. “Essencialmente, o que fizemos foi conduzir uma grande pesquisa.”

Os participantes do estudo compararam os tamanhos e as populações dos países com os tamanhos e as populações de vários estados dos EUA. Os resultados mostram que estados similares combinados, com multiplicadores simples, mesmo que menos precisos, sejam os melhores. Por exemplo, as pessoas nos Estados Unidos compreendem a área do Paquistão com mais facilidade quando expressa em aproximadamente o dobro do tamanho da Califórnia do que a comparação de cinco vezes maior do que a Geórgia, mesmo que a última seja uma medida mais precisa.

Essas descobertas foram usadas para gerar as perspectivas da área do país ao vivo no Bing. Pergunte ao buscador: “Qual é o tamanho do Paquistão?” E você saberá o número em quilômetros quadrados, juntamente com a comparação pré-calculada com a Califórnia.

Bing e além

A equipe de perguntas e respostas do Bing está trabalhando em perspectivas adicionais para aumentar a compreensão de tudo, desde o consumo de combustível até o tamanho dos planetas. A equipe de alimentos e bebidas do Bing implantou perspectivas que expressam calorias como se fossem minutos de funcionamento, proteína e sódio em porcentagem da recomendação diária, gramas de açúcar em colheres de chá e miligramas de cafeína em copos de café.

A decisão sobre como expressar cada perspectiva – calorias em minutos correndo versus andar, por exemplo – envolve um brainstorming por e-mail entre o Bing e as equipes de pesquisa, bem como análise de dados de logs e pesquisas, explicou Christina Ntouniaoglou, gerente de programa para a equipe de alimentos e bebidas do Bing.

“Estava pensando no caminhar. Por que ele seria executado? Há pessoas que não podem correr. Mas a pesquisa provou que as pessoas realmente gostam da parte de corrida, então seguimos esse direcionamento”, disse ela.

O próximo desafio, afirma Hofman, é construir um sistema que crie automaticamente perspectivas para que as pessoas possam usar mais facilmente todos os dados a que temos acesso hoje para tomar decisões informadas.

“Os computadores têm muitas informações em muitos bancos de dados, mas eles realmente não sabem como classificar esses dados como mais ou menos úteis ou compreensíveis para os seres humanos”, disse ele. “Esse é o último obstáculo restante – um grande obstáculo – que precisamos esclarecer neste projeto.”

Hofman e Goldstein estão aplicando os últimos avanços na aprendizagem de máquina, um ramo de inteligência artificial, e análise de dados para superar esse obstáculo. Seus olhos estão fixos no objetivo de um serviço generalizado que funciona como um plug-in para navegadores, programas de e-mail e editores de texto que geram automaticamente perspectivas relevantes e personalizadas para qualquer número que os usuários encontrem ou escrevam.

“Se fôssemos infinitamente sábios e bons no cálculo, realmente não importaria como os números fossem expressos, todos seriam os mesmos para nós. Mas o fato é que algumas coisas realmente fazem com que as pessoas pensem ‘Aha, agora entendi’”, disse Goldstein. “Esse é um novo território; olhando como comunicar números de uma maneira que dê às pessoas percepção, memória e compreensão.”

Os cincos anos que Hofman gastou no projeto de pesquisa, diz ele, já plantaram perspectivas em seu cérebro.

“Penso sempre: ‘estou apresentando isso da maneira mais compreensível?’”

Tags: , , ,

Posts Relacionados