A Microsoft investe na promessa da inteligência artificial há mais de 25 anos – e essa visão está ganhando vida com o novo chatbot Zo, kits de desenvolvimento e de recursos para dispositivos Cortana (Cortana Devices SDK and Skills Kit) e a expansão de ferramentas de inteligência.
“Em diversos testes do setor, nossos algoritmos de visão computacional superaram outros do mercado – até mesmo humanos”, afirma Harry Shum, vice-presidente executivo do grupo de Inteligência Artificial (IA) e Pesquisa da Microsoft, em uma pequena reunião sobre IA em São Francisco, em 13 de dezembro. “Mas o que é mais interessante para mim é que o progresso de nossa visão está aparecendo em nossos produtos, como o HoloLens, e em clientes, como os apps construídos pelo Uber para usar esses recursos.”
Quando Bill Gates criou a Microsoft Research, em 1991, ele previa que os computadores um dia veriam, ouviriam e entenderiam os seres humanos – e essa perspectiva atraiu algumas das melhores e mais brilhantes mentes para os laboratórios da empresa.
Em outubro, a Microsoft se tornou a primeira empresa do setor a chegar à paridade com humanos em reconhecimento de voz. Também há um trabalho inovador com o Skype Translator – agora disponível em nove línguas – como um exemplo de aceleração do processo de transformação da pesquisa em produtos. Com o Skype Translator, a Microsoft permite que as pessoas se compreendam enquanto conversam, em qualquer lugar do mundo. Mas, e quanto ao sonho da tradução em tempo real, cara a cara? Usando os novos recursos de inteligência em linguagem e reconhecimento de voz da empresa, o Microsoft Translator pode traduzir simultaneamente em grupos que falam diversas línguas, pessoalmente, em tempo real, conectando pessoas e superando barreiras.
A Microsoft também produziu o que possivelmente é o maior gráfico de conhecimento do mundo. Graças ao trabalho com Bing e Office 365, é possível compreender bilhões de entidades – pessoas, lugares e coisas. Temos agora a oportunidade de conectar esse “conhecimento do mundo” com o “conhecimento de trabalho” das pessoas.
A visão da Microsoft é ampla e ousada – criar sistemas que possuam inteligência artificial real entre agentes, aplicações, serviços e infraestrutura. É também inclusiva. A Microsoft busca tornar a IA acessível a todos – consumidores, empresas, desenvolvedores – para que todos possam usufruir de seus benefícios.
“Sempre buscamos democratizar a tecnologia. Com a IA, faremos isso de duas formas – ao infundi-la em produtos como o Office 365, ao mesmo tempo em que criamos uma plataforma na qual outros podem construir e inovar”, afirma Shum, descrevendo-se como um “cara de pesquisa transformado num cara de produtos”.
Essa plataforma inclui 25 APIs chamadas de Cognitive Services, que fornecem recursos de inteligência como fala, linguagem, conhecimento e busca.
O sucesso nessa nova forma de inovação requer profundas parcerias.
“Eu estava nessa mesma sala poucas semanas atrás com Sam Altman, trabalhando no anúncio de nossa colaboração com a OpenAI. É ótimo trabalhar em conjunto e produzir a partir desses trabalhos”, afirma Shum.
Estamos começando a testemunhar os primeiros dias de uma transição para a próxima grande mudança de plataforma na computação, aquela impulsionada pelos avanços da IA e construída em torno de um comportamento que é muito natural para humanos – conversas. É uma nova era, na qual experiências digitais refletem a forma com a qual as pessoas interagem com outras e rumamos de um mundo no qual temos que entender os computadores para um no qual eles nos entendem, compreendem nossas intenções e podem ser proativos.
Quando computadores podem falar “humano”, cada humano pode falar com computadores
Conheça a Zo
A IA conversacional tem dois lados – o lado de cumprimento de tarefas ou de produtividade e o lado emocional. Você precisa de ambos para realmente compreender a promessa da IA.
A estratégia a longo prazo da Microsoft pressupõe que agentes como a Cortana não possuem apenas quociente de inteligência (QI), mas também quociente emocional (QE). Essa ideia gerou alguns dos inovadores trabalhos que a empresa está realizando com chatbots.
O próximo capítulo dessa evolução é Zo.
Zo é um chatbot social, construído com as tecnologias que geraram Xiaoice e Rinna – chatbots bem-sucedidos da Microsoft na China e no Japão. Você pode interagir com ela no Kik agora mesmo, da mesma forma que você faria com um amigo. No futuro, o plano da Microsoft é levá-la para outros canais sociais e conversacionais como o Skype e o Facebook Messenger.
Zo foi construída utilizando o vasto conteúdo da internet. Ela aprende com interações humanas para responder de forma inteligente e emocional, fornecendo um ponto de vista único, acompanhado de gestos e expressões emocionais. Mas ela também possui balanceamentos e verificações sólidas para protegê-la de abusos.
A jornada da Microsoft com chatbots começou em maio de 2014, na China, com Xiaoice. Ela teve mais de 40 milhões de usuários – mais que toda a população da Califórnia. E ela teve uma média de 23 turnos de conversa por sessão com usuários – quase 10 vezes a média do mercado. Xiaoice é a primeira chatbot de IA a ter um emprego real na televisão, na Dragon TV, um dos maiores canais de TV da China, que possui mais de 800 milhões de espectadores. Por conta do sucesso da Xiaoice, a Microsoft lançou Rinna no Japão, em julho de 2015. Hoje, RInna conversa regularmente com 20% da população do Japão.
Zo já teve conversas com mais de 100.000 pessoas nos Estados Unidos. Até hoje, mais de 5.000 usuários conversaram mais de uma hora com a Zo. Ela detém o recorde de maior conversa contínua de chatbot: 1.229 turnos, com duração de 9 horas e 53 minutos.
“É uma experiência muito pessoal”, afirma Shum. “Estamos realmente mudando para um mundo no qual temos que entender os computadores para um mundo no qual eles entendem a nós e às nossas intenções, do foco nas máquinas ao foco no ser humano, do perceptivo ao cognitivo e do racional ao emocional.”
Construindo no Bot Framework
A Microsoft está fornecendo o Bot Framework e todas as suas ferramentas, serviços de nuvem e dados para que desenvolvedores e clientes possam produzir e experimentar juntos com a tecnologia da Microsoft – tanto grandes empresas quanto pequenos negócios.
Aprendemos como os clientes estão usando a extensão de nossos serviços de nuvem para criar bots avançados para melhorar processos e servir melhor a seus clientes: o banco de Kochi, no Japão, está desenvolvendo um bot recepcionista; a Rockwell Automation está criando um bot para automatizar produções, e o Departamento de Serviços de Saúde, na Austrália, está fazendo um bot para melhorar o engajamento com clientes.
“Falamos sobre a noção de cérebro robótico e, em muitos aspectos, esse é o desafio de desenvolvimento de software dessa década”, afirma Lili Cheng, renomada engenheira e gerente-geral dos laboratórios FUSE da Microsoft. “Nossa visão para o Bot Framework e nossas ofertas de desenvolvimento não estão apenas facilitando um começo, mas também colocam esses cenários futurísticos ao alcance das pessoas.”
Mais de 67.000 desenvolvedores estão utilizando o Bot Framework e os Cognitive Services da Microsoft. Atualizações estão chegando, incluindo novos conectores para o Microsoft Teams e a Cortana Bing Location, assim como o novo serviço QnA Maker, que pega as perguntas mais comuns que as empresas recebem e permitem que até não-desenvolvedores construam seus bots para respondê-las de forma simples.
“Aproveitando as ferramentas do Microsoft Bot Framework e do Microsoft Graph, estamos entregando novos e inovadores cenários para as pessoas em suas vidas pessoais e profissionais”, afirma Amritansh Raghav, vice-presidente corporativo do Skype. “Essas inovações estão aparecendo em apps, e-mail, plataformas de chat, dispositivos móveis e conectados.”
Uma das formas nas quais consumidores estão buscando tirar vantagem da oportunidade que esses bots dão é com experiências como Skype e Microsoft Teams. Com a disponibilidade geral da API de ligações do Skype, ele agora fornece bots falantes assim como as ferramentas para que os parceiros criem cartões de rich media, que permitem que os usuários adicionem vídeos, GIFs animados e áudio para esses bots.
Parceiros são importantes para ajudar a construir novas e engajadoras experiências para os clientes, e a Hipmunk foi uma das primeiras a lançar seu bot no Skype.
“Existimos para eliminar a agonia da experiência de viajar”, afirma Adam Goldstein, co-fundador e CEO da Hipmunk. “Vemos assistentes virtuais como uma extensão natural disso – possivelmente a melhor forma de ajudar as pessoas a agendar suas viagens facilmente. Ser descoberto é importante, e o diretório de bots facilita encontrar aqueles que as pessoas precisam e querem para simplificar suas vidas.”
Um agente inteligente para todos
Quando a Microsoft pensa sobre a promessa de IA conversacional, outra peça importante é o papel dos agentes, como a Cortana. Mais de 145 milhões de pessoas em 13 países estão usando a Cortana atualmente. Ela é livre, não está vinculada a plataformas ou dispositivos conectados.
Todo mundo merece ter seu próprio assistente pessoal. Um assistente que nos ajude a lidar com as lutas para ficar no topo de tudo.
“Para cumprir essa promessa, precisamos nos concentrar no que podemos tirar do seu prato. Metade de nós envia itens de ação ou lembretes regularmente por e-mail. Muitos de nós mantêm listas de tarefas. Eu costumo forrar a parede do meu escritório com notas adesivas”, diz Marcus Ash, gerente do programa de parceiros da Microsoft. “Então, estamos trabalhando para tirar o atrito de ficar no topo das coisas.”
A Cortana trabalha em plataformas móveis e agora em e-mail por meio do novo serviço Calendar.help, além de novas habilidades como a que a Expedia construiu para viagens ou o novo serviço que a Capital One oferece para operações bancárias. O próximo passo nessa jornada é tornar a Cortana disponível para todos os fabricantes de computadores e dispositivos para criar aparelhos mais inteligentes e mais úteis em todas as plataformas. É aí que entra o Cortana Devices SDK.
A Microsoft está trabalhando com parceiros em vários tipos de dispositivos para integrar a Cortana em seus aparelhos conectados. O Devices SDK desenvolve as habilidades da Cortana em produtividade, música, automação residencial e controle de dispositivos.
Em breve, a Cortana estará presente em uma nova forma, na sua casa, graças à parceria com a Harman Kardon, fabricante de equipamentos de áudio premium.
O que está por vir…
Na Microsoft, acreditamos que tecnologias inovadoras são criadas por constante experimentação, exploração destemida e um comprometimento com a inovação a longo prazo.
Embora tenhamos feito um grande progresso, ainda há questões difíceis sobre a IA para serem resolvidas. Nos primeiros dias de outras ondas de tecnologia – internet, dispositivos móveis, economia dos apps – houve muitas dores do parto, e a IA não é exceção.
“Iremos testar os limites e aprenderemos”, afirma Shum. “Compartilharemos nossos aprendizados com o mercado, com você – dessa forma podemos democratizar a IA e, com sorte, acelerar seus benefícios para nossa sociedade.”