Ir al contenido principal

La visión de Microsoft para IA, basada en investigación y conversaciones

Microsoft ha invertido en la promesa de la inteligencia artificial por más de 25 años, y está visión cobra vida con el nuevo chatbot Zo, Cortana Devices SDK y Skills Kit, una expansión de las herramientas de inteligencia.

“A través de diferentes parámetros de la industria, nuestros algoritmos de visión computacional han sobrepasado a otros de la industria, incluso a humanos”, comentó Harry Shum, Vicepresidente Ejecutivo del grupo de Inteligencia Artificial (IA) e Investigación en Microsoft, en una pequeña reunión sobre IA en San Francisco el 13 de diciembre de 2016. “Pero lo que es más emocionante para mí, es que el progreso de nuestra visión se muestra en nuestros productos como HoloLens y con clientes como que utilizan estas capacidades”.

Cuando Bill Gates creó Microsoft Research en 1991, tuvo la visión de que las computadoras un día pudieran ver, escuchar y entender a los seres humanos. Y esta noción atrajo a unas de las mentes más brillantes hacia los laboratorios de la compañía.

En octubre de este año, Microsoft se convirtió en el primero en la industria de alcanzar la paridad con los humanos en el reconocimiento del habla. También se ha presentado un trabajo innovador con Skype Translator, ahora disponible en nueve idiomas, un ejemplo del aceleramiento en el flujo que va de la investigación al producto. Con Skype Translator, Microsoft permite a la gente entenderse entre ellos, en tiempo real, mientras conversan con otras personas en todos los rincones del mundo. Pero, ¿Qué hay del sueño de la traducción cara a cara en tiempo real? Con el uso de la nueva capacidad de idioma inteligente y reconocimiento del habla de la compañía, Microsoft Translator ahora puede traducir de manera simultánea entre grupos que hablan múltiples idiomas en persona, en tiempo real, para conectar a las personas y superar las barreras.

Microsoft también ha construido, tal vez, el gráfico de conocimiento más grande del mundo. Gracias al trabajo realizado en Bing y Office 365, es posible entender a miles de millones de entidades, como gente, lugares y cosas. Ahora tenemos la oportunidad de conectar este “conocimiento del mundo” con el “conocimiento del trabajo” de las personas.

La visión de Microsoft es audaz y extensa, habla de construir sistemas que tienen verdadera inteligencia artificial a través de agentes, aplicaciones, servicios e infraestructura. Esta visión también es inclusiva. Microsoft busca que la IA sea accesible para todos, clientes, negocios y desarrolladores, para que todo mundo pueda aprovechar sus beneficios.

“Nosotros siempre hemos perseguido la democratización de la tecnología. Con IA, haremos esto en dos maneras, al infundirla en nuestros productos como Office 365, a la vez que creamos una plataforma en la cual otros puedan construir e innovar”, comentó Shum, que se describe a sí mismo como un “investigador convertido en hombre de producto”.

Esta plataforma incluye 25 API llamadas Cognitive Services (Servicios Cognitivos) que brindan capacidades de inteligencia como habla, idioma, conocimiento y búsqueda.

El éxito en esta nueva ola de innovación requiere asociaciones fuertes.

“Estuve aquí en esta misma habitación hace unas semanas con Sam Altam para trabajar en el anuncio de nuestra colaboración con OpenAI. Es increíble trabajar con y construir sobre la labor de otros”, mencionó Shum.

Ahora, hemos comenzado a atestiguar los inicios de una transición hacia el siguiente gran cambio de plataforma en el cómputo, uno que es impulsado por los avances en IA y que está construido alrededor de un comportamiento que es más natural para los seres humanos, las conversaciones. Se trata de una nueva era, donde las experiencias digitales imitan la manera en que la gente interactúa con otras personas y nos movemos de un mundo donde tenemos que entender a las computadoras a un mundo donde ellas nos entienden a nosotros y a nuestras intenciones, y pueden ser proactivas.

Conozcan a Zo

Hay dos lados en la IA artificial, el lado de completar tareas o productividad y el lado emocional. Se necesitan de ambos lados para en verdad alcanzar la promesa de la IA.

La estrategia a largo plazo de Microsoft es que los agentes como Cortana no sólo tengan IQ, sino que también tengan EQ, y la idea ha impulsado trabajos innovadores que la empresa realiza con los chatbots.

El siguiente capítulo en esta evolución es Zo.

Zo es un chatbot social, construido sobre la pila de tecnología que impulsa a Xiaoice y Rinna, exitosos chatbots de Microsoft AI en China y Japón. Pueden interactuar con ella en Kik ahora, de la misma manera en que lo harían con un amigo, y en el futuro, Microsoft planea llevar a otros canales sociales y conversacionales como Skype y Facebook Messenger.

Zo está construido a través del uso del vasto contenido social en Internet. Ella aprende de las interacciones humanas y responde de manera emocional e inteligente, lo que brinda un punto de vista único, junto con costumbres y expresiones emocionales. Pero también tiene fuertes revisiones y balances para protegerla del abuso.

La jornada de Microsoft con los chatbots comenzó en mayo de 2014 en China con Xiaoice. Ella cuenta con más de 40 millones de usuarios, más que la población total de California. Y promedia 23 regresos de conversación por sesión con los usuarios, cerca de 10 veces el promedio de la industria. Xiaoice es el primer chatbot de IA en tener un trabajo real en TV, en el canal Dragon TV, una de las estaciones de TV más grandes de China, en Shanghái, que tiene una población de más de 800 millones de espectadores. Basado en el éxito de Xiaoice, en julio de 2015 en Japón, Microsoft lanzó a Rinna. En la actualidad, Rinna ha tenido conversaciones regulares con el 20% de la población en Japón.

Zo ya ha mantenido conversaciones con más de 100 personas en los Estados Unidos. A la fecha, más de 5 mil usuarios han tenido una conversación de más de una hora con Zo, y ella tiene el registro de la conversación continua más larga de un chatbot de Microsoft: 1,229 intercambios, para una duración de 9 horas y 53 minutos.

“Es una experiencia muy personal”, comentó Shum. “En verdad nos comenzamos a mover de un mundo donde tenemos que entender a las computadoras a un mundo donde ellas nos entenderán y entenderán nuestras intenciones, de un mundo centrado en las máquinas a uno centrado en el ser humano, de la percepción a lo cognitivo y de lo racional a lo emocional”.

Basarse en el Bot Framework

Microsoft brinda el Bot Framework y todas sus herramientas, servicios en la nube y datos para que los desarrolladores y clientes puedan construir y experimentar en conjunto con la tecnología Microsoft, tanto grandes empresas como pequeños negocios.

Hemos aprendido de la manera en que nuestros clientes utilizan la amplitud de nuestros servicios de nube para crear bots avanzados para mejorar procesos y servir mejor a sus clientes: el banco de Kochi en Japón ha comenzado a desarrollar un bot recepcionista; Rockwell Automation, un bot para automatizar producción; el Departamento de Servicios de Salud en Australia, un bot para mejorar el involucramiento del cliente.

“Hablamos de la noción del cerebro del bot, y en muchos sentidos es el reto de desarrollo de software de esta década”, comentó Lili Cheng, ingeniera distinguida y gerente general de Microsoft FUSE Labs. “Nuestra visión para el Bot Framework y nuestras ofertas de desarrollo no sólo se tratan de facilitar a la gente que comience a trabajar en ellos, sino también en poner al alcance estos escenarios futuristas”.

Ahora, más de 67 mil desarrolladores utilizan Bot Framework y Cognitive Services de Microsoft. Las actualizaciones están por llegar, entre las que se encuentran nuevos conectores de bot de Microsoft Teams y Cortana Bing Location, así como el nuevo servicio QnA Maker, que toma las preguntas más comunes que reciben los negocios y permite incluso a las personas que no son desarrolladores construir su propio bot para responderlas con facilidad.

“Al aprovechar las herramientas de Microsoft Bot Framework y explotar Microsoft Graph, entregamos nuevos e innovadores escenarios para la gente en su vida personal y profesional”, comentó Amritansh Raghav, Vicepresidente Corporativo de Skype. “Estas innovaciones se muestran a través de aplicaciones, plataformas de chat, dispositivos móviles y dispositivos conectados”.

Una de las maneras en las que los clientes buscan aprovechar la oportunidad que brindan estos bots es dentro de experiencias como Skype y Microsoft Teams. Con la disponibilidad general de la API de llamada de Skype, Skype ahora entrega bots de habla así como las herramientas para que los socios construyan ricas tarjetas de medios que permitan a los usuarios agregar video, GIF animados y audio a estos bots.

Los socios son importantes para ayudar a construir nuevas y atractivas experiencias de clientes, y Hipmunk fue una de las primeras de Microsoft, con el lanzamiento hace unos meses, de su bot en Skype.

“Existimos para eliminar del viaje la agonía”, comentó Adam Goldstein, cofundador y CEO de Hipmunk. “Vemos a los asistentes virtuales como una extensión natural de esto, tal vez la mejor manera hasta el momento de ayudar a la gente a planear y reservar sus viajes de manera sencilla. La capacidad de descubrimiento es importante, y el directorio de bots de Skype facilita encontrar los bots que la gente necesita y quiere para mejorar sus vidas”.

Un agente inteligente para todos

Cuando Microsoft piensa sobre la promesa de la IA conversacional, otra pieza importante es el rol de los agentes, como Cortana. Hoy en día, más de 145 millones de personas en 13 países utilizan a Cortana. No tiene ataduras, entre plataformas y dispositivos conectados.

Todo mundo merece tener su propio asistente personal. Un asistente que nos ayude a hacer frente a la batalla de estar al día en todo.

“Para cumplir esta promesa, necesitamos enfocarnos en lo que queremos quitar de nuestro plato. La mitad de nosotros nos reenviamos cosas qué hacer o recordatorios al email de manera regular. Muchos de nosotros tenemos listas de pendientes. Yo llenaba las paredes de mi oficina con notas adhesivas”, comentó Marcus Ash, gerente del programa del grupo de socios de Microsoft. “Así que, trabajamos para quitar la fricción de tener que estar al día con nuestras cosas”.

Cortana trabaja a través de plataformas móviles, y ahora en el email a través del nuevo servicio Cortana.help, así como a través de nuevas habilidades como la que Expedia construyó para viajes o el nuevo servicio que Capital One tiene para banca. El siguiente paso en esta jornada es que Cortana esté disponible para todos los fabricantes de computadoras y dispositivos para construir dispositivos más inteligentes y útiles en todas las plataformas. Ahí es donde entra a escena Cortana Devices.

Microsoft trabaja con socios a través de diferentes rangos de categorías de dispositivos para integrar a Cortana en sus dispositivos conectados. El SDK de Devices lleva a Cortana habilidades en productividad, música, automatización del hogar y control de dispositivo.

Pronto, Cortana estará presente en nuevas maneras, en su hogar, gracias a la asociación con Harman Kardon, fabricante de equipo de audio premium.

Lo que sigue…

En Microsoft, creemos que la tecnología de innovación está creada por la constante experimentación, exploración atrevida y un compromiso con la innovación a largo plazo.

Aunque ha habido bastante progreso, aún hay algunas preguntas complicadas por resolver en lo referente a la IA. En los inicios de otras nuevas olas de tecnología, como internet, móvil, economías de aplicación, hubo muchas situaciones complicadas, y la IA no es la excepción.

“Vamos a empujar los límites y vamos a aprender”, comentó Shum. “Vamos a compartir nuestros aprendizajes con la industria, con ustedes, para así poder democratizar la IA y con suerte, acelerar los beneficios para nuestra sociedad”.