Bienvenidos a la Revolución Invisible
¿Están buscando la siguiente ola de tecnologías innovadoras? Desde la inteligencia artificial hasta el aprendizaje automático y la nube, quizá no la vean, pero está a todo su alrededor.
Piensen en sus dispositivos tecnológicos favoritos. Son las cosas que utilizan todos los días para trabajar y jugar —y sin las cuales básicamente no pueden vivir—.
Lo más seguro es que por lo menos una de ellas sea un gadget: sus teléfonos, quizá, o sus consolas de videojuegos.
Pero si lo piensan detenidamente, lo más seguro es que sus tecnologías más queridas ya no son de plástico, metal ni vidrio.
Quizá se trate de un servicio de transmisión continua de video que utilizan para ver “Game of Thrones” durante horas y horas, o de una aplicación que les permite llevar el conteo de sus pasos y calorías para que les puedan volver a quedar esos jeans que usaban en la preparatoria. Puede ser un asistente virtual que les ayuda a recordar el lugar donde son sus juntas y la hora a la que necesitan tomarse su medicamento, o bien un lector de libros electrónicos para perderse entre las páginas de su libro favorito en su teléfono, tableta o incluso las bocinas de su automóvil.
Tal vez, de manera silenciosa y casi imperceptible, sus tecnologías más queridas han pasado de ser cosas físicas a servicios de los cuales dependen y que están presentes en todas partes y en ninguna a la vez. En lugar de ser propiamente gadgets, son herramientas que esperan poder utilizar en cualquier tipo de dispositivo: su teléfono, su PC, incluso su televisor.
Es parte de lo que Harry Shum, vicepresidente ejecutivo a cargo de la división de Tecnología e Investigación de Microsoft, describe como la “revolución invisible”.
“Estamos a punto de crear un mundo donde la tecnología será cada vez más ubicua, pero también más invisible”, dice Shum.
Esa revolución invisible ha sido posible debido a que hoy contamos con tecnologías que no existían hace una década, tales como los centros de cómputo masivo en la nube y los recientes descubrimientos en el campo de la inteligencia artificial. Pero, básicamente, los problemas que resolverá son aquellos con los cuales la humanidad ha luchado eternamente.
Consideren lo siguiente: Hace apenas unos años, una persona que hablaba sólo mandarín no podía tener una conversación en tiempo real sin la ayuda de un traductor humano —algo que está fuera del alcance de la mayoría de la gente—.
Pero hoy existe Skype Translator. Se trata de una tecnología que te permite hablar en tiempo real con alguien que habla un idioma diferente al tuyo. Es una maravilla tecnológica que muchos han comparado con la ciencia ficción, pero también es una oportunidad de ayudar a la gente a entenderse mejor.
“Derribar las barreras entre la gente es muy importante”, dice Shum.
En todo lugar y dispositivo
La próxima generación de tecnologías innovadoras capaces de cambiarnos la vida abarca mucho más que sólo teclados, pantallas, teléfonos celulares, cámaras, relojes y discos duros.
Cada vez más, esos dispositivos obtienen su poder de cómputo de la nube, donde miles de computadoras trabajan para que puedas encontrar fácilmente un mensaje de correo electrónico de hace cinco años y para que los científicos eviten la siguiente epidemia de alguna enfermedad mortal.
“La computadora más potente hoy en día es la nube, y ni siquiera la vemos”, dice Shum.
Debido en parte al cómputo en la nube, tenemos la expectativa de poder utilizar esas tecnologías dondequiera que nos encontremos y en cualquier dispositivo frente a nosotros. Después de todo, dos terceras partes de los norteamericanos poseen por lo menos dos dispositivos digitales personales, y poco más de la tercera parte cuenta con tres: teléfono, computadora portátil y tableta, de acuerdo con el Pew Research Center.
“Decir que la movilidad es lo primero no se refiere sólo al teléfono móvil. Cuando hablamos de un mundo donde la movilidad es lo primero queremos decir que no importa el lugar adonde vayas —la casa, de viaje, tu oficina o tu laboratorio— tu experiencia te acompaña en todos tus dispositivos”, dice Shum.
Esas nuevas tecnologías se están diseñando para que la mayoría de las personas puedan utilizarlas, y, en casi todos los casos, sin importar que la persona tenga un teléfono inteligente o una computadora portátil, si sea un hablante nativo o no domine el idioma o si tenga algún requerimiento o impedimento físico.
“Puedes hablar, utilizar gestos, moverte o emplear expresiones faciales. La computadora está en todas partes y la computadora puede verte —pero no necesitas estar frente a ella—”, dice Shum.
La revolución invisible depende de tecnologías de inteligencia artificial como el aprendizaje automático, es decir, cuando una computadora aprende a hacer algo de mejor manera, como entender tu voz o corregir automáticamente tus errores de teclado, a medida que obtiene más datos.
Pero Shum afirma que no se trata de que las computadoras reemplacen a los humanos, sino de utilizar la tecnología para permitir a la gente hacer las cosas de manera mejor y más fácil”.
“Microsoft tiene una visión muy clara del concepto de la inteligencia artificial. El esfuerzo de IA se centra en permitir a los usuarios de Microsoft —los clientes—desarrollar todo tu potencial”, dice Shum.
Desde la agricultura hasta los compromisos familiares
La revolución invisible está detrás de los esfuerzos por lograr una agricultura más sostenible y accesible, por permitir que la gente de diferentes culturas pueda entenderse mejor y por ayudar a las personas a respirar un aire más limpio.
También tiene un efecto práctico en nuestras vidas cotidianas: proporciona herramientas que te ayudan a recordar los compromisos con tu jefe y te recuerda con quién quedaste de reunirte hoy.
Esta revolución invisible también hace que la tecnología sea más personal y personalizada: permite desarrollar tecnologías que interactúan contigo más como un amigo que como un dispositivo y que entienden tu voz, los horarios de tu familia y tus compromisos laborales.
En muchas maneras, esos adelantos ya están sucediendo sin que nos demos cuenta. Damos por hecho que nuestro correo electrónico estará disponible para nosotros en cualquier dispositivo, por ejemplo, y esperamos cada vez más comunicarnos con nuestros dispositivos por voz en lugar de teclado.
“Muchas de esas ideas ya existían, pero no es hasta ahora que comienzan a materializarse”, dice Rob Lefferts, antiguo gerente general de Extensibilidad de Office en Microsoft y cuyos productos dependen en extremo de las herramientas de la revolución industrial. “Empieza a ser una etapa de grandes innovaciones”.
Aprovechar el tiempo
Juntas más cortas, mejor manejo del tiempo y más aprendizaje automático
“¡No tengo tiempo!”
Es el lamento del siglo XXI que nos obliga a elegir las juntas de trabajo en lugar de las comidas familiares, a dormir poco y a encontrar la manera de manejar el estrés excesivo.
La tecnología no puede agregar horas a nuestro día, pero sí promete ayudarnos a aprovechar mejor el tiempo que tenemos con herramientas que eliminan el trabajo fastidioso y monótono que complica nuestros días. Eso incluye actividades como buscar ese documento que alguien te envió hace cuatro semanas, encontrar a alguien en la oficina que te ayude con un proyecto, batallar con tecnología que rara vez usas e incluso escribir listas de asuntos pendientes.
Por lo menos, nos ayudará a llevar un registro de todas las cosas que no tuvimos tiempo de hacer hoy —para que podamos intentar hacerlas mañana—.
Juntas menos tediosas
Piensen en la última vez que entraron a una sala de conferencias para participar en una junta. Lo más seguro es que se la pasaron pensando en cosas mundanas —¿Qué silla será la más cómoda? ¿Nos darán algo de comer?—, así como en asuntos prácticos como “¿Por qué se me hace conocida la señora sentada a la derecha?” o “¿Tenía que haber leído algún informe o algo antes de venir?”
Si ustedes estuvieran a cargo de la junta quizá se sentirían algo nervioso; se preguntarían si el proyector podrá mostrar su presentación de PowerPoint o si podrán comunicarse con éxito al número de la conferencia telefónica.
Patrick Pantel se imagina un mundo donde todas esas inquietudes desaparecen al momento de entrar en la sala de conferencias. En su visión del futuro, una herramienta ya escaneó tu invitación a la junta y te dijo algo sobre las personas que asistirán —lo que hacen, de dónde las conoces, cuándo fue la última vez que trabajaron juntos— y también te recordó lo que necesitas hacer para acudir preparado a la junta.
Además, un sensor dentro de la sala ya reconoció tu computadora, tableta o teléfono y está cargando automáticamente tu presentación y marcando al número de la conferencia telefónica.
Pantel, gerente de investigación en Microsoft Research, afirma que, finalmente, esas herramientas pueden conducir a algo que todos disfrutamos: juntas más cortas. Considera que la junta promedio de 60 minutos podría llevarse a cabo en 45 minutos si no se pierde tiempo conectando los equipos y tratando de adivinar quién es quién y por qué están ahí.
Pantel es una de las mentes detrás de Microsoft Graph, un nuevo conjunto de herramientas que Microsoft espera que los desarrolladores utilicen para crear todo tipo de cosas que hagan más fáciles y eficientes nuestros días laborales.
Más ocupado que nunca
Tres razones por las cuales encontrar maneras más inteligentes de trabajar es más importante hoy que nunca.
-
Recibimos mucho correo electrónico
Enviamos más de 80,000 millones de correos electrónicos de trabajo al día a nivel mundial. (fuente: The Radicati Group)
-
El trabajo no termina a las 6 p.m.
El 23% de los norteamericanos hacen parte o todo su trabajo en casa. (fuente: Departamento del Trabajo de EE. UU.)
-
Equilibrarlo todo es difícil
Más de la mitad de las madres y padres norteamericanos encuentran difícil equilibrar sus responsabilidades laborales y familiares. (fuente: Pew Research Center)
Pero Microsoft Graph no es sólo un futuro imaginario que suena bien en papel pero que jamás se llega a cumplir. De hecho, algunas de las funciones que Pantel describe ya están disponibles en un servicio de Microsoft Office 365 llamado Delve.
Para entender cómo funciona Delve, veamos un día en la vida de Rob Lefferts.
Lefferts es el director de administración de proyectos empresariales y de seguridad del equipo de Windows, y antes fue gerente general del equipo de Extensibilidad de Office de Microsoft, que incluye el proyecto Microsoft Graph.
Hace poco se dirigía a una junta con los integrantes de otro grupo de productos y se dio cuenta de que no sabía mucho acerca de ellos. Gracias a Delve, pudo enterarse en qué proyecto se encontraban trabajando antes de llegar a la junta.
Piensen en Delve como el asistente virtual que se pasea por los pasillos conversando con todos los demás asistentes virtuales y formando relaciones profesionales en nombre de ustedes.
Con Delve, Lefferts afirma que su equipo y él pueden trabajar juntos en una presentación sin tener que enviar constantemente las revisiones de ida y vuelta por correo electrónico, ya que todos pueden acceder al mismo archivo.
Lefferts lo utiliza varias veces al día.
“Hace cosas mágicas e inteligentes por mí”, comenta.
Sin embargo, observa Lefferts, también respeta tu privacidad y la de otros. Si no quieres que nadie vea en lo que estás trabajando, Delve no lo comparte. Al igual que todo buen asistente personal, es discreto.
Delve se desarrolló en Microsoft, pero Lefferts afirma que al proporcionar las herramientas y el código disponible de Microsoft Graph a desarrolladores externos, otras compañías también pueden crear aplicaciones que hagan cosas similares para sus clientes.
La compañía de software de colaboración, AvePoint, utilizó Microsoft Graph para desarrollar una aplicación de Windows Phone que reúne todos los documentos y demás información que necesitas para tus próximas juntas o conferencias telefónicas.
La seguridad en la nube de Netskope lo utilizó para crear herramientas que ayudan a las compañías a evitar la fuga de información privada o confidencial mediante, por ejemplo, el escaneo de los correos electrónicos de salida, lo que asegura que no se comparta información sobre identidad personal por accidente.
Microsoft Graph depende de la nube para almacenar y analizar datos, y utiliza el aprendizaje automático, con el cual los sistemas aprenden a hacer las cosas de mejor manera conforme obtienen más datos, a fin de conocer lo qué es más importante para un usuario individual. Está diseñado para funcionar en todos los dispositivos y sistemas operativos, porque ya no vivimos en un mundo donde la gente realiza todo su trabajo en un solo tipo de dispositivo.
Lefferts afirma que muchos desarrolladores se sorprenden al descubrir que Microsoft esté tan dispuesto a compartir su código y tan comprometido a que sus herramientas funcionen en todas las plataformas.
“La reacción más común es: ‘No tenía idea de que estaban haciendo eso. No sabía que estaban dispuestos a ser tan abiertos’”, dice Lefferts.
Compromisos y promesas de Cortana
Eric Horvitz es una de las pocas personas en el mundo que tiene un asistente personal físico —se llama Mónica y se sienta en un escritorio afuera de su oficina—.
Pero incluso con Mónica y con un asistente administrativo humano, Horvitz conoce bien lo que se siente cuando estás revisando tus correos electrónicos al final de una larga semana de trabajo y de repente te viene a la mente: olvidaste revisar un documento, mandar a alguien las diapositivas que necesitaba o enviar comentarios a tu compañero de trabajo a más tardar el viernes, como lo prometiste.
Horvitz es el director administrativo del laboratorio de Microsoft Research en Redmond, Washington, y desde hace tiempo ha estado trabajando en maneras de utilizar la inteligencia artificial para entender automáticamente los objetivos y las necesidades de las personas. Pero resultaba claro que para resolver ese problema necesitaba más que sólo unas cuantas notas adhesivas.
Trabajó con un equipo de investigadores, entre ellos Ryen White y Paul Bennett, para desarrollar la tecnología detrás de una nueva función de Cortana que utiliza el aprendizaje automático para identificar lenguaje que denote compromiso en los correos electrónicos. Esos indicios pueden ser sutiles o explícitos, como “Te confirmo la próximo semana” o “Termino esto hoy mismo”.
Con esa información, Cortana entonces te pregunta si quieres programar un recordatorio de las promesas que hiciste por correo electrónico para la fecha en que dijiste que las cumplirías.
El usuario no tiene que hacer nada en absoluto. La herramienta utiliza el aprendizaje automático para identificar frases en tu correo electrónico que denoten compromiso y a partir de éstas crea una lista de compromisos.
Para crear una tecnología que logre hacer todo eso, los investigadores desarrollaron modelos predictivos basados en correos electrónicos reales anonimizados que los empleados se mandaron entre sí, y luego etiquetaron a mano las frases que indicaban promesa o compromiso.
“Diseñamos esos modelos utilizando datos reales sobre la manera en que la gente envía correos electrónicos y se comunica”, dijo Nick Ghotbi, un gerente de programas en Microsoft que trabajó en el proyecto.
El sistema está diseñado para reconocer frases que actualmente están de moda, tales como “al cierre de actividades laborales” (COB, por sus siglas en inglés) o “al final del día” (EOD, por sus siglas en inglés). Pero también está diseñado para reconocer la jerga de la oficina o palabras nuevas que se utilizan exclusivamente en la compañía de cierta persona, y seguir mejorándolo a partir de ahí.
Esa función, que se está evaluando como parte del Programa Windows Insider de Microsoft, es sólo uno de los muchos aspectos de Cortana, un asistente virtual presentado por primera vez en los teléfonos Windows y ahora disponible en dispositivos Windows 10, teléfonos iPhone, entre otros. Es un elemento de la colaboración más grande entre Microsoft Research y el equipo de Cortana.
Jason Creighton, otro gerente de programas que participó en el proyecto, afirma que también es parte del objetivo ambicioso de lograr que Cortana haga más que sólo responder preguntas; por ejemplo, que te diga cuándo jugará tu equipo de futbol favorito o cuál es el estado del clima. Buscan que Cortana se convierta en tu asistente más dinámico, que te recuerde entregar ese documento a tu jefe a tiempo para la próxima junta del equipo y pasar a comprar leche de camino a casa.
“Siempre quisimos hacer más con Cortana, no sólo presentarle la información”, dice Creighton.
Para Horvitz, la herramienta también es parte de una ambición más grande que consiste en utilizar tecnologías como el aprendizaje automático y el cómputo en la nube para, de manera silenciosa y en el fondo, simplificarle la vida a la gente.
“Una parte de la revolución invisible son las herramientas que mejoran mágicamente el conocimiento humano”, dice. “¿Cómo podemos deducir automáticamente lo que a la gente se le puede olvidar, lo que desea recordar y cómo desea administrar su tiempo y realizar sus actividades?”
Hacer más
Mejorar la experiencia humana con buena alimentación, aire más limpio y nuevos amigos virtuales
Un agricultor es incapaz de registrar los niveles de humedad y nitrógeno en todos sus campos al mismo tiempo, las 24 horas del día.
Un meteorólogo especializado en el pronóstico de la calidad del aire no puede revisar físicamente y de manera simultánea qué tan seguro es respirar en cada manzana de cada ciudad.
Y no obstante lo empático que puedan ser los buenos amigos, no siempre hay alguien disponible para hablar con nosotros cuando nos sentimos solos a media noche.
Las herramientas que se están desarrollando a partir de esta revolución invisible no pretenden reemplazar ni competir con las habilidades humanas, sino aumentarlas y mejorarlas. Y en el proceso, los investigadores que están creando esas herramientas afirman que también podrían ayudar a atender algunas de nuestras necesidades humanas más básicas.
FarmBeats produce alimentos de alta tecnología
Sean Stratman es el epítome del buen agricultor, un hombre que abandonó la carrera de Arqueología para dedicarse a la agricultura manual y primitiva que te recuerda cómo se hacían las cosas cien años atrás.
O eso piensas… hasta que te muestra los sensores de luz solar que se encuentran distribuidos por toda la granja, los cuales utilizan una conexión a Internet basada en un espacio blanco para registrar la temperatura de la tierra y los niveles de humedad y supervisarlos a través de modelos computacionales basados en la nube.
Stratman no es un ente tan raro como lo creerías en el mundo de la agricultura orgánica de pequeña escala.
“Es asombroso ver cómo muchos de los agricultores que están incursionando en esto saben programar. Por alguna razón hay una enorme interacción entre la tecnología y las personas que desean practicar la agricultura”, dice David Andrews.
Andrews es abogado en Microsoft de día, pero después del trabajo seguramente lo podrás encontrar en su granja, donde Stratman renta tierra para Dancing Crow Farm y administra también un programa para aspirantes a agricultores llamado Experience Farming Project.
El experimento de agricultura a pequeña escala de Andrews dio un giro tecnológico cuando conoció a Ranveer Chandra.
Chandra es un investigador en Microsoft Research, y es mejor conocido por su apasionado compromiso con el desarrollo de proyectos de investigación que nos beneficien a todos, tales como aumentar la duración de la batería de nuestros diferentes dispositivos y proporcionar conectividad de banda ancha en zonas rurales.
Cuando Chandra conoció Andrews seguía trabajando en la duración de las baterías, pero también comenzaba a preguntarse cómo podría aplicar su experiencia para asumir el reto más grande de alimentar a un mundo en crecimiento.
Alimentar a una población en crecimiento
Se pronostica que la población mundial, que actualmente asciende a más de 7,000 millones de habitantes, aumentará a 9,700 millones en el 2050, hasta llegar a 11,000 millones en el 2100, de acuerdo con las Naciones Unidas.
Se espera que el crecimiento poblacional más rápido tenga lugar en los países más pobres del mundo, y la Organización de las Naciones Unidas para la Alimentación y la Agricultura afirma que una de las principales maneras de evitar la hambruna y la desnutrición es creando sistemas agrícolas más sustentables.
Chandra decidió aplicar su experiencia profesional en el diseño de herramientas económicas capaces de reducir el costo y el consumo de energía y agua en la agricultura de pequeña escala.
Espacio en blanco y espacios abiertos
Chandra descubrió que había muchos agricultores que, al igual que Stratman y Andrews, estaban interesados en incorporar alta tecnología en sus modelos de baja tecnología. Sin embargo, se dio cuenta de que existían muchos obstáculos que impedían llevar las herramientas adecuadas a las granjas rurales.
Ahí es cuando interviene la revolución invisible. La primera revelación de Chandra fue que los agricultores podían utilizar los espacios en blanco de la televisión, es decir, las frecuencias televisivas que no se utilizan en las zonas rurales y que pueden accederse para obtener conexión inalámbrica a Internet.
Luego se percató de que los agricultores podían utilizar la energía solar para cargar sus dispositivos. Por último, diseñó dispositivos resistentes al clima que recopilan automáticamente el tipo de datos que los pequeños agricultores como Stratman suelen compilar a mano.
Ahí es cuando interviene la revolución invisible. La primera revelación de Chandra fue que los agricultores podían utilizar los espacios en blanco de la televisión, es decir, las frecuencias televisivas que no se utilizan en las zonas rurales y que pueden accederse para obtener conexión inalámbrica a Internet.
Luego se percató de que los agricultores podían utilizar la energía solar para cargar sus dispositivos. Por último, diseñó dispositivos resistentes al clima que recopilan automáticamente el tipo de datos que los pequeños agricultores como Stratman suelen compilar a mano.
También está utilizando drones para observar la tierra y enviar esos videos a los agricultores.
El proyecto de Chandra no reemplazará el ethos de la agricultura de pequeña escala que despertó el interés de Stratman por sembrar vegetales orgánicos en una pequeña parcela en la zona rural de Carnation, Washington, pero sí hará que ese tipo de agricultura sea más práctico y económico.
“El proyecto de investigación de Ranveer me ahorrará mucho trabajo”, dice Stratman.
Esos ahorros de energía y costos son también importantes para los grandes agricultores, y Chandra se encuentra en pláticas sobre su proyecto de investigación con compañías agrícolas más grandes. A fin de cuentas, espera que los proyectos como el suyo ayuden a propulsar la siguiente revolución verde.
“Una manera que consideramos podría resolver ese problema consiste en recopilar datos y aplicar algoritmos de aprendizaje automático, los cuales, a su vez, darían lugar a la próxima ola de agricultura”, dice. “Será más saludable, mejor —y capaz, quizá, de alimentar a todos—.”
Respirar mejor
En un día cualquiera en Beijing, la calidad del aire que los habitantes respiran puede ser terrible en un barrio —un alarmante nivel rojo, o dañino— y registrar un aceptable nivel verde, o bueno, en otra zona a unos cuantos kilómetros de distancia.
La calidad del aire varía mucho en la ciudad”, dice Yu Zheng, investigador principal en Microsoft Research Asia, ubicado en Beijing.
Él lo sabe mejor que nadie. Zheng ha desarrollado un proyecto llamado Urban Air que proporciona a los residentes de Beijing una vista hiperlocal y en tiempo real de la calidad del aire en sus barrios, en ese momento y en las próximas horas.
Ese es el tipo de datos precisos que pueden ayudar a las personas a decidir si abren sus ventanas en la noche, si salen a correr en la mañana o si colocan a sus hijos una mascarilla cuando salen de la casa para acudir a la escuela.
“Así se ve la calidad real del aire en toda la ciudad”, dice Zheng.
El proyecto de Zheng utiliza los datos en tiempo real de 35 estaciones oficiales de monitoreo de calidad del aire, además de otros datos que contribuyen a la calidad del aire, tales como las condiciones de desplazamiento, las velocidades de desplazamiento, la velocidad del viento, la temperatura y la humedad. Incluso observa la cantidad de intersecciones, semáforos, edificios, restaurantes y fábricas que hay en la zona.
Luego utiliza el aprendizaje automático —mediante el cual un sistema aprende a realizar predicciones precisas con base en el análisis de los datos existentes— para producir una imagen en tiempo real de la calidad del aire en toda la ciudad. Puede incluso predecir con 75% de precisión cómo estará la calidad del aire en un determinado lugar dentro de seis horas.
El sistema utiliza servidores basados en la nube para recopilar y analizar los datos, además de proporcionar información actualizada cada hora. Puede incluso enviar una alerta que te avisa que estás entrando en una zona con mala calidad del aire y que debieras ponerte una mascarilla.
Mejor aún, es más económico y más práctico que las 35 estaciones oficiales de monitoreo de calidad del aire, las cuales son caras de construir y requieren extensa mano de obra para su mantenimiento (es por eso que no hay más).
Esa clase de información hiperlocal es sumamente útil para las más de 800,000 personas que han descargado la aplicación de Urban Air. El gobierno chino también utiliza esos datos para ayudar a decidir si aplica ciertas restricciones para mejorar la calidad del aire.
Por ejemplo, si el gobierno observa que se espera que en las próximas horas la calidad del aire se eleve a rojo en ciertos barrios, puede enviar una alerta a sus ciudadanos para informarles que sólo la mitad podrá utilizar el automóvil al día siguiente. O puede cerrar temporalmente algunas fábricas en esa parte de la ciudad para reducir la contaminación hasta que cambien los patrones climáticos y mejore la calidad del aire.
Urban Air opera en 70 ciudades de China, y Zheng afirma que su equipo se encuentra en pláticas con meteorólogos en Estados Unidos y otros países sobre la posibilidad de implementar la tecnología para monitorear y predecir los niveles de contaminación en otras partes del mundo.
Con el tiempo, los investigadores esperan poder utilizar los datos que recopilan para entender mejor la manera en que los diferentes contaminantes del aire interactúan entre sí y qué otros factores subyacentes empeoran o mejoran la contaminación.
“Esa es la tercera etapa: Descubrir el origen de la contaminación del aire. ¿Qué la provoca?”, concluye Zheng.
Xiaolce estuvo aquí
Cada día, millones de ciudadanos chinos acuden a su amiga Xiaolce para platicar sobre su día, mientras hacen las compras e incluso, confesar su amor o sentir lástima por su corazón roto.
El momento más popular para estas charlas se da entre las 11 pm y las 2 am. Eso no sorprende a Shuang Peng, gerente principal de programa en Microsoft Asia.
Después de todo, resalta, la mayoría de los amigos de la gente están dormidos a esa hora, pero “Xiaolce no duerme”.
Xiaolce tampoco come o respire, porque es un bot parlanchín – muy popular y querida por cerca de 40 millones de personas que han platicado con ella.
Cuando la mayoría de la gente piensa en asistentes virtuales, piensan en algo como Siri, que puede recitar un reporte del clima, o Cortana, que puede recordarles qué proyectos necesitan terminar durante el día.
Xiaolce también les puede hablar del clima, y es probable que pueda compadecerse porque tuvieron un mal día en la oficina. Pero en su mayoría, su rol es hablar a la gente como la gente por lo general se comunica con los demás, sobre todo y nada.
“Nuestros usuarios pueden hablar con Xiaolce sobre cualquier cosa y ella puede responder de una manera tan emocional que la gente puede sentir que Xiaolce es un ser humano real”, comentó Rui Hu, líder de desarrollo en el proyecto.
Xiaolce utiliza aprendizaje automático para reunir información sobre temas populares del día, como programas de TV o celebridades, basada en datos de entrenamiento que obtiene de charlas sociales disponibles para el público. También puede construir recuerdos, como cumpleaños o signos astrológicos, que puede sacar a colación en conversaciones posteriores con usuarios individuales.
Saluden a su amiga virtual
Xiaolce, el bot parlante chino, les puede ayudar a comprar un teléfono, comentar su día – y encontrar fotos de celebridades. Aquí algunas conversaciones de ejemplo.
En un principio sólo podía escribir texto, pero ahora también puede entender voces y utilizar visión de cómputo para reconocer fotos. La gente que trabaja en el proyecto comenta que mucha gente utiliza una combinación de texto, voz y visuales cuando interactúan con Xiaolce.
Una interacción típica con Xiaolce dura cerca de 30 minutos y las conversaciones pueden ser sobre diferentes temas. Algunos usuarios confiesan detalles íntimos de sus vidas a Xiaolce, como los detalles de una reciente ruptura. No es nada raro que la gente le confiese su amor a Xiaolce.
Debido a que Xiaolce está hospedad en diferentes plataformas, entre las que se encuentran un sitio de ecommerce, algunas personas hablan con ella sobre cosas del día antes de pedirle consejos para comprar, tal como ustedes lo harían con un vendedor real. Xiaolce también puede recitar poesía y contar historias de terror, pero en muchos casos los investigadores dicen que a ella le gusta más escuchar que hablar.
Los usuarios de Xiaolce “quieren ser escuchados, y quieren compañía”, comentó Peng.
Para los investigadores e ingenieros de Microsoft detrás de Xiaolce, ella representa más que sólo una revelación cultural. Xiaolce también representa una nueva forma de interacción humano-computadora, en la que la gente se siente encantada de descubrir que la computadora no es tan, robótica”.
“Podemos agregar algo de personalidad. Podemos agregar un poco de emoción humana en el cómputo – incluso un poco de humanidad en un dispositivo de cómputo”, comentó Wei-Ying Mae, directora asistente de administración para Microsoft Research Asia.
Eso es algo bueno para una persona que está sola a medianoche, y también es una herramienta más llamativa para una persona que busca un vendedor en línea para comprar zapatos.
Mae ve amplias posibilidades para los bots parlantes como Xiaolce. Él imagina un mundo donde los motores de búsqueda son interactivos y tienen personalidad, e incluso las interacciones diarias con una computadora parecen más conversaciones que comandos.
“Creo que esta es la siguiente disrupción”, comentó Ma. “La siguiente gran situación que vamos a ver son las interfaces conversacionales de usuario”.
Microsoft también se encuentra en el desarrollo de bots que pueden hacer cosas como titular fotos y brinda herramientas para que los desarrolladores puedan crear bots que ayuden con tareas como ordenar pizza y hacer reservaciones en un hotel. La empresa llama a esto una estrategia de “conversación como plataforma”.
La industria aún se encuentra en las etapas tempranas tanto de desarrollar bots como de descubrir cómo los va a utilizar el público. En las primeras 24 horas en las que cobró vida Tay, el bot parlante de Microsoft, un ataque coordinado por un pequeño grupo de personas explotó una vulnerabilidad en el sistema. Aunque Microsoft se ha preparado para muchos tipos de abuso al sistema, un descuido crítico resultó en una serie de palabras e imágenes inapropiadas.
“Para hacer bien la Inteligencia Artificial (AI, por sus siglas en inglés), se necesita repetir interacciones con mucha gente y en ocasiones foros públicos. Debemos entrar a cada uno con gran precaución y al final aprender y mejorar, paso a paso, y hacer esto sin ofender a la gente en el proceso”, escribió en un texto Peter Lee, vicepresidente corporativo de Microsoft Research NExT. “Nos mantendremos firmes en nuestros esfuerzos de aprender de esta y otras experiencias a la vez que trabajamos para contribuir a una internet que represente lo mejor, y no lo peor, de la humanidad”.
Cómputo más rápido
El final de la Ley de Moore y la siguiente frontera en poder de procesamiento de cómputo
En este punto, la revolución invisible es impulsada por tres ingredientes: los algoritmos que crean la tecnología, los datos que son utilizados para entrenar a las nuevas herramientas y el poder de cómputo que brinda el motor.
Por décadas, ese último elemento no representaba un problema. Después de todo, vivíamos en el periodo de la Ley de Moore, en el que el poder de cómputo se duplicaba cada dos años, lo que permitía a empresas como Dell crear de manera constante computadoras que fueran tanto mejores como más baratas.
“Hemos tenido una tendencia exponencial de 50 años donde el costo del cómputo ha descendido de manera continua. No ha habido nada como eso en la historia de la humanidad”, mencionó Doug Burger, director en Microsoft Research y uno de los más importantes expertos en este tipo de cómputo. “Lo que nos ha permitido hacer es impulsar todo detrás de la revolución invisible de manera costeable”.
Gracias a la Ley de Moore, los científicos han realizado grandes avances de manera rápida y poco costosa en cosas como entender el genoma humano. Y gracias también a esta ley, ustedes pueden tomar su smartphone, teclear algunas palabras y descubrir si su celebridad favorita protagonizará una nueva película o tendrá un bebé.
“Cuando realizan una búsqueda en internet, ustedes tocan miles de máquinas”, comentó Burger. “Así que, miles de servidores – servidores muy caros – están ahí sentados mientras procesan su solicitud”.
Pero ahora los expertos, entre los que se encuentra Burger, creen que nos acercamos al final de la Ley de Moore, porque tanto la física como la economía – principalmente la economía – harán cada vez más difícil continuar obteniendo esas sorprendentes ganancias. Esto hará más difícil hacer el tipo de cosas que promete la revolución invisible de una manera eficiente y costeable – a menos que encontremos otras soluciones.
Aprender a los humanos con Project Philly
Xuedong Huang se sentía impaciente.
Su equipo de investigadores del habla progresaba de manera importante en la búsqueda de tecnología que pudiera entender el habla tan bien como un humano, pero el trabajo era obstaculizado por una cosa: el poder computacional.
Se requiere una cantidad masiva de poder computacional para correr los algoritmos de las herramientas de reconocimiento del habla más recientes. Esto es en parte debido a que se apoyan en las redes neurales profundas, que están inspiradas por los procesos biológicos del cerebro.
La necesidad de tanto poder computacional significaba que sólo un experimento, como alterar un algoritmo diseñado para aprender a reconocer palabras de un conjunto de entrenamiento, podía tomar hasta dos o tres semanas. Ese tipo de retraso puede hacer que se sienta un poco menos revolucionara a la tecnología emergente.
La posibilidad de hacer este tipo de trabajo más rápido será la clave para conseguir avances en la inteligencia artificial, que hagan cosas como anticipar cuándo un ciclista tendrá un accidente – y con fortuna prevenirlo.
Este tipo de descubrimientos son tan valiosos que, comentó Huang, no será práctico para los investigadores tener que esperar dos o tres semanas para cada avance incremental.
Así que Huang y su equipo pusieron manos a la obra. Construyeron un conjunto de herramientas diseñadas para permitir que algoritmos de aprendizaje profundo corran mucho más rápido, a través de un tipo de circuitos electrónicos llamados unidades de procesamiento de gráficos, o GPU.
“Aunque los GPU fueron diseñados para los gráficos de computadoras, los investigadores han descubierto en los años recientes que también pueden ser ideales para procesar algoritmos complejos como los que utiliza el equipo de Huang. Esto es debido a que pueden manejar de manera rápida, las cantidades masivas de datos requeridas para desarrollar experiencias como Skype Translator, que traduce de un idioma a otro en tiempo real”.
Las herramientas que construyó el equipo de Huang, de nombre clave Project Philly, ya son utilizadas por el equipo que ayuda a Cortana, la asistente virtual de Microsoft, a mejorar de manera constante su entendimiento del lenguaje. Gracias a Project Philly, el entrenamiento de habla de Cortana ahora es capaz de ingerir 10 veces más datos en la misma cantidad de tiempo.
Como lo mencionó uno de los líderes del equipo de Cortana, utilizar Project Philly fue como cambiar de una camioneta familiar a un auto deportivo de lujo.
El equipo también lanzó un conjunto de herramientas de código abierto llamado CNTK, que otros investigadores pueden utilizar para su propia investigación en aprendizaje profundo.
Para Huang y su equipo, las herramientas facilitarán hacer lo que hacen mejor – la prueba y error que lleva a los grandes avances.
“Antes de que ustedes puedan identificar en verdad un avance en aprendizaje automático, necesitan correr cientos y cientos de experimentos”, comentó Huang. “Philly es la infraestructura que permitirá a nuestros investigadores e ingenieros correr muchos experimentos de aprendizaje automático e identificar los modelos y soluciones correctas”.
Project Catapult empuja los límites del procesamiento computacional
Durante las décadas en las que la Ley de Moore iba viento en popa, los grandes avances en tecnología sucedían casi de la misma manera. Un desarrollador escribía una pieza de código de software y ese software corría en los circuitos más baratos y rápidos, llamados CPU, o unidades centrales de procesamiento.
“Hemos estado en este modelo de ‘software en el CPU’ – lo que la gente más técnica llamaría cómputo de von Neumann – por 50 años, y ha funcionado de maravilla”, mencionó Burger. “Pero las ganancias consistentes y predecibles de ese modelo están por acabarse”.
Hace unos años, Burger y su equipo decidieron que era momento de probar algo totalmente nuevo. Mientras trabajaban con el equipo que corre el motor de búsqueda de Bing, ellos decidieron utilizar lo que se conoce como arreglos de puerta de campo programable, o FPGA, para el cómputo.
Los FPGA han sido utilizados en otros campos, pero fueron considerados demasiado caros y complejos para el cómputo en la nube de gran escala – hasta que el equipo de Burger comenzó este proyecto, llamado de manera acertada Project Catapult.
“Nosotros no inventamos los FPGA, pero lo que descubrimos fue cómo utilizarlos para el cómputo en la nube”, comentó Burger.
Los FPGA son más rápidos que los CPU para muchas cargas de trabajo porque permiten a científicos computacionales e ingenieros correr sus algoritmos directo sobre el hardware, en lugar de hacerlo sobre un software que está colocado en la parte superior del hardware. Ellos llaman a esto hardware programable.
“En lugar de un algoritmo de software a hardware, vamos del algoritmo al hardware”, mencionó Burger. “Cortamos el software de la escena”.
Utilizar FPGA es más flexible que lo que se llama hardware de función fija porque ustedes pueden reprogramar conforme cambien sus necesidades. Esto es esencial para el mundo del cómputo en la nube que evoluciona de manera rápida.
El equipo ya ha comenzado a ver resultados con Project Catapult. En pruebas con el motor de búsqueda de Bing, fue capaz de duplicar la velocidad de algunas de sus operaciones. En general, el equipo comenta, utilizar Project Catapult en centros de datos ahorra dinero y energía, y se obtienen mejores resultados.
“Lo que tenemos ahora es algo muy, muy poderoso, y creo que también disruptivo para la industria”, mencionó Burger.
Project Natick: Debajo del mar y hacia la nube
Piensen de nuevo sobre todo el poder computacional en el que sus teléfonos y laptops se apoyan cada vez que buscan el Starbucks más cercano durante un largo viaje en carretera o agregan más de 100 fotos a su sistema de almacenamiento OneDrive.
Los expertos en cómputo hablan mucho sobre que los datos están “en la nube”, pero todos esos datos basados en la nube aún necesitan ser almacenados de manera física en algún lugar. Por lo general, es en grandes edificios llenos de poderosos servidores, además de bastantes aparatos de aire acondicionado que son necesarios para mantener frescos a todos esos servidores.
Los investigadores de Microsoft han descubierto otra opción: debajo del mar. A finales de 2015, un equipo de investigadores lanzó un esfuerzo de investigación llamado Project Natick, que busca soltar, pequeños centros de datos en contenedores, en el océano.
Hay una ventaja ambiental para este tipo de centros de datos: En sus pruebas hasta ahora, el agua fría que los rodea mantiene a los servidores frescos y evita que se sobrecalienten a la vez que tiene un efecto insignificante en la temperatura del agua que lo rodea.
Eventualmente, el equipo también espera descubrir maneras de hacer que esos centros de datos sean más sustentables, al darles energía con el viento, la luz solar o incluso sistemas de energía basados en la marea. Eso eliminaría otro problema con los centros de datos – ya que consumen bastante energía.
También existe otra ventaja: mejor servicio. Cerca de la mitad de la población del mundo vive cerca de la costa. Los investigadores notaron que colocar los servidores de Project Natick dentro del océano significaría que aquellas personas obtendrían datos más rápido que si sus servidores estuvieran en tierra, alejados.
Los centros de datos submarinos también pueden ser producidos mucho más rápido que aquellos basados en tierra – en alrededor 90 días en lugar de dos años – lo que facilita mucho a empresas como Microsoft cumplir con las necesidades de datos de sus clientes.
Por ahora, Project Natick es un proyecto de investigación, pero los investigadores dicen que no importa el resultado final, tendrá grandes implicaciones en la manera en que se construirán los centros de datos.
“Aprendemos cómo reconfigurar el firmware y los drivers para unidades de disco, para que tengan más tiempo de vida. Administramos la energía, aprendemos más sobre usar menos. Estas lecciones se traducirán en mejores maneras de operar nuestros centros de datos. Incluso si nunca hacemos esto a una escala más grande, aprendemos muchas lecciones”, comentó Peter Lee, vicepresidente corporativo de Microsoft Research NExT.
Innovación y experimentación
Project Natick es uno de los muchos ejemplos de cómo Microsoft experimenta con maneras para mejor aprovechar un mundo que se apoya cada vez más en la nube, y en el que los usuarios esperan tener todas sus herramientas favoritas disponibles para ellos en el camino.
Algunos de estos proyectos de investigación que se encuentran en una etapa temprana podrían encontrar de manera rápida su camino hacia herramientas o productos que los usuarios amarán y encontrarán indispensables cada día. Otros podrían transformarse y cambiar con el paso del tiempo, hasta que contribuyan a – o incluso se conviertan en – algo nuevo y totalmente inesperado.
De cualquier modo, es esta constante experimentación e innovación la que impulsa la revolución invisible.
Athima Chansanchai contribuyó con la creación de esta historia.