La ciencia imita a la naturaleza: Investigadores de Microsoft prueban una elevada máquina controlada por IA
Por: Allison Linn
HAWTHORNE, Nevada – En un abrasador medio día en el desierto de Nevada, un Jeep Wrangler blanco desciende por un desolado camino de tierra, rodeado por ambos lados de miles de artemisas y arena.
Mientras que el Jeep salta por el camino, dos miembros de un equipo de investigación de Microsoft, Jim Piavis y Rick Rogahn, se sujetan a la barra antivuelco, sus pies plantados en los asientos y la parte superior de sus cuerpos sobresale por el techo abierto. Escanean el brillante cielo azul, rastrean un cierto tipo de parapente conocido como un planeador.
El delicado planeador negro, blanco y rojo vira con fuerza y de manera desigual al principio, pero después de manera gradual comienza a realizar círculos amplios y ascendentes.
Un halcón aparece junto a él, lo sigue y realiza el mismo patrón de movimientos.
“Tenemos un amigo allá arriba con nosotros” dice Piavis, director de la preparación para las misiones. “Es una buena señal”.
El planeador de 16.5 pulgadas y 12.5 libras ha encontrado una térmica o una invisible columna de aire que se eleva debido al calor. Pronto, se eleva por el cielo, el Jeep acelera a 30 millas por hora mientras vuela por el camino de tierra en búsqueda de lo que el equipo llama la máquina infinita de elevación.
Los investigadores de Microsoft han creado un sistema que utiliza inteligencia artificial para mantener al planeador en el aire sin la necesidad de un motor, a través de encontrar de manera autónoma y tomar viajes a través de columnas térmicas que ocurren de manera natural, similar a lo que hacen las aves para mantenerse en las alturas.
“Las aves hacen esto de manera continua, todo lo que hacen es aprovechar la naturaleza, y lo hacen con un cerebro del tamaño de una nuez”, dice Ashish Kapoor, uno de los directores de investigación en Microsoft.
Las aves lo hacen de manera natural. Para que una máquina lo realice requiere de un complejo conjunto de algoritmos de IA para identificar cosas como la temperatura del aire, dirección del viento y áreas donde no está permitido volar. Después, el sistema debe utilizar otros métodos de IA para tomar esa información y realizar predicciones en tiempo real acerca de los lugares donde es posible que puedan encontrar su siguiente viaje a través de una columna térmica.
En conjunto, eso es mucho más complejo que la mayoría de los sistemas de IA que las personas utilizan en la actualidad para realizar tareas individuales como el reconocimiento facial en una foto, o las palabras en una conversación.
Kapoor dice que es probable que sea uno de los pocos sistemas de IA que operan en el mundo real que no sólo realiza predicciones, sino que actúa con base en dichas predicciones.
Aún es un trabajo en proceso, pero Kapoor dice que la infinita máquina de elevación podría ser utilizada de manera eventual para todo tipo de tareas prácticas, tales como monitorear cultivos en zonas rurales o proveer servicio de internet móvil en un lugar donde es difícil obtener la conectividad necesaria.
“Estas podrían ser sus torres celulares algún día”, Kapoor dice. “No necesitan ninguna infraestructura terrestre”.
De manera eventual, el equipo dice que el planeador podría incluso utilizar el poder del sol o del viento para reunir energía, y en teoría, hacer posible que se mantenga en el aire de manera indefinida.
IA en el mundo real
El planeador autónomo es útil para y por sí mismo. Pero Andrey Kolobov, el investigador de Microsoft a cargo del proyecto y de los esfuerzos de ingeniería, dice que también esperan que el trabajo aplique en muchos otros sistemas sofisticados que ya comienzan a emerger que se apoyan en la IA, que operarán en ambientes reales e impredecibles.
“Para nosotros, el planeador es un lecho de prueba para las tecnologías que se encuentran al centro de lo que será considerado inteligente en los próximos 10 años”, él dice.
Para las personas que dependen de la IA para ayudarlos con cosas como conducir autos, mantener seguros sus hogares o gestionar sus ocupadas agendas todos los días, estos sistemas necesitarán tomar decisiones complejas y confiables en el lugar, basados en diversas variables como el tráfico, el ruido, clima, otros objetos e incluso emociones humanas. Y hay más, no podrán tener muchos errores, eso sería costoso y peligroso de manera potencial.
“La IA en el mundo real tendría muy poco espacio para el error, como nuestro planeador”, dice Kolobov.
En términos de investigación, esta clase de capacidad es conocida como toma de decisiones secuencial bajo incertidumbre.
“La verdadera pregunta es, ¿Cómo planificar para el futuro, varios pasos por delante?” Kapoor dice. “En términos de computación, representa un gran problema”.
La teoría de la IA en acción
El planeador que prueban en Nevada se apoya en una batería para correr equipo de cómputo a bordo y varios controles como el timón, además de radios para comunicarse con la base en tierra. También tiene un motor para que un piloto pueda realizar operaciones manuales cuando sea necesario. Sin embargo, una vez en el aire, ha sido diseñado para operar por sí solo, y encontrar y utilizar columnas térmicas para viajar sin la ayuda de un motor o una persona.
“Lo que intentamos hacer es asegurar que el planeador sea lo más autónomo e inteligente posible para cambiar su ruta”, Kolobov dice.
Para diseñar el sistema, el equipo de investigadores comenzó con un marco de trabajo para pensar en el problema conocido como el proceso de decisión observable de manera parcial de Markov.
Kolobov, quien escribió un libro en co-autoría acerca del proceso de decisión de Markov, menciona que es un modelo para tomar decisiones de planeación dentro de un ambiente en el cual no es posible saber todo. Con el planeador, el equipo combinó ese modelo con otro enfoque de IA llamado el aprendizaje reforzado de Bayesian, para crear una manera en la que el sistema aprenda lo que necesita saber sobre su ambiente lo más rápido posible y tomar las decisiones correctas.
El equipo también utiliza lo que se llama el árbol de investigación de Monte Carlo, el cual es una manera de que la IA busque el curso de acción más prometedor.
El sistema de IA del planeador está dividido en dos partes: El planeador de alto nivel y de bajo nivel.
El planador de alto nivel toma en cuenta todos los factores del ambiente e intenta crear una política de los lugares a donde el planeador debería ir para buscar columnas térmicas. Esta parte mejora al momento de realizar las predicciones conforme el tiempo avanza, basada en la información que el planeador recolecta cada vez que está en el aire.
“Para el planeador de alto nivel, la experiencia cuenta”, dice Kolobov. “El desempeño del sistema será mejor el viernes a comparación del jueves ya que incorpora información basada en los vuelos pasados”.
El planeador de bajo nivel es la parte que utiliza el aprendizaje reforzado de Bayesian para detectar y fijarse a las columnas térmicas en tiempo real gracias a los datos capturados por parte de los sensores del planeador. Piénsenlo como aprendizaje por ejecución.
Prueba de realidad
Para construir esos algoritmos de IA, se requirieron meses de trabajo en las oficinas de Microsoft en el campus de Redmond, Washington.
Una vez que el clima se tornó caluroso y las columnas térmicas mejoraron, el equipo realizó pruebas limitadas vuelo en una granja cerca de los cuarteles generales de la compañía. Pero no fue hasta que llegaron al pequeño espacio aéreo en Hawthorne, Nevada a mediados de agosto, que tuvieron la oportunidad de ver cómo todas las teorías funcionarían en el mundo real.
El día que descubrieron al halcón, el equipo ya había recorrido el camino de tierra durante cuatro días, combatido condiciones de mucho polvo y el fuerte reflejo del sol mientras lanzaban el planeador una y otra vez.
Detrás del Jeep, una extra-larga y borgoña Ford Expedition se estableció como una oficina improvisada, abarrotada de múltiples computadoras, herramientas para reparaciones en campo y otros cuatro miembros del equipo de investigación. El poderoso AC hace muy poco para combatir el calor del desierto y proteger a la gran cantidad de computadoras.
Mientras que el planeador vuela sobre ellos, los becarios de investigación Lain Guilliard y Sangwoo Moon, ambos escritores de los algoritmos principales que ayudaron a darle poder al sistema, utilizan cuatro laptops para rastrear el progreso y monitorear cómo este aprovecha las condiciones climatológicas, incluidas las columnas térmicas.
Cada cierto tiempo, Guilliard resalta los parámetros de vuelo del planeador, mientras que las personas en el Jeep escanean el aire para obtener pruebas físicas sobre la posición del planeador. Kolobov y Debadeepta Dey, un investigador de Microsoft que diseñó el módulo de predicción térmica del planeador, hace varios recorridos en la oficina móvil detrás del Jeep y el planeador.
Además de encontrar columnas térmicas, el sistema necesita planear sus acciones para evitar ciertos obstáculos como montañas cercanas, un lago grande y municiones que la armada de los Estados Unidos almacena en el área cercana al sitio de pruebas de vuelo.
El desordenado ambiente del mundo real, con todos sus giros y obstáculos que serían imposibles de predecir en la oficina, provee el terreno de pruebas perfecto para el sistema.
Muchos de los problemas con los que se encuentran y deben resolver, no tienen nada que ver con la IA. Una falla en la comunicación del sistema crea problemas con el planeador más grande que prueban, y el equipo sospecha que partículas magnéticas en el polvo del camino pueden ser las responsables de los daños a los equipos electrónicos.
Durante una de las pruebas, cuando intentan lanzar el planeador con ayuda de una cuerda de bungee atada al Jeep después de una falla del motor, la cuerda se rompe.
Con cada falla, el equipo trabaja con paciencia para encontrar una solución: Reparar el motor, reparar la cuerda de bungee, encontrar una nueva batería, usar otro planeador cuando uno es retirado.
Kolobov dice que estos problemas del mundo real son justo lo que llevó a muchas personas a participar en este proyecto. También es la razón de por qué no se desaniman con cada cosa inesperada con la que se encuentran.
“Esta es la razón de por qué la realidad es diferente a la simulación”, Kolobov dice. “Y por eso estamos aquí. Vinimos a aprender y no son exactamente las cosas que esperábamos aprender”.
“El algoritmo lo hace mejor que yo”
Se hace tarde un viernes cuando el equipo se reúne en el pequeño aeropuerto de Hawthorne para una última sesión de preguntas.
Una hora antes, durante el último vuelo, los algoritmos se han desempeñado justo como lo habían anticipado, al hacer que el planeador se elevara en el aire, justo antes de que la batería de pronto se acabara y que el planeador se fuera en picada hacia la arena y artemisas con una alarmante velocidad.
Rogahn, cuyo trabajo era el de ser el piloto humano, que provee apoyo a la IA y maniobra, de ser necesario, para que el planeador esté a salvo, pudo recuperar el control en el último momento y prevenir por centímetros, que este se estrellara.
“No es educado portar un sombrero de vaquero en interiores, pero siento que monté un par de toros”, Rogahn dice durante la sesión de preguntas, lo cual provocó la risa en el grupo.
Pero después Rogahn se pone serio, se quita el sombrero y reconoce todo lo que han logrado durante los largos días que estuvieron en el desierto.
“Hemos alcanzado el punto en este verano donde lo ha hecho mejor que yo”, él dice. “el algoritmo lo ha hecho mejor que yo como piloto del planeador”.
Fotos y videos por John Brecher de Microsoft.