Por: Harry Shum, vicepresidente ejecutivo de Microsoft AI y del grupo de investigación
Imaginen a un vehículo autónomo que navega por una mina llena de humo en busca de sobrevivientes, pertenencias personales o cualquier otra pista para encontrar a alguien que podría estar vivo. Identifica los objetos que ve y decide qué rutas tomar primero. Conforme llega al límite que puede explorar, un dron integrado en el vehículo vuela para explorar las esquinas de la mina que son difíciles de alcanzar. Todo esto se hace sin comunicación con el exterior. Créanlo o no, ¡Esto no es ciencia ficción! Team Explorer de la Universidad Carnegie Mellon y de la Universidad del Estado de Oregon hicieron justo esto para ganar el Subterranean Challenge en el primer evento de la Agencia de Proyectos de Investigación de Defensa Avanzada (DARPA, por sus siglas en inglés).
Hoy vivimos en la era de la inteligencia artificial (IA) dirigida por datos, donde los sistemas de inteligencia automática resuelven problemas difíciles al considerar cientos de millones de pruebas o episodios de entrenamiento. Los problemas difíciles en percepción y la toma de decisiones que se consideraba muy complicada por la comunidad incluso en el pasado reciente son ahora resueltas de manera exitosa a través de técnicas como el aprendizaje de refuerzo (RL).
A menudo pienso sobre cómo avances como estos en percepción automática y toma de decisiones automatizada podrían ayudarnos a hacer cosas como construir robots inteligentes y en particular enfrentar los desafíos del control óptimo de sistemas dinámicos. Y desde mis primeros días como estudiante graduado en Carnegie Mellon, me ha fascinado el estrecho bucle entre percepción – utilizar inteligencia computacional para detectar el entorno – y acción – utilizar esta retroalimentación y estos datos para tomar decisiones. Hoy, nuestra labor de enseñar a las computadoras a jugar (por ejemplo, dominar Ms. Pac-Man) tiene la capacidad de cambiar de manera fundamental la forma en que construimos sistemas de control en el futuro. Las aplicaciones potenciales podrían impactar a un amplio rango de industrias con un profundo impacto en seguridad y productividad – y va más allá de los coches autónomos que dominan los ciclos noticiosos actuales.
Los sistemas y dispositivos de ingeniería de hoy en día utilizan lógica basada en reglas para reunir los principios científicos, la tecnología y las matemáticas que han sido descubiertos de manera cuidadosa con el tiempo por expertos en la materia e ingenieros. Pero ¿Qué pasa si nuestros ingenieros del futuro pudieran construir sistemas de control infundidos con inteligencia automática que vayan más allá de la lógica basada en reglas, y respondieran en tiempo real a los cambiantes entornos para cumplir sus metas? Tecnologías como RL que han visto un tremendo éxito en resolver videojuegos serán clave para la construcción de mecanismos de toma de decisiones secuencial del mundo real e impulsarán a nuestra siguiente generación de sistemas autónomos.
Ayudar a los ingenieros a construir bucles de acción-percepción para el mundo real
Traducir el éxito de RL en los videojuegos a sistemas autónomos del mundo real conlleva grandes desafíos – por ejemplo, ¡Nadie pierde la vida después de hacer un mal movimiento en un videojuego! La IA no puede aprender de sus fallos tan fácil en el mundo real, donde el costo potencial de los errores puede ser enorme. Adicional a esto, las técnicas más nuevas de IA están hambrientas de datos. Por ejemplo, se necesitan cientos de millones de intentos antes de que una política en apariencia respetable pueda ser entrenada para muchas de estas tareas de juego. Por lo tanto, operar sistemas físicos como máquinas o procesos químicos para millones de ciclos para generar los datos para entrenar a una IA puede ser una propuesta muy costosa.
En esta ocasión, me emociona hablar sobre cómo nuevos avances en el mundo de la enseñanza automática y la creación de simulaciones de alta fidelidad les permitirá hacer frente a esos desafíos.
Enseñanza automática – un nuevo paradigma para infundir conocimiento de dominio para ayudar a mejorar el aprendizaje
Nuestros investigadores han trabajado duro en el desarrollo de la enseñanza automática, la cual infunde conocimiento experto de dominio y aprovecha la experiencia humana para romper un problema grande en tareas más pequeñas y sencillas. También puede dar a los modelos de IA pistas importantes sobre cómo encontrar más rápido una solución, lo que acelera de manera importante el tiempo de entrenamiento del modelo. Bajo el capó todavía hay IA, pero ustedes como expertos brindan ejemplos, o planes de lección, para ayudar a los algoritmos de aprendizaje a resolver la tarea en cuestión. Dado que ustedes son los que dan las lecciones, describen las metas, el comportamiento deseado, y las condiciones de límites de seguridad, los modelos resultantes de IA también son mucho más explicables y auditables una vez que han sido implementados. ¡Sé que no querría un modelo IA de “caja negra” que corra el bucle de control para mis sistemas!
Tomo prestada una cita de Alfred Aho y Jeffrey Ullman, “Las Ciencias de la Computación son una ciencia de abstracción, de crear el modelo correcto para pensar sobre un problema e idear las técnicas que puedan ser mecanizadas y sean apropiadas para resolverlo”. Creo que la enseñanza automática es la abstracción que creamos, el modelo correcto para pensar sobre aplicar la experiencia de dominio a los sistemas de IA. Te puede ayudar a establecer un puente entre la mentalidad de los ingenieros donde el modelo es primero y la mentalidad donde el código es primero practicada por los desarrolladores de software.
Simulaciones de alta fidelidad – Una ruta crítica para reunir experiencias a escala
Similares a la enseñanza automática, las simulaciones ofrecen una manera de generar datos sintéticos que pueden entrenar a los sistemas de inteligencia automática a escala y sin tomar riesgos innecesarios. Las simulaciones son una manera segura y rentable para entrenar modelos IA, si pueden modelar los elementos clave como los dispositivos, los sensores y el entorne que interactúan con su sistema. Esto les permite simular todos los escenarios posibles, incluidas situaciones de entorno – como cuando un cierto sensor o actuador falla – para enseñar a la IA cómo adaptarse a esas situaciones.
Por ejemplo, construimos un simulador de código abierto para vehículos aéreos y otros vehículos robóticos llamado Aerial Informatics and Robotics Simulation, o AirSim. AirSim permite la simulación de una amplia variedad de entornos, condiciones de luz, sensores y fusión de datos de sensor. La capacidad de AirSim de crear una canalización de autonomía casi real es la manera en que el equipo Explorer aseguro el triunfo.
La mayoría de nuestros clientes utilizan software de simulación con una alta especialización para sus casos de uso específico. Trabajamos con líderes creadores de simulación en la industria como MathWorks para llevar estos simuladores a Azure. MathWorks es el desarrollador líder de software de cómputo matemático, incluido MATLAB y Simulink, utilizado por millones de ingenieros y científicos para diseñar sistemas complejos integrados y multidominio. Estas asociaciones les permitirán producir de manera sencilla grandes volúmenes de datos sintéticos requeridos para entrenar modelos de IA de manera rápida para su caso de uso específico.
Las posibilidades son ilimitadas, y el momento es ahora
Continuamos con la labor de llevar la IA a ingenieros y diseñadores que aprovecharán su experiencia y autonomía confiable como la base para la innovación acelerada. Clientes como Delta, Shell y Toyota han comenzado a utilizar y beneficiarse de este enfoque. Desde aplicaciones industriales a operaciones de búsqueda y rescate como en el reto de DARPA, las aplicaciones de esta tecnología serán ilimitadas. ¡Esperamos que nos acompañen en esta jornada para comenzar a inventar el futuro!
Contenido relacionado:
Visiten: Sistemas autónomos con Microsoft AI
Lean: Cómo los sistemas autónomos utilizan IA que aprende del mundo que los rodea
Lean: Ayudar a servicios de emergencia a conseguir más con sistemas autónomos y AirSim
Lean: Enseñanza automática: Cómo la experiencia de las personas hace aún más poderosa a la IA
Conozcan más: Competencia Game of Drones en NeurIPS 2019