Por: Jennifer Langston.
La mayoría de las personas no pensarían en enseñar a los niños de cinco años a pegarle a una pelota de beisbol con sólo darles un bate y la bola, diciéndoles que tiren objetos al aire en un millón de combinaciones diferentes a la espera de que descubran cómo se conectan las dos cosas.
Y aun así, esta es de alguna manera la forma en que nos acercamos hoy al aprendizaje automático, a través de mostrar a las máquinas grandes cantidades de datos a la espera de que aprendan asociaciones o encuentren patrones por su cuenta.
Para muchas de las aplicaciones más comunes de las tecnologías IA de la actualidad, como reconocimiento de texto o imagen, esto funciona muy bien.
Pero conforme ha crecido el deseo de utilizar IA para más escenarios, los científicos y desarrolladores de productos de Microsoft han sido pioneros en un enfoque complementario llamado enseñanza automática. Esta se apoya en la experiencia de la gente para dividir un problema en tareas más sencillas y dar a los modelos de aprendizaje automático pistas importantes sobre cómo encontrar más rápido una solución. Es como enseñar a un niño a dar un home run al poner primero la bola en un soporte, luego lanzar la bola por debajo de la cabeza para después pasar a las bolas rápidas.
“Esto es algo muy natural e intuitivo cuando hablamos sobre esto en términos humanos pero queremos cambiar el aprendizaje automático, la mentalidad de todos, ya sea que se den cuenta o no, es ‘sólo lancemos bolas rápidas al sistema’”, comentó Mark Hammond, gerente general de negocios IA para Microsoft. “El aprendizaje automático es un conjunto de herramientas que te ayudan a dejar de hacer eso”.
La enseñanza automática busca obtener conocimiento de la gente en lugar de extraer conocimiento sólo de los datos. Una persona que entiende la tarea en cuestión, se trate de decidir qué departamento en una compañía debería recibir un email entrante o cómo posicionar de manera automática las turbinas eólicas para generar más energía, primero debe descomponer ese problema en partes más pequeñas. Luego, deberían proporcionar un número limitado de ejemplos, o el equivalente a planes de lección, para ayudar a los algoritmos de aprendizaje automático a resolverlo.
En escenarios supervisados de aprendizaje, la enseñanza automática es en particular útil cuando existen pocos datos o datos no etiquetados de entrenamiento para los algoritmos de aprendizaje automático debido a que las necesidades de una industria o compañía son muy específicas.
En escenarios ambiguos o difíciles de aprendizaje de refuerzo, donde los algoritmos tienen problemas en descubrir cuál de los millones de acciones posibles deberían tomar para dominar tareas en el mundo real, la enseñanza automática puede reducir de manera dramática el tiempo que toma a un agente inteligente encontrar la solución.
También es parte de una meta mayor permitir que un amplio grupo de personas utilicen IA en maneras más sofisticadas. La enseñanza automática permite a los desarrolladores o expertos en la materia con poca experiencia en IA, como abogados, contadores, ingenieros, enfermeras u operadores de montacargas, impartir conceptos abstractos a un sistema inteligente, que luego desempeña las mecánicas del aprendizaje automático en segundo plano.
Los investigadores de Microsoft comenzaron a explorar los principios de la enseñanza automática hace casi una década, y esos conceptos ahora se han convertido en productos que ayudan a las compañías a construir todo, desde bots inteligentes de servicio al cliente a sistemas autónomos.
“Incluso la IA más inteligente va a batallar por sí misma para aprender cómo realizar algunas de las tareas más complejas que son comunes en el mundo real. Por esta razón necesitas un enfoque como este, con gente que guíe a los sistemas de IA para que aprendan las cosas que ya sabemos”, comentó Gurdeep Pall, vicepresidente corporativo de Microsoft para negocios IA. “Tomar esta llave de IA y hacer que los no expertos la usen para realizar tareas mucho más complejas es en realidad el punto perfecto para la enseñanza automática”.
Hoy, si tratamos de enseñar a un algoritmo de aprendizaje automático a que aprenda qué es una mesa, de manera muy sencilla podríamos encontrar un conjunto de datos con fotos de mesas, sillas y lámparas que han sido etiquetadas de manera meticuloso. Después de exponer al algoritmo a incontables ejemplos etiquetados, éste aprende a reconocer las características de una tabla.
Pero si le tienen que enseñar a una persona cómo reconocer una mesa, es probable que empiecen con explicar que tiene cuatro patas y una parte superior plana. Si vieran que la persona también pone sillas en esa categoría, tendrían que explicar también que una silla tiene un respaldo y la mesa no. Estas abstracciones y ciclos de retroalimentación son clave para la manera en que la gente aprende, y también pueden incrementar enfoques tradicionales para el aprendizaje automático.
“Si le puedes enseñar algo a otra persona, deberías poder enseñárselo a una máquina a través del lenguaje que es muy cercano a como los humanos aprenden”, comentó Patrice Simard, ingeniero distinguida en Microsoft que es pionera de la labor de enseñanza automática de la compañía para Microsoft Research. Este mes, su equipo se mueve al grupo de Experiencias y Dispositivos para continuar su labor e integrar aún más la enseñanza de máquina con ofertas de IA conversacional.
Millones de usuarios potenciales de IA
Simard comenzó a pensar por primera vez sobre un nuevo paradigma para construir sistemas IA cuando notó que casi todos los documentos en conferencias de aprendizaje automático se enfocaban en mejorar el desempeño de algoritmos en puntos de referencia curados de manera cuidadosa. Pero en el mundo real, se dio cuenta que enseñar es un componente igual o tal vez más importante para el aprendizaje, en especial para tareas simples donde hay datos limitados disponibles.
Si quieren enseñar a un sistema de IA cómo elegir el mejor auto, pero sólo tienen algunos ejemplos que fueron etiquetados como “bueno” o “malo”, este podría inferir de esa información limitada que una característica definitoria de un buen auto es que el cuarto número de su placa sea un “2”. Pero apuntar al sistema de IA hacia las mismas características que le dirían a su hijo adolescente que considere, como rendimiento de combustible, clasificación de seguridad, resultados de pruebas de impacto, precio, permite a los algoritmos reconocer autos buenos y malos de manera correcta, a pesar de la disponibilidad limitada de los ejemplos etiquetados.
En escenarios supervisados de aprendizaje, la enseñanza automática mejora los modelos al identificar estas características significativas de alto nivel. Como en la programación, el arte de la enseñanza automática también involucra la descomposición de tareas en tareas más sencillas. Si las características necesarias no existen, pueden ser creadas a través de la utilización de submodelos que utilizan menos niveles de características y tienen la simpleza suficiente para ser aprendidos a partir de algunos ejemplos. Si el sistema comete el mismo error de manera consistente, los errores pueden ser eliminados al agregar características o ejemplos.
Uno de los primeros productos de Microsoft que emplea conceptos de enseñanza automática es Language Understanding, una herramienta en Azure Cognitive Services que identifica la intención y los conceptos clave en un texto corto. Ha sido utilizado por compañías que van desde UPS y Progressive Insurance a Telefónica para desarrollar bots inteligentes de atención a clientes.
“Para saber si un cliente tiene una pregunta sobre facturación o sobre un plan de servicio, no tienes que darnos cada ejemplo de la pregunta. Puedes brindar cuatro o cinco, junto con las características y las palabras clave que son importantes en ese dominio, y Language Understanding se encarga de la maquinaria en segundo plano”, comentó Riham Mansour, gerente de ingeniería de software responsable de Language Understanding.
Los investigadores de Microsoft exploran como aplicar conceptos de enseñanza automática para problemas más complicados, como clasificar documentos, emails e incluso imágenes más grandes. También trabajan en hacer más intuitivo el proceso de enseñanza, como sugerir a los usuarios qué características podrían ser importantes para resolver la tarea.
Imaginen que una compañía quiere utilizar IA para escanear todos sus documentos e emails del año pasado para descubrir cuántas cotizaciones se enviaron y cuántas terminaron en ventas, comentó Alicia Edelman Pelton, gerente principal de programa para el grupo de enseñanza automática de Microsoft.
Como un primer paso, el sistema tiene que saber cómo identificar una cotización de un contrato o un recibo. En ocasiones, no existen datos etiquetados de entrenamiento para ese tipo de tarea, en particular si cada vendedor en la compañía que los maneja de manera un poco diferente.
Si el sistema utilizaba técnicas tradicionales de aprendizaje automático, la compañía necesitaría subcontratar ese proceso, enviar miles de documentos muestra e instrucciones detalladas para que un ejército de personas pueda intentar etiquetarlos de manera correcta, un proceso que puede tomar meses de ida y vuelta para eliminar el error y encontrar todos los ejemplos relevantes. También necesitarían a un experto en aprendizaje automático, que tendría una alta demanda, para construir el modelo de aprendizaje automático. Y si nuevos vendedores comenzaran a utilizar diferentes formatos en los que el sistema no estuviera entrenado, el modelo se confundiría y dejaría de funcionar bien.
En contraste, comenta Pelton, el enfoque de enseñanza automática de Microsoft utilizaría a una persona dentro de la compañía para que identifique las características y estructuras definitorias encontradas de manera común en una cotización: algo enviado por un vendedor, el nombre de un cliente externo, palabras como “cotización” o “fecha de entrega”, “producto”, “cantidad”, o “términos de pago”.
Traduciría la experiencia de la persona en lenguaje que una máquina pueda entender y utilizar un algoritmo de aprendizaje automático que haya sido preseleccionado para desarrollar esa tarea. Esto puede ayudar a los clientes a construir soluciones de IA a la medida en una fracción de tiempo a través del uso de experiencia que ya existe dentro de su organización, comentó Pelton.
Pelton notó que hay innumerables personas en el mundo “que entienden su negocio y pueden describir los conceptos importantes, un abogado que dice, ‘Oh, sé cómo se ve un contrato y sé cómo es una convocatoria y te puedo dar las pistas para mostrar las diferencias’”.
Hacer en verdad solucionables los problemas difíciles
Hace más de una década, Hammond trabajaba como programador de sistemas en un laboratorio de neurociencias de Yale y notó cómo los científicos utilizaban un enfoque paso a paso para entrenar animales a que desarrollen tareas para sus estudios. Tuvo una epifanía similar sobre tomar prestadas esas lecciones para enseñar a las máquinas.
Eso lo llevó a fundar Bonsai, que fue adquirido por Microsoft en 2018. Combina enseñanza automática con aprendizaje de refuerzo profundo y simulación para ayudar a las compañías a desarrollar “cerebros” que corren sistemas autónomos en aplicaciones que van desde robótica y manufactura a energía y gestión de construcción. La plataforma utiliza un lenguaje de programación llamado Inkling para ayudar a los desarrolladores e incluso a los expertos en la materia a descomponer problemas y escribir programas de IA.
El aprendizaje de refuerzo profundo, una rama de la IA en la cual los algoritmos aprenden a través de prueba y error basados en un sistema de recompensas, ha superado con éxito a las personas en videojuegos. Pero esos modelos han batallado en dominar tareas industriales más complicadas del mundo real, comentó Hammond.
Agregar una capa de enseñanza automática, o infundir la experiencia única en la materia de una organización directo en un modelo de refuerzo de aprendizaje profundo, puede reducir de manera importante el tiempo que toma encontrar soluciones a esos problemas del mundo real con una compleja profundidad, mencionó Hammond.
Por ejemplo, imaginen que una compañía de manufactura quiere entrenar un agente de IA para que calibre de manera autónoma una pieza crítica de equipo que se puede desestabilizar a medida que la temperatura o la humedad fluctúan o después de que ha estado en uso por algún tiempo. Una persona podría utilizar el lenguaje Inkling para crear un “plan de lección” que destaque información relevante para desempeñar la tarea y monitorear si el sistema se desempeña de manera correcta.
Armado con la información de su componente de enseñanza automática, el sistema de Bonsai seleccionaría el mejor modelo de refuerzo de aprendizaje y crearía un “cerebro” de IA para reducir los costosos tiempos de paro al calibrar el equipo de manera automática. Probaría diferentes acciones en un ambiente simulado y sería recompensado o penalizado según qué tan rápido o preciso desempeñe la calibración.
Decirle a ese cerebro de IA qué es lo importante en lo que se debe de enfocar puede crear un corto circuito en muchas exploraciones infructuosas y lentas, ya que trata de aprender en simulación lo que funciona y lo que no, comenta Hammond.
“La razón por la que la enseñanza automática es crítica se debe a que si sólo se utiliza el aprendizaje de refuerzo de manera ingenua y no se le da ninguna información sobre cómo resolver el problema, va a explorar de manera aleatoria y se espera que, aunque no siempre con frecuencia, llegue a una solución que funcione”, menciona Hammond. “Hace que los problemas sean en verdad solucionables, mientras que sin la enseñanza automática no lo son”.
Material relacionado con la enseñanza automática:
- Visiten: Microsoft Research Machine Teaching Group
- Visiten: Azure Language Understanding
- Lean: Microsoft adquiere Bonsai en camino a construir “cerebros” para sistemas autónomos
Jennifer Langston escribe sobre investigación e innovación en Microsoft. Síganla en Twitter.