Una conversación con Kevin Scott: ¿Qué sigue en IA?

Los sistemas de inteligencia artificial impulsados por grandes modelos de lenguaje hoy en día transforman la forma en que las personas trabajan y crean, desde generar líneas de código para desarrolladores de software hasta bocetos para diseñadores gráficos.

Kevin Scott, director de tecnología de Microsoft, espera que estos sistemas de IA continúen con su crecimiento en sofisticación y escala, desde ayudar a abordar desafíos globales como el cambio climático y la educación infantil hasta revolucionar campos desde la atención médica y el derecho hasta la ciencia de los materiales y la ciencia ficción.

De manera reciente, Scott compartió sus pensamientos con nosotros sobre el impacto de la IA para los trabajadores del conocimiento y lo que sigue en IA. Las conclusiones más importantes:

  • Los avances en los grandes modelos de IA y la IA generativa seguirán con el impulso de la productividad, la creatividad y la satisfacción.
  • La IA permitirá avances científicos y ayudará al mundo a resolver algunos de sus mayores desafíos.
  • A medida que estos modelos se convierten en plataformas y Microsoft continúa con la escala de manera responsable de los avances de IA para los clientes, la nube, las inversiones en infraestructura y un enfoque de IA sólido y responsable son fundamentales.

En tu opinión, ¿cuáles fueron algunos de los avances más importantes en IA este año?

Una pintura al óleo de ukiyo de un joven desarrollador de software que programa en un café en una toma cerrada con un código de computadora brillante sobre un fondo oscuro.

Cuando nos dirigíamos al 2022, creo que casi todo el mundo en IA anticipaba cosas en verdad impresionantes para los próximos doce meses. Pero ahora que casi hemos terminado el año, e incluso con esas elevadas expectativas, es alucinante mirar hacia atrás y ver la magnitud de la innovación que vimos de izquierda a derecha en la IA. Las cosas que los investigadores y otras personas han hecho para avanzar en el estado del arte están a años luz de lo que creíamos posible incluso hace unos años. Y casi todo esto es el resultado del avance tan rápido que ha ocurrido con los grandes modelos de IA.

Las tres cosas que más me impresionaron este año fueron el lanzamiento de GitHub Copilot, que es un gran sistema basado en un modelo de lenguaje que convierte las indicaciones en lenguaje natural en código y tiene un impacto positivo dramático en la productividad de los desarrolladores. Abre la codificación a un grupo mucho más amplio de personas que nunca antes, lo cual es increíble porque gran parte del futuro depende de nuestra capacidad para escribir software.

Lo segundo son estos modelos de imagen generativa como DALL∙E 2 que se han vuelto muy populares y más accesibles. Se requiere un grado de habilidad bastante alto para bocetar y dibujar y dominar todas las herramientas del diseño gráfico, la ilustración y el arte. Un sistema de IA como DALL∙E 2 no convierte a la gente común en artistas profesionales, pero les brinda a muchas personas un vocabulario visual que no tenían antes, un nuevo superpoder que nunca pensaron que tendrían.

(Nota del editor: todas las imágenes en esta publicación, excepto la fotografía de Kevin Scott, fueron generadas por un productor que usó DALL∙E 2).

También hemos visto que los modelos de IA se vuelven más poderosos y brindan ganancias aún más sustanciales para los problemas que se utilizan para resolver. Creo que el trabajo sobre el plegamiento de proteínas este año ha sido en verdad bueno en toda la industria de la tecnología, incluido el trabajo que hemos realizado con el laboratorio de David Baker en la Universidad de Washington, el Instituto para el Diseño de Proteínas con RoseTTAFold, y para ayudar con un montón de IA avanzada para hacer cosas transformadoras.

Y eso es bastante emocionante. Cualquier cosa que sea un multiplicador de fuerza en la ciencia y la medicina es bastante beneficiosa para el mundo porque ahí es donde viven algunos de nuestros problemas más grandes y desagradables.

Ese es un año grande e impresionante. Y creo que el próximo año será mejor.

¿Dónde crees que la tecnología de IA tendrá el mayor impacto el próximo año y más allá?

Creo que puedo decir con cierta confianza que 2023 será el año más emocionante que jamás haya tenido la comunidad de IA. Y digo eso después de creer en verdad, que 2022 fue el año más emocionante que jamás hayamos tenido. El ritmo de la innovación sigue su avance a un ritmo acelerado.

Ya hablé sobre GitHub Copilot y es increíble. Pero es la punta del iceberg de lo que los grandes modelos de IA podrán hacer en el futuro: extrapolar la misma idea a todo tipo de escenarios diferentes sobre cómo pueden ayudar en otros tipos de trabajo intelectual más allá de la codificación. Toda la economía del conocimiento verá una transformación en la forma en que la IA ayuda con los aspectos repetitivos de su trabajo y lo hace, en general, más placentero y satisfactorio. Esto se aplicará a casi cualquier cosa: diseñar nuevas moléculas para crear medicamentos, hacer «recetas» de fabricación a partir de modelos 3D o tan solo escribir y editar.

Creo que puedo decir con cierta confianza que 2023 será el año más emocionante que jamás haya tenido la comunidad de IA.

Por ejemplo, he jugado con un sistema experimental que construí para mí con GPT-3 diseñado para ayudarme a escribir un libro de ciencia ficción, que es algo que quería hacer desde que era adolescente. Tengo cuadernos llenos de sinopsis que he creado para libros teóricos, donde describo de qué tratan los libros y los universos donde se desarrollan. Con esta herramienta experimental, he podido romper el atasco. Cuando escribía un libro a la antigua usanza, si tenía 2 mil palabras en un día, me sentía muy bien conmigo mismo. Con esta herramienta, he tenido días en los que puedo escribir 6 mil palabras en un día, lo que para mí es mucho. Se siente como un proceso, a nivel cualitativo, más energizante que lo que hacía antes.

Este es el sueño del «copiloto para todo»: que tendrías un copiloto que podría sentarse a tu lado mientras realizas cualquier tipo de trabajo cognitivo, ayudándote no solo a hacer más, sino también a mejorar tu creatividad en formas nuevas y emocionantes.

Este aumento de la productividad es, con claridad, un impulso para tu satisfacción. ¿Por qué estas herramientas traen más alegría al trabajo?

Todos usamos herramientas para hacer nuestro trabajo. Algunos de nosotros en verdad disfrutamos adquirir las herramientas, dominarlas y descubrir cómo implementarlas de una manera súper efectiva para hacer lo que tratamos de hacer. Creo que eso es parte de lo que pasa aquí. En muchos casos, las personas ahora tienen herramientas nuevas e interesantes y mucho más efectivas que las que tenían antes. Hicimos un estudio que encontró que el uso de herramientas sin código o de bajo código tuvo un impacto positivo de más del 80% en la satisfacción laboral, la carga de trabajo general y la moral de los usuarios. En especial para las herramientas que se encuentran en sus etapas más o menos tempranas, eso es solo un gran beneficio para ver.

Para algunos trabajadores, de manera literal mejora ese flujo central en el que se involucran cuando hacen el trabajo; te acelera. Es como tener un mejor par de zapatillas para correr una carrera o un maratón. Esto es justo lo que vemos con las experiencias que los desarrolladores tienen con Copilot; ellos informan que Copilot les ayuda a mantenerse en el flujo y mantiene sus mentes más agudas durante lo que solían ser tareas aburridas y repetitivas. Y cuando las herramientas de IA pueden ayudar a eliminar la monotonía de un trabajo, algo que es súper repetitivo o molesto o que se interpone en su camino para llegar a lo que en verdad disfrutan, como era de esperar, mejora la satisfacción.

A nivel personal, estas herramientas me permiten estar en estado de flujo por más tiempo que antes. El enemigo del flujo creativo es la distracción y quedarse atascado. Llego a un punto en el que no sé muy bien cómo resolver lo siguiente, o lo siguiente es, como, «Tengo que ir a buscar esto». Tengo que cambiar el contexto de lo que hacía para resolver el subproblema”. Estas herramientas me resuelven cada vez más el subproblema para que me mantenga en el flujo.

Además de GitHub Copilot y DALL∙E 2, la IA aparece en los productos y servicios de Microsoft de otras maneras. ¿Cómo mejora la IA de próxima generación los productos actuales, como Teams y Word?

Una pintura al óleo impresionista de una mujer en una videollamada.

Esta es la gran historia no contada de la IA. Hasta la fecha, la mayoría de los beneficios de la IA se distribuyen en mil cosas diferentes en las que es posible que ni siquiera aprecies por completo la cantidad de experiencia que obtienes con el producto que proviene de un sistema de aprendizaje automático.

Por ejemplo, estamos sentados aquí en esta llamada de Teams en video y, en el sistema, hay todos estos parámetros que fueron aprendidos por un algoritmo de aprendizaje automático. Hay búferes de fluctuación para el sistema de audio para suavizar la comunicación. El desenfoque detrás tuyo en tu pantalla es un algoritmo de aprendizaje automático en el trabajo. Hay más de una docena de sistemas de aprendizaje automático que hacen que esta experiencia sea más agradable para los dos. Y eso es cierto en todo Microsoft.

Hemos pasado del aprendizaje automático en algunos lugares a. literal, mil elementos de aprendizaje automático distribuidos en diferentes productos, desde cómo funciona tu cliente de correo electrónico de Outlook, tu texto predictivo en Word, tu experiencia de búsqueda en Bing, hasta cómo se ve tu fuente de noticias en Xbox Cloud Gaming y LinkedIn. Hay IA por todas partes que hace que estos productos sean mejores.

Una de las grandes cosas que ha cambiado en los últimos dos años es que solía haber un modelo especializado para cada una de estas tareas que tenemos en todos nuestros productos. Ahora tienes un solo modelo que se usa en muchos lugares porque son bastante útiles. Poder invertir en estos modelos que se vuelven más poderosos con la escala, y luego tener todas las cosas construidas sobre el modelo que se benefician de manera simultánea de las mejoras que se realizan, es tremendo.

La investigación y el desarrollo de IA de Microsoft continúan a través de iniciativas como AI4Science y AI for Good. ¿Qué es lo que más te emociona de esta área de la IA?

Una pintura al óleo impresionista de un grupo de científicos en un laboratorio nuclear.

Los problemas más desafiantes que enfrentamos como sociedad en este momento están en las ciencias. ¿Cómo se curan estas enfermedades cuyo tratamiento es complicado? ¿Cómo te preparas para la próxima pandemia? ¿Cómo se brinda atención médica asequible y de alta calidad a una población que envejece? ¿Cómo ayudas a educar a más niños a escala en las habilidades que necesitarán para el futuro? ¿Cómo desarrollas tecnologías que revertirán algunos de los efectos negativos de las emisiones de carbono a la atmósfera? Exploramos cómo llevar algunos de estos emocionantes desarrollos en IA a esos problemas.

Los modelos en estas aplicaciones de ciencia básica tienen las mismas propiedades de escala que los modelos de lenguaje grande. Construyes un modelo, lo pones en un modo auto supervisado donde aprende de una simulación o aprende de su propia capacidad para observar un dominio particular, y luego el modelo que obtienes te permite cambiar de manera drástica el rendimiento de una aplicación, ya sea que lleves a cabo una simulación de dinámica de fluidos computacional o dinámica molecular para el diseño de fármacos.

Hay una inmensa oportunidad allí. Esto significa mejores medicamentos, significa que tal vez podamos encontrar el catalizador que aún no tenemos para solucionar nuestro problema de emisión de carbono, significa acelerar en general la forma en que los científicos y otras personas con grandes ideas pueden trabajar para tratar de resolver los mayores desafíos de la sociedad.

¿Cómo han contribuido los avances en las técnicas informáticas y el hardware a los avances en IA?

Lo fundamental que subyace a casi todo el progreso reciente que hemos visto en IA es cuán crítica ha demostrado ser la importancia de la escala. Resulta que los modelos entrenados en más datos con más poder de cómputo tienen un conjunto de capacidades mucho más rico y generalizado. Si queremos seguir con el impulso de este progreso, y para ser claros, en este momento no vemos ningún fin a los beneficios de una mayor escala, debemos optimizar y escalar nuestra potencia de cómputo tanto como podamos.

Hace dos años, anunciamos nuestra primera supercomputadora Azure AI y en nuestra conferencia de desarrolladores Build de este año, compartí que ahora tenemos varios sistemas de supercomputación que estamos bastante seguros de que son las supercomputadoras AI más grandes y poderosas del mundo en la actualidad. Nosotros y OpenAI usamos esta infraestructura para entrenar casi todos nuestros modelos grandes de última generación, ya sean nuestros modelos Turing, Z-code y Florence en Microsoft o los modelos GPT, DALL∙E y Codex en OpenAI. Y de manera reciente anunciamos una colaboración con NVIDIA para construir una supercomputadora impulsada por la infraestructura de Azure combinada con GPU de NVIDIA.

Imagen de supercomputadora generada por un productor usando DALL∙E 2.

Parte de este progreso solo ha sido a través de la escala de cómputo de fuerza bruta con grupos de GPU cada vez más grandes. Pero tal vez un avance aún mayor sea la capa de software que optimiza la forma en que los modelos y los datos se distribuyen en estos sistemas gigantes, tanto para entrenar los modelos como para luego entregarlos a los clientes. Si vamos a presentar estos modelos grandes como plataformas con las que las personas pueden crear, no solo pueden ser accesibles para la pequeña cantidad de empresas tecnológicas en el mundo con suficientes recursos para construir supercomputadoras gigantes.

Por lo tanto, hemos invertido mucho en software como DeepSpeed para aumentar la eficiencia del entrenamiento y ONNX Runtime para la inferencia. Optimizan el costo y la latencia y, en general, nos ayudan a hacer que los modelos de IA más grandes sean más accesibles y valiosos para las personas. Estoy muy orgulloso de nuestros equipos que trabajan en estas tecnologías porque Microsoft en verdad lidera la industria aquí, y abrimos el código de todo esto para que otros puedan mejorar.

Todos estos avances se desarrollan en medio de una preocupación constante de que la IA afectará los empleos. ¿Cuál es tu pensamiento sobre el tema de la IA y los empleos?

Vivimos en una época de extraordinaria complejidad y cambios macroeconómicos históricos, y mientras miramos hacia el futuro a 5 o 10 años, incluso para lograr un balance neto neutral para todo el mundo, vamos a necesitar nuevas formas de productividad para todos nosotros para poder disfrutar del progreso. Queremos construir estas herramientas de IA como plataformas que muchas personas puedan usar para construir negocios y resolver problemas. Creemos que estas plataformas democratizan el acceso a la IA a muchas más personas. Con ellos, obtendrás un conjunto más rico de problemas resueltos y tendrás un grupo más diverso de personas que podrán participar en la creación de tecnología.

Con la creación de instancias de IA previa, necesitabas una gran cantidad de experiencia solo para comenzar. Ahora puedes llamar a Azure Cognitive Services, puedes llamar al servicio Azure OpenAI y crear productos complicados por sobre estas cosas, sin tener que ser tan experto en IA que tengas que poder entrenar su propio modelo grande desde cero.

Para algunos trabajadores, mejora ese flujo central en el que se involucran cuando hacen el trabajo; te acelera. Es como tener un mejor par de zapatillas para correr una carrera o un maratón.

A medida que todos estos enormes sistemas de IA continúan con su crecimiento y evolución, creo que podemos esperar que estos avances cambien de manera fundamental la naturaleza del trabajo, en algunos lugares más que en otros, y en algunos casos crearán una gran cantidad de nuevos trabajos que no existían antes. Puedes mirar hacia atrás y ver que sucede lo mismo junto a todo tipo de cambios de paradigma famosos en la tecnología a lo largo de la historia: el teléfono, el automóvil, Internet. Y creo que, al igual que esos ejemplos, vamos a necesitar nuevas formas de pensar sobre el trabajo, nuevas formas de pensar sobre las habilidades y estar súper enfocados en asegurarnos de que tenemos suficientes personas talentosas alrededor y capacitadas para los trabajos en verdad críticos.

Otra preocupación asociada con las tecnologías de IA es el potencial de mal uso y abuso. ¿Cuáles son los pasos concretos que Microsoft toma para garantizar que sus herramientas y servicios de inteligencia artificial se desarrollen y utilicen de manera responsable?

Esto es algo que nos tomamos muy en serio. Tenemos un proceso de IA responsable por el que pasan nuestros sistemas de IA, y seguimos con las mejoras de ese proceso. Examinamos lo que hacemos con un equipo multidisciplinario de expertos para tratar de asegurarnos de que entendemos todas las cosas que podrían ser dañinas y que podrían suceder, y mitigamos la mayor cantidad de ellas posible. Ejemplos de eso son cosas como refinar el conjunto de datos utilizado para entrenar modelos, implementar filtros para limitar la generación de contenido dañino, integrar técnicas como el bloqueo de consultas en temas sensibles que ayudan a prevenir el mal uso por parte de malos actores o aplicar tecnología que puede ofrecer respuestas y resultados que sean más útiles y diversas. Y contamos con un plan con el sistema de inteligencia artificial en el que podemos detectar y mitigar lo más rápido posible después del lanzamiento cualquier daño que suceda que no hayamos anticipado.

Otra salvaguardia muy importante es la implementación intencional e iterativa. La mayor parte del trabajo que hacemos es en modelos que tienen una amplia capacidad. Los alojamos en nuestra nube y los hacemos accesibles por API o a través de nuestros productos. Para la API, cualquier desarrollador puede obtener acceso a ella, pero debe cumplir con los términos de servicio para poder usarla, y si viola los términos de servicio, se le puede quitar el acceso. Y para otros productos, podemos comenzar con una vista previa limitada con un número selecto de clientes con casos de uso bien definidos en mente. Las colaboraciones con estos primeros clientes nos ayudarán a asegurarnos de que las medidas de seguridad responsables de la IA funcionen en la práctica para que podamos escalar la adopción de manera más amplia.

En verdad creemos que la seguridad y la responsabilidad son importantes. Con suerte, podemos ofrecer algo de aliento a toda la industria. Con ese fin, todos los recursos y la experiencia que hemos aplicado para desarrollar algunas soluciones se comparten con el resto de la comunidad en general a través de nuestros Principios y estándares de IA responsable.

Imagen superior: la fotografía central del director de tecnología de Microsoft, Kevin Scott, es cortesía de Microsoft. Las imágenes izquierda y derecha fueron creadas por un productor a través de DALL∙E 2, el sistema de IA de OpenAI que puede crear imágenes e ilustraciones realistas a partir de descripciones de texto.