Una mujer de pie frente al edificio de una universidad

IA «para todos»: cómo el acceso a nuevos modelos permite avanzar la investigación académica, desde la astronomía hasta la educación

Por: Deborah Bach.

A principios de 2023, la profesora Alice Oh y sus colegas del Instituto Avanzado de Ciencia y Tecnología de Corea (KAIST, por sus siglas en inglés) se dieron cuenta de que necesitaban abordar el creciente interés en OpenAI ChatGPT entre los estudiantes del KAIST.

ChatGPT, una herramienta desarrollada por OpenAI que se ejecuta en grandes modelos de lenguaje y genera respuestas conversacionales basadas en las indicaciones de las personas, podría llevar a los estudiantes a tomar atajos en su trabajo, pero también podría ofrecer beneficios educativos, razonaron. El grupo quería desarrollar un proyecto de investigación que involucrara a los estudiantes en el uso de la tecnología, por lo que comenzaron a pensar en cómo desarrollar su propia aplicación de chat.

«Teníamos prisa», dice Oh, profesora de la Escuela de Computación KAIST. «Nuestro semestre comenzó en marzo, y queríamos que los estudiantes comenzaran a usar esto de inmediato cuando comenzara el semestre».

Personas en un aula de una universidad
So-Yeon Ahn, profesora de inglés en KAIST, guía a los estudiantes que prueban una plataforma creada para ayudar a los estudiantes de inglés como lengua extranjera con la redacción de ensayos. Foto de Jean Chung para Microsoft.

Pronto surgió una solución. En abril de 2023, Microsoft Research lanzó una iniciativa que tiene como objetivo acelerar el desarrollo y el uso de modelos básicos: modelos de IA a gran escala entrenados con grandes cantidades de datos que se pueden usar para una amplia gama de tareas.

Advancing Foundation Models Research (AFMR) proporciona a los investigadores académicos acceso a modelos básicos de última generación a través de Azure AI Services, con el objetivo de fomentar una comunidad global de investigación de IA y crear modelos sólidos y confiables que ayuden a promover la investigación en disciplinas que van desde el descubrimiento científico y la educación hasta la atención médica, el empoderamiento multicultural, el trabajo legal y el diseño.

El programa de becas de la iniciativa incluye 200 proyectos en universidades de 15 países, que abarcan una amplia gama de áreas de interés. Investigadores de la Universidad Northeastern de Boston trabajan en un asistente impulsado por IA diseñado para parecer empático con el bienestar de los trabajadores. En la Universidad Tecnológica de Ciudad Ho Chi Minh en Vietnam, los investigadores planean crear un modelo de lenguaje grande (LLM, por sus siglas en inglés) ajustado en específico para vietnamita. En Canadá, investigadores de la Universidad de Montreal exploran cómo los LLM podrían ayudar con el diseño molecular y el descubrimiento de nuevos fármacos.

El acceso a los modelos básicos puede ser un reto para los investigadores académicos, que a menudo deben esperar para utilizar recursos compartidos que pueden carecer de la potencia informática necesaria para ejecutar modelos de gran tamaño. Microsoft Research creó la iniciativa para dar a los investigadores acceso a una serie de potentes modelos básicos disponibles a través de Azure y garantizar que el desarrollo de la IA esté impulsado no solo por la industria, sino también por la comunidad de investigación académica.

«Nos dimos cuenta de que para desarrollar la IA hoy en día, en verdad existe una necesidad de que la industria abra la capacidad para la academia», dice Evelyne Viegas, directora senior de Research Catalyst en Microsoft Research. «Esos diferentes puntos de vista podrían dar forma a lo que hacemos».

Con acceso a Azure OpenAI Service, que combina modelos de vanguardia de OpenAI con seguridad, privacidad y protecciones de IA responsables que se ofrecen en Azure, Oh y el equipo de KAIST desarrollaron una plataforma que utiliza los modelos subyacentes a ChatGPT para un chatbot para ayudar a los estudiantes universitarios a escribir ensayos para cursos de inglés como lengua extranjera (EFL, por sus siglas en inglés). Los estudiantes a menudo escriben por la noche, cuando la orientación de los profesores o asistentes de enseñanza no está disponible, dice Oh, y los estudiantes de inglés como lengua extranjera con frecuencia usan herramientas para ayudar a navegar los desafíos de escribir en inglés.

Captura de pantalla de una computadora en una universidad
La plataforma KAIST, desarrollada a través de un programa de becas de Microsoft que ofrece a los académicos acceso a modelos avanzados de IA, fue diseñada para permitir que un chatbot solo responda a las preguntas de los estudiantes, pero no escriba sus ensayos por ellos. Foto de Jean Chung para Microsoft.

El equipo de Oh diseñó el chatbot para responder a las preguntas de los estudiantes, pero no para escribir sus ensayos por ellos. A lo largo de un semestre, 213 estudiantes de inglés como lengua extranjera utilizaron la herramienta para perfeccionar sus ensayos; la plataforma recopiló las preguntas de los estudiantes y las revisiones de ensayos que hicieron en función de las respuestas del chatbot, luego el equipo de Oh analizó los datos y publicó un artículo sobre el experimento.

Los investigadores descubrieron que algunos estudiantes utilizaban de manera amplia la plataforma e incorporaban los comentarios que proporcionaba. Muchos trataron al chatbot como un «compañero inteligente», dice Oh, para sugerir que la tecnología puede ser un complemento útil para la instrucción en el aula. Y dado que la plataforma utiliza GPT-4, un gran modelo multimodal desarrollado por OpenAI que puede comunicarse en varios idiomas, los estudiantes a veces cambiaban entre el inglés y su lengua materna cuando usaban la plataforma, lo que permitía interacciones más naturales.

El equipo de KAIST planea expandir la plataforma a clases de escritura creativa e inglés conversacional. Oh ve un tremendo potencial para la IA generativa en la educación, en particular si los modelos pueden ser entrenados para mostrar a los estudiantes cómo razonar a través de problemas en lugar de simplemente proporcionar respuestas.

«Las universidades deberían aprovechar al máximo esto y empezar a pensar en realidad en cómo podemos utilizar estas herramientas para la investigación científica y la educación», dice.

«Como tener un súper asesor»

Investigadores de la Universidad Estatal Agrícola y Técnica de Carolina del Norte, que recibieron una subvención en el marco del programa Microsoft, desarrollan un sistema de monitoreo de tráfico basado en IA capaz de identificar la congestión vial y los peligros para la seguridad. El proyecto tiene como objetivo automatizar gran parte del trabajo manual requerido por los sistemas tradicionales de monitorización del tráfico.

Los investigadores utilizaron GPT-4 junto con otros modelos de IA que se basan en los datos de tráfico recopilados por el gobierno federal para analizar los patrones de tráfico y la congestión. Los usuarios interactúan con el sistema a través de un chatbot y pueden hacer preguntas sobre las condiciones actuales del tráfico, como qué tan ocupado está el tráfico en un lugar en particular o la velocidad a la que viajan los vehículos.

«Hará que la gestión del tráfico sea más fácil y eficiente», dice Tewodros Gebre, estudiante de doctorado que trabaja en el proyecto.

El sistema utiliza GPT-4 para interpretar los datos de tráfico recopilados de sensores, drones y GPS, lo que permite a las agencias de transporte, los planificadores urbanos y los ciudadanos que no son necesariamente científicos de datos obtener de manera rápida información sobre las condiciones del tráfico a través de la aplicación de chat.

«Hablamos de equidad de datos, y esta combinación con el chatbot hace que el sistema esté disponible para las personas sin necesidad de ir a este modelo complejo y ver qué pasa», dice Leila Hashemi-Beni, profesora asociada de geodetección y teledetección en la universidad. «Las personas con diferentes conjuntos de habilidades aún pueden obtener la información que necesitan de este sistema».

El sistema, que aún está en desarrollo, también podría ayudar a identificar las mejores rutas de evacuación después de un desastre natural, dice.

«No es solo el transporte. Este proyecto tiene un impacto mucho mayor y más amplio. Nos da la oportunidad de realizar investigaciones de vanguardia que son muy útiles para nosotros como investigadores y educadores».

Grupo de estudiantes universitarios en un aula
Ioana Ciucă, segunda desde la izquierda, es miembro de la Universidad Nacional de Australia y lidera un esfuerzo para utilizar la IA para avanzar en la investigación astronómica. Foto cortesía de Ioana Ciucă.

Una colaboración entre astrónomos de la Universidad de Harvard y la Universidad Nacional de Australia aprovecha GPT-4 de una manera diferente. Con el objetivo de utilizar los LLM para acelerar la investigación en astronomía, el grupo, llamado UniverseTBD, desarrolló una aplicación de chat basada en la astronomía que se basa en más de 300 mil artículos de astronomía.

Alyssa Goodman, profesora Robert Wheeler Wilson de Astronomía Aplicada en Harvard, dice que la aplicación podría ayudar a los jóvenes astrónomos a extraer información clave de artículos académicos y analizar datos para desarrollar sus propias investigaciones y teorías.

«Si tienes una idea en verdad buena, es muy difícil buscar en la literatura y tratar de encontrar todo», dice Goodman. «Esto es como tener un súper asesor, un astrónomo brillante con una memoria enciclopédica que puede decir: ‘Bueno, esa podría ser una muy buena idea y he aquí por qué’, o ‘Es probable que sea una mala idea y he aquí por qué'».

Los investigadores esperan desarrollar modelos de lenguaje más pequeños para la astronomía que sean accesibles para los astrónomos de todos los niveles, dice Ioana Ciucă, miembro conjunto de Jubilee en la Universidad Nacional de Australia que lidera UniverseTBD con Sandor Kruk, científico de datos de la Agencia Espacial Europea, y Kartheik Iyer, becario Hubble de la NASA en la Universidad de Columbia.

«Nuestra misión es democratizar la ciencia para todos», dice. «GPT-4 es un modelo de lenguaje muy grande y funciona con muchos recursos. En nuestra búsqueda de democratizar el acceso, queremos construir modelos más pequeños que aprendan de GPT-4 y que también puedan aprender a hablar el lenguaje de la astronomía mejor que GPT-4. Eso es lo que hemos imaginado».

Muchos de los proyectos de investigación de AFMR se centran en el uso de LLM para una serie de beneficios sociales, desde el aprovechamiento de la IA generativa para evaluar el riesgo de pandemia hasta el uso de modelos de visión y lenguaje para ayudar a las personas ciegas o con baja visión a navegar al aire libre.

En la Universidad de Oxford, los investigadores estudian cómo hacer que los LLM sean más diversos a través de ampliar la retroalimentación humana que los informa. Los investigadores revisaron 95 artículos académicos y encontraron que la retroalimentación humana utilizada para adaptar y evaluar los resultados de los LLM por lo general proviene de pequeños grupos de personas que no siempre representan a la población en general. En consecuencia, dice la investigadora Hannah Rose Kirk, los LLM se adaptan a las preferencias y valores de «un subconjunto bastante estrecho de la población que es la que al final utiliza esos modelos».

Eso puede significar, por ejemplo, que si le pides a un modelo de lenguaje que te ayude a planificar una boda, es probable que obtengas información sobre una boda occidental estereotipada: un gran vestido blanco, rosas y cosas por el estilo (este hallazgo fue parte de un estudio de 2021).

«Imagina un modelo que pudiera aprender un poco más de un contexto individual o sociocultural y adaptar su asistencia para ayudarte a planificar tu boda, o al menos saber que las bodas se ven diferentes para diferentes personas: debería hacer una pregunta de seguimiento para determinar qué camino seguir», dice Kirk, estudiante de doctorado en Oxford que investiga LLM.

Para su proyecto AFMR, Kirk y Scott Hale, profesor asociado de Oxford e investigador principal del Instituto de Internet de Oxford, encuestaron a 1.500 personas de 75 países sobre la frecuencia con la que utilizan modelos de lenguaje y qué características de esos modelos de IA generativa, como reflejar sus valores o ser objetivos y honestos, son importantes para ellos. Luego, los participantes del estudio tuvieron una serie de conversaciones en tiempo real con una variedad de modelos de IA generativa y calificaron sus resultados.

Con las funcionalidades de Azure, Kirk y Hale usarán los comentarios y las conversaciones de participantes de todo el mundo para entrenar y ajustar los modelos de lenguaje para hacerlos más diversos. Planean poner su conjunto de datos a disposición de otros investigadores y esperan que el trabajo fomente modelos de lenguaje más inclusivos.

«La gente no quiere sentir que esta tecnología fue hecha para otros y no para mí», dice Hale. «En términos de la utilidad que alguien puede recibir de él, si puede usarlo como un agente conversacional para razonar sobre algo o tomar una decisión, buscar algo o acceder a contenido, ese beneficio debe distribuirse de manera equitativa en toda la sociedad».

«Al diseñar modelos de IA generativa, tener más personas en la mesa, tener más perspectivas representadas, en última instancia, conduce a una mejor tecnología, y conduce a una tecnología que elevará a todos», dice.

«Un catalizador para el cambio global»

Después de que OpenAI lanzara ChatGPT en noviembre de 2022, dice Viegas, Microsoft Research quería comprender cómo los investigadores académicos podrían usar y beneficiarse de la IA generativa. La organización vio la oportunidad de crear una red global de investigadores académicos centrados en la evolución de los modelos básicos para alinear mejor la IA con los objetivos humanos, promover los usos beneficiosos de la IA y promover los descubrimientos científicos. El programa AFMR también fue diseñado para respaldar una serie de compromisos voluntarios redactados por la administración Biden para fomentar sistemas de IA confiables y seguros, dijo Viegas.

El programa de subvenciones proporciona acceso a modelos y API personalizables a través de Azure AI Services, que aprovechan los protocolos de seguridad y cumplimiento integrados de Azure que permiten la investigación en áreas confidenciales como la atención médica. La iniciativa también brinda a los participantes la oportunidad de conocerse y aprender unos de otros en conferencias y eventos virtuales, y de trabajar con científicos de Microsoft Research.

«Una cosa es tener acceso a los recursos, pero otra cosa es acelerar tu propia investigación al ver lo que otros hacen», dice Viegas.

En última instancia, dice, la iniciativa tiene como objetivo fomentar una comunidad de investigación global y diversa y aplicar la IA para el bien común.

«Queremos asegurarnos de que la IA no sea solo para unos pocos. Nuestra aspiración es que la IA se convierta en un catalizador del cambio global, en beneficio de todos», afirma.

Enlaces relacionados:

Más información: Programa de subvenciones de investigación Accelerating Foundation Models de Microsoft

Más información: El Proyecto de Alineación del Prisma: Retroalimentación Participativa, Representativa e Individualizada para la Alineación Subjetiva y Multicultural

Imagen de portada: Alice Oh, profesora de la Escuela de Computación KAIST, se encuentra entre los investigadores académicos de 15 países de todo el mundo que han recibido una subvención a través de una nueva iniciativa de Microsoft Research. Foto de Jean Chung para Microsoft.