Un agricultor trabaja en un vivero de árboles.
Una mujer con una chaqueta naranja y un niño caminan por una calle estrecha y mojada, flanqueada por edificios históricos de piedra.

Construir una IA que funcione para todos comienza con el lenguaje

Por: Susanna Ray

Un agricultor hace una foto y toca el teléfono: «¿Cuál es la causa de las manchas en estas hojas y qué debería hacer al respecto?» Es el tipo de pregunta común que la gente de todo el mundo recurre ahora a la IA para responder, a medida que la tecnología se convierte en una puerta de entrada a la información — una forma de aprender, decidir y recibir ayuda con las tareas diarias.

Pero el lenguaje moldea quién puede cruzar esa puerta. Incluso con un smartphone y una conexión rápida a internet, que ese agricultor o cualquier otra persona obtenga una respuesta útil suele depender de una cosa: qué idioma hablan.

La IA se impulsa por grandes modelos de lenguaje entrenados sobre grandes cantidades de texto para entender y generar respuestas. El inglés representa la mitad del contenido online, lo que influye en cómo aprende la IA y crea una gran disparidad en quién se beneficia de ella. Por eso, los investigadores y científicos de datos de Microsoft construyen herramientas abiertas y alianzas para ampliar el soporte lingüístico y que más personas puedan usar la IA en su lengua materna. Pero el lenguaje moldea quién puede cruzar esa puerta. Incluso con un smartphone y una conexión rápida a internet, que ese agricultor o cualquier otra persona obtenga una respuesta útil suele depender de una cosa: qué idioma hablan.

«La IA tiene el mayor impacto positivo cuando está diseñada para las personas a las que está destinada a servir», dice Inbal BeckerReshef, director general de AI for Good Lab de Microsoft. «El lenguaje no es algo que sea un buen acierto, es lo que determina si la tecnología en verdad empodera a las comunidades o las excluye.»

Más de 1.200 millones de personas han utilizado herramientas de IA en los últimos tres años, según el Informe de Difusión de IA 2025, pero el uso es desigual, con una tasa en el Norte Global casi el doble que en el Sur Global. El informe sugiere que el idioma es una barrera en sí mismo, con una menor adopción en lugares donde los idiomas locales tienen menos contenido digital, incluso si se ajusta por ingresos y conectividad.

Es un gran desequilibrio. De más de 7.000 idiomas hablados en todo el mundo, menos de 100 tienen suficiente presencia digital para moldear de manera significativa los grandes modelos de lenguaje actuales. Eso significa que millones de personas no pueden usar su lenguaje para navegar por sistemas de IA.

A medida que la tecnología avanza más en la vida cotidiana, esa brecha puede ser frustrante, pero también puede ser consecuente, al limitar el acceso a herramientas que ayudan a otros a mejorar sus vidas con apoyo en el trabajo, la sanidad, las finanzas, la educación y más.

«Resolver el reto del idioma no es tan sencillo como traducir contenido», dice Jacki O’Neill, directora de laboratorio de Microsoft Research Africa en Nairobi, un equipo que trabaja para ampliar la inclusión lingüística y cultural de las herramientas de IA. «La utilidad de la IA depende de si puede responder a lo que las personas piensan, no solo a lo que dicen, y el significado vive en la cultura de una comunidad, que está entrelazada de manera profunda con su lenguaje.»

Eso significa que cerrar la brecha requiere nuevos datos, nuevos métodos de evaluación y mejores formas de diseñar, construir y probar modelos y sistemas de IA en entornos reales, con las comunidades que los utilizarán. Aquí tienen siete proyectos destinados a hacer que la IA sea más accesible en todo el mundo.

1. Project Gecko: Construir IA diseñada para comunidades enteras

Profesora enseña a los estudiantes en un aula desde una PC de escritorio
Una niña ayuda a su madre a lavar ropa en un balde, al aire libre, dentro de su patio en un asentamiento urbano.

Project Gecko es un esfuerzo de Microsoft Research centrado en una idea sencilla: la IA funciona mejor cuando está diseñada para las personas que en verdad la van a usar. En lugar de tratar el soporte lingüístico como un complemento al final, el equipo construye IA con los idiomas locales y el contexto local en mente desde el principio.

Co-dirigido por equipos de Microsoft Research India, Microsoft Research Africa en Nairobi y el Microsoft Research Accelerator, el trabajo inicial del grupo en África Oriental y Asia del Sur se ha centrado en la agricultura y la educación, donde la gente necesita orientación práctica que refleje las realidades de su región — no consejos genéricos extraídos de otros lugares.

La investigación del proyecto se centra en cómo la IA puede adaptarse y desplegarse en entornos donde las personas puedan compartir dispositivos, tener un ancho de banda limitado, hablar varios idiomas y cambiar entre voz y texto. Incluye métodos para crear datos donde hay pocos, así como probar las herramientas en entornos reales para medir si son útiles, fiables y alineadas con la forma en que las personas en realidad hacen preguntas y usan la información.

Estas lecciones se comparten ahora de manera más amplia a través de un conjunto de manuales del Project Gecko, que ofrecen orientación práctica para crear IA que funcione a través de idiomas y culturas.

2. MMCTAgent: Encontrar respuestas en voz, imágenes y vídeo — no solo en texto

Paisaje de Islandia
India, Rajastán: mujeres secan y clasifican chiles, vista aérea.

Mucha información importante no se encuentra en texto en una página web. Está en fotos, diagramas y vídeos — incluidos vídeos de formación donde un detalle clave puede aparecer solo durante unos segundos. Pero muchas herramientas de IA todavía tienen dificultades cuando la respuesta correcta depende de encontrar un momento concreto en un vídeo largo o extraer pistas de una gran biblioteca de imágenes y clips.

MMCTAgent de Microsoft Research, disponible en GitHub y presentado en Microsoft Foundry Labs, fue creado para abordar ese problema. En lugar de una respuesta «one-shot», descompone una pregunta en pasos, utiliza herramientas para buscar imágenes, fotogramas o escenas relevantes y luego une esas piezas en una respuesta que puede perfeccionar a lo largo del camino — incluso al revisar su propio trabajo por medio de un «crítico» incorporado.

Un lugar donde esto importa es FarmerChat, una herramienta de Digital Green utilizada para ayudar a los trabajadores de extensión agrícola a apoyar a los agricultores. En un prototipo habilitado por vídeo, MMCTAgent ayuda a FarmerChat a buscar y extraer información de una colección de vídeos sobre agricultura local, de modo que las respuestas se basan en directrices creadas dentro de las propias comunidades de agricultores por personas que conocen los cultivos, las condiciones y los idiomas de primera mano.

3. Paza: Reconocimiento de voz que funciona en más idiomas y acentos

Panorámica de un campo en Kaimbu, Kenia
Silueta de mujeres que transportan agua y alimentos sobre la cabeza, Madagascar, África.

Para muchas personas, hablar por un smartphone es la forma más sencilla de usarlo. Pero el reconocimiento de voz puede tener dificultades cuando un idioma tiene pocos datos de entrenamiento, o cuando el acento de alguien no coincide con el que se entrenó un sistema.

El esfuerzo Paza de Microsoft Research aborda ese problema tanto al mejorar la tecnología como al facilitar la medición del progreso. Incluye PazaBench, un marcador de reconocimiento automático de voz (ASR, por sus siglas en inglés) que mide qué tan bien manejan diferentes modelos de voz a texto el mismo conjunto de grabaciones. Eso facilita la comparación del progreso —en especial para idiomas con poca presencia en línea— para que los investigadores puedan ver qué funciona, qué no y dónde quedan lagunas. Este año comenzó con 39 lenguas africanas y 51 modelos y es el primer referente ASR de su tipo.

Más allá de PazaBench, el equipo desarrolló modelos de habla afinados para seis lenguas kenianas — suajili, dholuo, kalenjin, kikuyu, masái y somalí — que fueron probadas para su rendimiento en condiciones reales, incluidas pruebas en dispositivos móviles cotidianos con agricultores en el campo.

El proyecto surgió del trabajo de campo con Project Gecko, donde los equipos vieron con qué frecuencia fallan las herramientas de voz en entornos reales y cómo eso puede limitar el acceso cuando los idiomas locales son más hablados que escritos. El nombre proviene de la frase suajili «paza sauti», que significa «proyectar» o «alzar la voz».

4. LINGUA: Financiar conjuntos de datos abiertos para que más lenguas aparezcan en la IA

Vista de una villa europea cerca del campo
Vista de espalda de una persona sentada en una banca.

Si la IA va a funcionar bien en más lenguajes, necesita algo básico: datos. Los idiomas menos comunes en internet no tienen suficiente texto y voz disponibles de manera abierta para que los sistemas de IA aprendan o sean evaluados.

Eso es lo que aborda el proyecto LINGUA de Microsoft AI for Good Lab.

En Europa, el programa apoya a 11 organizaciones que recopilan y comparten nuevos conjuntos de datos para lenguas europeas subrepresentadas — recursos que otros pueden utilizar para construir y mejorar herramientas lingüísticas. Los proyectos seleccionados para subvenciones abarcan 16 idiomas y dialectos en 10 países, para abarcar lenguas habladas por más de 65 millones de personas, incluidas euskera, islandesa y ucraniana.

Microsoft amplía ese enfoque con LINGUA Africa, a través de una colaboración con el Masakhane African Languages Hub y la Fundación Gates para otorgar 5,5 millones de dólares en subvenciones a proyectos de IA centrados en desarrollar modelos de lenguaje africano en áreas como la educación, la seguridad alimentaria, la salud y los servicios gubernamentales.

5. Trae tu propio idioma: una «receta» repetible para añadir más idiomas a la IA

Grupo de personas maoríes no identificables con vestimenta tradicional durante el Día de Waitangi, celebración nacional de Nueva Zelanda.

Incluso cuando los investigadores mejoran la IA en un idioma, el mayor desafío es hacerlo una y otra vez para muchos otros — en especial en idiomas con poco texto online del que aprender.

Bring Your Own Language (BYOL) es un marco de trabajo de AI for Good Lab de Microsoft que presenta una forma práctica de hacerlo. Empieza por evaluar cuánto material digital tiene un lenguaje, clasificándolos por niveles y luego al elegir un enfoque que se adapte. Eso hace que el trabajo sea repetible, para que más comunidades puedan crear herramientas que tengan en cuenta las sutilezas y necesidades locales.

Para lenguas con algunos datos, como el chichewa y el maorí, BYOL se centra en enseñar el idioma directo al modelo a través de limpiar y ampliar lo disponible y luego ajustándolo para que maneje mejor ese idioma. El equipo experimentó una mejora del 12% en la precisión con este método.

Para idiomas con muy pocos datos, como el inuktitut, BYOL explora el uso de la traducción como puente. Alguien puede hacer una pregunta en su idioma, el sistema la traduce a un idioma que el modelo ya maneja bien, genera una respuesta y luego la traduce de nuevo. Eso puede ofrecer acceso antes, cuando construir un modelo completo desde cero en el idioma original aún no es realista.

6. ASHABot: Un ayudante práctico de IA para los trabajadores sanitarios de primera línea de la India

La escena muestra participación comunitaria, con médicos que brindan atención personalizada y educación en salud para mejorar el bienestar de las personas del poblado en su entorno cotidiano.
Persona trabajando en un sembradío

En muchas zonas rurales de la India, los trabajadores sanitarios de primera línea conocidos como Activistas Sociales Acreditados en Salud, o ASHAs, son el puente entre los hogares y el sistema sanitario. Se encargan de todo, desde la salud neonatal e infantil hasta las vacunas y la planificación familiar — a menudo con solo formación básica y acceso limitado a supervisores.

ASHABot es un chatbot basado en WhatsApp que les ayuda a obtener soporte rápido, fiable y bajo demanda, incluso en lugares donde la señal móvil puede ser poco fiable. La herramienta fue desarrollada por la organización sin fines de lucro Khushi Baby, a través de tecnología de IA generativa desarrollada por Microsoft Research.

Está conectado a una base de conocimiento de confianza que incluye los manuales de salud pública de la India, y puede entender preguntas en hindi, inglés o incluso una mezcla de ambos. Puede dar respuestas por texto o voz, lo que permite que los ASHA reproduzcan las recomendaciones en voz alta para que el paciente las escuche.

7. Historias de salud africanas: Guía personalizada sobre la diabetes

Nubes sobre rondavels masái en Laikipia.
Mujeres shangaan cocinan alrededor de una fogata.

Los consejos genéricos de salud pueden ser difíciles de seguir en cualquier sitio, pero pueden ser aún más complicados cuando no coinciden con la comida, la cultura, el idioma o la realidad diaria de una persona. African Health Stories utiliza IA generativa para crear relatos personalizados destinados a ayudar a las personas que viven con diabetes tipo 2 a realizar cambios realistas en su estilo de vida.

El proyecto comienza en Sudáfrica, que tiene una tasa de enfermedad superior a la media mundial. Microsoft Research lo desarrolla junto con la Universidad de Stellenbosch, la Universidad de Pretoria, la Universidad de Swansea y un equipo de expertos médicos.

Pacientes y clínicos pueden generar historias que respondan preguntas y ofrezcan orientación sobre cómo vivir con diabetes, basadas en su lenguaje, cultura y realidades cotidianas — como las elecciones de dieta y ejercicio moldeadas por las opciones y rutinas alimentarias locales. Las historias pueden compartirse mediante texto, imágenes o habla, y se adaptan mediante la interacción para adaptar los consejos a las necesidades y preferencias individuales.

Susanna Ray escribe sobre la IA y la tecnología, con relatos que muestran su impacto real y examinan cómo la innovación transforma el trabajo, los negocios y la sociedad. Antes informó para Bloomberg News y otras grandes organizaciones internacionales de noticias en EE. UU. y en el extranjero, donde cubría temas que iban desde política y gobierno hasta negocios y aviación. Sigan su trabajo en Microsoft Source.

Todas las fotos y vídeos son de Getty Images. Créditos de arriba a abajo: Sergeyxsp, Kevin Fleming, Dimple Bhati, DarioGaona, THEGIFT777, ImagesBazaar, Nattrass, Somnuk Krobkum, Tuul y Bruno Morandi, Bruce Mounde y 500px, Danm, Arctic-Images, Laviejasirena, Raimund Linke, Chameleonseye, Mayur Kakade, CR Shelare, Richard T. Nowitz y Martin Harvey.

Español (España)
Icono de exclusión de opciones de privacidad Tus opciones de privacidad
Privacidad de la salud del consumidor Ponte en contacto con Microsoft Privacidad Gestionar cookies Condiciones de uso Marcas registradas Sobre nuestra publicidad Docs de cumplimiento de la UE Informes regulatorios