Aldea por aldea, se crean los componentes básicos de las herramientas de IA con una labor que también educa

Mujer apoyada en un poste, mirando su teléfono junto a un grupo de mujeres

KHARADI, Maharashtra, India – A las 10:30 p.m., después de un largo día de trabajo, Baby Rajaram Bokale tiene una tarea más que completar antes de dormir.

Se acomoda con las piernas cruzadas en su cama. En una esquina, un elaborado santuario a la deidad hindú Krishna brilla con coloridas cadenas de luces. Un retrato de su difunto esposo, con un bigote gris y una mirada directa, cuelga sobre la cama.

Abre una aplicación en su teléfono inteligente y, con su voz clara y resonante, comienza a leer una historia en voz alta en su lengua materna, el marathi, el idioma del estado de Maharashtra, donde vive en Kharadi, un bullicioso barrio suburbano de la ciudad de Pune.

La voz de Bokale, entre otras, se utilizará para entrenar modelos de IA en marathi. Pero al mismo tiempo, ella aprende valiosas lecciones para sí misma, en este caso sobre finanzas personales. La historia que leía está diseñada para ofrecer información práctica de una manera entretenida: sobre cómo funcionan los bancos, cómo ahorrar y cómo evitar estafadores y fraudes.

«Ahora puedo hacer cosas más interesantes con mi smartphone», dice. Aprendió a pagar artículos con el sistema de pago UPI de la India. También aprendió a usar el teléfono para realizar operaciones bancarias, entre otras cosas.

Bokale trabaja para una organización de impacto social llamada Karya, que en sánscrito significa «trabajo que te da dignidad», que se describe a sí misma como la «empresa de datos éticos más importante del mundo».

«Gana, aprende y crece» es el mantra de Karya, que quiere revolucionar la forma en que se crean los conjuntos de datos en la India y en otros lugares. El objetivo del grupo es sacar a la mayor cantidad posible de personas de la pobreza y, al mismo tiempo, brindarles las herramientas para prosperar en la economía digital moderna. Al mismo tiempo, Karya crea conjuntos de datos éticos y de alta calidad con una fuerza laboral poco convencional.

Esos conjuntos de datos son valiosos. Si bien alrededor de 80 millones de personas hablan marathi, no está bien representado en el mundo digital. En la India, si no hablas hindi o inglés, puede ser difícil acceder a la tecnología que ayuda a las personas a prosperar: aplicaciones, herramientas y asistentes digitales que los hablantes de inglés e hindi dan por sentado. El hecho de que cientos de millones de clientes potenciales puedan beneficiarse de esas tecnologías es la razón por la que Microsoft y otros están en una carrera para que sus productos estén disponibles en esos lenguajes «de escasos recursos». 

«Estoy muy orgullosa de que mi voz sea grabada, y de que alguien esté a punto de aprender marathi gracias a mi voz», dice Bokale, de 53 años, «y también orgullosa de que estas herramientas y funciones estén disponibles en marathi».

Ella tiene un pequeño negocio de molienda de especias y chiles en su casa. «Usé lo que gané para comprar una pieza y reparar mi amoladora», dice. «Es dinero que por lo general no tendría».

Karya: Crear datos de alta calidad y aliviar la pobreza

Karya crea conjuntos de datos en varios idiomas indios para entrenar modelos de IA y para la investigación, al tiempo que crea puestos de trabajo para los indios, en su mayoría en las zonas rurales.

Karya comenzó como un proyecto de Microsoft Research en Bangalore en 2017.

Con el tiempo, quedó claro que Karya tenía un enorme potencial, tanto como creadora de conjuntos de datos lingüísticos de alta calidad en los muchos idiomas de la India como una forma de ayudar a sacar a los indios rurales de la pobreza con educación e ingresos. El proyecto se escindió en 2021 como una organización independiente de Microsoft. Toda su operación, incluida la aplicación que los trabajadores usan para grabar y escribir en sus idiomas nativos, se basa en Microsoft Azure y usa Azure OpenAI Service, así como Azure AI Cognitive Services para validar sus datos. Microsoft es uno de sus principales clientes.

Karya paga a trabajadores como Bokale unos 5 dólares la hora, muy por encima del salario mínimo en la India. Durante 11 días, Bokale trabajó unas cinco horas y ganó 2.000 rupias, unos 25 dólares. El trabajo es atractivo y educativo (de ahí el «aprender»), y el apoyo continuo está destinado a ayudar a los trabajadores de Karya a prosperar con el conocimiento que han adquirido. Además, si los datos creados por Karya se revenden, los trabajadores reciben regalías.

Los fundadores de Karya tienen metas ambiciosas. La organización se ha asociado con más de 200 organizaciones sin fines de lucro con el objetivo de llegar a 100 millones de personas para 2030. Espera que los datos sirvan de base para herramientas que luego sirvan a estas mismas personas en sus propios idiomas. Karya trata de recopilar y procesar los conjuntos de datos de manera que mitiguen el sesgo basado en el género y otros factores. Es una de las razones por las que Karya se ha comenzado a acercar a diversos grupos de personas para crear datos más inclusivos.

Manu Chopra, de 27 años, es uno de los fundadores de la empresa y su CEO. Dice que la enorme demanda de conjuntos de datos en idiomas desatendidos, combinada con el hecho de que el 78 por ciento de los indios rurales tienen acceso a un teléfono inteligente, es una enorme oportunidad. Karya está creada para canalizar la mayor parte de sus ganancias a las manos de sus trabajadores, y retiene lo suficiente para mantener a su personal y hacer más investigación.

Retrato al exterior de un hombre de pie en una calle muy transitada
Manu Chopra, director ejecutivo de Karya, en el barrio Kharadi de Pune, India. Foto de Chris Welsch para Microsoft.

«Digamos que el mundo va a gastar un billón de dólares en la construcción de la IA», dice Chopra. «Entonces, en los próximos 20 años, ¿qué porcentaje de eso puedo llevar directo a las billeteras de las personas que más lo necesitan? En verdad creemos que la India rural puede ser un excelente constructor de IA, pero también un excelente receptor de tecnologías de IA».

Bokale es una de las más de 30.000 personas que hasta ahora han trabajado para Karya en ciudades y pueblos de 24 de los 28 estados de la India.

Hacer que la tecnología sea accesible en idiomas de escasos recursos

Las herramientas de IA como ChatGPT de OpenAI y Copilot de Microsoft funcionan bien en inglés debido a la abundancia de material escrito y de audio en Internet en el idioma. India, un país de 1.400 millones de habitantes, tiene 22 idiomas oficiales, cientos de otros idiomas y miles de dialectos. Alrededor del 60 por ciento de los indios hablan hindi y alrededor del 10 por ciento hablan inglés, lo que deja a cientos de millones de personas sin herramientas digitales que puedan ayudarlos a prosperar en el mundo moderno.

«Creo que queremos rectificar que la mayor parte de Internet está en inglés y no es un buen punto de partida», dice Kalika Bali, tecnóloga lingüística e investigadora del Laboratorio de Investigación de Microsoft en Bangalore. Ella utiliza los datos recopilados por Karya para su investigación.

«La gente necesita ser parte del crecimiento de la economía digital que se extiende por todas partes. Nadie debería ser excluido del uso de la tecnología por su idioma», dice.

Retrato de una mujer sonriente
Kalika Bali, tecnóloga lingüística e investigadora del Microsoft Research Lab en Bangalore, India. Foto de Chris Welsch para Microsoft.

«En Microsoft, decimos que queremos empoderar a todo el planeta, ¿verdad? Y más de la mitad de la población mundial utiliza idiomas distintos del inglés».

Bali afirma que la IA ha acelerado de manera importante el proceso de preservación del lenguaje y su uso en grandes modelos lingüísticos (LLM, por sus siglas en inglés). Esto es útil para crear herramientas en línea y de IA, pero también para preservar idiomas raros o moribundos.

«Ahora podemos crear este tipo de cosas de copiloto muy rápido», dice. «Antes, cuando hablábamos de preservación del idioma, hablábamos de esfuerzos que se llevaban a cabo durante décadas, literalmente. … Todo eso ahora se puede acortar a meses».

Karya, que dice que está en camino de comprometerse con más de 100.000 trabajadores para fines de 2024, busca participantes que más necesiten trabajo y educación, a menudo mujeres en áreas rurales. Además de un salario superior, ofrece capacitación y otros tipos de apoyo cuando se realiza el trabajo.

«La tecnología en verdad puede ayudar a amplificar los deseos de las personas»

Chopra creció en un «basti» -un asentamiento informal- en Delhi y dice que las desigualdades que presenció mientras crecía tuvieron un profundo efecto en su sentido de propósito mientras estudiaba ciencias de la computación con un enfoque en IA en la Universidad de Stanford en California.

«Cuando regresé a la India, lo primero que me di cuenta fue que, dondequiera que iba, la gente tenía la intención o la voluntad de salir de la pobreza, todos trabajan muy duro, todos tienen aspiraciones», dice. «Y tienen la capacidad de aprender nuevas habilidades. Y si esas dos cosas existen, la tecnología en verdad puede ayudar a amplificar los deseos de las personas, de hacer algo de sí mismas».

El trabajo que Bokale realizó en el transcurso de 11 días fue parte de un proyecto piloto para probar si el trabajo de ingresar datos podría combinarse con el aprendizaje de información útil. Mientras ganaban lo que para ellos era una cantidad sustancial de dinero, también aprenderían sobre las herramientas financieras que necesitan para hacer el mejor uso de él.

El material se presentó como una historia serializada sobre dos hermanas, y fue esta historia la que los trabajadores leyeron en voz alta en sus teléfonos inteligentes para capturar los sonidos y ritmos del marathi hablado. «En verdad disfrutamos la historia», dice Bokale, «y en esa historia, había gente común que trabaja duro todos los días. El dinero que ganaban se gastaba con facilidad, no había ahorros. En resumen, la cuestión era cómo ahorrar».

Safiya Husain, directora de impacto de Karya, dijo que el formato de la historia resultó ser un éxito, y que muchos de los participantes leyeron la historia en voz alta a sus familiares y amigos.

Retrato al exterior de una joven sonriendo en un campo
Safiya Husain, directora de impacto de Karya. Foto de Chris Welsch para Microsoft.

«Me decían: ‘Voy a hacer este trabajo y a leerte la historia'», dice Husain. «Y en realidad se emocionaban y se preguntaban: ‘Oh, ¿qué pasará ahora? ¿Obtendrá su préstamo? ¿O tendrá suficiente dinero para pagar la boda?'».

Ella dice que al combinar el trabajo con la educación, Karya buscaba tratar a sus trabajadores con respeto y crear resultados que sean significativos más allá de los ingresos. «Le pagábamos a la gente por su tiempo y les decíamos que lo que hacían era valioso», dice. «No fue sólo, aquí hay una lección que aprender en tu tiempo libre».

Husain dice que espera que, con el tiempo, muchos de los trabajadores de Karya se unan a la organización en diferentes roles, para trabajar como organizadores y administradores locales. En el panorama general, dice, el objetivo es poner la tecnología al servicio de todos.

«Cuando recopilamos datos en estos idiomas como el marathi, intentamos asegurarnos de que estas comunidades y estas poblaciones, que tienen millones y millones de hablantes, no se queden atrás en la revolución tecnológica», dice.

Involucrar a comunidades enteras en el proyecto

Kalika Bali, la investigadora de Microsoft, dice que una de las claves del éxito de Karya es que se esfuerza por involucrar a comunidades enteras en el proyecto. La mayoría de los trabajadores de Karya son mujeres, y ella dice que tienen más «círculos de confianza» que cruzar que los hombres.

«Los hombres solo tienen que preguntar dos cosas: ¿funcionará esto para mí y me pagarán?», dice. «Las mujeres tienen que preguntar; ¿Lo aceptará mi familia? ¿Traerá esto un mal nombre a mi familia y a mí misma al hacer esto? ¿Esto me va a perjudicar de alguna manera? Solo entonces se llega a la plataforma y al dinero».

«La ventaja de Karya es que ha creado mucha confianza sobre el terreno. Están en verdad comprometidos con las comunidades en las que se encuentran», dice.

En su vecindario en Pune, Bokale es una figura muy conocida que es conocida por todos como Baby Tai, tai que significa «hermana mayor». Dirige una red financiera informal con varias docenas de otras mujeres que juntan sus ahorros cada mes y se turnan para tomar una cantidad mayor para usarla en cosas como iniciar un pequeño negocio o pagar las cuotas escolares. Las mujeres a menudo aparecen en su patio a la sombra de los árboles para hablar de negocios o tan solo para pasar el rato. Su equipo de molienda de chiles y especias está en un pequeño cobertizo de hojalata a un lado del pequeño patio.

Tres mujeres sentadas en un escalón
De izquierda a derecha, Parvati Kemble, Surekha Sanjay Gaikwad y Baby Rajaram Bokale hablan sobre su grupo bancario de autoayuda en el barrio de Kharadi de Pune, India. Foto de Chris Welsch para Microsoft.

Surekha Sanjay Gaikwad, de 51 años, es una de sus vecinas y amigas. Ella tiene una pequeña tienda de comestibles a media hora de su casa. También lee marathi en su teléfono para Karya. Sentada con Bokale en los escalones de su casa, esbozó una amplia sonrisa cuando se le preguntó qué le gustaba de la experiencia.

«No podía creer que pudiera hacerlo en casa», dice. «No tengo que volver a subirme a un autobús ni ir a ningún otro lugar al final del día».

El componente educativo del trabajo fue una ventaja, dijo Gaikwad. Aprendió a crear un depósito a plazo fijo en el banco, y lo hizo como una forma de ahorrar de manera más efectiva para los estudios universitarios de su hijo.

En el transcurso de una mañana reciente, varias otras mujeres que habían trabajado para Karya se detuvieron en la casa de Bokale para charlar. Meena Jadhav, de 55 años, había utilizado el dinero para comprar material y herramientas de costura para su negocio de sastrería: hacía camisas para vender. Gracias a lo que aprendió, dijo, ahora puede usar una cuenta de ahorros y sabe cómo usar un cajero automático. Ella no sabía que se podía retirar y depositar dinero sin ir al banco.

Otra mujer usó las lecciones que aprendió y el dinero que ganó para abrir una cuenta de ahorros para la educación de su hija.

Todos dijeron que disfrutaron el trabajo y que la información sobre planificación financiera y herramientas en línea les resultó útil. Un beneficio adicional para las mujeres, dice Bokale, fue aprender que sus teléfonos inteligentes podían abrir las puertas a otros tipos de oportunidades.

Ella dice que muchas de las otras mujeres en el proyecto piloto no sabían cómo usar un teléfono inteligente de antemano. «Sus esposos y suegros dicen: ‘Oh, has aprendido tantas cosas nuevas, y eso es genial'».

Imagen de portada: Baby Rajaram Bokale con algunas de las mujeres de su grupo de inversión informal.  Al grabar y escribir marathi en sus teléfonos inteligentes, ayudaron a crear conjuntos de datos que se utilizarán para crear modelos de lenguaje de IA.