Aldeia por aldeia, criando os componentes fundamentais para construção das ferramentas de IA com um trabalho que também educa 

Mulher indiana ensinando outras mulheres a acessar a tecnologia no smartphone

KHARADI, Maharashtra, Índia – Às 22h30, após um longo dia de trabalho, Baby Rajaram Bokale tem mais uma tarefa para completar antes de dormir. 

Ela se acomoda de pernas cruzadas na cama. Em um canto, um elaborado santuário dedicado à divindade hindu Krishna brilha com luzes coloridas. Um retrato de seu falecido marido, com bigode grisalho e olhar direto, está pendurado acima da cama. 

Ela abre um aplicativo em seu smartphone e, com sua voz clara e ressonante, começa a ler uma história em voz alta em sua língua nativa, o marathi, o idioma do estado de Maharashtra, onde mora em Kharadi, um movimentado bairro suburbano da cidade de Puna. 

A voz de Bokale, entre outras, será usada para treinar modelos de IA em marathi. Mas, ao mesmo tempo, ela está aprendendo lições valiosas para si mesma – neste caso, sobre finanças pessoais. A história que ela estava lendo foi elaborada para fornecer informações práticas de uma forma divertida – sobre como funcionam os bancos, como poupar e como evitar golpes e fraudes. 

“Agora posso fazer coisas mais interessantes com meu smartphone”, diz ela. Ela aprendeu a pagar contas com o sistema de pagamento UPI da Índia e a usar o telefone para operações bancárias, entre outras coisas. 

Bokale trabalha para uma organização de impacto social chamada Karya, que em sânscrito significa “trabalho que lhe dá dignidade”. A companhia se descreve como a “empresa de dados éticos mais importante do mundo”. 

“Ganhe, aprenda e cresça” é o mantra da Karya, que quer revolucionar a forma como os conjuntos de dados são criados na Índia e em outros lugares. O objetivo do grupo é tirar o maior número possível de pessoas da pobreza, proporcionando-lhes, ao mesmo tempo, as ferramentas para prosperarem na economia digital moderna. Ao mesmo tempo, a organização está construindo conjuntos de dados éticos e de alta qualidade com uma força de trabalho não convencional. 

Esses conjuntos de dados são valiosos. Embora cerca de 80 milhões de pessoas falem marathi, o idioma não está bem representado no mundo digital. Na Índia, se você não fala hindi ou inglês, pode ser difícil acessar a tecnologia que ajuda as pessoas a prosperar – aplicativos, ferramentas e assistentes digitais que os falantes de inglês e hindi têm garantidos. O fato de centenas de milhões de potenciais clientes poderem se beneficiar dessas tecnologias é a razão pela qual a Microsoft e outros estão numa corrida para disponibilizar os seus produtos nessas línguas com “poucos recursos”. 

“Estou muito orgulhosa de que minha voz esteja sendo gravada e que alguém esteja prestes a aprender marathi graças à minha voz”, diz Bokale, de 53 anos, “e orgulhosa de que essas ferramentas e recursos estarão disponíveis em marathi”. 

Ela dirige uma pequena empresa que moe temperos e pimenta em sua casa. “Usei o que ganhei para comprar uma peça e consertar meu moedor”, diz ela. “Esse é um dinheiro que eu normalmente não teria”.

 

Karya: Criando dados de alta qualidade e aliviando a pobreza 

A Karya cria conjuntos de dados em vários idiomas indianos para treinar modelos de IA e para pesquisa, ao mesmo tempo que cria empregos para os indianos, principalmente em áreas rurais. 

A organização começou como um projeto de pesquisa da Microsoft em Bengaluru em 2017. 

Com o tempo, tornou-se claro que a Karya tinha um enorme potencial, tanto como criador de conjuntos de dados linguísticos de alta qualidade nas muitas línguas da Índia, quanto como forma de ajudar a tirar os indianos rurais da pobreza com educação e renda. O projeto foi desmembrado em 2021 como uma organização independente da Microsoft. Toda a sua operação, incluindo o aplicativo que os trabalhadores usam para gravar e escrever em seus idiomas nativos, é construída no Microsoft Azure e usa o Azure OpenAI Service, bem como os Azure AI Cognitive Services para validar seus dados. A Microsoft é um de seus principais clientes. 

A Karya paga a trabalhadores como Bokale cerca de US$ 5 por hora, muito acima do salário mínimo na Índia. Durante 11 dias, Bokale trabalhou cerca de cinco horas e ganhou 2.000 rúpias, ou cerca de US$ 25. O trabalho é envolvente e educativo (por isso o “aprender”), e o apoio contínuo destina-se a ajudar os trabalhadores da organização a prosperar com o conhecimento que adquiriram. Além disso, se os dados criados pela Karya forem revendidos, os trabalhadores recebem royalties. 

Os fundadores da Karya têm objetivos ambiciosos. Eles estão estabelecendo parcerias com mais de 200 outras organizações sem fins lucrativos com o objetivo de alcançar 100 milhões de pessoas até 2030. Espera-se que os dados sirvam de base para ferramentas que mais tarde servirão essas mesmas pessoas nas suas próprias línguas. A empresa está tentando reunir e processar os conjuntos de dados de forma a mitigar preconceitos baseados em gênero e outros fatores. É uma das razões pelas quais a companhia está entrando em contato com diversos grupos de pessoas para construir dados mais inclusivos. 

Manu Chopra, 27 anos, é um dos fundadores da empresa e atua como CEO. Ele diz que a enorme procura por conjuntos de dados em idiomas negligenciados, combinada com o fato de 78% dos indianos rurais terem acesso a um smartphone, é uma enorme oportunidade. A Karya está preparada para canalizar a maior parte dos seus lucros para as mãos dos seus trabalhadores, retendo o suficiente para sustentar o seu time e fazer mais pesquisas. 

Acreditamos verdadeiramente que a Índia rural pode ser um excelente construtor de IA, mas também um excelente receptor de tecnologias de IA. Manu Chopra, CEO da Karya

Manu Chopra, CEO da Karya, no bairro Kharadi de Pune, Índia. Foto de Chris Welsch para Microsoft.

“Digamos que o mundo gaste um trilhão de dólares na construção de IA”, diz Chopra. “Então, nos próximos 20 anos, que porcentagem disso poderei trazer diretamente para as carteiras das pessoas que mais precisam? Acreditamos realmente que a Índia rural pode ser um excelente construtor de IA, mas também um excelente receptor de tecnologias de IA”. 

Bokale está entre as mais de 30 mil pessoas que até agora trabalharam para a Karya em cidades e vilarejos de 24 dos 28 estados da Índia. 

Tornando a tecnologia acessível em idiomas com poucos recursos 

Ferramentas de IA, como o ChatGPT da OpenAI e o Copilot da Microsoft, funcionam bem em inglês devido à abundância de material escrito e de áudio com o idioma na Internet. A Índia, um país de 1,4 mil milhões de habitantes, tem 22 línguas oficiais, centenas de outras línguas e milhares de dialetos. Cerca de 60% dos indianos falam hindi e cerca de 10% falam inglês, deixando centenas de milhões de pessoas sem ferramentas digitais que possam ajudá-las a prosperar no mundo moderno. 

“Acho que queremos corrigir o fato de que a maior parte da Internet está em inglês, enfatizando que não é um bom ponto de partida”, diz Kalika Bali, tecnóloga linguística e pesquisadora do Laboratório de Pesquisa da Microsoft em Bengaluru. Ela usa dados coletados pela Karya para sua pesquisa. 

“As pessoas precisam fazer parte do crescimento da economia digital que está se espalhando por todo o lado. Ninguém deve ser excluído do uso da tecnologia por causa da sua linguagem”, diz ela. 

As pessoas precisam de fazer parte do crescimento da economia digital que se espalha por todo o lado. Ninguém deve ser excluído do uso da tecnologia por causa da sua linguagem.
Kalika Bali, pesquisadora da Microsoft

Kalika Bali, tecnóloga linguística e pesquisadora do Microsoft Research Lab em Bengaluru, Índia. Foto de Chris Welsch para Microsoft.

“Na Microsoft, dizemos que queremos capacitar todo o planeta, certo? E mais de metade da população mundial utiliza outras línguas além do inglês”. 

Bali diz que a IA acelerou muito o processo de preservação dos idiomas e seu uso em grandes modelos de linguagem (LLMs). Isto é útil na criação de ferramentas online e de IA, mas também para preservar línguas raras ou em extinção. 

“Agora podemos criar esse tipo de copiloto muito rapidamente”, diz ela. “Anteriormente, quando falávamos sobre preservação da língua, falávamos sobre esforços que ocorreram ao longo de décadas, literalmente. … Tudo isso agora pode ser reduzido para meses”. 

A Karya, que afirma estar a caminho de envolver mais de 100.000 trabalhadores até ao final de 2024, procura os participantes que mais necessitam de trabalho e educação – muitas vezes mulheres em áreas rurais. Além de um salário-prêmio, oferece treinamento e outros tipos de apoio na execução do trabalho. 

‘A tecnologia pode realmente ajudar a amplificar os desejos das pessoas’ 

Chopra cresceu em um “basti” – um assentamento informal – em Delhi e diz que as desigualdades que testemunhou enquanto crescia tiveram um efeito profundo em seu senso de propósito enquanto estudava ciência da computação com foco em IA na Universidade de Stanford, na Califórnia. 

“Quando voltei para a Índia, a primeira coisa que percebi foi que, onde quer que eu fosse, as pessoas tinham a intenção ou a vontade de sair da pobreza, todos trabalham muito, todos têm aspirações”, diz ele. “E eles têm a capacidade de aprender novas habilidades. E se essas duas coisas existirem, a tecnologia pode realmente ajudar a amplificar os desejos das pessoas, a fazerem algo por si mesmas”. 

O trabalho que Bokale realizou ao longo de 11 dias fez parte de um projeto piloto para testar se o trabalho de introdução de dados poderia ser combinado com a aprendizagem de informações úteis. Embora ganhassem o que para eles era uma quantia substancial de dinheiro, eles também aprenderiam sobre as ferramentas financeiras necessárias para fazer o melhor uso dele. 

O material foi apresentado como uma história serializada sobre duas irmãs, e foi essa história que os trabalhadores leram em voz alta em seus smartphones para capturar os sons e ritmos do Marathi falado. “Nós realmente gostamos da história”, diz Bokale, “E nessa história havia pessoas comuns que trabalhavam duro todos os dias. O dinheiro que ganhavam seria facilmente gasto, não havia poupança. Em suma, a questão era como poupar.” 

Safiya Husain, diretora de impacto da Karya, disse que o formato da história foi um sucesso e que muitos dos participantes leram a história em voz alta para as suas famílias e amigos. 

Safiya Husain, diretora de impacto da Karya. Foto de Chris Welsch para Microsoft.

“Eles diziam: ‘Vou fazer este trabalho e ler a história para vocês”, diz Husain. “E eles ficavam realmente entusiasmados e se perguntavam: ‘Oh, o que vai acontecer a seguir? Ela conseguirá o empréstimo? Ou ela terá dinheiro suficiente para pagar o casamento?’”. 

Ela diz que, ao combinar trabalho com educação, a Karya estava tentando tratar seus trabalhadores com respeito e criar resultados significativos além da renda. “Estávamos pagando às pessoas pelo seu tempo e dizendo que o que elas faziam era valioso”, diz ela. “Não foi só: aqui está uma lição para aprender no seu tempo livre.” 

Husain diz que espera que, eventualmente, muitos dos trabalhadores da Karya ingressem na organização em diferentes funções, trabalhando como organizadores e administradores locais. No geral, diz ela, o objetivo é colocar a tecnologia ao serviço de todos. 

“Quando recolhemos dados nestas línguas, como o marathi, tentamos garantir que estas comunidades e estas populações, que têm milhões e milhões de falantes, não sejam deixadas para trás na revolução tecnológica”, diz ela. 

Envolvendo comunidades inteiras no projeto 

Kalika Bali, pesquisadora da Microsoft, diz que uma das chaves para o sucesso da Karya é que a empresa se esforça para envolver comunidades inteiras no projeto. A maioria dos trabalhadores da companhia são mulheres, e ela diz que elas têm mais “círculos de confiança” para atravessar do que os homens. 

“Os homens só precisam perguntar duas coisas: isso funcionará para mim e serei pago?” ela diz. “As mulheres têm que perguntar; minha família aceitará isso? Isso trará má fama para minha família e para mim mesma ao fazer isso? Isso vai me prejudicar de alguma forma? Só então se trata da plataforma e do dinheiro.” 

“A vantagem da Karya é que ela criou muita confiança no terreno. Eles estão realmente engajados com as comunidades em que estão”, diz ela. 

Em seu bairro em Pune, Bokale é uma figura conhecida universalmente como Baby Tai, “tai” que significa “irmã mais velha”. Ela dirige uma rede financeira informal com várias dezenas de outras mulheres que juntam poupanças mensalmente e se revezam na obtenção de uma quantia maior para usar em coisas como iniciar um pequeno negócio ou pagar propinas escolares. As mulheres costumam aparecer em seu pátio arborizado para conversar sobre negócios ou simplesmente sair. Seu equipamento para moer pimenta e temperos fica em um pequeno galpão de lata em um dos lados do pequeno quintal. 

A partir da esquerda, Parvati Kemble, Surekha Sanjay Gaikwad e Baby Rajaram Bokale discutindo sobre seu grupo bancário de autoajuda no bairro de Kharadi, em Pune, na Índia. Foto de Chris Welsch para Microsoft.

Surekha Sanjay Gaikwad, 51 anos, é uma de suas vizinhas e amigas. Ela administra uma pequena mercearia a cerca de meia hora de sua casa. Ela também lê marathi em seu telefone para a Karya. Sentada com Bokale nos degraus da frente, ela abriu um amplo sorriso quando questionada sobre o que ela gostou na experiência. 

“Eu não conseguia acreditar que conseguiria fazer isso em casa”, diz ela. “Não preciso pegar um ônibus novamente ou ir a qualquer outro lugar no final do dia.” 

O componente educacional do trabalho foi uma vantagem, disse Gaikwad. Ela aprendeu a criar um depósito fixo no banco e fez exatamente isso como uma forma de economizar de forma mais eficaz para os estudos universitários do filho. 

Durante uma manhã recente, várias outras mulheres que trabalharam para a Karya pararam na casa de Bokale para conversar. Meena Jadhav, 55 anos, usou o dinheiro para comprar material e ferramentas de costura para o seu negócio de alfaiataria – ela fazia camisas para vender. Graças ao que aprendeu, disse ela, agora pode usar uma conta poupança e sabe usar um caixa eletrônico. Ela não sabia que era possível sacar e depositar dinheiro sem ir ao banco. 

Outra mulher usou as lições que aprendeu e o dinheiro que ganhou para abrir uma conta poupança para a educação da filha. 

Todos disseram que gostaram do trabalho e acharam úteis as informações sobre planejamento financeiro e ferramentas on-line. Um benefício adicional para as mulheres, diz Bokale, foi aprender que os seus smartphones poderiam abrir portas para outros tipos de oportunidades. 

Ela diz que muitas das outras mulheres no projeto piloto não sabiam de antemão como usar um smartphone. “Seus maridos e sogros dizem: ‘Oh, você aprendeu tantas coisas novas e isso é ótimo’”. 

Imagem em capa: Baby Rajaram Bokale com algumas das mulheres de seu grupo informal de investimento. Ao gravar e digitar Marathi em seus smartphones, eles ajudaram a criar conjuntos de dados que serão usados ​​para criar modelos de linguagem de IA.