2023 foi um ano importante para a IA generativa, ano em que ela passou dos laboratórios de pesquisa para a vida real, com milhões de pessoas usando-a por meio de ferramentas populares como ChatGPT e Microsoft Copilot. Para os próximos meses, espera-se que a IA se torne ainda mais acessível, diferenciada e integrada em tecnologias que melhorem as tarefas cotidianas e ajudem a resolver alguns dos problemas mais desafiadores do mundo.
Aqui estão três tendências importantes de IA para ficar de olho em 2024.
Pequenos modelos de linguagem
Você já experimentou o poder dos grandes modelos de linguagem (LLMs) se usou o Copilot para responder a perguntas complexas. Os modelos são tão grandes que podem exigir recursos computacionais significativos para que sejam executados, tornando o surgimento dos pequenos modelos de linguagem (SLMs) um grande negócio.
Os SLMs são grandes, com vários bilhões de parâmetros – em contraste com centenas de bilhões de parâmetros nos LLMs – mas são pequenos o suficiente para serem executados offline em um telefone. O que determina o comportamento de um modelo são parâmetros variáveis ou elementos ajustáveis
“Pequenos modelos de linguagem podem tornar a IA mais acessível devido ao seu tamanho e acessibilidade”, diz Sebastien Bubeck, que lidera o grupo Machine Learning Foundations na Microsoft Research. “Ao mesmo tempo, estamos descobrindo novas maneiras de torná-los tão poderosos quanto os grandes modelos de linguagem.”
Pesquisadores da Microsoft desenvolveram e lançaram dois SLMs – Phi e Orca – que apresentam desempenho tão bom ou melhor que grandes modelos de linguagem em determinadas áreas, desafiando a noção de que a escala é necessária para o desempenho.
Ao contrário dos LLMs treinados em grandes quantidades de dados da Internet, os modelos menores usam dados de treinamento selecionados e de alta qualidade, com os pesquisadores encontrando novos limites de tamanho e desempenho. Este ano, podemos esperar modelos melhorados concebidos para promover mais investigação e inovação.
IA multimodal
A maioria dos LLMs pode processar apenas um tipo de dado – texto – mas os modelos multimodais podem compreender informações de diferentes tipos de dados como texto, imagem, áudio e vídeo. Essa capacidade está tornando as tecnologias, desde ferramentas de pesquisa até aplicativos de criatividade, mais ricas, precisas e contínuas.
Você pode perguntar ao Copilot o que está acontecendo em uma imagem carregada, graças a um modelo multimodal que pode processar imagens, linguagem natural e dados de pesquisa do Bing. O Copilot pode gerar, por exemplo, informações relevantes como o significado histórico de um monumento em sua foto.
A IA multimodal também está alimentando o Microsoft Designer, um aplicativo de design gráfico que pode gerar imagens com base em uma descrição do que você deseja. E permite personalizar vozes neurais ou vozes com som natural, úteis em leitores de texto, além de ferramentas para pessoas com deficiência vocal.
“A multimodalidade tem o poder de criar experiências mais humanas que podem aproveitar melhor a gama de sentidos que usamos como humanos, como visão, fala e audição”, afirma Jennifer Marsman, engenheira principal do Office of the Chief Technology Officer da Microsoft, Kevin Scott.
IA na ciência
Os especialistas antecipam grandes ganhos em ferramentas de IA concebidas para acelerar as descobertas científicas, com grande parte do trabalho destinado a resolver problemas globais como as alterações climáticas, crises energéticas e doenças.
Para mitigar as alterações climáticas e ajudar os agricultores a trabalhar de forma mais eficiente, os pesquisadores da Microsoft estão utilizando a IA para criar melhores previsões meteorológicas, estimadores de carbono e outras ferramentas para uma agricultura sustentável. Eles também estão desenvolvendo tecnologias de IA que ajudarão os agricultores no campo, incluindo um chatbot que pode processar a foto de um agricultor de uma erva daninha misteriosa ou de um trator que precisa de combustível, fornecendo informações sobre como resolver o problema.
Nas ciências da vida, os pesquisadores estão colaborando no maior modelo de IA baseado em imagens do mundo para combater o câncer e estão utilizando IA avançada para encontrar novos medicamentos para doenças infecciosas, além de novas moléculas para medicamentos inovadores. A tecnologia está comprimindo tentativas e erros científicos – um trabalho que pode levar anos – em apenas algumas semanas ou meses.
A IA também está transformando a ciência dos materiais, um amplo campo focado na criação de novos materiais com propriedades específicas. Uma descoberta recente mostrou o poder da IA e da computação de alto desempenho para acelerar a busca por materiais de bateria menos tóxicos.
“A inteligência artificial está impulsionando uma revolução na descoberta científica”, afirma Chris Bishop, diretor da equipe AI4Science da Microsoft Research. “Essa pode acabar sendo a aplicação mais emocionante e, em última análise, a mais importante da IA.”
Receba as últimas notícias e saiba mais sobre o que vem por aí em Entendendo a IA na Microsoft.