Uma conversa com Kevin Scott: As últimas novidades em Inteligência Artificial

Os sistemas de inteligência artificial alimentados por grandes modelos de linguagem estão transformando a forma como as pessoas trabalham e criam, ajudando em áreas que vão da programação para desenvolvedores de software até esboços para designers gráficos.

Kevin Scott, Chief Technology Officer da Microsoft, espera que esses sistemas de IA continuem a crescer tanto em sofisticação como em escala – para que possam cada vez mais ajudar no enfrentamento dos desafios globais, como as mudanças climáticas e a educação infantil, até revolucionar setores como a Saúde, o Direito, a Ciência dos Materiais e a ficção científica.

Scott compartilhou recentemente seus pensamentos sobre o impacto da IA para os profissionais do conhecimento e as últimas novidades do assunto. Estas são suas principais conclusões:

  • Os avanços em grandes modelos de IA e a IA generativa continuarão a aumentar a produtividade, a criatividade e a satisfação.
  • A IA permitirá avanços científicos e ajudará o mundo a resolver alguns de seus maiores desafios.
  • Conforme esses modelos se tornam plataformas e a Microsoft continua a escalar de forma responsável os avanços de IA para clientes, elementos como a nuvem, os investimentos em infraestrutura e uma forte abordagem de IA responsável são críticos.

Em sua opinião, quais foram alguns dos avanços mais importantes na área de IA este ano?

No início de 2022, acho que quase todo mundo na área de IA estava antecipando coisas realmente impressionantes que aconteceriam nos próximos doze meses. Mas agora que estamos praticamente no final do ano, e mesmo com essas expectativas elevadas, é realmente incrível olhar para a magnitude da inovação que vimos em todas as áreas da IA. O que pesquisadores e outros colegas fizeram para avançar o estado da arte do setor já estão anos-luz além do que pensávamos ser possível até alguns anos atrás. E quase tudo isso é resultado do avanço incrivelmente rápido que aconteceu com os grandes modelos de IA.

Entre as três coisas que mais me impressionaram este ano, destaco o lançamento do GitHub Copilot, que é um grande sistema baseado em modelo de linguagem que transforma prompts de linguagem natural em código e tem esse impacto positivo dramático na produtividade do desenvolvedor. Ele abre a codificação para um grupo muito mais amplo de pessoas do que havia antes, o que é incrível, porque grande parte do futuro depende da nossa capacidade de escrever software.

A segunda novidade foram os modelos generativos de imagem, como o DALL∙E 2, que se tornaram muito populares e mais acessíveis. Um grau bastante alto de habilidade é necessário para esboçar, desenhar e dominar todas as ferramentas de design gráfico, ilustração e arte. Um sistema de IA como o DALL∙E 2 não transforma pessoas comuns em artistas profissionais, mas disponibiliza a uma grande quantidade de pessoas um vocabulário visual que elas não tinham antes – um novo superpoder que elas jamais imaginaram que teriam algum dia.

Também vimos que os modelos de IA estão se tornando mais poderosos e oferecendo ganhos ainda mais substanciais para os problemas que estão resolvendo. O trabalho sobre o desdobramento de proteínas este ano tem sido muito bom em toda a indústria de tecnologia, incluindo o que fizemos com o laboratório de David Baker na Universidade de Washington, o Institute for Protein Design com RoseTTAFold, apoiando tudo isso com muita IA avançada para fazer coisas realmente transformadoras.

Tudo realmente muito incrível. Qualquer coisa que seja um multiplicador de força na ciência e na medicina é sempre benéfica para o mundo, porque é onde vivem alguns dos nossos maiores e mais desagradáveis problemas.

Esse foi um ano impressionante. E acho que o próximo ano será ainda melhor.

Onde você vê a tecnologia de IA tendo o maior impacto no próximo ano e além?

Acho que, com alguma confiança, posso dizer que 2023 será o ano mais emocionante que a comunidade de IA já teve. E digo isso depois de realmente acreditar genuinamente que 2022 foi o ano mais emocionante que já tivemos. O ritmo da inovação continua forte.

Eu já falei sobre o GitHub Copilot, ele é incrível. Mas é apenas a ponta do iceberg em termos do que os grandes modelos de IA serão capazes de fazer daqui para frente – extrapolando a mesma ideia para todos os tipos de cenários diferentes de como eles podem ajudar em outros tipos de trabalho intelectual além da codificação. Toda a economia do conhecimento verá uma transformação na forma como a IA ajuda com aspectos repetitivos do seu trabalho e o tornam geralmente mais agradáveis e gratificantes. Isso se aplicará a praticamente qualquer coisa – de projetar novas moléculas para criar remédios a criar “receitas” de fabricação a partir de modelos 3D ou simplesmente escrever e editar.

Por exemplo, eu tenho brincado com um sistema experimental que construí para mim mesmo usando GPT-3, projetado para me ajudar a escrever um livro de ficção científica, que é algo que eu queria fazer desde minha adolescência. Tenho cadernos cheios de sinopses que criei para livros teóricos, descrevendo sobre o que são os livros e os universos onde eles se passam. Com esta ferramenta experimental, consegui desbloquear muita coisa. Quando eu escrevia um livro à moda antiga, se eu conseguisse produzir 2.000 palavras em um dia, eu me sentia muito bem comigo mesmo. Com esta ferramenta, tive dias em que escrevi 6.000 palavras em um dia, o que para mim parece muito. E achei um processo qualitativamente mais energizante do que o que eu estava fazendo antes.

Este é o sonho do “copiloto para tudo” – onde você teria um copiloto que poderia se sentar ao seu lado enquanto você está fazendo qualquer tipo de trabalho cognitivo, ajudando-o não apenas a fazer mais, mas também a melhorar sua criatividade de maneiras novas e emocionantes.

Este aumento na produtividade é claramente um impulso para satisfação. Por que essas ferramentas trazem mais alegria ao trabalho?

Todos nós usamos ferramentas para fazer o nosso trabalho. Alguns de nós realmente gostamos de adquirir as ferramentas e dominá-las e descobrir como implantá-las de uma maneira super eficaz para fazer o que estamos tentando fazer. Isso faz parte do que está acontecendo. Em muitos casos, as pessoas agora têm ferramentas novas, interessantes e fundamentalmente mais eficazes do que antes. Fizemos um estudo que descobriu que o uso de ferramentas no-code ou low-code levou a um impacto positivo de mais de 80% na satisfação no trabalho, na carga de trabalho geral e no moral dos usuários. Especialmente para ferramentas que estão em seus estágios relativamente iniciais, isso é realmente um enorme benefício.

Para alguns profissionais, trata-se literalmente de melhorar o fluxo central em que você está quando está fazendo o seu trabalho; ele acelera você. É como ter um conjunto melhor de tênis para correr uma corrida ou maratona. Isso é exatamente o que estamos vendo com as experiências que os desenvolvedores estão tendo com o Copilot; eles estão relatando que o Copilot tem ajudado a permanecer no fluxo e manter suas mentes mais afiadas durante o que costumavam ser tarefas chatas e repetitivas. E quando as ferramentas de IA podem ajudar a eliminar o trabalho penoso, algo que é super repetitivo ou irritante ou que estava atrapalhando o caminho de chegar ao que as pessoas realmente gostam, a melhora na satisfação é real.

Pessoalmente, essas ferramentas permitem que eu esteja em um estado de fluxo por muito mais tempo do que antes. O inimigo do fluxo criativo é a distração e ficar preso. Eu chego a um ponto em que eu não sei muito bem como resolver a próxima coisa, ou a próxima coisa é algo como “Eu tenho que ir procurar isso. Tenho que mudar o contexto do que eu estava fazendo para resolver este outro problema.” Essas ferramentas resolvem cada vez mais esse outro problema para mim, para que eu permaneça no fluxo central.

Além do GitHub Copilot e do DALL∙E 2, a IA está aparecendo nos produtos e serviços da Microsoft de outras maneiras. Como a IA de última geração está melhorando os produtos atuais, como o Teams e o Word?

Esta é a grande história não contada da IA. Até o momento, a maioria dos seus benefícios está espalhada por mil coisas diferentes, onde você pode nem mesmo apreciar completamente o quanto da experiência do produto que você está recebendo vem de um sistema de machine learning.

Por exemplo, estamos sentados aqui nesta chamada do Teams em vídeo e, no sistema, há todos esses parâmetros que foram aprendidos por um algoritmo de machine learning. Existem buffers de jitter para o sistema de áudio suavizar a comunicação. O borrão atrás de você na tela é um algoritmo de machine learning em ação. Existem mais de uma dúzia de sistemas de machine learning que tornam essa experiência mais agradável para nós dois. E isso é certamente verdade por toda a Microsoft.

Passamos do machine learning em alguns lugares para literalmente mil coisas de machine learning espalhadas por diferentes produtos, desde o funcionamento do cliente de email do Outlook, o texto preditivo no Word, a experiência de pesquisa do Bing até a aparência do feed no Xbox Cloud Gaming e no LinkedIn. Existe IA em todo o lugar, sempre tornando esses produtos melhores.

Uma das grandes coisas que mudou nos últimos dois anos é que costumava ser o caso de você ter um modelo especializado para cada uma dessas tarefas que temos em todos os nossos produtos. Agora você tem um único modelo que é usado em muitos lugares, porque eles são amplamente úteis. Ser capaz de investir nesses modelos que se tornam mais poderosos com a escala – e, em seguida, ter todas as coisas construídas em cima do modelo se beneficiando simultaneamente das melhorias que você está fazendo, é algo tremendo.

A pesquisa e o desenvolvimento de IA da Microsoft continuam por meio de iniciativas como a AI4Science e a AI for Good. O que mais o entusiasma nessa área da IA?

Os problemas mais desafiadores que enfrentamos como sociedade agora estão nas ciências. Como você cura essas doenças intratáveis complicadas? Como você se prepara para a próxima pandemia? Como você fornece cuidados de saúde acessíveis e de alta qualidade para uma população em envelhecimento? Como você ajuda a educar mais crianças em escala nas habilidades que elas precisarão para o futuro? Como você desenvolve tecnologias que revertam alguns dos efeitos negativos das emissões de carbono na atmosfera? Estamos explorando como levar alguns desses desenvolvimentos empolgantes em IA para esses problemas.

Os modelos nessas aplicações de ciência básica têm as mesmas propriedades de escala que os grandes modelos de linguagem. Você constrói um modelo, o coloca em algum modo auto supervisionado no qual ele está aprendendo com uma simulação, ou está aprendendo com sua própria capacidade de observar um domínio específico e, em seguida, o modelo obtido permite mudar drasticamente o desempenho de um aplicativo – seja em uma simulação computacional de dinâmica de fluidos ou em uma dinâmica molecular para o design de medicamentos.

Há uma oportunidade imensa aí. Isso significa melhores medicamentos, significa que talvez possamos encontrar o catalisador que ainda não temos para corrigir nosso problema de emissão de carbono, significa acelerar como os cientistas e outras pessoas com grandes ideias podem trabalhar para tentar resolver os maiores desafios da sociedade.

Como os avanços nas técnicas de computação e hardware contribuíram para os avanços na IA?

O ponto fundamental subjacente a quase todo o progresso recente que vimos na IA é o quão crítica a importância da escala provou ser. Acontece que os modelos treinados em mais dados, com mais poder de computação, têm um conjunto muito mais rico e generalizado de recursos. Se quisermos continuar impulsionando esse progresso ainda mais – e para ser claro, agora não vemos nenhum fim para os benefícios do aumento da escala –precisamos otimizar e ampliar nosso poder de computação o máximo que pudermos.

Anunciamos nosso primeiro supercomputador Azure AI há dois anos e, em nossa conferência de desenvolvedores Build deste ano, compartilhei que agora temos vários sistemas de supercomputação que temos certeza de que são hoje os maiores e mais poderosos supercomputadores de IA do mundo hoje. Nós e a OpenAI usamos essa infraestrutura para treinar quase todos os nossos modelos grandes de última geração, sejam nossos modelos Turing, Z-code e Florence na Microsoft ou os modelos GPT, DALL∙E e Codex na OpenAI. E anunciamos recentemente uma colaboração com a NVIDIA para criar um supercomputador alimentado pela infraestrutura do Azure combinado com GPUs NVIDIA.

Parte desse progresso ocorreu apenas por meio de escala de computação de força bruta, com clusters cada vez maiores de GPUs. Mas talvez um avanço ainda maior seja a camada de software, que otimiza a forma como os modelos e os dados são distribuídos entre esses sistemas gigantes, tanto para treinar os modelos quanto para fornecê-los aos clientes. Se formos apresentar esses grandes modelos como plataformas com as quais as pessoas podem criar, eles não podem ser acessíveis apenas a um pequeno número de empresas de tecnologia do mundo, com recursos suficientes para construir supercomputadores gigantes.

Então, investimos fortemente em softwares como o DeepSpeed para aumentar a eficiência do treinamento e o ONNX Runtime para inferência. Eles otimizam o custo e a latência e, geralmente, nos ajudam a tornar modelos maiores de IA mais acessíveis e valiosos para as pessoas. Estou super orgulhoso das equipes que estão trabalhando nessas tecnologias, porque a Microsoft está realmente liderando o setor de IA, e estamos abrindo tudo isso para que outros possam continuar melhorando.

Esses avanços estão todos ocorrendo em meio a uma preocupação contínua sobre como a IA afetará os empregos. Como você pensa sobre a questão da IA e dos empregos?

Vivemos em uma época de extraordinária complexidade e mudança macroeconômica histórica, e à medida que olhamos para 5, 10 anos no futuro, mesmo para alcançar um equilíbrio neutro líquido para o mundo inteiro, precisaremos de novas formas de produtividade para que todos nós possamos continuar desfrutando do progresso. Queremos construir essas ferramentas de IA como plataformas que muitas pessoas possam usar para construir negócios e resolver problemas. Acreditamos que essas plataformas democratizam o acesso à IA para muito mais pessoas. Com elas, você terá um conjunto mais rico de problemas resolvidos e terá um grupo mais diversificado de pessoas podendo participar da criação de tecnologias.

No cenário anterior de IA, você precisava de uma enorme quantidade de experiência apenas para começar. Agora você pode utilizar os Serviços Cognitivos do Azure, você pode utilizar o Serviço OpenAI do Azure e criar produtos complicados por meio desses serviços, sem necessariamente ter que ser tão especialista em IA a ponto de precisar ser capaz de treinar seu próprio modelo grande a partir do zero.

À medida que todos esses enormes sistemas de IA continuarem a crescer e evoluir, acho que podemos esperar que esses avanços mudem fundamentalmente a natureza do trabalho, em alguns lugares mais do que em outros, e em alguns casos criem uma série de novos empregos que não existiam antes. Você pode olhar para trás e ver a mesma coisa acontecer ao lado de todos os tipos de mudanças famosas de paradigma na tecnologia ao longo da história: o telefone, o automóvel, a Internet. E, assim como esses exemplos, precisaremos de novas maneiras de pensar sobre o trabalho, novas maneiras de pensar sobre habilidades e estar super focados em garantir que tenhamos pessoas talentosas suficientes e treinadas para os trabalhos realmente críticos.

Outra preocupação associada às tecnologias de IA é o potencial de uso indevido e de abuso. Quais são as medidas concretas que a Microsoft está tomando para garantir que suas ferramentas e serviços de IA sejam desenvolvidos e usados de forma responsável?

Isso é uma coisa que a gente leva muito a sério. Temos um processo de IA responsável pelo qual nossos sistemas de IA passam, e a cada dia procuramos melhorar esse processo. Examinamos o que estamos fazendo com uma equipe multidisciplinar de especialistas para tentar garantir que entendamos todos os pontos prejudiciais possíveis que podem acontecer, e possamos mitigar o maior número possível delas. Exemplos disso são coisas como refinar o conjunto de dados usado para treinar modelos, implantar filtros para limitar a geração de conteúdo nocivo, integrar técnicas como o bloqueio de consultas em tópicos confidenciais que ajudam a evitar o uso indevido por pessoas mal-intencionadas, ou ainda a aplicação de tecnologias que podem retornar respostas e resultados mais úteis e diversificados. E temos um plano implantado com o sistema de IA, no qual podemos detectar e mitigar o mais rápido possível, mesmo após o lançamento, quaisquer danos que aconteçam que não previmos antes.

Outra salvaguarda muito importante é a implantação intencional e interativa. A maior parte do trabalho que fazemos é em modelos que têm ampla capacidade. Nós os hospedamos em nossa nuvem e os tornamos acessíveis por meio de APIs ou por meio de nossos produtos. Para a API, qualquer desenvolvedor pode obter acesso a ela, mas eles têm que cumprir os termos de serviço, a fim de usá-la, e se eles violarem os termos de serviço, seu acesso pode ser retirado. E para outros produtos, podemos começar com uma visualização limitada com um número seleto de clientes com casos de uso bem definidos em mente. As colaborações com esses primeiros clientes nos ajudarão a garantir que as proteções responsáveis de IA estejam funcionando na prática, para que possamos escalar a adoção de forma mais ampla.

Acreditamos verdadeiramente que a segurança e a responsabilidade são importantes. Espero que possamos oferecer algum incentivo a toda a indústria. Para esse fim, todos os recursos e conhecimentos que aplicamos contra o desenvolvimento de algumas soluções estão sendo compartilhados com o resto da comunidade em geral por meio de nosso Padrão e Princípios de IA Responsável.

Tags:

Posts Relacionados