Microsoft desenvolve estrutura para criar aplicativos e copilotos de IA; expande o ecossistema de plug-ins de IA

*Por John Roach, Microsoft Stories

Lembra quando o software não estava conectado à Internet? Acho que não. Em alguns anos, isso também será verdade para softwares que não vêm com um assistente de copiloto inteligente, de acordo com Kevin Scott, diretor de tecnologia da Microsoft.

Um copiloto é um aplicativo que usa IA moderna e grandes modelos de linguagem para ajudá-lo em uma tarefa cognitiva complexa – desde escrever um pitch de vendas ou atualizar-se sobre o que foi dito em uma reunião perdida até gerar imagens para uma apresentação ou planejar um jantar temático.

A Microsoft introduziu o conceito de copiloto há quase dois anos com o GitHub Copilot, um programador de pares de IA que auxilia os desenvolvedores na escrita de código. Este ano, a Microsoft lançou experiências de copiloto em seus principais produtos e serviços, desde o bate-papo com IA no Bing, que está mudando a forma como as pessoas pesquisam na Internet, até o Microsoft 365 Copilot, GitHub Copilot X, Dynamics 365 Copilot, Copilot no Microsoft Viva e Microsoft Security Copilot.

Hoje, na conferência anual de desenvolvedores Build, a Microsoft anunciou que expandiu esse ecossistema de Microsoft Copilots para incluir o Copilot no Power BI e o Copilot no Power Pages em pré-visualização, o Copilot no Microsoft Fabric, disponível em pré-visualização em breve, e o Windows Copilot, que estará disponível para pré-visualização a partir de  junho. A empresa também introduziu novos recursos que ajudarão os desenvolvedores a criar seus próprios copilotos e aplicativos de IA de última geração. Isso inclui novas ferramentas chamadas plug-ins que tornam os copilotos mais úteis, permitindo que eles interajam com outros softwares e serviços.

“Você pode olhar para o Bing Chat e pensar que isso é algo super mágico e complicado, mas a Microsoft está dando aos desenvolvedores tudo o que eles precisam para começar a construir seu próprio copiloto”, disse Scott. “Acho que nos próximos anos, isso se tornará uma expectativa de como todos os softwares funcionam.”

Expandindo o ecossistema de plug-ins

A OpenAI introduziu os plug-ins do ChatGPT em março. A Microsoft anunciou plug-ins para o Bing no início deste mês. Essa tecnologia permite que o ChatGPT e o Bing Chat ajudem você a encontrar e fazer uma reserva em um restaurante usando um plug-in OpenTable, por exemplo.

Hoje, a Microsoft está adotando o mesmo padrão de plug-in aberto que o OpenAI introduziu para o ChatGPT, garantindo a interoperabilidade no ChatGPT e a amplitude das ofertas copiloto da Microsoft. Isso significa que os desenvolvedores agora podem usar uma plataforma para criar plug-ins que funcionam em superfícies comerciais e de consumo, incluindo ChatGPT, Bing, Dynamics 365 Copilot, Microsoft 365 Copilot e Windows Copilot. A Microsoft também anunciou que está trazendo o Bing para o ChatGPT como a experiência de pesquisa padrão.

Como parte dessa plataforma compartilhada de plug-in, o Bing está adicionando suporte a plug-ins. Além dos anunciados anteriormente para OpenTable e Wolfram Alpha, também terá Instacart, Kayak, Klarna, Redfin e Zillow, entre muitos outros, no ecossistema Bing.

Além disso, os desenvolvedores agora poderão estender o Microsoft 365 Copilot com plug-ins. Os plug-ins para Microsoft 365 incluem plug-ins ChatGPT e Bing, bem como extensões de mensagem do Teams e conectores Power Platform – permitindo que os desenvolvedores aproveitem seus investimentos existentes. E os desenvolvedores poderão criar facilmente plug-ins com o Microsoft Teams Toolkit para Visual Studio Code e Visual Studio.

Como funcionam os plug-ins

Durante o  Build, a empresa apresentou uma estrutura de desenvolvimento de IA que ajuda os desenvolvedores a criar seu próprio copiloto. Esse conjunto de tecnologias inclui suporte para plug-ins que aumentam os recursos dos sistemas de IA permitindo que eles recuperem informações em tempo real, incorporem dados da empresa ou outros dados de negócios, executem novos tipos de cálculos e tomem medidas com segurança em nome do usuário.

Essencialmente, pense nos plug-ins como uma ponte. Eles podem funcionar como  uma ponte entre um grande modelo de linguagem que foi treinado em dados públicos da internet e todos os dados que uma empresa pode manter em sigilo sobre seus benefícios. O plug-in é a ponte que dá ao copiloto acesso a esses arquivos quando ele responde a uma pergunta de um funcionário da empresa.

Da mesma forma, um plug-in pode servir como uma ponte entre um grande modelo de linguagem e um site ou sistema de back-end. Assim, uma empresa pode usá-lo  para reservar viagens de negócios, permitindo que o copiloto faça arranjos para a viagem de um vendedor a São Francisco, de acordo com a política de viagens da empresa.

Os plugins tornam o Copilot mais útil, permitindo que ele interaja com outros softwares e serviços.

“Um plug-in é sobre como você, o desenvolvedor do copiloto, dá ao seu copiloto ou a um sistema de IA a capacidade de ter recursos que não estão se manifestando no momento e de conectá-los aos dados e aos sistemas que você está construindo”, disse Scott. “Acho que, eventualmente, haverá um ecossistema incrivelmente rico de plugins.”

Expandindo o ecossistema de plug-ins

Os desenvolvedores também poderão criar, testar e instalar seus próprios plug-ins de várias maneiras – para, eventualmente, implantar para uso com Microsoft Copilots e aumentar os recursos de seus próprios aplicativos criados com tecnologia de IA generativa.

Por exemplo, um desenvolvedor em uma grande corporação pode querer o Microsoft 365 Copilot para acessar os contratos da empresa com clientes e fornecedores para fazer perguntas sobre como certas questões legais eram tratadas no passado. Para isso, o desenvolvedor precisa conectar o Microsoft 365 Copilot com o banco de dados privado de arquivos jurídicos, o que exige que os documentos sejam codificados, indexados e armazenados de forma que possam ser pesquisados.

“Esse é um padrão de como você carregaria informações no modelo”, disse John Montgomery, vice-presidente corporativo de gerenciamento de programas da plataforma de IA da Microsoft. “E é aí que entram os plug-ins. O que um plug-in faz é dizer ‘Ei, queremos tornar esse padrão reutilizável e definir alguns limites sobre como ele é usado.’”

A Microsoft está lançando um conjunto de recursos para facilitar a criação de plug-ins que funcionam em suas superfícies copilot. Visual Studio Code, GitHub Copilot e GitHub Codespaces simplificarão a criação, depuração e implantação de novos plug-ins, por exemplo, e o Azure AI adicionará recursos para executar e testar plug-ins em dados de empresas privadas. Depois de criados, esses plug-ins funcionarão nas experiências Copilot da Microsoft.

Montgomery observou que a adição de plug-ins também acelerará ainda mais o ritmo de aplicativos inovadores que os clientes da Microsoft já estão criando com o Azure OpenAI Service, que fornece acesso aos modelos de IA generativa da OpenAI, incluindo o GPT-4 da OpenAI e atualmente atende a mais de 4.500 empresas.

“O que você verá no Build é o  melhor do nosso pensamento atual sobre as práticas arquitetônicas, as ferramentas necessárias e os padrões de aplicativos e designs de experiência do usuário que você deseja colocar nesses novos aplicativos copilotos”, disse ele em uma entrevista antes da conferência.

Novas ferramentas para construir seu próprio copiloto

Embora a Microsoft tenha implantado tecnologia de IA generativa nos produtos e serviços da empresa, os desenvolvedores acabarão construindo a maioria dos copilotos do mundo, de acordo com Scott.

“Eles entenderão uma coisa específica que eles ou seus usuários estão tentando realizar e usarão esse padrão de desenvolvimento de software de IA para construir essas coisas para esses usuários”, disse ele.

O desenvolvimento do copiloto começa como qualquer projeto de software: como uma ideia. O que é diferente é o universo de possibilidades que essa plataforma de desenvolvimento de IA permite, disse Scott.

Ele compara isso às novas experiências e serviços que surgiram com a chegada dos smartphones. Muitas coisas que eram impossíveis de imaginar tornaram-se possíveis. Alguns eram fáceis de desenvolver, como aplicativos para jogos familiares e casuais. Outros foram difíceis e aproveitaram todos os recursos da plataforma do smartphone para criar novos tipos de experiências, incluindo serviços que interromperam os setores de táxi e aluguel de temporada.

“Eles passaram de impossíveis a difíceis e, como foram esforçados e realmente usaram os recursos da nova plataforma, encontraram um sucesso duradouro”, disse Scott, aludindo à sua expectativa de que aplicativos igualmente disruptivos sejam criados com o pacote de copiloto.

A Microsoft delineou uma estrutura de desenvolvimento de IA para ajudar os desenvolvedores a criar seu próprio copiloto.

Com uma ideia sólida para um aplicativo em mãos, os desenvolvedores podem transformá-la em realidade, disse ele. O processo começa com a seleção de um modelo de IA generativo, como GPT-4, que está disponível por meio do Azure OpenAI Service. O próximo passo é dar ao copiloto um meta-prompt, que é uma descrição básica do papel do copiloto e como ele deve operar. Além disso, o copiloto precisa de memória para acompanhar uma conversa com um usuário e responder com contexto e consciência apropriados. Por fim, o copiloto precisa da capacidade de acessar dados e outros serviços, que os plug-ins podem fornecer.

Copilotos implantados para dar suporte a tarefas complexas, como escrever um livro inteiro, também exigirão orquestração – a capacidade de dividir tarefas em componentes de várias etapas e executá-las de acordo com um plano gerado.

Os desenvolvedores podem usar ferramentas como o kit de desenvolvimento de software Semantic Kernel que a Microsoft lançou em código aberto em março para integrar grandes modelos de linguagem com linguagens de programação convencionais. O kit inclui ferramentas para memória e orquestração e suporte para plugins, o que acelera o desenvolvimento dos copilotos, segundo Montgomery.

No Build, a Microsoft também apresentou novas ferramentas para simplificar o desenvolvimento de copilotos. Por exemplo, com o novo Azure AI Studio, os desenvolvedores agora podem basear mais facilmente os modelos de IA conversacional em seus dados privados. Com um novo recurso chamado Azure OpenAI Service em seus dados, os desenvolvedores podem descobrir informações específicas da organização a partir de dados, texto e imagens usando interfaces de aplicativos baseadas em linguagem natural. Para ampliar ainda mais os recursos de modelos de linguagem grandes, a Microsoft também anunciou o suporte para plug-ins com o Azure OpenAI Service. O Azure AI agora também oferece suporte ao fluxo de prompt do Azure Machine Learning, uma sofisticada ferramenta de engenharia de prompt, observou Montgomery.

“Construímos vários desses copilotos. Examinamos várias arquiteturas diferentes disponíveis para saber como você carrega outras informações, como cria conteúdo viável, como você alimenta o modelo com as coisas certas para que ele dê as respostas certas”, disse ele. “O Build será uma celebração de todas as coisas que aprendemos, as ferramentas que criamos e trazemos isso para o mundo.”

Atualizações de IA responsável

É importante ressaltar que os desenvolvedores também precisam garantir que o copiloto retorne os resultados pretendidos e evite saídas tendenciosas, sexistas, racistas, odiosas, violentas ou que levem à automutilação, observou Sarah Bird, gerente de produto de um grupo de parceiros da Microsoft que lidera a IA responsável por fundamentos tecnologias.

Hoje, no Build, a Microsoft anunciou que o Azure AI Content Safety está em pré-visualização. Esse novo serviço de IA do Azure ajuda os desenvolvedores a criar comunidades e ambientes online mais seguros com modelos projetados para detectar conteúdo impróprio em imagens e texto. Os modelos atribuem uma pontuação de gravidade ao conteúdo sinalizado, indicando aos moderadores humanos qual conteúdo requer ação urgente.

“É o sistema de segurança que alimenta o GitHub Copilot, faz parte do sistema de segurança que alimenta o novo Bing. Agora estamos lançando-o como um produto que clientes terceirizados podem usar”, disse Bird.

O Azure AI Content Safety é integrado ao Azure OpenAI Service, fornecendo aos clientes de IA generativa acesso contínuo a ele. O serviço também pode ser aplicado a sistemas não AI, como comunidades online e plataformas de jogos, e os filtros podem ser ajustados para o contexto. Por exemplo, a frase “correr pela colina e atacar” usada em um jogo seria considerada um nível médio de violência e bloqueada se o sistema de jogo estivesse configurado para bloquear conteúdo de gravidade média. Um ajuste para aceitar níveis médios de violência permitiria que o modelo tolerasse a frase, explicou Bird.

Além disso, a Microsoft anunciou novos recursos de proveniência de mídia chegando ao Microsoft Designer e ao Bing Image Creator, que permitirão aos usuários verificar se uma imagem ou vídeo foi gerado por IA. A tecnologia usa métodos criptográficos para marcar e sinalizar conteúdo gerado por IA com metadados sobre sua origem.

Uma nova plataforma de desenvolvimento

Cerca de quatro anos atrás, Scott e seus colegas levantaram a hipótese de que sistemas de IA generativos baseados em grandes modelos de linguagem se tornariam plataformas. Eles permitiriam que os desenvolvedores construíssem novos aplicativos e serviços com relativamente pouco esforço em comparação com as formas mais clássicas de aprendizado de máquina que exigem obter dados, escolher um modelo, treiná-lo, testá-lo, implantá-lo e assim por diante.

“O ponto em que estamos hoje é simplesmente fantástico. Você pode pegar um grande modelo de linguagem como o GPT-4 e começar a usá-lo para criar aplicativos”, disse Scott. “Estabelecemos esta nova plataforma de aplicativos chamada copilot.”

A Microsoft acredita que o copilot representa um novo paradigma em software baseado em IA e uma mudança profunda na forma como o software é construído – desde a imaginação de novos cenários de produtos até a experiência do usuário, a arquitetura, os serviços que ele usa e como pensar em proteção e segurança. O ecossistema da Microsoft, acrescentou Scott, é o lugar para os desenvolvedores criarem copilotos de ponta a ponta.

“Temos tudo o que você precisa no Azure para fazer um copiloto”, disse ele. “E essas coisas funcionam super bem juntas, então testar sua ideia e iterar rapidamente será mais fácil de fazer no Azure do que de qualquer outra maneira.”

Relacionado

Saiba mais sobre o Bing, Microsoft 365 Copilot, Dynamics 365 Copilot, Copilot no Microsoft Viva e Microsoft Security Copilot

Leia: Como 6 especialistas usam IA de última geração

Leia: Refletindo sobre nosso programa de IA responsável: três elementos críticos para o progresso

Leia: Como a aposta da Microsoft no Azure desencadeou uma revolução da IA

Tags: , , , , , , , ,

Posts Relacionados