[LO MÁS DESTACADO DE BUILD 2023] Microsoft describe el marco para crear aplicaciones de IA y copilotos; expande el ecosistema de plugins de IA

¿Recuerdan cuando el software no estaba conectado a Internet? No lo creo. En unos pocos años, esto también será cierto para el software que no venga con un asistente de copiloto inteligente, según Kevin Scott, director de tecnología de Microsoft.

Un copiloto es una aplicación que utiliza inteligencia artificial moderna y modelos de lenguaje avanzados para ayudar con tareas cognitivas complejas, desde escribir un discurso de ventas o ponerse al día con una reunión perdida, hasta generar imágenes para una presentación o planificar una cena temática.

Microsoft introdujo el concepto de copiloto hace casi dos años con GitHub Copilot, un programador de IA que ayuda a los desarrolladores a escribir código. Este año, Microsoft implementó experiencias de copiloto en sus productos y servicios principales, desde el chat impulsado por IA en Bing, que ha comenzado a cambiar la forma en que las personas buscan en Internet, hasta Microsoft 365 Copilot, GitHub Copilot XDynamics 365 CopilotCopilot en Microsoft Viva y Microsoft Security Copiloto.

Hoy, en la conferencia anual de desarrolladores de Build, Microsoft anunció que ha ampliado este ecosistema de Microsoft Copilots para incluir Copilot en Power BI y Copilot en Power Pages en versión preliminar, Copilot en Microsoft Fabric, disponible en versión preliminar más adelante, y Windows Copilot, que comenzará a estar disponible en vista previa en junio. La compañía también presentó nuevas funciones que ayudarán a los desarrolladores a crear sus propios copilotos y aplicaciones de IA de próxima generación. Esto incluye nuevas herramientas llamadas plugins (complementos) que hacen que los copilotos sean más útiles al permitirles interactuar con otro software y servicios.

“Puedes mirar Bing Chat y pensar que esto es algo súper mágico y complicado, pero Microsoft está brindando a los desarrolladores todo lo que necesitan para comenzar a construir su propio copiloto» dijo Scott. “Creo que en los próximos años, esto se convertirá en una expectativa de cómo funciona todo el software”.

Expandir el ecosistema de plugins

OpenAI introdujo los plugins de ChatGPT en marzo. Microsoft anunció plugins para Bing a principios de este mes. Esa tecnología permite que ChatGPT y Bing Chat los ayuden a encontrar y reservar una mesa en un restaurante a través de un plugin de OpenTable, por ejemplo.

Hoy, Microsoft adopta el mismo estándar de plugin abierto que OpenAI introdujo para ChatGPT, lo que permite la interoperabilidad entre ChatGPT y la amplia gama de ofertas de copiloto de Microsoft. Esto significa que los desarrolladores ahora pueden utilizar una plataforma para crear plugins que funcionen en todas las superficies tanto comerciales como de consumo, incluyendo ChatGPT, Bing, Dynamics 365 Copilot, Microsoft 365 Copilot y Windows Copilot. Microsoft también anunció que está llevando Bing a ChatGPT como la experiencia de búsqueda predeterminada.

Como parte de esta plataforma de plugins compartidos, Bing agrega soporte para plugins. Además de los anunciados de manera previa para OpenTable y Wolfram Alpha, también contará con Expedia, Instacart, Kayak, Klarna, Redfin, TripAdvisor y Zillow entre muchos otros en el ecosistema Bing.

Además, los desarrolladores ahora podrán ampliar Microsoft 365 Copilot con plugins. Los plugins para Microsoft 365 incluyen plugins de ChatGPT y Bing, así como extensiones de mensajes de Teams y conectores de Power Platform, lo que permite a los desarrolladores aprovechar sus inversiones existentes. Y los desarrolladores podrán crear con facilidad nuevos plugins con el kit de herramientas de Microsoft Teams para Visual Studio Code y Visual Studio.

Cómo funcionan los plugins

En Build, la empresa presentó un marco de desarrollo de IA que ayuda a los desarrolladores a crear su propio copiloto. Esta pila incluye soporte para plugins que aumentan las capacidades de los sistemas de IA al permitirles recuperar información en tiempo real, incorporar datos de la empresa u otros datos comerciales, realizar nuevos tipos de cálculos y tomar medidas de manera segura en nombre del usuario.

En esencia, piensen en los plugins como un puente. Esto podría ser un puente entre un modelo de lenguaje grande que se entrenó con datos públicos de Internet y todos los datos que una empresa puede mantener en privado sobre sus beneficios. El plugin es el puente que le da acceso al copiloto a esos archivos cuando responde una pregunta de un empleado de la empresa.

De manera similar, un plugin podría servir como un puente entre un modelo de lenguaje grande y un sitio web o sistema de back-end que una empresa usa para reservar viajes de negocios, lo que permite al copiloto hacer arreglos para el viaje de un vendedor a San Francisco que están en línea con la política de viajes de la empresa.

Los plugins hacen que los copilotos sean más útiles al permitirles interactuar con otros software y servicios. Gráfico cortesía de Microsoft.
Los plugins hacen que los copilotos sean más útiles al permitirles interactuar con otros software y servicios. Gráfico cortesía de Microsoft.

“Un plugin se trata de cómo ustedes, los desarrolladores del copiloto, le dan a su copiloto o a un sistema de inteligencia artificial la habilidad de tener capacidades que no se manifiestan en este momento y conectarlo a los datos y conectarlo a los sistemas que construyen”, dijo Scott. “Creo que, con el tiempo, habrá un ecosistema bastante rico de plugins”.

Expandir el ecosistema de plugins

Los desarrolladores también podrán crear, probar e implementar sus propios plugins de varias maneras: implementarlos, de manera eventual, para usarlos con Microsoft Copilots y aumentar las capacidades de sus propias aplicaciones creadas con tecnología de IA generativa.

Por ejemplo, un desarrollador de una gran corporación puede querer que Microsoft 365 Copilot pueda acceder a los contratos de la empresa con clientes y proveedores para hacer preguntas sobre cómo se manejaron ciertos problemas legales en el pasado. Para hacer eso, el desarrollador necesita conectar Microsoft 365 Copilot con la base de datos privada de archivos legales, lo que requiere que los documentos se codifiquen, indexen y almacenen de tal manera que se puedan buscar.

“Ese es un patrón de cómo cargarías información en el modelo”, dijo John Montgomery, vicepresidente corporativo de administración de programas de Microsoft para la plataforma de IA. «Y ahí es donde entran los plugins. Lo que hace un plugin es decir ‘Oye, queremos que ese patrón sea reutilizable y establecer algunos límites sobre cómo se usa’».

Microsoft ha comenzado a lanzar un conjunto de capacidades para facilitar la creación de plugins que funcionan en sus superficies de copiloto. Visual Studio Code, GitHub Copilot y GitHub Codespaces facilitarán a los desarrolladores la creación, depuración e implementación de nuevos plugins, por ejemplo, y Azure AI agregará capacidades para ejecutar y probar plugins en datos de empresas privadas. Una vez creados, estos plugins funcionarán en las experiencias Copilot de Microsoft.

Montgomery señaló que la incorporación de plugins acelerará el ritmo al que los clientes de Microsoft podrán desarrollar aplicaciones innovadoras con Azure OpenAI Service, el cual brinda acceso a los modelos de IA generativa de OpenAI, incluyendo el GPT-4, y en la actualidad presta servicios a más de 4,500 empresas.

“Lo que verán en Build es nuestro mejor pensamiento actual sobre las prácticas arquitectónicas, las herramientas que necesitan y los patrones de aplicaciones y los diseños de experiencia del usuario que desean implementar en estas nuevas aplicaciones copiloto”, dijo en una entrevista antes de la conferencia.

Nuevas herramientas para construir su propio copiloto

Si bien Microsoft ha implementado tecnología de inteligencia artificial generativa en los productos y servicios de la compañía, los desarrolladores de manera eventual construirán la mayoría de los copilotos en el mundo, según Scott.

“Entenderán una cosa en particular que ellos o sus usuarios tratan de lograr, y usarán este patrón de desarrollo de software de IA para construir esas cosas para esos usuarios”, dijo.

El desarrollo de Copilot comienza como cualquier proyecto de software: como una idea. Lo que es diferente es el ámbito de posibilidades que permite esta plataforma de desarrollo de IA, dijo Scott.

Él compara esto con las nuevas experiencias y servicios que aparecieron con la llegada de los teléfonos inteligentes. Muchas cosas que eran imposibles de imaginar se hicieron posibles. Algunas fueron sencillas de desarrollar, como aplicaciones para juegos familiares e informales. Otros fueron duros y aprovecharon todas las capacidades de la plataforma de teléfonos inteligentes para crear nuevos tipos de experiencias, incluidos servicios que revolucionaron las industrias de alquiler de taxis y vacaciones.

“Pasaron de imposible a difícil y debido a que eran difíciles y en verdad usaron las capacidades de la nueva plataforma, encontraron un éxito duradero”, dijo Scott, al aludir a su expectativa de que se construyan aplicaciones disruptivas similares con la pila de copiloto.

Microsoft delineó un marco de desarrollo de IA para ayudar a los desarrolladores a construir su propio copiloto. Gráfico cortesía de Microsoft.

Con una idea sólida para una aplicación en la mano, los desarrolladores pueden convertirla en una realidad, dijo. El proceso comienza con la selección de un modelo de IA generativa como GPT-4, que está disponible a través de Azure OpenAI Service. El siguiente paso es darle al copiloto un meta-mensaje, que es una descripción básica del rol del copiloto y cómo debe operar. Además, el copiloto necesita memoria para realizar un seguimiento de una conversación con un usuario y responder con el contexto y la conciencia apropiados. Por último, el copiloto necesita la capacidad de acceder a los datos y otros servicios que pueden proporcionar los plugins.

Los copilotos desplegados para respaldar tareas complejas, como escribir un libro completo, también requerirán orquestación: la capacidad de dividir las tareas en componentes de varios pasos y ejecutar las tareas de acuerdo con un plan generado.

Los desarrolladores pueden usar herramientas como el kit de desarrollo de software Semantic Kernel que Microsoft lanzó en código abierto en marzo para integrar grandes modelos de lenguaje con lenguajes de programación convencionales. El kit incluye herramientas de memoria y orquestación y soporte para plugins, lo que acelera el desarrollo de los copilotos, según Montgomery.

En Build, Microsoft presentó nuevas herramientas para simplificar el desarrollo de copilotos. Por ejemplo, con el nuevo Azure AI Studio, los desarrolladores ahora pueden basar, de manera más fácil, los modelos de IA conversacionales en sus datos privados. Con una nueva capacidad llamada Azure OpenAI Service en sus datos, los desarrolladores pueden descubrir información específica de la organización a partir de datos, texto e imágenes mediante interfaces de aplicaciones basadas en lenguaje natural. Para ampliar aún más las capacidades de los modelos de idiomas grandes, Microsoft también anunció la compatibilidad con plugins con Azure OpenAI Service. Azure AI ahora también es compatible con el flujo de solicitud de Azure Machine Learning, una herramienta de ingeniería de solicitud sofisticada, señaló Montgomery.

“Hemos construido un montón de estos copilotos. Hemos analizado un montón de diferentes arquitecturas para ver cómo ustedes cargan otra información, cómo crean contenido reproducible, cómo alimentan el modelo con las cosas correctas para que dé las respuestas correctas”, dijo. “Build va a ser una celebración de todas las cosas que hemos aprendido, las herramientas que hemos creado y llevarlas al mundo”.

Actualizaciones para la IA responsable

Es importante destacar que los desarrolladores también deben asegurarse de que el copiloto devuelva los resultados previstos y evite los resultados que sean sesgados, sexistas, racistas, de odio, violentos o que inciten a la autolesión, señaló Sarah Bird, gerente de producto del grupo de socios en Microsoft que lidera la inteligencia artificial responsable para la base. tecnologías

Hoy en Build, Microsoft anunció que Azure AI Content Safety está en versión preliminar. Este nuevo servicio de Azure AI ayuda a los desarrolladores a crear comunidades y entornos en línea más seguros con modelos diseñados para detectar contenido inapropiado en imágenes y texto. Los modelos asignan una puntuación de gravedad al contenido marcado, lo que indica a los moderadores humanos qué contenido requiere una acción urgente.

“Es el sistema de seguridad que impulsa a GitHub Copilot, es parte del sistema de seguridad que impulsa al nuevo Bing. Ahora lo lanzamos como un producto que los clientes externos pueden usar”, dijo Bird.

Azure AI Content Safety está integrado en Azure OpenAI Service, lo que brinda a los clientes un acceso sin inconvenientes a la IA generativa. El servicio también se puede aplicar a sistemas que no son de IA, como comunidades en línea y plataformas de juegos, y los filtros se pueden ajustar según el contexto. Por ejemplo, la frase «corre por la colina y ataca» utilizada en un juego se consideraría un nivel medio de violencia y se bloquearía si el sistema de juego estuviera configurado para bloquear contenido de gravedad media. Un ajuste para aceptar niveles medios de violencia permitiría que el modelo tolerara la frase, explicó Bird.

Además, Microsoft anunció nuevas capacidades de procedencia de medios que llegarán a Microsoft Designer y Bing Image Creator que permitirán a los usuarios verificar si una imagen o video fue generado por IA. La tecnología utiliza métodos criptográficos para marcar y firmar contenido generado por IA con metadatos sobre su origen.

Una nueva plataforma para el desarrollo

Hace unos cuatro años, Scott y sus colegas plantearon la hipótesis de que los sistemas de IA generativa basados en grandes modelos de lenguaje se convertirían en plataformas. Permitirían a los desarrolladores crear nuevas aplicaciones y servicios con muy poco esfuerzo en comparación con las formas más clásicas de aprendizaje automático que requieren obtener datos, elegir un modelo, entrenarlo, probarlo, implementarlo, etc.

“El punto en el que nos encontramos hoy es simplemente fantástico. Ahora puedes tomar un modelo de lenguaje grande como GPT-4 y comenzar a usarlo para crear aplicaciones”, dijo Scott. “Hemos establecido esta nueva plataforma de aplicaciones llamada Copilot”.

Microsoft cree que el copiloto representa tanto un nuevo paradigma en el software impulsado por IA como un cambio profundo en la forma en que se construye el software: desde imaginar nuevos escenarios de productos hasta la experiencia del usuario, la arquitectura, los servicios que utiliza y cómo pensar en la seguridad. El ecosistema de Microsoft, agregó Scott, es el lugar para que los desarrolladores construyan copilotos de principio a fin.

“Tenemos todo lo que ustedes necesitan en Azure para hacer un copiloto”, dijo. “Y esas cosas funcionan muy bien juntas, por lo que probar su idea e iterar con rapidez será más fácil de hacer sobre Azure que de otra manera”.

Contenido relacionado

Imagen principal: Microsoft está introduciendo herramientas que ayudarán a los desarrolladores a construir sus propios copilotos y aplicaciones de inteligencia artificial de próxima generación. Gráfico cortesía de Microsoft.

John Roach escribe sobre investigación e innovación. Conecta con él en LinkedIn.