Por: Steve Sweetman, jefe de producto de servicios de Azure OpenAI y Naomi Moneypenny, directora sénior de desarrollo de productos.
Imaginen una plataforma en la que todos los desarrolladores, ya sea que construyan para una startup o una empresa global, puedan desbloquear todo el espectro de IA: texto, imágenes, audio y video. En OpenAI DevDay, Azure AI Foundry hizo realidad esa visión. Con el lanzamiento de OpenAI GPT-image-1-mini, GPT-realtime-mini y GPT-audio-mini, además de importantes actualizaciones de seguridad para GPT-5, ahora ustedes tienen el conjunto de herramientas definitivo para crear, experimentar y escalar soluciones multimodales, de manera más rápida y asequible que nunca. Nos complace compartir que los modelos anunciados por OpenAI se implementarán ahora en Azure AI Foundry, y la mayoría de los clientes pudieron comenzar a partir del 7 de octubre de 2025.
Prueben Azure AI Foundry hoy mismo
Este anuncio se unió a las principales innovaciones que anunciamos hace unas semanas con el lanzamiento de Microsoft Agent Framework (ahora en versión preliminar), flujos de trabajo multiagente en Foundry Agent Service en versión preliminar privada, observabilidad unificada, disponibilidad general de Voice Live API y las nuevas capacidades de IA responsable. Microsoft Agent Framework (GitHub) es un SDK de código abierto de nivel comercial y un entorno de ejecución diseñado para simplificar la orquestación de sistemas multiagente. Unifica los cimientos listos para el negocio de Semantic Kernel con las capacidades multiagente de AutoGen, para brindar a los desarrolladores las herramientas para crear soluciones agenciales inteligentes y escalables con velocidad y confianza.
Al expandir Azure AI Foundry con los modelos OpenAI más recientes y avanzar en nuestro marco de IA agéntica, capacitamos a los clientes con opciones, flexibilidad y funcionalidades empresariales sin precedentes, lo que permite a los desarrolladores crear sistemas de agentes inteligentes que abordan necesidades empresariales complejas e impulsan la innovación a escala.
Conozcan los nuevos modelos: Creado para desarrolladores, listo para cualquier cosa
GPT-image-1-mini: Potencia compacta para la creatividad visual
GPT-image-1-mini está diseñado en específico para organizaciones y desarrolladores que necesitan una generación de imágenes rápida y eficiente en recursos a escala. Su arquitectura compacta permite la creación de texto a imagen e imagen de alta calidad mientras consume menos recursos computacionales, lo que permite a los equipos implementar IA multimodal incluso en entornos restringidos. Su sólida arquitectura basada en el modelo Image-1 optimiza la coherencia y la facilidad de adopción para las organizaciones que ya aprovechan la IA multimodal en Azure AI Foundry.
¿Qué lo hace especial?
- Generación flexible de imágenes: implementen funciones de texto a imagen e imagen a imagen de alta calidad sin romper su presupuesto.
- Inferencia ultrarrápida: generen imágenes en tiempo real, integradas a la perfección con los flujos de trabajo existentes de Azure AI Foundry.
Casos de uso:
- Generar materiales educativos para las aulas y el aprendizaje en línea.
- Diseño de libros de cuentos y narrativas visuales.
- Producción de activos de juegos para la creación rápida de prototipos y desarrollo.
- Aceleración de los flujos de trabajo de diseño de interfaz de usuario para aplicaciones y sitios web.
Tabla 1: Precios e implementación de GPT-image-1-mini en Azure AI Foundry (por 1 millón de tokens)*

GPT-realtime-mini y GPT-audio-mini: solución de voz eficiente y asequible
Los dos nuevos mini modelos están diseñados para organizaciones y desarrolladores que necesitan una IA multimodal rápida y rentable sin sacrificar la calidad. Estos modelos son livianos y de una alta optimización, y ofrecen interacción de voz en tiempo real y generación de audio con requisitos mínimos de recursos. Su arquitectura optimizada permite una inferencia rápida y baja latencia, lo que los hace ideales para escenarios donde la velocidad y la capacidad de respuesta son críticas, como chatbots basados en voz, traducción en tiempo real y creación dinámica de contenido de audio. Al consumir menos recursos computacionales, estos modelos ayudan a las empresas y a los equipos de desarrolladores a reducir los costos operativos mientras escalan las capacidades multimodales en una amplia gama de aplicaciones.
¿Qué los hace especiales?
- Capacidad de respuesta en tiempo real: potencien los chatbots, los asistentes y las herramientas de traducción con una latencia casi nula.
- Pocos recursos: ejecuten modelos avanzados de voz y audio en una infraestructura mínima.
- Escalado asequible: reduzcan sus costos operativos mientras expanden las capacidades multimodales.
Casos de uso:
- Chatbots basados en voz para servicio y soporte al cliente.
- Traducción en tiempo real para la comunicación global.
- Creación dinámica de contenido de audio para medios y entretenimiento.
- Asistentes de voz interactivos para aplicaciones empresariales y de consumo.
GPT‑realtimemini en Azure AI Foundry permite a nuestros clientes crear soluciones de voz con menor latencia, mejor cumplimiento de las instrucciones y rentabilidad, funcionalidades que nuestros clientes valoran, lo que impulsa tiempos de gestión más cortos, diálogos más fluidos y un tiempo de creación de valor más rápido.
Andy O’Dower, vicepresidente de producto, Twilio
Tabla 2: Precios e implementación de GPT-realtime-mini y GPT-audio-mini en Azure AI Foundry (por 1 millón de tokens)*

GPT-5-chat-latest: Elevar el listón de la seguridad y el bienestar
La última actualización de GPT-5-chat-latest en Azure AI Foundry presenta un conjunto más sólido de barreras de seguridad, diseñadas para proteger mejor a los usuarios durante conversaciones confidenciales. Con capacidades mejoradas de detección y respuesta, GPT-5-chat-latest ahora está equipado para reconocer y administrar de manera más efectiva el diálogo que podría conducir a angustia mental o emocional. Estas mejoras reflejan nuestro compromiso continuo con la IA responsable, para asegurar que cada interacción no solo sea inteligente y útil, sino también segura y de apoyo para los usuarios en momentos difíciles.
Tabla 3: Precios e implementación de GPT-5-chat-latest en Azure AI Foundry (por 1 millón de tokens)*

GPT-5-pro: El pináculo del razonamiento y el análisis
GPT-5-pro representa el pináculo del razonamiento y el análisis avanzados dentro del ecosistema de Azure AI Foundry, para brindar inteligencia de grado de investigación. Cuando se implementa a través de Foundry, la arquitectura de estilo torneo de GPT-5-pro aprovecha múltiples vías de razonamiento para garantizar la máxima precisión y confiabilidad, lo que la hace ideal para análisis complejos, generación de código y flujos de trabajo de toma de decisiones. Con Azure AI Foundry, las organizaciones liberan todo el potencial de GPT-5-pro, para impulsar decisiones más inteligentes y acelerar la innovación en sus procesos empresariales más críticos, de forma segura y confiable.
Tabla 4: Precios e implementación de GPT-5-pro en Azure AI Foundry (por 1 millón de tokens)*

La ventaja del desarrollador: construye, experimenta y envía más rápido
Con estos nuevos modelos, Azure AI Foundry no solo se mantiene al día, sino que marca el ritmo. Los desarrolladores ahora pueden ir más allá del texto, para aprovechar la generación, edición y comprensión de imágenes y audio. ¿El resultado? Flujos de trabajo más ricos e inteligentes que impulsan la innovación en todas las industrias, desde la educación y los juegos hasta la automatización empresarial.
Adelanto: Sora 2: generación de audio y video de siguiente nivel
Y hay más en el horizonte. Sora 2 en Azure AI Foundry estará disponible más adelante, para brindar generación avanzada de video y audio en una sola API. Imaginen animaciones basadas en la física, diálogos sincronizados y características de cameo, todo disponible para los desarrolladores a través de Azure AI Foundry. Estén atentos a la próxima ola de experiencias inmersivas y generativas.
¿Están listos para crear la próxima ola de experiencias inmersivas y multimodales? Azure AI Foundry es su plataforma para todas las posibilidades.
*Los precios son precisos a partir de octubre de 2025.