Presentamos GPT-image-1: Alcanzar nuevas alturas con la generación de imágenes en Azure AI Foundry

Por Steve Sweetman, jefe de producto del servicio Azure OpenAI.

Estamos encantados de anunciar el lanzamiento de GPT-image-1, el último y más avanzado modelo de generación de imágenes. Nuestra API ya está disponible para todos los clientes cerrados: aplicación de modelo de acceso limitado y patio de recreo llegará más adelante. Este modelo innovador establece un nuevo estándar en la generación de imágenes de alta calidad, la resolución de prompts complejos y la oferta de capacidades de disparo cero en varios escenarios.

Creen soluciones personalizadas de IA generativa

Eso es suficiente texto para describir un modelo de generación de imágenes por ahora: miren el video a continuación y observen a GPT-image-1 en acción:

Características clave y mejoras

GPT-image-1 se basa en los puntos fuertes de su predecesor, DALL-E, con importantes mejoras:

Respuesta de instrucciones granulares: GPT-image-1 sobresale en la comprensión y ejecución de instrucciones detalladas, lo que garantiza una generación de imágenes precisa y precisa.
Representación de texto: El modelo representa de forma fiable el texto dentro de las imágenes, lo que mejora su utilidad en la creación de materiales educativos y libros de cuentos.
Aceptación de entrada de imágenes: Los usuarios pueden cargar imágenes y proporcionar indicaciones de texto para generar nuevas imágenes o editar las existentes, lo que ofrece una herramienta versátil para proyectos creativos.

Una casa abierta virtual con una habitación que tiene un sofá y una ventana

Capacidades de GPT-image-1

GPT-image-1 admite múltiples modalidades y características:

Text-to-image: Generen imágenes a partir de prompts de texto, similar a text2im en ChatGPT DALL-E.
Imagen a imagen: Creen nuevas imágenes a partir de imágenes cargadas por el usuario y mensajes de texto, una función que no está disponible en ChatGPT DALL-E.
Transformación de texto: Editen imágenes por medio de prompts de texto, similar a la función de transformación en ChatGPT DALL-E.
Inpainting: Editen imágenes con prompts de texto y cuadros delimitadores dibujados por el usuario, de forma similar a inpainting con DALL-E.

Grupo de imágenes de personas en una habitación

Casos de uso

GPT-image-1 está diseñado para impulsar una amplia gama de aplicaciones, entre ellas:

Generación de material educativo: Crear ayudas visuales y contenidos interactivos para el aprendizaje.
Creación de libros de cuentos: Generación de ilustraciones consistentes y atractivas para libros infantiles.
Producción de juegos: Desarrollar activos de juego con un estilo y un diseño de personajes coherentes.
Diseños de interfaz de usuario: Diseñar interfaces de usuario con elementos fotorrealistas y diseños coherentes.

Especificaciones técnicas

Resolución: admite imágenes con una anchura y una altura mínimas de 1024 píxeles, incluidas las resoluciones 1024×1024, 1024×1536 y 1536×1024.
Integración de API: Gpt-image-1 está disponible a través de API.

Seguridad y moderación

GPT-image-1 está construido con una sólida pila de seguridad de OpenAI, que incluye c2pa y moderación de entrada/salida. Los elementos específicos de Azure AI incluyen: Seguridad del contenido y supervisión de abusos.

Comiencen hoy mismo

Den rienda suelta a su potencial creativo con GPT-image-1, la tecnología de vanguardia diseñada para elevar sus proyectos artísticos. Con capacidades que admiten imágenes de alta resolución y una integración perfecta de API, pueden dar vida a sus visiones sin esfuerzo. Experimenten los impresionantes elementos fotorrealistas y los diseños coherentes que diferenciarán sus proyectos. Utilicen la generación de imágenes ética y segura con los sólidos sistemas de moderación de GPT-image-1, lo que la convierte en la opción clara para todas sus necesidades creativas.

Descubran hoy mismo el poder transformador de GPT-image-1.