Por Steve Sweetman, jefe de producto del servicio Azure OpenAI.
Estamos encantados de anunciar el lanzamiento de GPT-image-1, el último y más avanzado modelo de generación de imágenes. Nuestra API ya está disponible para todos los clientes cerrados: aplicación de modelo de acceso limitado y patio de recreo llegará más adelante. Este modelo innovador establece un nuevo estándar en la generación de imágenes de alta calidad, la resolución de prompts complejos y la oferta de capacidades de disparo cero en varios escenarios.
Creen soluciones personalizadas de IA generativa
Eso es suficiente texto para describir un modelo de generación de imágenes por ahora: miren el video a continuación y observen a GPT-image-1 en acción:
Características clave y mejoras
GPT-image-1 se basa en los puntos fuertes de su predecesor, DALL-E, con importantes mejoras:
- Respuesta de instrucciones granulares: GPT-image-1 sobresale en la comprensión y ejecución de instrucciones detalladas, lo que garantiza una generación de imágenes precisa y precisa.
- Representación de texto: El modelo representa de forma fiable el texto dentro de las imágenes, lo que mejora su utilidad en la creación de materiales educativos y libros de cuentos.
- Aceptación de entrada de imágenes: Los usuarios pueden cargar imágenes y proporcionar indicaciones de texto para generar nuevas imágenes o editar las existentes, lo que ofrece una herramienta versátil para proyectos creativos.

Capacidades de GPT-image-1
GPT-image-1 admite múltiples modalidades y características:
- Text-to-image: Generen imágenes a partir de prompts de texto, similar a text2im en ChatGPT DALL-E.
- Imagen a imagen: Creen nuevas imágenes a partir de imágenes cargadas por el usuario y mensajes de texto, una función que no está disponible en ChatGPT DALL-E.
- Transformación de texto: Editen imágenes por medio de prompts de texto, similar a la función de transformación en ChatGPT DALL-E.
- Inpainting: Editen imágenes con prompts de texto y cuadros delimitadores dibujados por el usuario, de forma similar a inpainting con DALL-E.

Casos de uso
GPT-image-1 está diseñado para impulsar una amplia gama de aplicaciones, entre ellas:
- Generación de material educativo: Crear ayudas visuales y contenidos interactivos para el aprendizaje.
- Creación de libros de cuentos: Generación de ilustraciones consistentes y atractivas para libros infantiles.
- Producción de juegos: Desarrollar activos de juego con un estilo y un diseño de personajes coherentes.
- Diseños de interfaz de usuario: Diseñar interfaces de usuario con elementos fotorrealistas y diseños coherentes.

Especificaciones técnicas
- Resolución: admite imágenes con una anchura y una altura mínimas de 1024 píxeles, incluidas las resoluciones 1024×1024, 1024×1536 y 1536×1024.
- Integración de API: Gpt-image-1 está disponible a través de API.
Seguridad y moderación
GPT-image-1 está construido con una sólida pila de seguridad de OpenAI, que incluye c2pa y moderación de entrada/salida. Los elementos específicos de Azure AI incluyen: Seguridad del contenido y supervisión de abusos.
Comiencen hoy mismo
Den rienda suelta a su potencial creativo con GPT-image-1, la tecnología de vanguardia diseñada para elevar sus proyectos artísticos. Con capacidades que admiten imágenes de alta resolución y una integración perfecta de API, pueden dar vida a sus visiones sin esfuerzo. Experimenten los impresionantes elementos fotorrealistas y los diseños coherentes que diferenciarán sus proyectos. Utilicen la generación de imágenes ética y segura con los sólidos sistemas de moderación de GPT-image-1, lo que la convierte en la opción clara para todas sus necesidades creativas.
Descubran hoy mismo el poder transformador de GPT-image-1.