OpenAI lanza el modelo GPT-Image 1.5 con mayor velocidad y mejor renderizado de texto

Puntos clave
- OpenAI lanza el modelo GPT-Image 1.5, cuatro veces más rápido que la versión anterior.
- El modelo mejora el cumplimiento de instrucciones y genera texto más legible en las imágenes.
- Nuevas herramientas de edición permiten a los usuarios agregar objetos, cambiar estilos y eliminar elementos.
- Disponible para todos los usuarios de ChatGPT a través de un espacio dedicado en la barra lateral y a través de la API.
- El lanzamiento sigue la presentación de Gemini 3 de Google, lo que provocó un "código rojo" interno en OpenAI.
- El acuerdo reciente de OpenAI con Disney eventualmente permitirá personajes icónicos en futuras imágenes y videos.
- Los debates de la industria continúan sobre el contenido generado por IA, los derechos de autor y el uso ético.
OpenAI ha lanzado el modelo GPT-Image 1.5, un generador de imágenes de IA mejorado que es cuatro veces más rápido que su predecesor y ofrece una mejor seguimiento de instrucciones, herramientas de edición y generación de texto legible. El nuevo modelo está disponible para todos los usuarios de ChatGPT a través de un espacio dedicado en la barra lateral y también está disponible a través de la API.
Visión general del nuevo modelo
OpenAI anunció el lanzamiento del modelo GPT-Image 1.5, la versión más reciente de su tecnología de imágenes generativas. Según la empresa, el modelo ofrece un aumento de velocidad de cuatro veces en comparación con la versión anterior, mientras que también proporciona un seguimiento más preciso de las instrucciones del usuario. Un enfoque notable de la actualización es la capacidad de generar texto legible dentro de las imágenes, una tarea que históricamente ha desafiado a los generadores de imágenes de IA.
Características y acceso del usuario
El nuevo modelo introduce una suite de herramientas de edición que permiten a los usuarios agregar objetos específicos, alterar estilos, probar elementos de ropa y eliminar elementos no deseados de las visualizaciones generadas. Estas capacidades están integradas en un nuevo espacio dedicado en la interfaz de ChatGPT, ubicado en la barra lateral y diseñado específicamente para la creación visual. El modelo está disponible globalmente para todos los usuarios de ChatGPT y también se puede acceder a través de la API con el identificador GPT-Image-1.5.
Contexto de la industria y reacciones
El modelo GPT-Image 1.5 llega en un momento de intensa rivalidad en el espacio de la IA generativa. El lanzamiento de OpenAI sigue la introducción de Gemini 3 de Google, que incluye la herramienta "nano banana pro" elogiada por sus imágenes hiperrealistas y la mejora del renderizado de texto. Según se informa, OpenAI inició un "código rojo" interno en respuesta a los avances de Google, lo que subraya la presión competitiva.
En paralelo, OpenAI recientemente aseguró un acuerdo con Disney para eventualmente incorporar más de 200 personajes icónicos de Disney en sus plataformas de imágenes y videos, aunque los personajes no estarán disponibles con el nuevo modelo hasta una fecha posterior. La asociación con Disney refleja una tendencia más amplia de las empresas de entretenimiento que negocian términos para el uso de IA de su propiedad intelectual.
Los partes interesados en la comunidad de IA han expresado reacciones mixtas. Mientras que las mejoras de velocidad y calidad son bienvenidas por los creadores que buscan una generación de imágenes más rápida y confiable, persisten preocupaciones sobre las implicaciones éticas y legales del contenido generado por IA, especialmente con respecto a los derechos de autor y el uso de similitudes humanas. Los esfuerzos continuos de OpenAI para expandir las capacidades de su modelo ocurren junto con debates de la industria sobre licencias, litigios y el equilibrio entre innovación y protección de obras creativas.