OpenAI lanza ChatGPT Images 2.0, mejorando la precisión visual de la IA y la renderización de texto

OpenAI lanzó hoy ChatGPT Images 2.0, un nuevo sistema de generación de imágenes que agrega pasos de razonamiento antes de crear visuales. La actualización maneja prompts complejos, mantiene conceptos consistentes en variaciones y mejora notablemente la colocación de texto dentro de las imágenes, un área en la que los modelos anteriores tenían dificultades. La función está disponible para todos los usuarios de ChatGPT y Codex, con capacidades avanzadas desbloqueadas para los planes Plus, Pro, Business y Enterprise, y el modelo subyacente, gpt-image-2, se ofrece a través de la API.

OpenAI anunció el lanzamiento de ChatGPT Images 2.0, un motor de generación de imágenes mejorado que va más allá de la simple conversión de prompt a imagen. El nuevo sistema inserta una fase de razonamiento, esencialmente "pensando" en una solicitud antes de renderizar la visual, lo que se traduce en una salida más nítida y menos sorpresas para los usuarios.

Una de las ganancias más notables es la capacidad del modelo para procesar prompts intrincados sin perder la idea central. Los creadores ahora pueden solicitar escenas con múltiples elementos, y el motor mantiene relaciones lógicas entre los objetos, entregando imágenes que se sienten coherentes en lugar de una collage de partes relacionadas de manera laxa. La consistencia también se extiende a través de múltiples variaciones; el mismo prompt puede producir una serie de imágenes que compartan un estilo unificado mientras aún ofrecen alternativas distintas.

El manejo de texto, un punto débil durante mucho tiempo para las herramientas de arte de IA, ve un salto sustancial hacia adelante. ChatGPT Images 2.0 incorpora de manera confiable texto legible dentro de las imágenes, una función que anteriormente producía caracteres confusos o mal colocados. Los diseñadores que buscan crear borradores rápidos para presentaciones, gráficos de redes sociales o conceptos de productos ahora pueden confiar en la herramienta para colocar leyendas, etiquetas o eslóganes con mucho menos errores.

OpenAI hizo que la actualización estuviera ampliamente disponible. Todos los usuarios existentes de ChatGPT y Codex reciben la versión base de inmediato, mientras que los suscriptores de Plus, Pro, Business y Enterprise desbloquean el modo "Pensamiento" que impulsa las salidas más avanzadas. Los desarrolladores también pueden aprovechar el nuevo modelo, llamado gpt-image-2, a través de la API de OpenAI, abriendo la puerta para la integración en plataformas de terceros y flujos de trabajo personalizados.

A pesar del progreso, el sistema no es perfecto. Los usuarios informan de inconsistentencias ocasionales en el diseño cuando los prompts involucran diseños muy complejos o caracteres no ingleses. El modelo todavía se queda atrás del software de diseño profesional en precisión, pero la brecha se está cerrando rápidamente. Los ingenieros de OpenAI reconocen estos límites y dicen que seguirán perfeccionando la capacidad de razonamiento espacial y las capacidades de texto multilingüe del modelo.

La actualización señala un cambio en la estrategia de OpenAI. En lugar de perseguir tendencias virales de arte de IA, la empresa parece enfocada en aplicaciones prácticas que pueden aumentar las tareas creativas cotidianas. Al entregar visuales más confiables y texto legible, ChatGPT Images 2.0 se posiciona como un asistente viable para marketeros, educadores y pequeñas empresas que necesitan contenido visual rápido y asequible.

Los observadores de la industria señalan que el movimiento podría influir en cómo otros proveedores de IA priorizan la usabilidad sobre la novedad. A medida que la línea se desdibuja entre los generadores de arte experimentales y los ayudantes de diseño funcionales, herramientas como ChatGPT Images 2.0 pueden pronto convertirse en elementos básicos en los lugares de trabajo digitales.

Por ahora, el lanzamiento más reciente de OpenAI ofrece un paso tangible hacia visuales impulsados por IA que satisfacen necesidades del mundo real, mientras deja espacio para mejoras futuras que podrían eventualmente rivalizar con las suites de diseño gráfico tradicionales.

OpenAI lanza ChatGPT Images 2.0, mejorando la precisión visual de la IA y la renderización de texto

Puntos clave

También disponible en: