OpenAI Lanza Actualización de Imágenes de ChatGPT Más Rápida y Precisa

Puntos clave
- ChatGPT Images ahora genera imágenes hasta cuatro veces más rápido que el modelo anterior.
- La actualización mejora el seguimiento de instrucciones, permitiendo acciones de agregar, restar, mezclar y transponer.
- El renderizado de texto mejorado permite texto más claro, pequeño y denso dentro de las imágenes.
- Una nueva sección de Imágenes en la barra lateral de ChatGPT ofrece filtros preestablecidos y ideas de instrucciones.
- OpenAI lanza la actualización a todos los usuarios mientras mantiene el soporte para versiones anteriores.
- La actualización llega en un momento de creciente uso del chatbot Gemini de Google, intensificando la competencia.
OpenAI ha lanzado una nueva versión de su herramienta ChatGPT Images que es cuatro veces más rápida que el modelo anterior y ofrece un seguimiento de instrucciones más nítido. La actualización trae capacidades más fuertes para agregar, restar, combinar y transponer elementos visuales, así como una mejor manipulación de texto denso y pequeño. Una sección de Imágenes dedicada ahora aparece en la barra lateral de ChatGPT, proporcionando filtros preestablecidos y ideas de instrucciones. La actualización llega en un momento de creciente uso del chatbot Gemini de Google, posicionando la generación visual de OpenAI como un diferenciador clave para su creciente base de usuarios.
Mejoras de Rendimiento y Velocidad
OpenAI anunció que el modelo de ChatGPT Images actualizado ofrece velocidades de generación hasta cuatro veces más rápidas que su predecesor. Los usuarios que han experimentado retrasos durante los períodos pico, especialmente aquellos sin una suscripción a ChatGPT Plus, ahora pueden esperar una experiencia más rápida. El impulso de velocidad se destaca como una mejora bienvenida para los usuarios frecuentes de la plataforma.
Capacidades de Edición Mejoradas
El nuevo modelo amplía la capacidad del sistema para seguir instrucciones detalladas. Los usuarios pueden solicitar ediciones específicas, como agregar, restar, combinar, mezclar o incluso transponer elementos dentro de una imagen que el modelo ha generado. Este control más fino está diseñado para dar a los creadores más flexibilidad y precisión al dar forma a los resultados visuales.
Renderizado de Texto Mejorado
OpenAI también afirma que la actualización de ChatGPT Images maneja el texto de manera más efectiva. Históricamente, los modelos de generación de imágenes han tenido dificultades para renderizar texto claro, pequeño o denso. Según la empresa, la nueva versión puede producir texto legible en espacios más pequeños, abordando una limitación de larga data para muchos casos de uso.
Actualizaciones de la Interfaz de Usuario
Junta a las mejoras en el backend, OpenAI está agregando una sección de Imágenes dedicada a la barra lateral de ChatGPT. Esta nueva área albergará filtros preestablecidos y instrucciones curadas diseñadas para inspirar a los usuarios y simplificar el proceso de generación. El cambio de interfaz tiene como objetivo hacer que la creación visual sea más accesible directamente dentro del entorno de chat.
Contexto de la Industria y Competencia
El lanzamiento llega cuando Google informa un aumento en el uso de su chatbot Gemini, notando un salto de 450 millones a 650 millones de usuarios en unos pocos meses. La actualización de OpenAI está posicionada como una respuesta estratégica, reforzando el componente de generación visual de su ecosistema mientras la empresa continúa apoyando versiones heredadas como GPT-4o para usuarios que prefieren la herramienta más antigua.
Perspectiva de la Empresa
OpenAI enfatizó que la actualización representa un primer paso en el potencial más amplio de la generación de imágenes. Un portavoz de la empresa dijo: "Creemos que todavía estamos al comienzo de lo que la generación de imágenes puede permitir", y destacó expectativas de ediciones más finas y resultados más detallados y ricos en futuras versiones. La nueva ChatGPT Images se está lanzando a todos los usuarios a partir de hoy, con la opción de continuar utilizando versiones anteriores a través de configuraciones personalizadas.