OpenAI presenta GPT-5.4 con razonamiento, codificación y automatización de tareas mejorados

OpenAI anunció el lanzamiento de GPT-5.4, la última versión de su modelo de inteligencia artificial insignia. La actualización trae mejoras notables en el razonamiento, la asistencia de codificación y la automatización de tareas en el mundo real. Las nuevas capacidades permiten que el modelo interprete capturas de pantalla, controle navegadores y emita comandos de teclado y mouse, lo que permite flujos de trabajo de varios pasos que anteriormente requerían intervención humana. GPT-5.4 también ofrece capacidades de investigación más fuertes, retención de contexto más larga y un modo "Pensamiento" que muestra su proceso de razonamiento. El modelo se está implementando en los usuarios de ChatGPT, la API y los clientes empresariales, con una versión Pro para cargas de trabajo de alto rendimiento.

Introducción

OpenAI presentó GPT-5.4 como la última iteración de su gran modelo de lenguaje, destacando avances en el razonamiento, la codificación y la automatización de tareas. La implementación abarca ChatGPT, la API y las herramientas para desarrolladores, con versiones personalizadas para usuarios cotidianos y cargas de trabajo empresariales.

Interacción directa con la computadora

Uno de los cambios más significativos es la capacidad del modelo para interactuar directamente con las computadoras. GPT-5.4 puede interpretar capturas de pantalla, operar navegadores y emitir comandos de teclado y mouse, lo que le permite completar tareas en varias aplicaciones sin intervención humana. Esta capacidad admite flujos de trabajo complejos y de varios pasos que anteriormente interrumpían la productividad del usuario.

Investigación y razonamiento mejorados

La actualización mejora la capacidad del modelo para realizar una recopilación de información de varias rondas, combinando los hallazgos en respuestas más claras y estructuradas. OpenAI describe GPT-5.4 como su modelo más factual hasta la fecha, señalando una reducción en las afirmaciones falsas en comparación con su predecesor.

Modo "Pensamiento"

GPT-5.4 introduce un modo "Pensamiento" dentro de ChatGPT, diseñado para prompts complejos. Este modo muestra un esquema visible del proceso de razonamiento del modelo, lo que permite a los usuarios ajustar las instrucciones a mitad de la respuesta y guiar los resultados sin reiniciar la conversación.

Contexto más largo y soporte de codificación

El modelo retiene la información a lo largo de flujos de trabajo extendidos, lo que lo hace especialmente útil para herramientas de codificación como OpenAI Codex. Los desarrolladores pueden confiar en GPT-5.4 para automatizar tareas de desarrollo grandes o que consumen mucho tiempo.

Disponibilidad

GPT-5.4 se está implementando actualmente en los usuarios de ChatGPT en la web y Android, con soporte para iOS esperado pronto. OpenAI también ofrece una versión Pro dirigida a clientes empresariales y académicos que necesitan un rendimiento máximo para cargas de trabajo complejas.