OpenAI presenta GPT-5.4 con razonamiento, codificación y automatización de tareas mejorados

Puntos clave
- OpenAI lanza GPT-5.4, el último gran modelo de lenguaje.
- Nueva capacidad para interpretar capturas de pantalla y controlar navegadores a través de comandos de teclado y mouse.
- Admite flujos de trabajo de varios pasos sin intervención humana.
- Mayor precisión factual y reducción de afirmaciones falsas en comparación con los modelos anteriores.
- Introduce un modo "Pensamiento" que visualiza el proceso de razonamiento del modelo.
- Retención de contexto más larga mejora la asistencia de codificación y el manejo de tareas complejas.
- Se está implementando en los usuarios de ChatGPT en la web y Android; el soporte para iOS es inminente.
- Versión Pro disponible para clientes empresariales y académicos
OpenAI anunció el lanzamiento de GPT-5.4, la última versión de su modelo de inteligencia artificial insignia. La actualización trae mejoras notables en el razonamiento, la asistencia de codificación y la automatización de tareas en el mundo real. Las nuevas capacidades permiten que el modelo interprete capturas de pantalla, controle navegadores y emita comandos de teclado y mouse, lo que permite flujos de trabajo de varios pasos que anteriormente requerían intervención humana. GPT-5.4 también ofrece capacidades de investigación más fuertes, retención de contexto más larga y un modo "Pensamiento" que muestra su proceso de razonamiento. El modelo se está implementando en los usuarios de ChatGPT, la API y los clientes empresariales, con una versión Pro para cargas de trabajo de alto rendimiento.
Introducción
OpenAI presentó GPT-5.4 como la última iteración de su gran modelo de lenguaje, destacando avances en el razonamiento, la codificación y la automatización de tareas. La implementación abarca ChatGPT, la API y las herramientas para desarrolladores, con versiones personalizadas para usuarios cotidianos y cargas de trabajo empresariales.
Interacción directa con la computadora
Uno de los cambios más significativos es la capacidad del modelo para interactuar directamente con las computadoras. GPT-5.4 puede interpretar capturas de pantalla, operar navegadores y emitir comandos de teclado y mouse, lo que le permite completar tareas en varias aplicaciones sin intervención humana. Esta capacidad admite flujos de trabajo complejos y de varios pasos que anteriormente interrumpían la productividad del usuario.
Investigación y razonamiento mejorados
La actualización mejora la capacidad del modelo para realizar una recopilación de información de varias rondas, combinando los hallazgos en respuestas más claras y estructuradas. OpenAI describe GPT-5.4 como su modelo más factual hasta la fecha, señalando una reducción en las afirmaciones falsas en comparación con su predecesor.
Modo "Pensamiento"
GPT-5.4 introduce un modo "Pensamiento" dentro de ChatGPT, diseñado para prompts complejos. Este modo muestra un esquema visible del proceso de razonamiento del modelo, lo que permite a los usuarios ajustar las instrucciones a mitad de la respuesta y guiar los resultados sin reiniciar la conversación.
Contexto más largo y soporte de codificación
El modelo retiene la información a lo largo de flujos de trabajo extendidos, lo que lo hace especialmente útil para herramientas de codificación como OpenAI Codex. Los desarrolladores pueden confiar en GPT-5.4 para automatizar tareas de desarrollo grandes o que consumen mucho tiempo.
Disponibilidad
GPT-5.4 se está implementando actualmente en los usuarios de ChatGPT en la web y Android, con soporte para iOS esperado pronto. OpenAI también ofrece una versión Pro dirigida a clientes empresariales y académicos que necesitan un rendimiento máximo para cargas de trabajo complejas.