OpenAI Presenta GPT-5.4 con Variantes Pro y de Pensamiento

OpenAI anunció el lanzamiento de GPT-5.4, su nuevo modelo de base diseñado para cargas de trabajo profesionales. El modelo se ofrece en tres versiones: una versión standard, una edición de alto rendimiento Pro y una edición de pensamiento avanzado Thinking. GPT-5.4 cuenta con una ventana de contexto de hasta un millón de tokens y ofrece mejoras significativas en la eficiencia de tokens, lo que permite resolver tareas con menos tokens que los modelos anteriores. Las puntuaciones de los benchmarks muestran un rendimiento récord en pruebas de uso de computadora y trabajo de conocimiento, mientras que las actualizaciones de seguridad reducen las alucinaciones en aproximadamente un tercio. Una nueva arquitectura de llamada de herramientas llamada Búsqueda de Herramientas reduce la sobrecarga de tokens al acceder a muchas herramientas, y una evaluación de seguridad demuestra un menor riesgo de comportamiento de cadena de pensamiento engañoso en la versión Thinking.

Nueva Familia de Modelos

OpenAI introdujo GPT-5.4 como su modelo de frontera más capaz y eficiente para trabajo profesional. La oferta incluye tres versiones distintas: la versión standard GPT-5.4, GPT-5.4 Pro, que está optimizada para alto rendimiento, y GPT-5.4 Thinking, diseñada para tareas de razonamiento avanzado. Las tres versiones compartan una ventana de contexto dramáticamente ampliada que puede manejar hasta un millón de tokens, lo que proporciona la mayor capacidad de tokens actualmente disponible de OpenAI.

Eficiencia de Tokens y Mejoras de Rendimiento

OpenAI destacó que GPT-5.4 puede resolver los mismos problemas utilizando significativamente menos tokens que su predecesor. Esta mejora en la eficiencia de tokens se traduce en un procesamiento más rápido y económico para aplicaciones complejas. Las pruebas de benchmark muestran puntuaciones récord en evaluaciones de uso de computadora como OSWorld-Verificado y WebArena Verificado, y el modelo alcanzó un resultado del 83% en la prueba GDPval de OpenAI para tareas de trabajo de conocimiento. En benchmarks profesionales como APEX-Agentes de Mercor, que evalúan habilidades legales y financieras, GPT-5.4 lideró los rankings, demostrando una fuerte capacidad para generar entregables de largo plazo como presentaciones, modelos financieros y análisis legales.

Alucinaciones Reducidas y Salida más Segura

Continuando su enfoque en la confiabilidad, OpenAI informó que GPT-5.4 es un 33% menos propenso a cometer errores en reclamos individuales en comparación con GPT-5.2, y las respuestas generales son un 18% menos propensas a contener errores. Una nueva evaluación de seguridad que se centra en el comportamiento de cadena de pensamiento mostró que la versión Thinking es menos propensa a un razonamiento engañoso, lo que sugiere que el modelo carece de la capacidad de ocultar su proceso de pensamiento y que la supervisión sigue siendo una herramienta de seguridad efectiva.

Búsqueda de Herramientas: Un Nuevo Enfoque para la Llamada de Herramientas

La versión de API de GPT-5.4 introduce un sistema llamado Búsqueda de Herramientas, que cambia la forma en que el modelo accede a las definiciones de herramientas. Anteriormente, las solicitudes del sistema tenían que enumerar todas las herramientas disponibles, lo que consumía muchos tokens a medida que crecía el conjunto de herramientas. Búsqueda de Herramientas permite que el modelo busque definiciones solo cuando sea necesario, reduciendo el uso de tokens y los costos de solicitud en entornos con muchas herramientas.

Implicaciones para el Uso Profesional de la IA

Al combinar una ventana de contexto masiva, una eficiencia de tokens superior, un rendimiento de benchmark récord y mecanismos de seguridad más fuertes, GPT-5.4 se posiciona como un motor versátil para una amplia gama de aplicaciones profesionales. Las variantes Pro y Thinking brindan a los desarrolladores la flexibilidad para priorizar la velocidad o el razonamiento profundo, mientras que la nueva arquitectura de Búsqueda de Herramientas simplifica la integración con ecosistemas de herramientas complejos. Los anuncios de OpenAI señalan un impulso continuo hacia sistemas de IA más capaces, rentables y confiables para uso empresarial y de investigación.