El CEO de OpenAI, Sam Altman, destaca a GPT-5.4 como su modelo favorito mientras reconoce tres debilidades clave

Puntos clave
- El CEO de OpenAI, Sam Altman, califica a GPT-5.4 como su modelo favorito para conversar.
- GPT-5.4 muestra ganancias notables en personalidad y capacidad de codificación.
- Se identifican tres debilidades: el gusto estético en la interfaz de usuario, las lagunas en el contexto del mundo real y la ejecución incompleta de tareas.
- Altman asegura que la empresa abordará estos problemas.
- Los comentarios de los usuarios resaltan la competencia con modelos como Claude, Gemini y Opus.
- Los esfuerzos comunitarios continúan para revivir el modelo ChatGPT-4o retirado.
El jefe de OpenAI, Sam Altman, elogió el nuevo modelo GPT-5.4 como su versión favorita para conversar, destacando mejoras en personalidad y capacidad de codificación. También reconoció tres debilidades - el gusto estético en la interfaz de usuario, las lagunas ocasionales en el contexto del mundo real y la ejecución incompleta de tareas - que la empresa planea abordar. Estos comentarios subrayan el cambio de OpenAI hacia la mejora de cómo se siente al usar ChatGPT, no solo su rendimiento raw, mientras compite con rivales como Claude, Gemini y Opus.
El entusiasta respaldo de Altman
En una publicación reciente en X, el director ejecutivo de OpenAI, Sam Altman, describió a GPT-5.4 como "mi modelo favorito para conversar". Destacó que el último modelo de quinta generación ofrece una personalidad más atractiva y sobresale en codificación, trabajo de conocimiento y tareas basadas en computadora. Altman señaló que OpenAI había "fallado en el objetivo de la personalidad del modelo durante un tiempo" y que GPT-5.4 representa un paso en la dirección correcta.
Debilidades identificadas
En respuesta a los comentarios del usuario Matt Shumer, Altman también enumeró tres áreas donde GPT-5.4 todavía se queda corto. La primera es el "gusto en la interfaz de usuario", que se refiere al sentido del estilo y la estética del modelo al generar diseños de interfaz de usuario, una dimensión en la que los rivales como Opus 4.6, Gemini 3.1 Pro y Claude son percibidos como más fuertes. La segunda debilidad implica fallos ocasionales para incorporar el contexto obvio del mundo real; por ejemplo, el modelo sugirió ubicaciones de itinerarios de viaje que estarían abarrotadas de estudiantes de primavera, lo que requirió una reescritura de la solicitud. El tercer problema se refiere a la ejecución de tareas; durante las pruebas dentro del sistema OpenClaw - una plataforma para automatizar cargas de trabajo de IA en clusters de Mac - el modelo se detuvo antes de completar las tareas.
Respuesta y perspectiva de OpenAI
Altman respondió de manera positiva, afirmando: "Podremos arreglar estas tres cosas". Sus comentarios sugieren que OpenAI ahora prioriza la experiencia del usuario de ChatGPT - su tono, personalidad y facilidad de interacción - junto con los métricas de rendimiento tradicionales. Este enfoque llega en medio de campañas comunitarias en curso para restaurar el modelo ChatGPT-4o retirado, que muchos usuarios sintieron que tenía una personalidad superior en comparación con las versiones anteriores de quinta generación.
Paisaje competitivo
La discusión resalta un entorno competitivo más amplio en el que los modelos GPT de OpenAI se miden no solo por su capacidad raw sino también por su fluidez estética y contextual. Los rivales como Claude, Gemini y Opus se citan como puntos de referencia para la calidad del diseño de la interfaz de usuario, subrayando la importancia del acabado visual en las salidas generadas por IA.
Implicaciones para los usuarios
Para los desarrolladores y trabajadores del conocimiento, el sólido rendimiento de codificación de GPT-5.4 y su tono conversacional mejorado son prometedores. Sin embargo, las debilidades señaladas recuerdan a los usuarios que la ingeniería de solicitudes cuidadosa y la verificación siguen siendo esenciales, especialmente para tareas que involucran la planificación del mundo real o flujos de trabajo de automatización complejos.