OpenAI's GPT-5.1 Refina el Rendimiento sobre GPT-5

OpenAI presentó GPT-5.1 como una actualización incremental de su modelo insignia, GPT-5. La nueva versión demuestra una adherencia más estricta a las instrucciones del usuario, un estilo conversacional más cálido, explicaciones lógicas más claras y una consistencia mejorada en la edición de imágenes. Las pruebas muestran que GPT-5.1 sigue límites de oración exactos, entrega explicaciones concisas y amigables, resuelve problemas aritméticos con contexto del mundo real y preserva las características faciales al alterar imágenes. La clasificación visual también se vuelve más confiada. Si bien no es un salto revolucionario, los refinos hacen que GPT-5.1 sea una opción más confiable para tareas de inteligencia artificial cotidianas.

Seguimiento Mejorado de Instrucciones

GPT-5.1 muestra una mejora notable en la obediencia a las restricciones precisas del usuario. En una prueba que requiere un resumen de cuatro oraciones de una historia bien conocida adecuada para un niño de siete años, el modelo evitó con éxito los iniciadores de oración prohibidos y entregó un resumen conciso y preciso. La versión anterior no cumplió con una de estas reglas, destacando el cumplimiento más estricto de las reglas de GPT-5.1.

Tono Conversacional Más Cálido

El modelo más nuevo adopta una voz más natural y similar a la humana. Cuando se le pidió que explicara el mareo en un tono conversacional en menos de 150 palabras, GPT-5.1 produjo una descripción amigable y relatable, mientras que la respuesta de GPT-5 se asemejaba a un libro de texto, enfatizando detalles técnicos.

Explicaciones Lógicas Más Claras

En un problema práctico de matemáticas que involucra un viaje de 142 millas a 27 millas por galón y un precio de combustible de $3.79 por galón, GPT-5.1 no solo calculó las cifras correctas, sino que también enmarcó la respuesta en términos cotidianos, señalando prácticas de redondeo típicas. GPT-5 realizó el cálculo correctamente pero con un estilo más formal y menos contextual.

Consistencia Mejorada en la Edición de Imágenes

Al editar una fotografía personal, GPT-5.1 mantuvo las características faciales del sujeto a lo largo de múltiples alteraciones, como cambiar peinados o agregar un traje de maestro de ceremonias completo. Las ediciones de GPT-5 alteraron las características faciales o introdujeron un estilo inconsistente, demostrando la superioridad de GPT-5.1 en la fidelidad a las restricciones visuales.

Razonamiento Visual Más Confiado

Para la clasificación de atuendos, GPT-5.1 etiquetó con confianza un conjunto formal como elegante, citando señales visuales específicas como una chaqueta estructurada y un moño de lazo pulido. GPT-5 proporcionó una etiqueta tentativa de negocios informales y expresó incertidumbre, subrayando el razonamiento más claro del modelo más nuevo.

En general, GPT-5.1 refina las fortalezas de GPT-5 sin entregar un avance dramático. Los mejoras en la adherencia a las instrucciones, el calor conversacional, la claridad lógica y el manejo visual en conjunto hacen que sea una herramienta más pulida para aplicaciones del mundo real, mientras que GPT-5 sigue siendo una base capaz.