CEO da OpenAI, Sam Altman, Elogia o GPT-5.4 como Seu Modelo Favorito, ao Mesmo Tempo em que Reconhece Três Principais Fraquezas

O chefe da OpenAI, Sam Altman, elogiou o novo modelo GPT-5.4 como seu favorito para conversar, destacando melhorias na personalidade e habilidade de codificação. Ele também reconheceu três deficiências - gosto estético de frontend, lapsos ocasionais em contexto do mundo real e execução de tarefas incompleta - que a empresa planeja abordar.

Apoio Enthusiástico de Altman

Em uma postagem recente no X, o CEO da OpenAI, Sam Altman, descreveu o GPT-5.4 como "meu modelo favorito para conversar!" Ele enfatizou que o modelo de quinta geração mais recente entrega uma personalidade mais envolvente e se destaca em codificação, trabalho de conhecimento e tarefas baseadas em computador. Altman observou que a OpenAI havia "errado o alvo na personalidade do modelo por um tempo" e que o GPT-5.4 representa um passo na direção certa.

Fraquezas Identificadas

Em resposta a feedback do usuário Matt Shumer, Altman também listou três áreas em que o GPT-5.4 ainda deixa a desejar. A primeira é "gosto de frontend", que se refere ao senso de estilo e estética do modelo ao gerar designs de interface do usuário, uma dimensão em que rivais como Opus 4.6, Gemini 3.1 Pro e Claude são percebidos como mais fortes. A segunda fraqueza envolve falhas ocasionais em incorporar contexto do mundo real óbvio; por exemplo, o modelo sugeriu locais de itinerário de viagem que estariam superlotados por causa da pausa de primavera, exigindo uma reescrita da solicitação. A terceira questão diz respeito à conclusão de tarefas; durante testes dentro do sistema OpenClaw - uma plataforma para automação de cargas de trabalho de IA em clusters Mac - o modelo parou antes de concluir as tarefas.

Resposta e Perspectiva da OpenAI

Altman respondeu positivamente, afirmando: "Seremos capazes de consertar essas três coisas!" Seus comentários sugerem que a OpenAI agora está priorizando a experiência do usuário do ChatGPT - seu tom, personalidade e facilidade de interação - ao lado de métricas de desempenho tradicionais. Essa focalização ocorre em meio a campanhas comunitárias em andamento para restaurar o modelo ChatGPT-4o aposentado, que muitos usuários sentiram ter uma personalidade superior em comparação com lançamentos de quinta geração anteriores.

Paisagem Competitiva

A discussão destaca um ambiente competitivo mais amplo no qual os modelos GPT da OpenAI são medidos não apenas por capacidade bruta, mas também por fluência estética e contextual. Rivais como Claude, Gemini e Opus são citados como benchmarks para a qualidade do design de frontend, sublinhando a importância do polimento visual em saídas geradas por IA.

Implicações para os Usuários

Para desenvolvedores e trabalhadores do conhecimento, o desempenho de codificação forte do GPT-5.4 e o tom conversacional aprimorado são promissores. No entanto, as fraquezas observadas lembram aos usuários que a engenharia de solicitação cuidadosa e a verificação permanecem essenciais, especialmente para tarefas que envolvem planejamento do mundo real ou fluxos de trabalho de automação complexos.