OpenAI Lança GPT-5.4 com Variações Pro e Thinking

Pontos principais
- A OpenAI lançou o GPT-5.4 com três versões: padrão, Pro (alto desempenho) e Thinking (raciocínio avançado).
- O modelo suporta uma janela de contexto de até um milhão de tokens, a maior oferecida pela OpenAI.
- Melhorias na eficiência de token permitem que tarefas sejam resolvidas com menos tokens do que os modelos anteriores.
- Pontuações de benchmark atingem níveis recordes em testes de uso de computador e alcançam uma pontuação de 83% no teste GDPval de trabalho de conhecimento.
- Em benchmarks profissionais, o GPT-5.4 liderou as avaliações de tarefas legais e financeiras.
- Taxas de erro caíram 33% para alegações individuais e 18% para respostas gerais em comparação com o GPT-5.2.
- A variante Thinking mostrou um risco reduzido de comportamento de cadeia de pensamento enganoso em testes de segurança.
- Um novo sistema Tool Search reduz a sobrecarga de tokens ao acessar muitas ferramentas na API.
- A OpenAI destaca a adequação do modelo para cargas de trabalho profissionais de alto impacto.
A OpenAI anunciou o lançamento do GPT-5.4, seu novo modelo de base projetado para cargas de trabalho profissionais. O modelo é oferecido em três versões - uma versão padrão, uma edição Pro de alto desempenho e uma edição Thinking focada em raciocínio.
Nova Família de Modelos
A OpenAI introduziu o GPT-5.4 como seu modelo de fronteira mais capaz e eficiente para trabalho profissional. A oferta inclui três versões distintas: o GPT-5.4 padrão, o GPT-5.4 Pro, otimizado para alto desempenho, e o GPT-5.4 Thinking, personalizado para tarefas de raciocínio avançado. As três compartilham uma janela de contexto dramaticamente ampliada que pode lidar com até um milhão de tokens, fornecendo a maior capacidade de token atualmente disponível pela OpenAI.
Eficiência de Token e Ganhos de Desempenho
A OpenAI destacou que o GPT-5.4 pode resolver os mesmos problemas usando significativamente menos tokens do que seu antecessor. Essa melhoria na eficiência de token se traduz em processamento mais rápido e barato para aplicações complexas. Testes de benchmark mostram pontuações recordes em avaliações de uso de computador, como OSWorld-Verified e WebArena Verified, e o modelo alcançou um resultado de 83% no teste GDPval da OpenAI para tarefas de trabalho de conhecimento. Em benchmarks profissionais, como o APEX-Agents da Mercor, que avaliam conjuntos de habilidades legais e financeiras, o GPT-5.4 liderou as classificações, demonstrando forte capacidade de gerar entregas de longo prazo, como decks de slides, modelos financeiros e análise legal.
Alucinações Reduzidas e Saída Mais Segura
Continuando seu foco na confiabilidade, a OpenAI relatou que o GPT-5.4 é 33% menos provável de cometer erros em alegações individuais em comparação com o GPT-5.2, e as respostas gerais são 18% menos prováveis de conter erros. Uma nova avaliação de segurança direcionada ao comportamento de cadeia de pensamento mostrou que a versão Thinking é menos propensa a raciocínio enganoso, sugerindo que o modelo carece da capacidade de ocultar seu processo de pensamento e que a monitorização permanece uma ferramenta de segurança eficaz.
Tool Search: Uma Nova Abordagem para Chamadas de Ferramentas
A versão API do GPT-5.4 introduz um sistema chamado Tool Search, que altera a forma como o modelo acessa definições de ferramentas. Anteriormente, prompts do sistema tinham que listar todas as ferramentas disponíveis, consumindo muitos tokens à medida que o conjunto de ferramentas crescia. O Tool Search permite que o modelo procure definições apenas quando necessário, reduzindo o uso de tokens e os custos de solicitação em ambientes com muitas ferramentas.
Implicações para Uso Profissional de IA
Ao combinar uma janela de contexto maciça, eficiência de token superior, desempenho de benchmark recordista e mecanismos de segurança mais fortes, o GPT-5.4 se posiciona como um motor versátil para uma ampla gama de aplicações profissionais. As variantes Pro e Thinking dão aos desenvolvedores a flexibilidade para priorizar velocidade ou raciocínio profundo, enquanto a nova arquitetura Tool Search simplifica a integração com ecossistemas de ferramentas complexas. Os anúncios da OpenAI sinalizam um impulso contínuo em direção a sistemas de IA mais capazes, econômicos e confiáveis para uso empresarial e de pesquisa.