Anthropic Lança Opus 4.5, um Modelo de IA Mais Rápido, Barato e Capaz

Pontos principais
- A Anthropic lança o Opus 4.5, seu novo modelo de IA de ponta.
- Os aplicativos do Claude agora sumarizam a conversa anterior em vez de parar abruptamente em 200.000 tokens.
- O Opus 4.5 alcança 80,9% de precisão no SWE-Bench Verificado, superando o GPT-5.1-Codex-Max (77,9%) e o Gemini 3 Pro (76,2%).
- O modelo se destaca em benchmarks de codificação agente e uso de ferramentas.
- Ainda assim, fica atrás do GPT-5.1 em tarefas de raciocínio visual (MMMU).
- Os desenvolvedores podem usar as mesmas técnicas de gerenciamento de contexto por meio da API da Anthropic.
- As melhorias visam fornecer interações de usuário mais suaves e mais longas e fluxos de desenvolvimento mais eficientes.
A Anthropic anunciou o lançamento do Opus 4.5, seu novo modelo de ponta, destacando melhor desempenho em codificação, experiências de usuário mais suaves e tratamento de contexto mais inteligente. O modelo alcançou uma pontuação de precisão de 80,9 por cento no benchmark SWE-Bench Verificado, superando o GPT-5.1-Codex-Max da OpenAI e o Gemini 3 Pro do Google.
Lançamento do Novo Modelo e Melhorias Principais
A Anthropic lançou o Opus 4.5 como seu mais recente modelo de fronteira, posicionando-o como uma alternativa mais barata, poderosa e eficiente aos modelos de linguagem grandes concorrentes. O anúncio destacou várias melhorias focadas no usuário. Nas aplicações web, móvel e de desktop do Claude, o modelo agora é menos propenso a interromper abruptamente as conversas quando elas são longas. Anteriormente, os usuários que atingiam a janela de contexto de 200.000 tokens experimentavam paradas duras, o que forçava um fim abrupto ao diálogo, mesmo que os orçamentos de uso permanecessem.
Em vez de cortar, o Claude agora realiza uma sumaização dos segmentos de conversa anteriores em segundo plano, descartando material extraneous enquanto preserva os pontos principais. Essa abordagem visa manter a coerência e evitar que o modelo esqueça detalhes importantes à medida que a conversa progride. Os desenvolvedores que acessam a API da Anthropic podem aplicar técnicas semelhantes de gerenciamento e compactação de contexto em suas próprias aplicações.
Referências de Desempenho
O Opus 4.5 estabeleceu um novo marco alto no benchmark SWE-Bench Verificado, alcançando uma pontuação de precisão de 80,9 por cento. Esse resultado superou estreitamente o GPT-5.1-Codex-Max, recentemente lançado pela OpenAI, que obteve 77,9 por cento e o Gemini 3 Pro do Google, que obteve 76,2 por cento. O modelo demonstrou particular força em benchmarks de codificação agente e uso de ferramentas, embora ainda tenha ficado atrás do GPT-5.1 em tarefas de raciocínio visual medidas pelo benchmark MMMU.
Implicações para Usuários e Desenvolvedores
As melhorias na continuidade da conversa e no tratamento de contexto devem melhorar a experiência geral do usuário em todos os produtos de consumo da Anthropic. Ao sumarizar o diálogo anterior, o Claude pode continuar interações mais longas sem as paradas duras disruptivas que ocorriam anteriormente quando o limite de token era atingido.
Para os desenvolvedores, os mesmos princípios de sumaização e compactação de contexto estão disponíveis por meio da API da Anthropic, oferecendo um caminho para uma engenharia de prompt mais eficiente e um uso mais econômico das capacidades do modelo. O lançamento destaca o compromisso da Anthropic em entregar soluções de IA de alto desempenho, baratas e eficientes que competem diretamente com os principais modelos da OpenAI e do Google.