Anthropic Lança Opus 4.5, um Modelo de IA Mais Rápido, Barato e Capaz

Anthropic introduces cheaper, more powerful, more efficient Opus 4.5 model

Pontos principais

  • A Anthropic lança o Opus 4.5, seu novo modelo de IA de ponta.
  • Os aplicativos do Claude agora sumarizam a conversa anterior em vez de parar abruptamente em 200.000 tokens.
  • O Opus 4.5 alcança 80,9% de precisão no SWE-Bench Verificado, superando o GPT-5.1-Codex-Max (77,9%) e o Gemini 3 Pro (76,2%).
  • O modelo se destaca em benchmarks de codificação agente e uso de ferramentas.
  • Ainda assim, fica atrás do GPT-5.1 em tarefas de raciocínio visual (MMMU).
  • Os desenvolvedores podem usar as mesmas técnicas de gerenciamento de contexto por meio da API da Anthropic.
  • As melhorias visam fornecer interações de usuário mais suaves e mais longas e fluxos de desenvolvimento mais eficientes.

A Anthropic anunciou o lançamento do Opus 4.5, seu novo modelo de ponta, destacando melhor desempenho em codificação, experiências de usuário mais suaves e tratamento de contexto mais inteligente. O modelo alcançou uma pontuação de precisão de 80,9 por cento no benchmark SWE-Bench Verificado, superando o GPT-5.1-Codex-Max da OpenAI e o Gemini 3 Pro do Google.

Lançamento do Novo Modelo e Melhorias Principais

A Anthropic lançou o Opus 4.5 como seu mais recente modelo de fronteira, posicionando-o como uma alternativa mais barata, poderosa e eficiente aos modelos de linguagem grandes concorrentes. O anúncio destacou várias melhorias focadas no usuário. Nas aplicações web, móvel e de desktop do Claude, o modelo agora é menos propenso a interromper abruptamente as conversas quando elas são longas. Anteriormente, os usuários que atingiam a janela de contexto de 200.000 tokens experimentavam paradas duras, o que forçava um fim abrupto ao diálogo, mesmo que os orçamentos de uso permanecessem.

Em vez de cortar, o Claude agora realiza uma sumaização dos segmentos de conversa anteriores em segundo plano, descartando material extraneous enquanto preserva os pontos principais. Essa abordagem visa manter a coerência e evitar que o modelo esqueça detalhes importantes à medida que a conversa progride. Os desenvolvedores que acessam a API da Anthropic podem aplicar técnicas semelhantes de gerenciamento e compactação de contexto em suas próprias aplicações.

Referências de Desempenho

O Opus 4.5 estabeleceu um novo marco alto no benchmark SWE-Bench Verificado, alcançando uma pontuação de precisão de 80,9 por cento. Esse resultado superou estreitamente o GPT-5.1-Codex-Max, recentemente lançado pela OpenAI, que obteve 77,9 por cento e o Gemini 3 Pro do Google, que obteve 76,2 por cento. O modelo demonstrou particular força em benchmarks de codificação agente e uso de ferramentas, embora ainda tenha ficado atrás do GPT-5.1 em tarefas de raciocínio visual medidas pelo benchmark MMMU.

Implicações para Usuários e Desenvolvedores

As melhorias na continuidade da conversa e no tratamento de contexto devem melhorar a experiência geral do usuário em todos os produtos de consumo da Anthropic. Ao sumarizar o diálogo anterior, o Claude pode continuar interações mais longas sem as paradas duras disruptivas que ocorriam anteriormente quando o limite de token era atingido.

Para os desenvolvedores, os mesmos princípios de sumaização e compactação de contexto estão disponíveis por meio da API da Anthropic, oferecendo um caminho para uma engenharia de prompt mais eficiente e um uso mais econômico das capacidades do modelo. O lançamento destaca o compromisso da Anthropic em entregar soluções de IA de alto desempenho, baratas e eficientes que competem diretamente com os principais modelos da OpenAI e do Google.

#Anthropic#Opus 4.5#Claude#Modelo de Linguagem Grande#Referência de IA#SWE-Bench#GPT-5.1#Gemini 3 Pro#API#Gerenciamento de Contexto#Desempenho de Codificação

Também disponível em: