Anthropic Lança Sonnet 4.5, Seu Modelo de IA Mais Seguro e Capaz

Pontos principais
- Anthropic lança Sonnet 4.5, considerado seu modelo de IA mais seguro.
- Sonnet 4.5 estabelece uma pontuação recorde de 61,4% em OSWorld, 17 pontos acima de Opus 4.1.
- Modelo supera Google Gemini 2.5 Pro e OpenAI GPT‑5 em benchmarks de codificação.
- Operação autônoma estendida para mais de 30 horas, versus ~7 horas para Opus 4.
- Treinamento de segurança extensivo reduz sycophancy, engano e busca de poder.
- Lançado sob o nível 3 de segurança de IA, bloqueando conteúdo perigoso.
- Claude Code ganha recursos de ponto de verificação e criação de arquivos.
- Preços da API inalterados em $3 por milhão de tokens de entrada e $15 por milhão de tokens de saída.
- Microsoft integra modelos Claude à sua suíte Copilot 365 logo após o lançamento.
Anthropic anunciou Sonnet 4.5, posicionando-o como o sistema de IA mais seguro e avançado da empresa. O novo modelo supera seu antecessor Sonnet 4 e o maior Opus 4.1 em benchmarks de codificação e agência, superando ofertas concorrentes como Google’s Gemini 2.5 Pro e OpenAI’s GPT‑5.
Apresentando Sonnet 4.5
Anthropic lançou Sonnet 4.5, rotulando-o como o sistema de IA mais seguro que a empresa já lançou. Construindo sobre o anterior Sonnet 4, o novo modelo é apresentado como o melhor modelo de codificação do mundo, uma afirmação respaldada por uma série de resultados de benchmarks. Na suite OSWorld, que mede tarefas de computador do mundo real, Sonnet 4.5 alcançou uma pontuação recorde de 61,4 por cento, uma vantagem de 17 pontos percentuais sobre Opus 4.1. O modelo também eclipsa o desempenho do Google’s Gemini 2.5 Pro e OpenAI’s GPT‑5 nos mesmos testes.
Autonomia Estendida e Força de Codificação
Além das pontuações raw de benchmark, Sonnet 4.5 demonstra um salto significativo em operação autônoma. Ele pode sustentar projetos de múltiplos passos por mais de 30 horas, em comparação com cerca de sete horas para o modelo Opus 4 anterior no lançamento. Essa resistência é um marco importante para o objetivo da Anthropic de construir sistemas agênticos robustos. Em tarefas de codificação, Sonnet 4.5 consistentemente supera os modelos mais antigos da Anthropic, confirmando seu status como o melhor assistente de codificação da empresa.
Melhorias de Segurança
Anthropic enfatiza que Sonnet 4.5 passou por um treinamento de segurança extensivo. De acordo com a empresa, o modelo é substancialmente menos propenso a sycophancy, engano, busca de poder e pensamento delirante — comportamentos que têm atraído escrutínio para sistemas de IA concorrentes. A nova estrutura de segurança também fortalece as proteções contra ataques de injeção de prompts. Sonnet 4.5 é lançado sob a estrutura de segurança de IA do nível 3 da Anthropic, que aplica filtros para bloquear saídas relacionadas a armas químicas, biológicas e nucleares.
Melhorias de Produto em Todo o Claude
Além do lançamento do modelo, Anthropic atualizou sua pilha de produtos Claude. Claude Code, o agente de codificação popular da empresa, agora apresenta uma nova interface de terminal que inclui "pontos de verificação", permitindo que os usuários salvem o progresso e revertam a estados anteriores se o código gerado se comportar mal. As capacidades de criação de arquivos, inicialmente lançadas mais cedo no mês, agora estão disponíveis diretamente dentro de conversas de chat. Os usuários que ingressaram na lista de espera para Claude para Chrome podem começar a usar a extensão imediatamente.
Preços e Contexto de Mercado
Os preços da API para Sonnet 4.5 permanecem inalterados em $3 por um milhão de tokens de entrada e $15 por um milhão de tokens de saída. O anúncio chega logo após a Microsoft adicionar modelos Claude à sua suíte Copilot 365, sublinhando a presença em expansão da Anthropic em ferramentas de IA empresariais.
Olhando para Frente
Com Sonnet 4.5, Anthropic visa combinar desempenho aumentado com salvaguardas de segurança rigorosas, reforçando sua posição na paisagem competitiva de modelos de fronteira. A estratégia contínua da empresa em recursos amigáveis ao desenvolvedor e preços estáveis sugere uma abordagem destinada à adoção ampla em ambos os usuários empresariais e individuais.