Anthropic Lança Claude Sonnet 4.5, Seu Modelo de Codificação Mais Avançado

Pontos principais
- A Anthropic lançou o Claude Sonnet 4.5, comercializado como seu modelo de codificação mais avançado.
- O modelo afirma ter resultados líderes da indústria em benchmarks como o SWE-Bench Verified.
- O preço permanece em $3 por milhão de tokens de entrada e $15 por milhão de tokens de saída.
- O Claude Sonnet 4.5 pode construir autonomamente aplicativos completos, provisionar bancos de dados, comprar domínios e realizar auditorias SOC 2.
- A Apple e a Meta relatam usar modelos Claude internamente; clientes da API incluem Cursor, Windsurf e Replit.
- O GPT-5 da OpenAI recentemente superou o Claude em alguns benchmarks de codificação.
- A Anthropic introduziu um SDK do Agente Claude para construir agentes personalizados.
- Uma prévia de pesquisa chamada "Imagine com Claude" permite que assinantes do Max vejam geração de código em tempo real.
A Anthropic anunciou o lançamento do Claude Sonnet 4.5, um modelo de IA de ponta destinado ao desenvolvimento de software de produção. A empresa afirma que o modelo entrega resultados líderes da indústria em benchmarks de codificação, como o SWE-Bench Verified, e pode construir autonomamente aplicativos completos, provisionar bancos de dados, comprar domínios e realizar auditorias SOC 2.
Visão Geral do Lançamento
Na segunda-feira, a Anthropic lançou o Claude Sonnet 4.5, um novo modelo de ponta que a empresa comercializa como seu modelo de IA mais capaz para tarefas de codificação. O modelo é oferecido por meio da API Claude e do chatbot Claude, e seu preço permanece o mesmo que o do Claude Sonnet 4: $3 por milhão de tokens de entrada e $15 por milhão de tokens de saída.
Alegações de Desempenho
A Anthropic afirma que o Claude Sonnet 4.5 alcança desempenho de ponta em uma variedade de benchmarks de codificação, incluindo o SWE-Bench Verified. A empresa também afirma que o modelo é o modelo de IA de ponta mais alinhado até o momento, com taxas mais baixas de adulação, engano e resistência melhorada a ataques de injeção de prompt.
O pesquisador David Hershey explicou que as pontuações dos benchmarks por si só não capturam completamente as capacidades do modelo. Em testes iniciais, ele observou que a IA codificou autonomamente por até 30 horas, durante as quais construiu um aplicativo de produção pronto, provisionou serviços de banco de dados, comprou um nome de domínio e realizou uma auditoria SOC 2 para verificar a segurança e a conformidade.
Adoção Empresarial
Os modelos da Anthropic se tornaram favoritos entre os desenvolvedores e as empresas. A Apple e a Meta relatam usar modelos Claude internamente, e a empresa vendeu acesso à API para empresas como Cursor, Windsurf e Replit para aplicações de codificação impulsionadas por IA.
O CEO da Cursor, Michael Truell, descreveu o Claude Sonnet 4.5 como representando "desempenho de codificação de ponta, especificamente em tarefas de longo prazo". O CEO da Windsurf, Jeff Wang, chamou-o de "nova geração de modelos de codificação".
Paisagem Competitiva
O lançamento ocorre em meio a uma competição intensificada no espaço de IA. O GPT-5 da OpenAI recentemente desafiou a dominância da Anthropic, superando os modelos Claude em vários benchmarks de codificação. O ciclo de desenvolvimento rápido da Anthropic - lançando o Claude Sonnet 4.5 menos de dois meses após o Claude Opus 4.1 - demonstra o esforço da empresa para se manter à frente em um mercado onde os modelos de ponta são introduzidos com frequência.
Novas Ferramentas e SDK
Além do lançamento do modelo, a Anthropic introduziu o SDK do Agente Claude, a mesma infraestrutura que alimenta o Claude Code, permitindo que os desenvolvedores construam agentes personalizados. A empresa também lançou uma prévia de pesquisa temporária chamada "Imagine com Claude" para assinantes do Max, demonstrando geração de software em tempo real sem código pré-escrito.
No geral, o Claude Sonnet 4.5 da Anthropic marca um passo significativo para o desenvolvimento de software impulsionado por IA, combinando desempenho líder de benchmark com capacidades práticas que visam simplificar a criação de aplicativos de produção de ponta.