Anthropic Lança Claude Sonnet 4.5, Seu Modelo de Codificação Mais Avançado

A Anthropic anunciou o lançamento do Claude Sonnet 4.5, um modelo de IA de ponta destinado ao desenvolvimento de software de produção. A empresa afirma que o modelo entrega resultados líderes da indústria em benchmarks de codificação, como o SWE-Bench Verified, e pode construir autonomamente aplicativos completos, provisionar bancos de dados, comprar domínios e realizar auditorias SOC 2.

Visão Geral do Lançamento

Na segunda-feira, a Anthropic lançou o Claude Sonnet 4.5, um novo modelo de ponta que a empresa comercializa como seu modelo de IA mais capaz para tarefas de codificação. O modelo é oferecido por meio da API Claude e do chatbot Claude, e seu preço permanece o mesmo que o do Claude Sonnet 4: $3 por milhão de tokens de entrada e $15 por milhão de tokens de saída.

Alegações de Desempenho

A Anthropic afirma que o Claude Sonnet 4.5 alcança desempenho de ponta em uma variedade de benchmarks de codificação, incluindo o SWE-Bench Verified. A empresa também afirma que o modelo é o modelo de IA de ponta mais alinhado até o momento, com taxas mais baixas de adulação, engano e resistência melhorada a ataques de injeção de prompt.

O pesquisador David Hershey explicou que as pontuações dos benchmarks por si só não capturam completamente as capacidades do modelo. Em testes iniciais, ele observou que a IA codificou autonomamente por até 30 horas, durante as quais construiu um aplicativo de produção pronto, provisionou serviços de banco de dados, comprou um nome de domínio e realizou uma auditoria SOC 2 para verificar a segurança e a conformidade.

Adoção Empresarial

Os modelos da Anthropic se tornaram favoritos entre os desenvolvedores e as empresas. A Apple e a Meta relatam usar modelos Claude internamente, e a empresa vendeu acesso à API para empresas como Cursor, Windsurf e Replit para aplicações de codificação impulsionadas por IA.

O CEO da Cursor, Michael Truell, descreveu o Claude Sonnet 4.5 como representando "desempenho de codificação de ponta, especificamente em tarefas de longo prazo". O CEO da Windsurf, Jeff Wang, chamou-o de "nova geração de modelos de codificação".

Paisagem Competitiva

O lançamento ocorre em meio a uma competição intensificada no espaço de IA. O GPT-5 da OpenAI recentemente desafiou a dominância da Anthropic, superando os modelos Claude em vários benchmarks de codificação. O ciclo de desenvolvimento rápido da Anthropic - lançando o Claude Sonnet 4.5 menos de dois meses após o Claude Opus 4.1 - demonstra o esforço da empresa para se manter à frente em um mercado onde os modelos de ponta são introduzidos com frequência.

Novas Ferramentas e SDK

Além do lançamento do modelo, a Anthropic introduziu o SDK do Agente Claude, a mesma infraestrutura que alimenta o Claude Code, permitindo que os desenvolvedores construam agentes personalizados. A empresa também lançou uma prévia de pesquisa temporária chamada "Imagine com Claude" para assinantes do Max, demonstrando geração de software em tempo real sem código pré-escrito.

No geral, o Claude Sonnet 4.5 da Anthropic marca um passo significativo para o desenvolvimento de software impulsionado por IA, combinando desempenho líder de benchmark com capacidades práticas que visam simplificar a criação de aplicativos de produção de ponta.