Anthropic Lança Claude Sonnet 4.5, Afirmando Salto em Capacidades de Agente de IA e Codificação

A Anthropic anunciou seu novo modelo Claude Sonnet 4.5, destacando uma execução autônoma de 30 horas que produziu cerca de 11.000 linhas de código para um aplicativo de chat. A empresa afirma que o modelo é a solução líder para uso real de agentes, codificação e computador, notando um desempenho forte em cibersegurança, serviços financeiros e pesquisa. Testadores iniciais, como a Canva, relataram sucesso com tarefas complexas e de longo contexto.

Lançamento do Modelo de Quebra

A Anthropic introduziu o Claude Sonnet 4.5, descrevendo-o como o modelo mais capaz para uso real de agentes, codificação e computador. Em uma demonstração, o modelo operou autonomamente por 30 horas, gerando um aplicativo de chat comparável ao Slack ou Teams e produzindo cerca de 11.000 linhas de código antes de concluir a tarefa. A empresa contrastou isso com seu modelo Opus 4 anterior, que havia executado por sete horas.

Uso de Computador e Nível de Habilidade Aumentados

Dianne Penn, chefe de gerenciamento de produtos da Anthropic, disse que o novo modelo é mais de três vezes mais habilidoso em navegar navegadores e usar um computador em comparação com a tecnologia da empresa do mês de outubro anterior. Os feedbacks dos clientes de acesso antecipado, descritos como "os GitHubs e Cursors do mundo", impulsionaram um mês intensivo de desenvolvimento focado em melhorar essas capacidades.

Feedback dos Testadores Beta

A Canva, uma testadora beta, relatou que o Claude Sonnet 4.5 ajudou com "tarefas complexas e de longo contexto - desde engenharia em nossa base de código até recursos e pesquisas no produto". As forças do modelo também foram destacadas em setores como cibersegurança, serviços financeiros e pesquisa.

Paisagem Competitiva

O lançamento ocorre enquanto outros líderes de IA, incluindo OpenAI e Google, continuam a lançar atualizações incrementais destinadas a assistentes de consumidor e ferramentas empresariais. A OpenAI recentemente anunciou uma nova funcionalidade do ChatGPT chamada Pulse, projetada para as necessidades de rotina matutina e pesquisa dos usuários.

Melhorias Focadas em Desenvolvedores

A Anthropic emparelhou o lançamento do modelo com uma suíte de ferramentas para desenvolvedores, prometendo acesso a máquinas virtuais, memória, gerenciamento de contexto e suporte a multiagentes. Esses componentes são descritos como os blocos de construção que alimentam o Claude Code, permitindo que os desenvolvedores construam agentes de IA avançados.

Aplicações Práticas

Scott White, líder de produto para Claude.ai, ilustrou a capacidade do modelo de agendar reuniões, analisar dashboards de dados e gerar atualizações de status com base em reuniões individuais. Penn também compartilhou seu próprio caso de uso, empregando o modelo para pesquisas profundas na web, fontes de perfil e geração automática de planilhas de perfis do LinkedIn para fins de contratação.