Anthropic Lança Claude Sonnet 4.5, Afirmando Salto em Capacidades de Agente de IA e Codificação

Anthropic releases Claude Sonnet 4.5 in latest bid for AI agents and coding supremacy

Pontos principais

  • O Claude Sonnet 4.5 executou autonomamente por 30 horas, produzindo cerca de 11.000 linhas de código para um aplicativo de chat semelhante ao Slack.
  • A Anthropic afirma que o modelo lidera o mercado em agentes de uso real, codificação e uso de computador.
  • A testadora beta Canva elogiou a capacidade do modelo de lidar com tarefas complexas e de longo contexto em engenharia e pesquisa.
  • O modelo é considerado especialmente forte em aplicações de cibersegurança, serviços financeiros e pesquisa.
  • A Anthropic introduziu ferramentas para desenvolvedores - máquinas virtuais, memória, gerenciamento de contexto e suporte a multiagentes - para ajudar na criação de agentes de IA personalizados.
  • A funcionalidade recente Pulse da OpenAI destaca a pressão competitiva para assistentes de IA focados no consumidor.
  • Líderes de produtos destacaram capacidades como agendamento de reuniões, análise de dashboards e geração automática de atualizações de status.
  • Os testes internos da Anthropic mostraram uma melhoria de três vezes na navegação de navegador e uso de computador em comparação com a tecnologia anterior.

A Anthropic anunciou seu novo modelo Claude Sonnet 4.5, destacando uma execução autônoma de 30 horas que produziu cerca de 11.000 linhas de código para um aplicativo de chat. A empresa afirma que o modelo é a solução líder para uso real de agentes, codificação e computador, notando um desempenho forte em cibersegurança, serviços financeiros e pesquisa. Testadores iniciais, como a Canva, relataram sucesso com tarefas complexas e de longo contexto.

Lançamento do Modelo de Quebra

A Anthropic introduziu o Claude Sonnet 4.5, descrevendo-o como o modelo mais capaz para uso real de agentes, codificação e computador. Em uma demonstração, o modelo operou autonomamente por 30 horas, gerando um aplicativo de chat comparável ao Slack ou Teams e produzindo cerca de 11.000 linhas de código antes de concluir a tarefa. A empresa contrastou isso com seu modelo Opus 4 anterior, que havia executado por sete horas.

Uso de Computador e Nível de Habilidade Aumentados

Dianne Penn, chefe de gerenciamento de produtos da Anthropic, disse que o novo modelo é mais de três vezes mais habilidoso em navegar navegadores e usar um computador em comparação com a tecnologia da empresa do mês de outubro anterior. Os feedbacks dos clientes de acesso antecipado, descritos como "os GitHubs e Cursors do mundo", impulsionaram um mês intensivo de desenvolvimento focado em melhorar essas capacidades.

Feedback dos Testadores Beta

A Canva, uma testadora beta, relatou que o Claude Sonnet 4.5 ajudou com "tarefas complexas e de longo contexto - desde engenharia em nossa base de código até recursos e pesquisas no produto". As forças do modelo também foram destacadas em setores como cibersegurança, serviços financeiros e pesquisa.

Paisagem Competitiva

O lançamento ocorre enquanto outros líderes de IA, incluindo OpenAI e Google, continuam a lançar atualizações incrementais destinadas a assistentes de consumidor e ferramentas empresariais. A OpenAI recentemente anunciou uma nova funcionalidade do ChatGPT chamada Pulse, projetada para as necessidades de rotina matutina e pesquisa dos usuários.

Melhorias Focadas em Desenvolvedores

A Anthropic emparelhou o lançamento do modelo com uma suíte de ferramentas para desenvolvedores, prometendo acesso a máquinas virtuais, memória, gerenciamento de contexto e suporte a multiagentes. Esses componentes são descritos como os blocos de construção que alimentam o Claude Code, permitindo que os desenvolvedores construam agentes de IA avançados.

Aplicações Práticas

Scott White, líder de produto para Claude.ai, ilustrou a capacidade do modelo de agendar reuniões, analisar dashboards de dados e gerar atualizações de status com base em reuniões individuais. Penn também compartilhou seu próprio caso de uso, empregando o modelo para pesquisas profundas na web, fontes de perfil e geração automática de planilhas de perfis do LinkedIn para fins de contratação.

#Anthropic#Claude Sonnet 4.5#Agentes de IA#Codificação de IA#Canva#OpenAI#Pulse#Uso de Computador#Ferramentas de Desenvolvimento de IA#Cibersegurança#Serviços Financeiros#Pesquisa

Também disponível em:

Anthropic Lança Claude Sonnet 4.5, Afirmando Salto em Capacidades de Agente de IA e Codificação | AI News