Anthropic Lança Claude Opus 4.5, Aumentando o Desempenho de Codificação e Agente Enquanto Aborda Riscos de Injeção de Prompt

Pontos principais
- A Anthropic lança o Claude Opus 4.5, promovido como o melhor modelo para codificação, agentes e uso de computador.
- Novos recursos melhoram a pesquisa profunda, a criação de slides e o manejo de planilhas.
- O Claude Code e os aplicativos de consumidor ganham integrações com o Excel, Chrome e ambientes de desktop.
- A empresa afirma que o Opus 4.5 é mais difícil de enganar com ataques de injeção de prompt, embora não seja totalmente imune.
- Testes de segurança mostram 100 % de recusa de 150 solicitações de codificação maliciosas, cerca de 78 % de recusa de prompts relacionados a malware e pouco mais de 88 % de recusa de solicitações de uso de computador prejudicial mais amplo.
- O modelo está disponível por meio dos aplicativos da Anthropic, sua API e todos os três principais provedores de nuvem.
A Anthropic introduziu o Claude Opus 4.5, apresentado como o modelo mais capaz para codificação, agentes de IA e tarefas de uso de computador. A nova versão traz habilidades de pesquisa mais fortes, manipulação de planilhas e slides aprimorada e novos recursos no Claude Code e em aplicativos de consumidor que se integram com o Excel, Chrome e ambientes de desktop. Embora a empresa afirme que o Opus 4.5 é mais difícil de enganar com ataques de injeção de prompt, testes de segurança mostram que ele ainda yield a alguns pedidos maliciosos.
Lançamento do Novo Modelo da Anthropic
A Anthropic anunciou a disponibilidade do Claude Opus 4.5, posicionando-o como o principal modelo de linguagem grande para codificação, agentes de IA e cenários de uso de computador em geral. De acordo com o blog da empresa, o modelo supera seu antecessor em pesquisa profunda, criação de slides e preenchimento de planilhas, e é comercializado como o "melhor modelo do mundo para codificação, agentes e uso de computador".
Capacidades Aprimoradas e Novas Ferramentas
O lançamento inclui atualizações para o Claude Code, a interface de codificação dedicada da Anthropic, bem como melhorias nos aplicativos de consumidor da Claude. Essas atualizações permitem agentes com execução mais longa e introduzem novas maneiras de empregar a Claude dentro do Excel, Chrome e ambientes de desktop, expandindo a utilidade do modelo além das interações de bate-papo tradicionais.
Foco em Segurança e Mitigação de Injeção de Prompt
A Anthropic reconhece as persistentes preocupações de segurança em torno de ferramentas de IA agente, particularmente casos de uso malicioso e ataques de injeção de prompt. A injeção de prompt envolve incorporar instruções prejudiciais em fontes de dados que o modelo lê, potencialmente coagindo-o a contornar salvaguardas. A empresa afirma que o Opus 4.5 é "mais difícil de enganar com injeção de prompt do que qualquer outro modelo de fronteira da indústria", embora admita que o modelo não é completamente imune.
Resultados da Avaliação de Segurança
No cartão do sistema, a Anthropic detalha novas avaliações internas e externas que visam usos maliciosos e cenários de injeção de prompt em codificação, uso de computador e contextos de navegador. Durante uma avaliação de codificação agente que apresentou 150 solicitações de codificação proibidas, o Opus 4.5 recusou 100 % das tentativas. No entanto, o desempenho do modelo variou em outros testes de segurança. Quando solicitado a produzir malware, código para ataques DDoS destrutivos ou software de monitoramento não consensual, ele recusou cerca de 78 % das solicitações. Para usos mais amplos de computador, como vigilância, coleta de dados ou geração de conteúdo prejudicial, o modelo recusou pouco mais de 88 % das solicitações.
Disponibilidade e Distribuição
O Claude Opus 4.5 está disponível imediatamente por meio dos próprios aplicativos da Anthropic, sua API e os três principais provedores de nuvem. Essa ampla acessibilidade visa encorajar a adoção em uma variedade de fluxos de trabalho de empresa e desenvolvedor, enquanto fornece as melhorias de segurança destacadas no lançamento.