A IA Claude da Anthropic Encontra 22 Vulnerabilidades no Firefox em Teste de Duas Semanas

Pontos principais
- A Anthropic parceirou com a Mozilla para testar a Claude Opus 4.6 no Firefox.
- A IA identificou 22 vulnerabilidades, incluindo 14 de alta gravidade.
- A maioria dos bugs foi corrigida no Firefox 148; alguns aguardam a próxima versão.
- O teste se concentrou primeiro no mecanismo JavaScript antes de expandir.
- A Claude se mostrou melhor em encontrar falhas do que criar código de exploit.
- A equipe gastou $4.000 em créditos de API, alcançando apenas duas provas de conceito de exploits.
- As descobertas geradas pela IA vieram com muitas solicitações de mesclagem de baixo valor.
- A iniciativa destaca o potencial e os limites da IA na segurança de código aberto.
A Anthropic parceirou com a Mozilla para executar sua IA Claude Opus 4.6 no código do Firefox por duas semanas. A iniciativa descobriu 22 vulnerabilidades separadas, incluindo 14 classificadas como de alta gravidade. A maioria dos bugs foi corrigida no Firefox 148, enquanto alguns aguardam a próxima versão. A IA se mostrou melhor em identificar falhas do que criar código de exploit, com apenas duas provas de conceito produzidas após gastar $4.000 em créditos de API. Os resultados destacam o poder das ferramentas de IA para revisões de segurança de código aberto, mesmo gerando uma mistura de contribuições úteis e irrelevantes.
Contexto e Parceria
A Anthropic entrou em uma parceria de segurança com a Mozilla para avaliar as capacidades de seu modelo Claude Opus 4.6 em um grande projeto de código aberto bem testado. O foco foi no Firefox porque é um código complexo e um dos navegadores de código aberto mais seguros.
Processo de Teste
Em um período de duas semanas, a equipe da Anthropic direcionou a Claude Opus para examinar primeiro o mecanismo JavaScript do Firefox, e então expandiu a análise para outras partes do código. O modelo de IA foi encarregado de localizar possíveis vulnerabilidades de segurança em vez de desenvolver técnicas de exploração.
Descoberta de Vulnerabilidades
A IA descobriu 22 vulnerabilidades separadas no Firefox. Dessas, 14 foram rotuladas como "de alta gravidade". A maioria dos bugs identificados já foi corrigida no Firefox 148, a versão lançada no início deste ano, enquanto algumas correções estão programadas para o próximo ciclo de lançamento.
Tentativas de Exploit e Custos
Na tentativa de criar provas de conceito de exploits, a equipe alocou $4.000 em créditos de API para a Claude Opus. Apesar do investimento, código de exploit bem-sucedido foi produzido em apenas dois casos, indicando que o modelo se sai bem em encontrar falhas, mas é menos eficaz em gerar automaticamente scripts de exploit.
Implicações para a Segurança de Código Aberto
Os resultados demonstram que as ferramentas de IA, como a Claude, podem ajudar substancialmente a descobrir problemas de segurança em projetos de software complexos. No entanto, o processo também gerou um número substancial de solicitações de mesclagem de baixo valor ao lado das descobertas úteis, sublinhando a necessidade de uma revisão cuidadosa das contribuições geradas pela IA.
Conclusão
Esta colaboração entre a Anthropic e a Mozilla ilustra tanto a promessa quanto os desafios de aplicar a IA geradora à segurança de software. Embora a IA tenha identificado um número notável de vulnerabilidades de alta gravidade e ajudado a acelerar os esforços de correção, seu sucesso limitado em criar exploits e o barulho que acompanha sugerem que a expertise humana permanece essencial no fluxo de trabalho de segurança.