A IA Claude da Anthropic Encontra 22 Vulnerabilidades no Firefox em Teste de Duas Semanas

A Anthropic parceirou com a Mozilla para executar sua IA Claude Opus 4.6 no código do Firefox por duas semanas. A iniciativa descobriu 22 vulnerabilidades separadas, incluindo 14 classificadas como de alta gravidade. A maioria dos bugs foi corrigida no Firefox 148, enquanto alguns aguardam a próxima versão. A IA se mostrou melhor em identificar falhas do que criar código de exploit, com apenas duas provas de conceito produzidas após gastar $4.000 em créditos de API. Os resultados destacam o poder das ferramentas de IA para revisões de segurança de código aberto, mesmo gerando uma mistura de contribuições úteis e irrelevantes.

Contexto e Parceria

A Anthropic entrou em uma parceria de segurança com a Mozilla para avaliar as capacidades de seu modelo Claude Opus 4.6 em um grande projeto de código aberto bem testado. O foco foi no Firefox porque é um código complexo e um dos navegadores de código aberto mais seguros.

Processo de Teste

Em um período de duas semanas, a equipe da Anthropic direcionou a Claude Opus para examinar primeiro o mecanismo JavaScript do Firefox, e então expandiu a análise para outras partes do código. O modelo de IA foi encarregado de localizar possíveis vulnerabilidades de segurança em vez de desenvolver técnicas de exploração.

Descoberta de Vulnerabilidades

A IA descobriu 22 vulnerabilidades separadas no Firefox. Dessas, 14 foram rotuladas como "de alta gravidade". A maioria dos bugs identificados já foi corrigida no Firefox 148, a versão lançada no início deste ano, enquanto algumas correções estão programadas para o próximo ciclo de lançamento.

Tentativas de Exploit e Custos

Na tentativa de criar provas de conceito de exploits, a equipe alocou $4.000 em créditos de API para a Claude Opus. Apesar do investimento, código de exploit bem-sucedido foi produzido em apenas dois casos, indicando que o modelo se sai bem em encontrar falhas, mas é menos eficaz em gerar automaticamente scripts de exploit.

Implicações para a Segurança de Código Aberto

Os resultados demonstram que as ferramentas de IA, como a Claude, podem ajudar substancialmente a descobrir problemas de segurança em projetos de software complexos. No entanto, o processo também gerou um número substancial de solicitações de mesclagem de baixo valor ao lado das descobertas úteis, sublinhando a necessidade de uma revisão cuidadosa das contribuições geradas pela IA.

Conclusão

Esta colaboração entre a Anthropic e a Mozilla ilustra tanto a promessa quanto os desafios de aplicar a IA geradora à segurança de software. Embora a IA tenha identificado um número notável de vulnerabilidades de alta gravidade e ajudado a acelerar os esforços de correção, seu sucesso limitado em criar exploits e o barulho que acompanha sugerem que a expertise humana permanece essencial no fluxo de trabalho de segurança.