Anthropic presenta Claude Mythos Preview para detectar automáticamente fallos de seguridad para socios seleccionados

Anthropic ha lanzado Claude Mythos Preview, un nuevo modelo de inteligencia artificial bajo la iniciativa Project Glasswing, para un puñado de socios de seguridad defensiva. El modelo, que la empresa afirma puede identificar vulnerabilidades de alta gravedad en los principales sistemas operativos y navegadores sin supervisión humana, estará disponible inicialmente solo para empresas como JPMorgan Chase, Cisco y la Linux Foundation.

Anthropic anunció el debut de Claude Mythos Preview, un modelo de inteligencia artificial de propósito general diseñado para buscar vulnerabilidades de software con poca o ninguna supervisión humana. Bajo la iniciativa Project Glasswing, la oferta está limitada a una lista curada de colaboradores de "seguridad defensiva", que incluye a JPMorgan Chase, Broadcom, Cisco, CrowdStrike, la Linux Foundation, Palo Alto Networks y unas 40 organizaciones más que construyen o mantienen infraestructura de software crítica.

La empresa afirma que las habilidades de codificación y razonamiento agente fuerte de Mythos Preview permiten identificar "miles de vulnerabilidades de alta gravedad, incluyendo algunas en cada sistema operativo y navegador web importante". En pruebas internas, el modelo identificó supuestamente fallos y generó exploits relacionados de forma autónoma, sin orientación humana. Newton Cheng, líder cibernético de Anthropic para el equipo rojo de frontera, le dijo a The Verge que la herramienta está destinada a dar a los defensores una "ventaja" contra posibles atacantes.

El acceso al modelo sigue siendo estrictamente controlado. El blog de Anthropic señala que limitar la disponibilidad ayuda a evitar que los adversarios utilicen la misma tecnología para localizar puntos débiles para ataques. Como resultado, la empresa no planea una versión pública de Mythos Preview en este momento.

Para fomentar la adopción, Anthropic subsidiará el uso para sus socios de Glasswing. La empresa se comprometió a proporcionar hasta $100 millones en créditos de uso y una donación directa de $4 millones, dividida entre la Linux Foundation y la Apache Software Foundation. Estas contribuciones tienen como objetivo compensar el costo de ejecutar el modelo mientras la empresa evalúa su viabilidad comercial a largo plazo.

El movimiento de Anthropic se produce en un momento de mayor escrutinio del papel de las empresas de inteligencia artificial en la ciberseguridad. La empresa, que recientemente enfrentó un conflicto público con la administración Trump, dijo que mantiene "discusiones en curso con funcionarios del gobierno de EE. UU." sobre las capacidades del modelo. Dianne Penn, jefa de gestión de productos, confirmó que funcionarios seniors del gobierno de EE. UU. han sido informados sobre Mythos Preview, aunque se negó a nombrar agencias específicas.

Project Glasswing también reúne a gigantes tecnológicos como Nvidia, Google, Amazon Web Services, Apple y Microsoft, aunque la naturaleza exacta de su participación no se detalló. La asociación subraya un impulso más amplio de la industria para integrar la inteligencia artificial en las operaciones de seguridad, una tendencia que podría cambiar la forma en que las empresas y los gobiernos abordan el riesgo de software.

Si bien Anthropic promociona la detección autónoma de vulnerabilidades del modelo, los críticos advierten que confiar solo en la inteligencia artificial puede introducir nuevos desafíos. La entrevista de The Verge con Cheng evitó revelar métricas de éxito concretas más allá de los ejemplos de la empresa, lo que deja pendiente la validación externa.

Por ahora, Mythos Preview sigue siendo una herramienta privada destinada a fortalecer las defensas de socios seleccionados. Su rendimiento, estructura de costos y posible evolución en un servicio pago más amplio probablemente serán observados de cerca por la comunidad de ciberseguridad y los reguladores interesados en la intersección de la inteligencia artificial y la seguridad nacional.

Anthropic presenta Claude Mythos Preview para detectar automáticamente fallos de seguridad para socios seleccionados

Puntos clave

También disponible en: