Filtración del código de Claude de Anthropic revela características no lanzadas y plantea preocupaciones de seguridad

Puntos clave
- Anthropic liberó involuntariamente más de 512.000 líneas del código fuente de Claude Code.
- La filtración reveló características no lanzadas, incluyendo una mascota de codificación de estilo Tamagotchi.
- Un agente de fondo llamado KAIROS también se identificó en el código.
- Anthropic confirmó que no se expusieron datos o credenciales de clientes.
- La empresa atribuye el incidente a un error de empaquetado humano.
- Los analistas advierten que la filtración podría ayudar a actores maliciosos a evadir los guardrails de la inteligencia artificial.
- El episodio destaca la necesidad de salvaguardias operativas más fuertes en el desarrollo de la inteligencia artificial.
Un error de empaquetado reciente liberó más de 512.000 líneas del código fuente de Claude Code, exponiendo características no lanzadas como una mascota de codificación de estilo Tamagotchi y un agente de fondo siempre activo llamado KAIROS. Anthropic aclaró que no se comprometió ningún dato de cliente y calificó el incidente como un error humano, mientras que los analistas advirtieron que la filtración podría ayudar a actores maliciosos y destacar la necesidad de salvaguardias operativas más fuertes.
Resumen de la filtración
El asistente de codificación de inteligencia artificial de Anthropic, Claude Code, se envió involuntariamente con un mapa de código interno que reveló su base de código completa de TypeScript. El paquete filtrado contenía más de medio millón de líneas de código, ofreciendo una visión poco común de la arquitectura de la herramienta, las instrucciones internas y las funcionalidades futuras. El código se copió rápidamente a un repositorio público, donde acumuló miles de bifurcaciones.
Características no lanzadas descubiertas
Entre los descubrimientos más llamativos se encontraban una mascota "similar a Tamagotchi" que se sienta junto a la caja de entrada y reacciona a la actividad de codificación de un usuario, y una característica llamada "KAIROS" que permitiría a un agente de fondo siempre activo realizar tareas de forma autónoma. Un comentario de un codificador también salió a la luz, señalando que una implementación de memoización aumentó la complejidad sin beneficios de rendimiento claros.
Respuesta de Anthropic
Anthropic emitió un comunicado enfatizando que la filtración resultó de un error de empaquetado y no de una brecha de seguridad, y que no se expusieron datos o credenciales de clientes sensibles. La empresa dijo que está implementando medidas para prevenir errores similares en el futuro.
Perspectiva de la industria
El analista de inteligencia artificial de Gartner, Arun Chandrasekaran, advirtió que si bien la filtración podría proporcionar a actores maliciosos formas de evadir los guardrails, su impacto más amplio podría limitarse a impulsar a Anthropic a invertir en procesos y herramientas más fuertes para la madurez operativa. El incidente subraya la creciente tensión entre la innovación rápida de la inteligencia artificial y la necesidad de prácticas de seguridad robustas.