Filtración del código de Claude de Anthropic revela características no lanzadas y plantea preocupaciones de seguridad

Un error de empaquetado reciente liberó más de 512.000 líneas del código fuente de Claude Code, exponiendo características no lanzadas como una mascota de codificación de estilo Tamagotchi y un agente de fondo siempre activo llamado KAIROS. Anthropic aclaró que no se comprometió ningún dato de cliente y calificó el incidente como un error humano, mientras que los analistas advirtieron que la filtración podría ayudar a actores maliciosos y destacar la necesidad de salvaguardias operativas más fuertes.

Resumen de la filtración

El asistente de codificación de inteligencia artificial de Anthropic, Claude Code, se envió involuntariamente con un mapa de código interno que reveló su base de código completa de TypeScript. El paquete filtrado contenía más de medio millón de líneas de código, ofreciendo una visión poco común de la arquitectura de la herramienta, las instrucciones internas y las funcionalidades futuras. El código se copió rápidamente a un repositorio público, donde acumuló miles de bifurcaciones.

Características no lanzadas descubiertas

Entre los descubrimientos más llamativos se encontraban una mascota "similar a Tamagotchi" que se sienta junto a la caja de entrada y reacciona a la actividad de codificación de un usuario, y una característica llamada "KAIROS" que permitiría a un agente de fondo siempre activo realizar tareas de forma autónoma. Un comentario de un codificador también salió a la luz, señalando que una implementación de memoización aumentó la complejidad sin beneficios de rendimiento claros.

Respuesta de Anthropic

Anthropic emitió un comunicado enfatizando que la filtración resultó de un error de empaquetado y no de una brecha de seguridad, y que no se expusieron datos o credenciales de clientes sensibles. La empresa dijo que está implementando medidas para prevenir errores similares en el futuro.

Perspectiva de la industria

El analista de inteligencia artificial de Gartner, Arun Chandrasekaran, advirtió que si bien la filtración podría proporcionar a actores maliciosos formas de evadir los guardrails, su impacto más amplio podría limitarse a impulsar a Anthropic a invertir en procesos y herramientas más fuertes para la madurez operativa. El incidente subraya la creciente tensión entre la innovación rápida de la inteligencia artificial y la necesidad de prácticas de seguridad robustas.

Filtración del código de Claude de Anthropic revela características no lanzadas y plantea preocupaciones de seguridad

Puntos clave

Resumen de la filtración

Características no lanzadas descubiertas

Respuesta de Anthropic

Perspectiva de la industria

También disponible en: