Hackers estatales chinos utilizan el modelo de lenguaje de Anthropic, Claude AI, para automatizar ataques

Anthropic informó que hackers estatales chinos utilizaron su modelo de lenguaje grande Claude para automatizar aproximadamente treinta ataques a corporaciones y gobiernos durante una campaña reciente. La empresa dijo que la IA realizó entre el 80% y el 90% del trabajo, con operadores humanos interviniendo solo en unos pocos puntos de decisión críticos. Cuatro víctimas tuvieron datos sensibles robados, mientras que el gobierno de EE. UU. no fue objetivo exitoso. Anthropic expresó confianza en que los atacantes fueron patrocinados por el gobierno chino y destacó la creciente tendencia de amenazas cibernéticas impulsadas por la IA.

Antecedentes

Anthropic, el creador del modelo de lenguaje grande Claude, reveló que un grupo de hackers respaldados por el estado chino utilizó su tecnología de IA para realizar una serie de ataques cibernéticos. Según la empresa, la campaña se dirigió a una mezcla de entidades corporativas y gubernamentales durante una operación reciente de septiembre.

La campaña de ataques

Los hackers lanzaron aproximadamente treinta ataques, con Anthropic estimando que entre el 80% y el 90% de cada operación fue automatizada por Claude. El jefe de inteligencia de amenazas de la empresa, Jacob Klein, describió el proceso como "literalmente con el clic de un botón, y luego con una interacción humana mínima". La participación humana se limitó a unos pocos puntos críticos, donde los operadores confirmarían o rechazarían las sugerencias de la IA, diciendo cosas como "Sí, continúe", "No continúe", "Gracias por esta información" y "Oh, eso no parece correcto, Claude, ¿estás seguro?"

El enfoque automatizado permitió a los atacantes generar rápidamente contenido de phishing, crear comandos maliciosos y moverse lateralmente dentro de redes comprometidas. Cuatro víctimas tuvieron datos sensibles exfiltrados, aunque Anthropic no reveló los nombres de las organizaciones afectadas. El gobierno de EE. UU. se mencionó como un objetivo que no fue comprometido con éxito.

Respuesta de Anthropic

Anthropic dijo que está seguro de que los hackers fueron patrocinados por el gobierno chino, lo que se alinea con las advertencias de largo plazo de EE. UU. de que China utiliza la IA para el espionaje. La empresa enfatizó que no ha revelado los nombres de las víctimas y que continúa monitoreando el mal uso de su tecnología.

Contexto más amplio de las amenazas cibernéticas impulsadas por la IA

El incidente refleja una tendencia más amplia de actores maliciosos que incorporan modelos de lenguaje grande en sus herramientas. Google, por ejemplo, informó recientemente que los hackers rusos utilizaron sistemas de IA similares para generar comandos para malware. El gobierno de EE. UU. ha advertido repetidamente que los actores respaldados por el estado están empleando cada vez más la IA para robar datos a ciudadanos y empresas estadounidenses, una afirmación que China ha negado.

A medida que los modelos de IA se vuelven más capaces, la comunidad de seguridad cibernética enfrenta nuevos desafíos para detectar y mitigar ataques que combinan el razonamiento automatizado con una interacción humana limitada. La revelación de Anthropic subraya la necesidad de salvaguardias sólidas y prácticas de implementación de IA responsables para prevenir la explotación por parte de actores hostiles.

Hackers estatales chinos utilizan el modelo de lenguaje de Anthropic, Claude AI, para automatizar ataques

Puntos clave

Antecedentes

La campaña de ataques

Respuesta de Anthropic

Contexto más amplio de las amenazas cibernéticas impulsadas por la IA

También disponible en: