Anthropic Lanza Claude Opus 4.5, Mejorando la Codificación y el Rendimiento de los Agentes Mientras Aborda los Riesgos de Inyección de Prompt

Anthropic ha presentado Claude Opus 4.5, que se promociona como el modelo más capaz para la codificación, los agentes de IA y las tareas de uso de computadora. La nueva versión ofrece capacidades de investigación más fuertes, mejora el manejo de hojas de cálculo y diapositivas, y presenta nuevas características en Claude Code y aplicaciones de consumo que se integran con Excel, Chrome y entornos de escritorio.

El Último Lanzamiento de Modelo de Anthropic

Anthropic anunció la disponibilidad de Claude Opus 4.5, posicionándolo como el modelo de lenguaje grande premier para la codificación, los agentes de IA y los escenarios de uso de computadora en general. Según el blog de la empresa, el modelo supera a su predecesor en investigación profunda, creación de diapositivas y completado de hojas de cálculo, y se comercializa como el "mejor modelo del mundo para la codificación, los agentes y el uso de computadora".

Capacidades Mejoradas y Nuevas Herramientas

La implementación incluye actualizaciones a Claude Code, la interfaz de codificación dedicada de Anthropic, así como mejoras a sus aplicaciones de consumo de Claude. Estas actualizaciones permiten agentes de ejecución más larga e introducen nuevas formas de emplear Claude dentro de Excel, Chrome y entornos de escritorio, expandiendo la utilidad del modelo más allá de las interacciones de chat tradicionales.

Seguridad y Mitigación de la Inyección de Prompt

Anthropic reconoce las persistentes preocupaciones de seguridad que rodean las herramientas de IA agente, particularmente los casos de uso maliciosos y los ataques de inyección de prompt. La inyección de prompt implica incrustar instrucciones dañinas en fuentes de datos que el modelo lee, lo que podría coaccionarlo para que evite salvaguardias. La empresa afirma que Opus 4.5 es "más difícil de engañar con la inyección de prompt que cualquier otro modelo fronterizo de la industria", aunque admite que el modelo no es completamente inmune.

Resultados de la Evaluación de Seguridad

En su tarjeta del sistema, Anthropic detalla nuevas evaluaciones internas y externas que apuntan a usos maliciosos y escenarios de inyección de prompt en contextos de codificación, uso de computadora y navegador. Durante una evaluación de codificación agente que presentó 150 solicitudes de codificación prohibidas, Opus 4.5 rechazó el 100 % de los intentos. Sin embargo, el rendimiento del modelo varió en otras pruebas de seguridad. Cuando se le pidió que produjera malware, código para ataques de denegación de servicio distribuidos (DDoS) o software de monitoreo no consensuado, rechazó aproximadamente el 78 % de las solicitudes. Para un uso más amplio de la computadora, como la vigilancia, la recopilación de datos o la generación de contenido dañino, el modelo rechazó un poco más del 88 % de las solicitudes.

Disponibilidad y Distribución

Claude Opus 4.5 está disponible de inmediato a través de las propias aplicaciones de Anthropic, su API y los tres principales proveedores de servicios en la nube. Esta amplia accesibilidad tiene como objetivo fomentar la adopción en una amplia gama de flujos de trabajo empresariales y de desarrolladores, al mismo tiempo que proporciona las mejoras de seguridad destacadas en el lanzamiento.