DeepSeek lanza modelos de IA de código abierto que rivalizan con los sistemas líderes de EE. UU.

La startup china DeepSeek ha lanzado dos nuevos modelos de IA, DeepSeek-V3.2 y DeepSeek-V3.2-Speciale, bajo una licencia de código abierto. Los modelos afirman tener un rendimiento comparable al de GPT-5 y Gemini 3 Pro en razonamiento de largo formulario, uso de herramientas y resolución de problemas densos, mientras ofrecen una ventana de contexto de 128,000 tokens y reducen el costo computacional a través de la atención dispersa.

Modelos de código abierto apuntan a un rendimiento de vanguardia

DeepSeek, una startup de IA china, anunció el lanzamiento de dos grandes modelos de lenguaje: DeepSeek-V3.2 y una variante de alto rendimiento llamada DeepSeek-V3.2-Speciale. Ambos modelos se distribuyen bajo una licencia de código abierto de estilo MIT, lo que permite a cualquier persona descargar, modificar y comercializar los pesos. Según DeepSeek, los modelos igualan o superan las capacidades de GPT-5 y Gemini 3 Pro en tareas que requieren razonamiento de largo formulario, uso de herramientas y resolución de problemas densos, como competencias internacionales de matemáticas y codificación.

Las innovaciones técnicas clave incluyen un mecanismo de atención dispersa que reduce el costo de procesamiento de documentos largos al centrarse en las partes de entrada más relevantes, lo que reduce los gastos para contextos de 128,000 tokens en un 70 %. Los modelos también retienen la memoria a través de las interacciones de herramientas, lo que permite flujos de trabajo multi-paso más fluidos que involucran navegadores web, entornos de codificación y otras utilidades.

Benchmark de rendimiento y utilidad en el mundo real

DeepSeek-V3.2-Speciale logró una puntuación del 99,2 % en el Torneo de Matemáticas de Harvard-MIT, un 73 % en tareas de depuración de software y resultados de medalla de oro en varios benchmarks internacionales sin acceso a Internet externo. Los modelos se entrenaron en más de 85,000 instrucciones sintéticas complejas para mejorar las capacidades de uso de herramientas, lo que los posiciona para aplicaciones en el mundo real como la planificación de vacaciones de varios días, restricciones de presupuesto y verificación de código.

Consecuencias geopolíticas y regulatorias

El lanzamiento de código abierto ha llamado la atención de los reguladores y los formuladores de políticas. Las autoridades alemanas han intentado bloquear a DeepSeek por preocupaciones sobre la transferencia de datos, Italia previamente prohibió la aplicación y los legisladores estadounidenses han pedido su eliminación de los dispositivos gubernamentales. Estas acciones reflejan tensiones más amplias que rodean a las empresas de IA chinas y las implicaciones estratégicas de modelos de alto rendimiento ampliamente accesibles.

Impacto en el paisaje de la IA

Al ofrecer un rendimiento de vanguardia a una fracción del costo asociado con modelos propietarios que dependen de API de pago y pruebas de equipo rojo extensas, DeepSeek desafía la estructura de mercado actual dominada por empresas estadounidenses. El movimiento subraya un cambio desde el acceso exclusivo y cerrado hacia una democratización más amplia de las capacidades de IA avanzadas, al mismo tiempo que resalta los compromisos entre la apertura, la seguridad y el riesgo geopolítico.

DeepSeek lanza modelos de IA de código abierto que rivalizan con los sistemas líderes de EE. UU.

Puntos clave

Modelos de código abierto apuntan a un rendimiento de vanguardia

Benchmark de rendimiento y utilidad en el mundo real

Consecuencias geopolíticas y regulatorias

Impacto en el paisaje de la IA

También disponible en: