DeepSeek lanza modelos de IA de código abierto que rivalizan con los sistemas líderes de EE. UU.

DeepSeek just gave away an AI model that rivals GPT-5 – and it could change everything

Puntos clave

  • DeepSeek lanza dos modelos de IA de código abierto, DeepSeek-V3.2 y DeepSeek-V3.2-Speciale.
  • Los modelos afirman tener un rendimiento comparable al de GPT-5 y Gemini 3 Pro en razonamiento complejo y uso de herramientas.
  • La atención dispersa reduce el costo computacional para contextos de 128,000 tokens en un 70 %.
  • La variante Speciale obtiene una puntuación del 99,2 % en un torneo de matemáticas importante y encabeza varios benchmarks de codificación.
  • La licencia de código abierto MIT permite la descarga, modificación y uso comercial gratuitos.
  • Los reguladores europeos y los legisladores estadounidenses han expresado preocupaciones sobre la seguridad y la privacidad de los datos.
  • El lanzamiento podría cambiar el acceso a la IA al reducir las barreras de costo y desafiar el dominio del mercado estadounidense.

La startup china DeepSeek ha lanzado dos nuevos modelos de IA, DeepSeek-V3.2 y DeepSeek-V3.2-Speciale, bajo una licencia de código abierto. Los modelos afirman tener un rendimiento comparable al de GPT-5 y Gemini 3 Pro en razonamiento de largo formulario, uso de herramientas y resolución de problemas densos, mientras ofrecen una ventana de contexto de 128,000 tokens y reducen el costo computacional a través de la atención dispersa.

Modelos de código abierto apuntan a un rendimiento de vanguardia

DeepSeek, una startup de IA china, anunció el lanzamiento de dos grandes modelos de lenguaje: DeepSeek-V3.2 y una variante de alto rendimiento llamada DeepSeek-V3.2-Speciale. Ambos modelos se distribuyen bajo una licencia de código abierto de estilo MIT, lo que permite a cualquier persona descargar, modificar y comercializar los pesos. Según DeepSeek, los modelos igualan o superan las capacidades de GPT-5 y Gemini 3 Pro en tareas que requieren razonamiento de largo formulario, uso de herramientas y resolución de problemas densos, como competencias internacionales de matemáticas y codificación.

Las innovaciones técnicas clave incluyen un mecanismo de atención dispersa que reduce el costo de procesamiento de documentos largos al centrarse en las partes de entrada más relevantes, lo que reduce los gastos para contextos de 128,000 tokens en un 70 %. Los modelos también retienen la memoria a través de las interacciones de herramientas, lo que permite flujos de trabajo multi-paso más fluidos que involucran navegadores web, entornos de codificación y otras utilidades.

Benchmark de rendimiento y utilidad en el mundo real

DeepSeek-V3.2-Speciale logró una puntuación del 99,2 % en el Torneo de Matemáticas de Harvard-MIT, un 73 % en tareas de depuración de software y resultados de medalla de oro en varios benchmarks internacionales sin acceso a Internet externo. Los modelos se entrenaron en más de 85,000 instrucciones sintéticas complejas para mejorar las capacidades de uso de herramientas, lo que los posiciona para aplicaciones en el mundo real como la planificación de vacaciones de varios días, restricciones de presupuesto y verificación de código.

Consecuencias geopolíticas y regulatorias

El lanzamiento de código abierto ha llamado la atención de los reguladores y los formuladores de políticas. Las autoridades alemanas han intentado bloquear a DeepSeek por preocupaciones sobre la transferencia de datos, Italia previamente prohibió la aplicación y los legisladores estadounidenses han pedido su eliminación de los dispositivos gubernamentales. Estas acciones reflejan tensiones más amplias que rodean a las empresas de IA chinas y las implicaciones estratégicas de modelos de alto rendimiento ampliamente accesibles.

Impacto en el paisaje de la IA

Al ofrecer un rendimiento de vanguardia a una fracción del costo asociado con modelos propietarios que dependen de API de pago y pruebas de equipo rojo extensas, DeepSeek desafía la estructura de mercado actual dominada por empresas estadounidenses. El movimiento subraya un cambio desde el acceso exclusivo y cerrado hacia una democratización más amplia de las capacidades de IA avanzadas, al mismo tiempo que resalta los compromisos entre la apertura, la seguridad y el riesgo geopolítico.

#DeepSeek#Inteligencia Artificial#IA de código abierto#GPT-5#Gemini 3 Pro#Atención dispersa#Uso de herramientas#Competencia de IA#China#Dominio tecnológico de EE. UU.#Regulación de la IA

También disponible en: