Mistral AI Presenta Modelos de Lenguaje Multilingües de Código Abierto para Dispositivos de Borde

These New AI Models Are Built to Work Anywhere in Many Languages

Puntos clave

  • Mistral AI lanzó Mistral Large 3 y tres modelos más pequeños de Ministral 3.
  • Todos los modelos son de código abierto con pesos públicamente disponibles para la personalización de los desarrolladores.
  • La cartera enfatiza el rendimiento multilingüe al aumentar los datos de entrenamiento no ingleses.
  • Los modelos más pequeños están optimizados para el uso en dispositivos en laptops, smartphones, coches y robots.
  • Mistral AI ofrece un chatbot llamado Le Chat y fue fundada por ex investigadores de Google DeepMind y Meta.
  • El enfoque de código abierto y pesos abiertos tiene como objetivo hacer que la inteligencia artificial de alta gama sea accesible y adaptable para aplicaciones diversas.

La empresa de inteligencia artificial francesa Mistral AI anunció una nueva familia de modelos de lenguaje de código abierto, que incluye el modelo insignia Mistral Large 3 y una serie de variantes más pequeñas de Ministral 3. Diseñados para uso general y despliegue en dispositivos de borde, los modelos admiten una amplia gama de idiomas al enfatizar los datos de entrenamiento no ingleses. El cofundador Guillaume Lample destacó el objetivo de hacer que la inteligencia artificial de alta gama sea accesible, mientras que el enfoque de código abierto permite a los desarrolladores personalizar y ejecutar los modelos en laptops, smartphones, coches o robots sin depender de la conectividad a Internet constante.

Nueva Cartera de Modelos de Código Abierto

El desarrollador francés Mistral AI presentó un conjunto integral de modelos de lenguaje que buscan democratizar la inteligencia artificial avanzada. El centro de atención, Mistral Large 3, es un modelo a gran escala destinado a aplicaciones generales y amplias, comparable a servicios bien conocidos como ChatGPT o Gemini. Complementando al modelo insignia, hay tres modelos más pequeños - denominados Ministral 3 - disponibles en configuraciones de 3 mil millones, 8 mil millones y 14 mil millones de parámetros. Cada tamaño se ofrece en tres variantes: un modelo base que los desarrolladores pueden ajustar, una versión ya ajustada por Mistral para un rendimiento sólido fuera de la caja, y un modelo centrado en razonamiento que dedica tiempo adicional de procesamiento para entregar respuestas de mayor calidad.

Diseño de Código Abierto y Pesos Abiertos

Todos los modelos de la nueva cartera se lanzan bajo una licencia de código abierto con transparencia de pesos abiertos. Esto significa que los pesos subyacentes del modelo están disponibles públicamente, lo que permite a los desarrolladores inspeccionar, modificar y adaptar los modelos a tareas o dominios específicos. El cofundador y científico jefe de Mistral AI, Guillaume Lample, enfatizó que el enfoque de código abierto está destinado a poner la inteligencia artificial directamente en manos de los usuarios, fomentando una mayor accesibilidad y innovación.

Capacidad Multilingüe como Objetivo Principal

La empresa aumentó deliberadamente la proporción de datos de entrenamiento no ingleses para mejorar el rendimiento en muchos idiomas. Lample explicó que muchos modelos de inteligencia artificial líderes priorizan el inglés, lo que puede limitar su eficacia en contextos multilingües. Al asignar más recursos a los datos no ingleses, Mistral AI acepta un intercambio: los modelos pueden obtener una puntuación ligeramente inferior en las pruebas de benchmark centradas en inglés, pero entregan resultados más sólidos en el mundo real para los hablantes de otros idiomas.

Despliegue en Dispositivos de Borde y Beneficios de Privacidad

Más allá de los casos de uso basados en la nube, los modelos más pequeños de Ministral 3 están optimizados para la ejecución en dispositivos. Pueden ejecutarse en laptops, smartphones, sistemas automotrices y plataformas robóticas, lo que proporciona la ventaja del procesamiento local. Esta capacidad de ejecución en dispositivos mejora la privacidad - los datos del usuario no necesitan salir del dispositivo - y reduce la dependencia de la conectividad a Internet constante, lo que es crucial para escenarios en los que el acceso a la red es intermitente o no está disponible.

Ofertas Adicionales y Antecedentes de la Empresa

Mistral AI también opera un servicio de chatbot llamado Le Chat, accesible a través de navegadores web y tiendas de aplicaciones. La empresa fue fundada por investigadores que anteriormente trabajaron en Google DeepMind y Meta, lo que le da una sólida pedigrí técnica. Si bien Mistral AI es menos conocida en Estados Unidos en comparación con rivales como OpenAI y Anthropic, goza de un perfil más alto en Europa.

Implicaciones para el Paisaje de la IA

El lanzamiento de una suite de modelos de código abierto, multilingüe y amigable con dispositivos de borde posiciona a Mistral AI como un desafiante notable en el mercado de inteligencia artificial generativa en rápida evolución. Al ofrecer tanto un modelo masivo de 675 mil millones de parámetros como una serie de alternativas ligeras, la empresa aborda las necesidades de despliegues a gran escala y desarrolladores que buscan integrar la inteligencia artificial directamente en dispositivos de consumo. El énfasis en la apertura y el rendimiento multilingüe puede fomentar una adopción más amplia en regiones e industrias que tradicionalmente han sido subatendidas por soluciones de inteligencia artificial centradas en inglés.

#Inteligencia artificial#Modelos de lenguaje#Código abierto#Mistral AI#Guillaume Lample#Mistral Large 3#Ministral 3#IA de borde#Le Chat#Tecnología europea

También disponible en:

Mistral AI Presenta Modelos de Lenguaje Multilingües de Código Abierto para Dispositivos de Borde | AI News