Suiza presenta Apertus, su primer modelo de lenguaje grande de código abierto a nivel nacional

Suiza ha lanzado Apertus, un modelo de lenguaje grande de código abierto desarrollado por el Instituto Federal de Tecnología Suizo de Lausana (EPFL), ETH Zurich y el Centro Nacional de Supercomputación Suizo. Diseñado como una infraestructura de inteligencia artificial de interés público, Apertus es completamente transparente, con código fuente, documentación de entrenamiento y conjuntos de datos disponibles de forma abierta.

Colaboración en el sector público construye un activo de inteligencia artificial nacional

Las instituciones de investigación respaldadas por el gobierno suizo - EPFL, ETH Zurich y el Centro Nacional de Supercomputación Suizo - se han unido para crear Apertus, un modelo de lenguaje grande posicionado como una alternativa de interés público a las ofertas de inteligencia artificial comerciales. El esfuerzo subraya una visión de la inteligencia artificial como infraestructura pública esencial, comparable a carreteras, agua o electricidad. Al mantener abierto todos los aspectos del desarrollo del modelo, los socios buscan fomentar la transparencia y la confianza, permitiendo que cualquier persona examine el proceso de entrenamiento, el código fuente y los conjuntos de datos subyacentes.

Arquitectura del modelo y alcance del entrenamiento

Apertus se lanza en dos configuraciones: una versión de 8 mil millones de parámetros y una versión de 70 mil millones de parámetros. El modelo se entrenó en 15 billones de tokens extraídos de más de 1.000 idiomas, con aproximadamente el 40 por ciento de los datos que representan contenido no en inglés, incluyendo alemán suizo y romanche. El entrenamiento se basó únicamente en datos públicamente disponibles, y el proceso de crawl respetó las señales de exclusión legibles por máquina en los sitios web. Este enfoque busca alinear el modelo con las regulaciones suizas de protección de datos y derechos de autor, brindando una opción compatible para las empresas que deben adherirse a los estándares europeos.

Acceso abierto y usabilidad amplia

Todo el ecosistema Apertus, incluyendo la documentación, el código fuente y los conjuntos de datos utilizados para el entrenamiento, se libera públicamente. El modelo puede accederse a través de Swisscom, un proveedor de TIC suizo, o a través de la plataforma Hugging Face. Esta postura de acceso abierto invita a una amplia gama de usuarios - investigadores, aficionados y empresas - a crear aplicaciones personalizadas como chatbots, herramientas de traducción, ayudas educativas o otros servicios impulsados por inteligencia artificial. Al ofrecer una alternativa transparente y regulada, Apertus busca atraer a sectores que manejan datos sensibles, especialmente la banca, donde la cumplimiento de las estrictas reglas de privacidad locales es fundamental.

Implicaciones estratégicas para la industria suiza

Los defensores argumentan que un modelo desarrollado en el país puede respetar mejor las estrictas regulaciones suizas de protección de datos y secreto bancario en comparación con los servicios de inteligencia artificial de propiedad extranjera. Si bien los bancos suizos ya emplean soluciones de inteligencia artificial existentes, la introducción de Apertus proporciona una opción nacional potencial que podría simplificar el cumplimiento. La estructura de infraestructura pública del modelo también señala una dirección de política más amplia: tratar las capacidades de inteligencia artificial avanzadas como un recurso nacional que debe estar disponible de forma abierta y gobernado de manera responsable.

Perspectiva futura

Con Apertus ahora en vivo, la comunidad de inteligencia artificial suiza está preparada para experimentar, adaptar y ampliar el modelo para diversos casos de uso. La naturaleza abierta del proyecto fomenta la mejora colaborativa y puede servir como un modelo para que otras naciones desarrollen capacidades de inteligencia artificial soberanas que equilibren la innovación con el cumplimiento normativo.