Suíça Lança Apertus, Seu Primeiro Modelo de Linguagem Aberto de Grande Escala

Pontos principais
- A Suíça lança Apertus, um modelo de linguagem de grande escala de código aberto.
- Desenvolvido por EPFL, ETH Zurich e o Centro Nacional de Supercomputação da Suíça.
- Dois tamanhos de modelo lançados: 8 bilhões e 70 bilhões de parâmetros.
- Treinado em 15 trilhões de tokens em mais de 1.000 idiomas.
- Totalmente transparente: código-fonte, dados de treinamento e documentação são públicos.
- Está em conformidade com as leis de proteção de dados e direitos autorais da Suíça.
- Disponível via Swisscom e Hugging Face para pesquisadores e empresas.
- Visa fornecer uma alternativa compatível para setores como o bancário.
- Posiciona a IA como infraestrutura pública essencial na Suíça.
A Suíça lançou Apertus, um modelo de linguagem de grande escala de código aberto desenvolvido pelo Instituto Federal de Tecnologia de Lausanne (EPFL), ETH Zurich e o Centro Nacional de Supercomputação da Suíça. Projetado como uma infraestrutura de IA de interesse público, Apertus é totalmente transparente, com código-fonte, documentação de treinamento e conjuntos de dados disponíveis publicamente. O modelo está em conformidade com as leis de proteção de dados e direitos autorais da Suíça, oferecendo uma alternativa europeia e suíça amigável aos serviços de IA comerciais. Apertus é oferecido em dois tamanhos - 8 bilhões e 70 bilhões de parâmetros - e pode ser acessado por meio da Swisscom ou Hugging Face, convidando pesquisadores, entusiastas e empresas a construir sobre a plataforma.
Colaboração do Setor Público Constrói um Ativo Nacional de IA
A Suíça, por meio de instituições de pesquisa apoiadas pelo governo - EPFL, ETH Zurich e o Centro Nacional de Supercomputação da Suíça - uniram forças para criar Apertus, um modelo de linguagem de grande escala posicionado como uma alternativa de interesse público às ofertas de IA comerciais. A iniciativa destaca uma visão de IA como infraestrutura pública essencial, comparável a rodovias, água ou eletricidade. Ao manter todos os aspectos do desenvolvimento do modelo abertos, os parceiros visam promover a transparência e a confiança, permitindo que qualquer pessoa examine o processo de treinamento, o código-fonte e os conjuntos de dados subjacentes.
Arquitetura do Modelo e Escopo de Treinamento
Apertus é lançado em duas configurações: uma versão de 8 bilhões de parâmetros e uma versão de 70 bilhões de parâmetros. O modelo foi treinado em 15 trilhões de tokens extraídos de mais de 1.000 idiomas, com aproximadamente 40% dos dados representando conteúdo não em inglês, incluindo alemão suíço e romanche. O treinamento dependeu exclusivamente de dados publicamente disponíveis, e o processo de crawl respeitou sinais de opt-out legíveis por máquina em sites. Essa abordagem busca alinhar o modelo com as regulamentações de proteção de dados e direitos autorais da Suíça, fornecendo uma opção compatível para empresas que devem aderir aos padrões europeus.
Acesso Aberto e Usabilidade Ampliada
Todo o ecossistema Apertus - incluindo documentação, código-fonte e conjuntos de dados usados para treinamento - é lançado publicamente. O modelo pode ser acessado via Swisscom, um provedor de TIC suíço, ou por meio da plataforma Hugging Face. Essa postura de acesso aberto convida uma ampla gama de usuários - pesquisadores, entusiastas e empresas - a construir aplicações personalizadas, como chatbots, ferramentas de tradução, auxílios educacionais ou outros serviços impulsionados por IA. Ao oferecer uma alternativa transparente e regulamentada, Apertus visa atrair setores que lidam com dados sensíveis, especialmente o setor bancário, onde a conformidade com regras de privacidade locais rigorosas é fundamental.
Implicações Estratégicas para a Indústria Suíça
Defensores argumentam que um modelo desenvolvido domesticamente pode respeitar melhor as regulamentações rigorosas de proteção de dados e sigilo bancário da Suíça em comparação com serviços de IA de propriedade estrangeira. Embora os bancos suíços já empreguem soluções de IA existentes, a introdução de Apertus fornece uma opção caseira potencial que poderia simplificar a conformidade. A estruturação do modelo como infraestrutura pública também sinaliza uma direção política mais ampla: tratar capacidades de IA avançadas como um recurso nacional que deve ser disponibilizado abertamente e governado de forma responsável.
Perspectiva Futura
Agora que Apertus está ao vivo, a comunidade de IA suíça está pronta para experimentar, adaptar e estender o modelo para vários casos de uso. A natureza aberta do projeto incentiva a melhoria colaborativa e pode servir como um modelo para outras nações que buscam desenvolver capacidades de IA soberanas que equilibrem inovação com conformidade regulatória.