Suíça Lança Apertus, Seu Primeiro Modelo de Linguagem Aberto de Grande Escala

Switzerland launches its own open-source AI model

Pontos principais

  • A Suíça lança Apertus, um modelo de linguagem de grande escala de código aberto.
  • Desenvolvido por EPFL, ETH Zurich e o Centro Nacional de Supercomputação da Suíça.
  • Dois tamanhos de modelo lançados: 8 bilhões e 70 bilhões de parâmetros.
  • Treinado em 15 trilhões de tokens em mais de 1.000 idiomas.
  • Totalmente transparente: código-fonte, dados de treinamento e documentação são públicos.
  • Está em conformidade com as leis de proteção de dados e direitos autorais da Suíça.
  • Disponível via Swisscom e Hugging Face para pesquisadores e empresas.
  • Visa fornecer uma alternativa compatível para setores como o bancário.
  • Posiciona a IA como infraestrutura pública essencial na Suíça.

A Suíça lançou Apertus, um modelo de linguagem de grande escala de código aberto desenvolvido pelo Instituto Federal de Tecnologia de Lausanne (EPFL), ETH Zurich e o Centro Nacional de Supercomputação da Suíça. Projetado como uma infraestrutura de IA de interesse público, Apertus é totalmente transparente, com código-fonte, documentação de treinamento e conjuntos de dados disponíveis publicamente. O modelo está em conformidade com as leis de proteção de dados e direitos autorais da Suíça, oferecendo uma alternativa europeia e suíça amigável aos serviços de IA comerciais. Apertus é oferecido em dois tamanhos - 8 bilhões e 70 bilhões de parâmetros - e pode ser acessado por meio da Swisscom ou Hugging Face, convidando pesquisadores, entusiastas e empresas a construir sobre a plataforma.

Colaboração do Setor Público Constrói um Ativo Nacional de IA

A Suíça, por meio de instituições de pesquisa apoiadas pelo governo - EPFL, ETH Zurich e o Centro Nacional de Supercomputação da Suíça - uniram forças para criar Apertus, um modelo de linguagem de grande escala posicionado como uma alternativa de interesse público às ofertas de IA comerciais. A iniciativa destaca uma visão de IA como infraestrutura pública essencial, comparável a rodovias, água ou eletricidade. Ao manter todos os aspectos do desenvolvimento do modelo abertos, os parceiros visam promover a transparência e a confiança, permitindo que qualquer pessoa examine o processo de treinamento, o código-fonte e os conjuntos de dados subjacentes.

Arquitetura do Modelo e Escopo de Treinamento

Apertus é lançado em duas configurações: uma versão de 8 bilhões de parâmetros e uma versão de 70 bilhões de parâmetros. O modelo foi treinado em 15 trilhões de tokens extraídos de mais de 1.000 idiomas, com aproximadamente 40% dos dados representando conteúdo não em inglês, incluindo alemão suíço e romanche. O treinamento dependeu exclusivamente de dados publicamente disponíveis, e o processo de crawl respeitou sinais de opt-out legíveis por máquina em sites. Essa abordagem busca alinhar o modelo com as regulamentações de proteção de dados e direitos autorais da Suíça, fornecendo uma opção compatível para empresas que devem aderir aos padrões europeus.

Acesso Aberto e Usabilidade Ampliada

Todo o ecossistema Apertus - incluindo documentação, código-fonte e conjuntos de dados usados para treinamento - é lançado publicamente. O modelo pode ser acessado via Swisscom, um provedor de TIC suíço, ou por meio da plataforma Hugging Face. Essa postura de acesso aberto convida uma ampla gama de usuários - pesquisadores, entusiastas e empresas - a construir aplicações personalizadas, como chatbots, ferramentas de tradução, auxílios educacionais ou outros serviços impulsionados por IA. Ao oferecer uma alternativa transparente e regulamentada, Apertus visa atrair setores que lidam com dados sensíveis, especialmente o setor bancário, onde a conformidade com regras de privacidade locais rigorosas é fundamental.

Implicações Estratégicas para a Indústria Suíça

Defensores argumentam que um modelo desenvolvido domesticamente pode respeitar melhor as regulamentações rigorosas de proteção de dados e sigilo bancário da Suíça em comparação com serviços de IA de propriedade estrangeira. Embora os bancos suíços já empreguem soluções de IA existentes, a introdução de Apertus fornece uma opção caseira potencial que poderia simplificar a conformidade. A estruturação do modelo como infraestrutura pública também sinaliza uma direção política mais ampla: tratar capacidades de IA avançadas como um recurso nacional que deve ser disponibilizado abertamente e governado de forma responsável.

Perspectiva Futura

Agora que Apertus está ao vivo, a comunidade de IA suíça está pronta para experimentar, adaptar e estender o modelo para vários casos de uso. A natureza aberta do projeto incentiva a melhoria colaborativa e pode servir como um modelo para outras nações que buscam desenvolver capacidades de IA soberanas que equilibrem inovação com conformidade regulatória.

#Suíça#Apertus#IA de código aberto#modelo de linguagem de grande escala#EPFL#ETH Zurich#Centro Nacional de Supercomputação da Suíça#infraestrutura de IA pública#proteção de dados#conformidade de IA#sigilo bancário#Swisscom#Hugging Face

Também disponível em:

Suíça Lança Apertus, Seu Primeiro Modelo de Linguagem Aberto de Grande Escala | AI News