Suíça Lança Modelo de IA de Código Aberto Apertus

Pontos principais
- A Suíça lançou um modelo de IA de código aberto chamado Apertus.
- O Apertus é posicionado como uma alternativa ao ChatGPT e ao Claude.
- O código, dados, pesos e detalhes de desenvolvimento do modelo estão disponíveis na HuggingFace.
- O treinamento abrangeu mais de 1.800 idiomas.
- Dois tamanhos são oferecidos: 8 bilhões e 70 bilhões de parâmetros.
- O desempenho é dito ser comparável ao modelo Llama 3 da Meta.
- Os dados de treinamento foram limitados a fontes públicas que permitiam a coleta de dados.
- O projeto está em conformidade com a lei de direitos autorais da UE e respeita os pedidos de opt-out.
A Suíça introduziu um modelo de inteligência artificial de código aberto chamado Apertus, posicionando-o como uma alternativa aos sistemas proprietários, como o ChatGPT da OpenAI e o Claude da Anthropic.
Ambição de Código Aberto
A Suíça apresentou um modelo de inteligência artificial de código aberto chamado Apertus, promovendo-o como uma alternativa viável às ofertas proprietárias bem conhecidas, como o ChatGPT da OpenAI e o Claude da Anthropic. Ao publicar o código-fonte do modelo, conjuntos de dados de treinamento, pesos do modelo e uma estrada de desenvolvimento detalhada na plataforma HuggingFace, a equipe suíça enfatiza a transparência e a colaboração com a comunidade.
Metas de Design e Escopo
Os desenvolvedores descrevem o Apertus — que em latim significa "aberto" — como uma tentativa de estabelecer uma nova linha de base para modelos abertos confiáveis e globalmente relevantes. Para alcançar isso, o modelo foi treinado em um corpus multilíngue que abrange mais de 1.800 idiomas, refletindo uma ampla ambição linguística que excede muitos sistemas comerciais existentes.
Tamanhos e Capacidades do Modelo
O Apertus é lançado em duas configurações. A versão menor contém oito bilhões de parâmetros, enquanto a versão maior escala para setenta bilhões de parâmetros. De acordo com os desenvolvedores, as capacidades do modelo maior são comparáveis ao modelo Llama 3 da Meta de 2024, indicando um perfil de desempenho competitivo dentro da arena de código aberto.
Conformidade com Regulamentações Europeias
O projeto foi construído para cumprir a legislação de direitos autorais da União Europeia e o código de práticas voluntárias de IA que várias empresas de IA com sede nos EUA assinaram. Os dados de treinamento foram obtidos exclusivamente de sites públicos que permitiam a coleta de dados, e a equipe respeitou os pedidos de opt-out de sites que recusaram a participação, evitando assim quaisquer práticas de "crawling furtivo".
Contexto Estratégico
Ao oferecer um modelo totalmente aberto, a Suíça visa fornecer um caminho alternativo para organizações e desenvolvedores que buscam capacidades de IA sem dependência de plataformas proprietárias. A disponibilidade do modelo na HuggingFace também facilita melhorias impulsionadas pela comunidade, customizações potenciais e pesquisas acadêmicas mais amplas.
Recepção e Perspectiva
Observadores da indústria notam que o Apertus se junta a uma lista crescente de iniciativas de IA de código aberto que desafiam a dominância de gigantes comerciais. Sua amplitude multilíngue e adesão a padrões legais europeus podem atrair usuários focados na soberania de dados e práticas de IA éticas. O lançamento do modelo marca um passo notável para a contribuição europeia para o ecossistema global de IA.