Arcee AI Lança Trinity, um Modelo de Linguagem Aberto de 400 Bilhões de Parâmetros

Pontos principais
- Arcee AI lança Trinity, um LLM de 400 bilhões de parâmetros sob uma licença Apache.
- Benchmarks mostram que Trinity compete com o Llama 4 Maverick da Meta e o GLM-4.5 da China em tarefas de codificação, matemática e raciocínio.
- A versão atual suporta apenas texto; modelos de visão e fala-para-texto estão planejados.
- Três sabores de modelo estarão disponíveis: Large Preview (levemente pós-treinado), Large Base (bruto) e TrueBase (sem dados de instrução).
- Todas as versões são gratuitas para download; uma API hospedada está prevista para ser lançada dentro de semanas.
- O custo de treinamento foi de $20 milhões ao longo de seis meses usando 2.048 GPUs Nvidia Blackwell.
- Arcee AI visa fornecer uma alternativa de código aberto permanente para desenvolvedores e pesquisadores dos EUA.
- A startup originalmente ofereceu serviços de pós-treinamento para clientes corporativos antes de construir seu próprio modelo.
Arcee AI, uma startup de 30 pessoas, lançou Trinity, um modelo de linguagem aberto de 400 bilhões de parâmetros licenciado sob a licença Apache. A empresa afirma que Trinity rivaliza com o Llama 4 Maverick da Meta e o GLM-4.5 da China em testes de benchmark, especialmente em codificação, matemática, raciocínio comum e tarefas de conhecimento.
Arcee AI Apresenta Trinity
Arcee AI, uma pequena startup dos EUA com cerca de trinta funcionários, anunciou o lançamento de Trinity, um modelo de linguagem grande (LLM) de 400 bilhões de parâmetros. O modelo é oferecido sob uma licença Apache permissiva, tornando-o permanentemente de código aberto. De acordo com a empresa, Trinity compete com o Llama 4 Maverick 400B da Meta e o GLM-4.5 de origem chinesa em avaliações de benchmark que se concentram no desempenho do modelo base com pós-treinamento mínimo.
Desempenho e Capacidades
Os resultados iniciais dos benchmarks indicam que o modelo base de Trinity se sai bem contra os principais modelos em vários domínios, incluindo codificação, matemática, raciocínio comum, conhecimento factual e raciocínio lógico. Atualmente, Trinity suporta apenas entrada e saída de texto, mas o roadmap inclui um modelo de visão e uma variante de fala-para-texto. Isso contrasta com o Llama 4 Maverick da Meta, que já suporta texto e imagens.
Público-Alvo e Posicionamento no Mercado
O público-alvo principal da startup consiste em desenvolvedores e pesquisadores acadêmicos. Arcee AI visa fornecer uma alternativa de alto nível e de código aberto para modelos que são proprietários ou sujeitos a restrições de licenciamento. A empresa enfatiza que um modelo permanentemente de código aberto e licenciado sob a Apache pode conquistar os "corações e mentes" dos desenvolvedores dos EUA que hesitam em confiar em modelos abertos da China.
Variáveis do Modelo e Disponibilidade
Trinity será lançado em três versões distintas. "Trinity Large Preview" é um modelo de seguimento de instruções levemente pós-treinado destinado ao uso geral de bate-papo. "Trinity Large Base" é o modelo base puro sem pós-treinamento. "TrueBase" remove todos os dados de instrução e pós-treinamento, permitindo que empresas e pesquisadores personalizem o modelo sem herdar regras pré-impostas. Todas as versões podem ser baixadas gratuitamente, e uma oferta de API hospedada com preços competitivos está prevista para ser lançada dentro de seis semanas.
Infraestrutura de Treinamento e Custo
O modelo foi treinado durante um período de seis meses usando 2.048 GPUs Nvidia Blackwell B300. O custo total para treinar Trinity foi de $20 milhões, financiado a partir dos aproximadamente $50 milhões que a empresa arrecadou até o momento. A equipe de treinamento foi liderada pelo CTO Lucas Atkins, que anteriormente construiu agentes de voz para aplicações automotivas.
Histórico da Empresa e Estratégia
O fundador e CEO Mark McQuade, um ex-funcionário precoce da Hugging Face, explicou que a Arcee AI originalmente se concentrou em serviços de pós-treinamento e personalização para grandes clientes corporativos, como a SK Telecom. A empresa pegaria modelos de código aberto existentes - Llama, Mistral, Qwen - e os melhoraria por meio do aprendizado por reforço e outras técnicas. À medida que a base de clientes se expandia, a necessidade de um modelo proprietário cresceu, levando à decisão de desenvolver Trinity.
Filosofia de Código Aberto
A Arcee AI escolheu a licença Apache para garantir que Trinity permaneça totalmente de código aberto, diferenciando-o de modelos como o Llama da Meta, que usa uma licença controlada pela Meta com caveats comerciais e de uso. A startup argumenta que um modelo verdadeiramente aberto e de ponta é essencial para as empresas dos EUA que são cautelosas em relação a confiar em modelos de origem chinesa.
Perspectiva Futura
Além de Trinity, a Arcee AI planeja continuar expandindo sua suíte de modelos com capacidades multimodais e oferecer serviços de API hospedada a taxas competitivas com os principais provedores de nuvem. A empresa também mantém uma linha de negócios para serviços de pós-treinamento e personalização, aproveitando sua expertise em adaptar modelos para aplicações corporativas específicas.