Cohere Lança Família de Modelos Multilíngues Open-Weight Tiny Aya

Cohere Unveils Open-Weight Tiny Aya Multilingual Model Family

Pontos principais

  • A Cohere lança a família de modelos multilíngues Tiny Aya, que suporta mais de 70 idiomas.
  • O modelo base contém 3,35 bilhões de parâmetros e pode ser executado em hardware comum sem internet.
  • As variantes regionais visam idiomas africanos, sul-asiáticos e da Ásia-Pacífico/Ocidente Asiático/Europa.
  • O treinamento usou um único cluster de 64 H100 GPUs, destacando a necessidade de recursos computacionais modestos.
  • Os modelos estão disponíveis na HuggingFace, plataforma Cohere, Kaggle e Ollama para implantação local.
  • A Cohere lança conjuntos de dados de treinamento e avaliação e planeja um relatório técnico sobre a metodologia de treinamento.
  • O CEO Aidan Gomez sinaliza uma oferta pública futura; a empresa relatou US$ 240 milhões em receita anual recorrente e forte crescimento trimestral.

A empresa de inteligência artificial Cohere lançou a família de modelos multilíngues Tiny Aya, que suporta mais de 70 idiomas e é projetada para uso em dispositivos, sem necessidade de conexão com a internet. O modelo base contém 3,35 bilhões de parâmetros e pode ser executado em hardware comum.

Visão Geral do Lançamento

A empresa de inteligência artificial Cohere anunciou o lançamento de uma nova família de modelos multilíngues chamada Tiny Aya. O anúncio ocorreu durante a India AI Summit e foi apresentado pela divisão de pesquisa da Cohere, a Cohere Labs. Os modelos são open-weight, ou seja, o código subjacente está disponível publicamente para que qualquer pessoa possa usá-lo, modificá-lo ou redistribuí-lo.

Capacidades do Modelo

A família Tiny Aya suporta mais de 70 idiomas e é projetada para ser executada em dispositivos comuns, como laptops, eliminando a necessidade de uma conexão constante com a internet. O modelo base contém 3,35 bilhões de parâmetros, um tamanho que equilibra a capacidade linguística com demandas computacionais modestas. A suite inclui uma variante global, TinyAya-Global, ajustada para seguir comandos do usuário em um conjunto amplo de idiomas, bem como três versões regionais: TinyAya-Terra para idiomas africanos, TinyAya-Fogo para idiomas sul-asiáticos - incluindo bengali, hindi, punjabi, urdu, gujarati, tâmil, telugu e marati - e TinyAya-Água para idiomas falados na Ásia-Pacífico, Ásia Ocidental e Europa.

Detalhes Técnicos

Todos os modelos Tiny Aya foram treinados em um único cluster de 64 H100 GPUs, um chip de alto desempenho da Nvidia, usando recursos computacionais relativamente modestos. A Cohere projetou o software subjacente para uso em dispositivos, exigindo menos poder computacional do que a maioria dos modelos comparáveis. Essa arquitetura permite a tradução offline e outras tarefas intensivas em linguagem sem dependência de serviços de nuvem, um benefício destacado para mercados linguisticamente diversificados como a Índia.

Disponibilidade e Ecossistema

Os modelos estão disponíveis publicamente na plataforma HuggingFace e na plataforma Cohere. Os desenvolvedores também podem baixá-los do Kaggle e Ollama para implantação local. A Cohere está lançando os conjuntos de dados de treinamento e avaliação na HuggingFace e planeja emitir um relatório técnico que detalhe a metodologia de treinamento. Esses recursos visam ajudar pesquisadores e desenvolvedores a construir aplicações que atendam a audiências de língua nativa.

Contexto Empresarial

Durante o anúncio, o CEO da Cohere, Aidan Gomez, reiterou a intenção da empresa de abrir o capital "em breve". O relatório financeiro citado pela CNBC indicou que a Cohere encerrou 2025 com US$ 240 milhões em receita anual recorrente e experimentou um crescimento de 50% trimestre a trimestre ao longo do ano. O lançamento do Tiny Aya alinha-se com a estratégia mais ampla da Cohere de fornecer modelos de linguagem de alta qualidade e acessíveis para desenvolvedores e empresas em todo o mundo.

#Cohere#Tiny Aya#inteligência artificial multilíngue#modelos open-source#inteligência artificial em dispositivos#tecnologia de linguagem#pesquisa em inteligência artificial#HuggingFace#Nvidia GPUs#India AI Summit#inteligência artificial empresarial

Também disponível em: