Gimlet Labs Garante $80 Milhões em Série A para Melhorar a Eficiência de Inferência de IA

Pontos principais
- Gimlet Labs levanta $80 milhões em Série A liderada pela Menlo Ventures.
- O software de "nuvem de inferência multi-silicônio" da startup executa cargas de trabalho de IA em CPUs, GPUs e sistemas de alta memória.
- Alega uma inferência 3 a 10 vezes mais rápida sem aumento de custo ou potência.
- Parcerias com principais fabricantes de chips, incluindo NVIDIA, AMD, Intel, ARM, Cerebras e d-Matrix.
- Visa laboratórios de modelos de IA grandes e operadores de centros de dados importantes, não desenvolvedores de IA comuns.
- Fundadores anteriormente construíram a Pixie, adquirida pela New Relic em 2020.
- Financiamento total agora é de $92 milhões; equipe de 30 funcionários.
Gimlet Labs, fundada por ex-co-fundadores da Pixie, incluindo o professor adjunto da Stanford Zain Asgar, anunciou uma rodada de financiamento Série A de $80 milhões liderada pela Menlo Ventures. O software de "nuvem de inferência multi-silicônio" da startup permite que cargas de trabalho de IA executem simultaneamente em CPUs, GPUs e sistemas de alta memória, prometendo uma inferência 3 a 10 vezes mais rápida ao mesmo custo e potência.
Rodada de Financiamento e liderança
Gimlet Labs, uma startup focada na otimização de inferência de IA, fechou uma rodada de financiamento Série A de $80 milhões. A rodada foi liderada pela Menlo Ventures, com a participação de um grupo de anjos e outras firmas de venture. O fundador e professor adjunto da Stanford Zain Asgar, juntamente com os co-fundadores Michelle Nguyen, Omid Azizi e Natalie Serrino, usará o capital para expandir a plataforma de inferência multi-silicônio da empresa.
Visão Geral da Tecnologia
O núcleo da oferta da Gimlet Labs é uma camada de software que chama de "nuvem de inferência multi-silicônio". Essa camada orquestra cargas de trabalho de IA em diferentes tipos de hardware - CPUs tradicionais, GPUs otimizadas para IA e sistemas de alta memória - permitindo que uma única tarefa de IA seja dividida em etapas que executem no hardware mais adequado para cada etapa. Segundo Tim Tully, da Menlo Ventures, a inferência é limitada por computação, a decodificação é limitada por memória e as chamadas de ferramentas são limitadas por rede, e a plataforma combina dinamicamente cada requisito com o silicônio apropriado.
Alegações de Desempenho
Gimlet Labs afirma que sua solução pode acelerar a inferência de IA em três a dez vezes sem aumentar o custo ou o consumo de energia. A plataforma também pode particionar o modelo subjacente para que diferentes porções executem em arquiteturas diferentes, selecionando o chip ótimo para cada segmento. A empresa relata que o hardware de centro de dados existente é atualmente utilizado apenas entre 15% e 30% do tempo, levando a recursos