Nvidia lança DGX Spark, um supercomputador de IA compacto para desktops

Pontos principais
- O DGX Spark executa o DGX OS baseado em ARM da Nvidia construído no Ubuntu Linux.
- Inclui conjunto de software de IA pré-instalado com CUDA e microserviços NIM.
- Começa em US $3.999, oferecendo uma entrada acessível ao hardware de IA.
- Desempenho comparável a um GPU RTX 5070, mas com 128 GB de memória unificada.
- Permite a execução de grandes modelos de IA que excedem os limites de GPUs de consumidor típicas.
- O CEO Jensen Huang entregou pessoalmente uma unidade a Elon Musk na SpaceX Starbase.
- Huang referenciou uma entrega em 2016 à OpenAI, ligando missões passadas e presentes.
- Posicionado como uma alternativa mais barata a servidores e GPUs de IA de alto nível.
Nvidia apresentou o DGX Spark, um sistema de IA de fator de forma compacto que executa o DGX OS baseado em ARM construído no Ubuntu Linux e inclui o conjunto de software de IA da empresa. Com um preço a partir de US $3.999, o Spark oferece desempenho comparável a um GPU RTX 5070, mas com 128 GB de memória unificada, permitindo modelos de IA maiores.
Design Compacto, Software Potente
O DGX Spark é um sistema baseado em ARM que executa o DGX OS da Nvidia, um sistema operacional baseado em Ubuntu Linux construído especificamente para processamento de GPU. Ele vem com o conjunto de software de IA da Nvidia pré-instalado, incluindo bibliotecas CUDA e os microserviços NIM da empresa.
Preços e Desempenho
Os preços do DGX Spark começam em US $3.999. De acordo com The Register, o desempenho de computação de GPU do chip GB10 é aproximadamente equivalente a um RTX 5070. No entanto, o RTX 5070 é limitado a 12 GB de memória de vídeo, enquanto o DGX Spark fornece 128 GB de memória unificada, permitindo que ele execute modelos de IA muito maiores.
Vantagem de Memória
Com 128 GB de memória unificada, o DGX Spark pode lidar com modelos que excedem a capacidade de soluções de GPU de consumidor típicas. Por exemplo, um modelo de linguagem de 120 bilhões de parâmetros exigiria cerca de 80 GB de memória, muito mais do que a maioria das soluções de GPU de único pode acomodar.
Entrega Pessoal do CEO Jensen Huang
O fundador e CEO da Nvidia, Jensen Huang, marcou a ocasião do lançamento do DGX Spark entregando pessoalmente uma das primeiras unidades a Elon Musk na instalação da SpaceX em Starbase, no Texas. Isso ecoa uma entrega semelhante que Huang fez a Musk na OpenAI em 2016. Em uma declaração, Huang disse: "Em 2016, construímos o DGX-1 para dar aos pesquisadores de IA seu próprio supercomputador. Entreguei pessoalmente o primeiro sistema a Elon em uma pequena startup chamada OpenAI, e disso surgiu o ChatGPT. O DGX-1 lançou a era dos supercomputadores de IA e desbloqueou as leis de escala que impulsionam a IA moderna. Com o DGX Spark, retornamos a essa missão."
Posição no Mercado
Embora o DGX Spark não seja tão poderoso quanto GPUs de alto nível, como o RTX 5090 ou GPUs de servidor de IA, como o H100, seu ponto de preço mais baixo e sua memória substancial o tornam uma opção menos dispendiosa para organizações que buscam capacidade de IA local sem o custo de infraestrutura de servidor em grande escala.