Nvidia lança DGX Spark, um supercomputador de IA compacto para desktops

Nvidia sells tiny new computer that puts big AI on your desktop

Pontos principais

  • O DGX Spark executa o DGX OS baseado em ARM da Nvidia construído no Ubuntu Linux.
  • Inclui conjunto de software de IA pré-instalado com CUDA e microserviços NIM.
  • Começa em US $3.999, oferecendo uma entrada acessível ao hardware de IA.
  • Desempenho comparável a um GPU RTX 5070, mas com 128 GB de memória unificada.
  • Permite a execução de grandes modelos de IA que excedem os limites de GPUs de consumidor típicas.
  • O CEO Jensen Huang entregou pessoalmente uma unidade a Elon Musk na SpaceX Starbase.
  • Huang referenciou uma entrega em 2016 à OpenAI, ligando missões passadas e presentes.
  • Posicionado como uma alternativa mais barata a servidores e GPUs de IA de alto nível.

Nvidia apresentou o DGX Spark, um sistema de IA de fator de forma compacto que executa o DGX OS baseado em ARM construído no Ubuntu Linux e inclui o conjunto de software de IA da empresa. Com um preço a partir de US $3.999, o Spark oferece desempenho comparável a um GPU RTX 5070, mas com 128 GB de memória unificada, permitindo modelos de IA maiores.

Design Compacto, Software Potente

O DGX Spark é um sistema baseado em ARM que executa o DGX OS da Nvidia, um sistema operacional baseado em Ubuntu Linux construído especificamente para processamento de GPU. Ele vem com o conjunto de software de IA da Nvidia pré-instalado, incluindo bibliotecas CUDA e os microserviços NIM da empresa.

Preços e Desempenho

Os preços do DGX Spark começam em US $3.999. De acordo com The Register, o desempenho de computação de GPU do chip GB10 é aproximadamente equivalente a um RTX 5070. No entanto, o RTX 5070 é limitado a 12 GB de memória de vídeo, enquanto o DGX Spark fornece 128 GB de memória unificada, permitindo que ele execute modelos de IA muito maiores.

Vantagem de Memória

Com 128 GB de memória unificada, o DGX Spark pode lidar com modelos que excedem a capacidade de soluções de GPU de consumidor típicas. Por exemplo, um modelo de linguagem de 120 bilhões de parâmetros exigiria cerca de 80 GB de memória, muito mais do que a maioria das soluções de GPU de único pode acomodar.

Entrega Pessoal do CEO Jensen Huang

O fundador e CEO da Nvidia, Jensen Huang, marcou a ocasião do lançamento do DGX Spark entregando pessoalmente uma das primeiras unidades a Elon Musk na instalação da SpaceX em Starbase, no Texas. Isso ecoa uma entrega semelhante que Huang fez a Musk na OpenAI em 2016. Em uma declaração, Huang disse: "Em 2016, construímos o DGX-1 para dar aos pesquisadores de IA seu próprio supercomputador. Entreguei pessoalmente o primeiro sistema a Elon em uma pequena startup chamada OpenAI, e disso surgiu o ChatGPT. O DGX-1 lançou a era dos supercomputadores de IA e desbloqueou as leis de escala que impulsionam a IA moderna. Com o DGX Spark, retornamos a essa missão."

Posição no Mercado

Embora o DGX Spark não seja tão poderoso quanto GPUs de alto nível, como o RTX 5090 ou GPUs de servidor de IA, como o H100, seu ponto de preço mais baixo e sua memória substancial o tornam uma opção menos dispendiosa para organizações que buscam capacidade de IA local sem o custo de infraestrutura de servidor em grande escala.

#Nvidia#DGX Spark#hardware de IA#GPU#CUDA#NIM#Jensen Huang#Elon Musk#SpaceX#The Register#RTX 5070#Ubuntu Linux

Também disponível em: