Apple Habilita Clusters de Mac para Cargas de Trabalho de IA com macOS Tahoe 26.2

Pontos principais
- O macOS Tahoe 26.2 adiciona clusterização Thunderbolt 5 para vários Macs.
- Quatro Mac Studios (até 512 GB de RAM cada) podem executar um modelo de 1 trilhão de parâmetros.
- A energia consumida pelo cluster é inferior a 500 W, cerca de dez vezes menos do que os clusters de GPU típicos.
- O Thunderbolt 5 fornece até 80 Gb/s de largura de banda, melhorando as limitações do Thunderbolt mais antigo.
- O recurso funciona com Mac mini M4 Pro e MacBook Pro M4 Pro/Max; o MacBook Pro de 14 polegadas é limitado ao Thunderbolt 4.
- O MLX ganha acesso total aos aceleradores neurais do M5 no novo sistema operacional.
- O software EXO 1.0 da ExoLabs foi demonstrado nos Macs clusterizados.
- O hardware Mac existente pode ser reutilizado para cargas de trabalho de IA, reduzindo a necessidade de conjuntos de GPU caros.
A próxima versão do macOS Tahoe 26.2 da Apple adiciona uma funcionalidade de cluster de baixa latência com Thunderbolt 5, permitindo que vários Macs operem como um supercomputador de IA único. Ao vincular quatro Mac Studios - cada um capaz de até 512 GB de memória unificada - os desenvolvedores podem executar modelos massivos, como o modelo Kimi-K2-Thinking de 1 trilhão de parâmetros, usando muito menos energia do que os clusters de GPU tradicionais.
Novo Recurso de Clusterização no macOS Tahoe 26.2
A próxima versão do macOS Tahoe 26.2 da Apple introduz uma capacidade de clusterização de baixa latência baseada em Thunderbolt 5, que permite que vários Macs sejam vinculados como um único nó de computação. O recurso funciona com cabos Thunderbolt 5 padrão e não exige nenhum hardware especial além dos Macs compatíveis em si.
Benefícios de Desempenho e Energia
Em uma demonstração, um cluster de quatro Mac Studios - cada um equipado com até 512 GB de memória unificada - carregou e executou com sucesso o modelo Kimi-K2-Thinking de 1 trilhão de parâmetros. O cluster consumiu menos de 500 watts de energia, cerca de dez vezes menos do que um cluster de GPU típico, como o NVIDIA RTX 5090, que é classificado em 575 watts. A ligação Thunderbolt 5 fornece até 80 Gb/s de largura de banda, uma melhoria significativa em relação às implementações anteriores do Thunderbolt que eram limitadas a velocidades mais lentas e frequentemente exigiam hubs que reduziam a taxa de transferência para 10 Gb/s.
Compatibilidade de Hardware
A capacidade de clusterização não é limitada ao Mac Studio de alto nível. Ela também funciona com o Mac mini M4 Pro e o MacBook Pro M4 Pro/Max, permitindo que uma variedade de dispositivos Apple Silicon participe. O MacBook Pro de 14 polegadas, que atualmente é enviado com Thunderbolt 4, pode se juntar a um cluster, mas não se beneficiará da largura de banda total do Thunderbolt 5.
Integração com a Pilha de IA da Apple
O macOS Tahoe 26.2 dá ao projeto MLX de código aberto da Apple acesso direto aos aceleradores neurais no chip M5 que está por vir, acelerando ainda mais as tarefas de inferência de IA. Na mesma demonstração, os Macs clusterizados executaram o software EXO 1.0 da ExoLabs, mostrando como as ferramentas de terceiros podem aproveitar a nova configuração de hardware.
Implicações para Desenvolvedores e Pesquisadores
Para desenvolvedores e pesquisadores que já possuem Mac Studios, Mac minis ou MacBook Pros, o novo recurso de clusterização oferece uma maneira rentável de dimensionar as cargas de trabalho de IA sem comprar hardware de GPU adicional. Embora um Mac Studio de alto nível com o chip M3 Ultra comece em $9.499, a capacidade de reutilizar máquinas existentes pode reduzir o investimento geral para instituições que buscam computação de IA de alto desempenho e baixo consumo de energia.