Apple habilita clusters de Mac para cargas de trabajo de IA con macOS Tahoe 26.2

Puntos clave
- macOS Tahoe 26.2 agrega clustering de Thunderbolt 5 para varios Macs.
- Cuatro Mac Studios (hasta 512 GB de RAM cada uno) pueden ejecutar un modelo de 1 billón de parámetros.
- El consumo de energía del cluster es inferior a 500 W, aproximadamente diez veces menos que los clusters de GPU típicos.
- Thunderbolt 5 proporciona hasta 80 Gb/s de ancho de banda, mejorando los límites de las versiones anteriores de Thunderbolt.
- La función funciona con Mac mini M4 Pro y MacBook Pro M4 Pro/Max; MacBook Pro de 14 pulgadas limitado a Thunderbolt 4.
- MLX obtiene acceso completo a los aceleradores neuronales del M5 bajo el nuevo sistema operativo.
- El software EXO 1.0 de ExoLabs se demostró en los Macs clusterizados.
- El hardware de Mac existente se puede reutilizar para cargas de trabajo de IA, reduciendo la necesidad de configuraciones de GPU costosas.
La próxima versión de macOS Tahoe 26.2 de Apple agrega una función de clustering de Thunderbolt 5 de baja latencia que permite que varios Macs operen como una sola supercomputadora de IA. Al conectar cuatro Mac Studios, cada uno con capacidad de hasta 512 GB de memoria unificada, los desarrolladores pueden ejecutar modelos masivos como el modelo Kimi-K2-Thinking de 1 billón de parámetros utilizando mucha menos potencia que los clusters de GPU tradicionales.
Nueva función de clustering en macOS Tahoe 26.2
La próxima versión de macOS Tahoe 26.2 de Apple introduce una capacidad de clustering basada en Thunderbolt 5 de baja latencia que permite conectar varios Macs como un solo nodo de cómputo. La función funciona con cables Thunderbolt 5 estándar y no requiere hardware especial más allá de los Macs compatibles en sí mismos.
Beneficios de rendimiento y potencia
En una demostración, un cluster de cuatro Mac Studios, cada uno equipado con hasta 512 GB de memoria unificada, cargó y ejecutó con éxito el modelo Kimi-K2-Thinking de 1 billón de parámetros. El cluster consumió menos de 500 watts de potencia, aproximadamente diez veces menos que un cluster de GPU típico como el NVIDIA RTX 5090, que está calificado para 575 watts. La conexión Thunderbolt 5 proporciona hasta 80 Gb/s de ancho de banda, una mejora significativa sobre las implementaciones de Thunderbolt anteriores que estaban limitadas a velocidades más lentas y a menudo requerían hubs que reducían el rendimiento a 10 Gb/s.
Compatibilidad de hardware
La capacidad de clustering no se limita al Mac Studio de alta gama. También funciona con el Mac mini M4 Pro y el MacBook Pro M4 Pro/Max, lo que permite que una variedad de dispositivos Apple Silicon participen. El MacBook Pro de 14 pulgadas, que actualmente se envía con Thunderbolt 4, puede unirse a un cluster pero no beneficiarse del ancho de banda completo de Thunderbolt 5.
Integración con la pila de IA de Apple
macOS Tahoe 26.2 da al proyecto MLX de código abierto de Apple acceso directo a los aceleradores neuronales del chip M5, lo que acelera aún más las tareas de inferencia de IA. En la misma demostración, los Macs clusterizados ejecutaron el software EXO 1.0 de ExoLabs, lo que muestra cómo las herramientas de terceros pueden aprovechar la nueva configuración de hardware.
Implicaciones para desarrolladores e investigadores
Para los desarrolladores y investigadores que ya poseen Mac Studios, Mac minis o MacBook Pros, la nueva función de clustering ofrece una forma rentable de escalar las cargas de trabajo de IA sin comprar hardware de GPU adicional. Si bien un Mac Studio de alta gama con el chip M3 Ultra comienza en $9,499, la capacidad de reutilizar máquinas existentes podría reducir la inversión general para instituciones que buscan cómputo de IA de alto rendimiento y baja potencia.