Google instruye a su personal para duplicar la capacidad de infraestructura de IA cada seis meses

Puntos clave
- Google debe duplicar la capacidad de servicio de IA cada seis meses.
- Objetivo: aumentar el cómputo, el almacenamiento y las redes en aproximadamente un mil por ciento en 4-5 años.
- Amin Vahdat enfatiza la importancia de mantener la eficiencia de costo, energía y potencia.
- OpenAI planea seis nuevos centros de datos en EE. UU., invirtiendo más de $400 mil millones para 7 GW de capacidad.
- OpenAI atiende a 800 millones de usuarios semanales de ChatGPT, enfrentando límites de uso en características avanzadas.
- Google apunta a una infraestructura que sea más confiable, performante y escalable que la de los competidores.
- Desafío clave: escalar mientras se mantienen los costos y el consumo de energía estables.
El líder de infraestructura de IA de Google le informó a los empleados que la empresa debe duplicar su capacidad de servicio cada seis meses para satisfacer la creciente demanda de IA. El vicepresidente Amin Vahdat estableció un objetivo para aumentar la capacidad de cómputo, almacenamiento y redes en aproximadamente un mil por ciento en los próximos cuatro a cinco años, manteniendo la eficiencia de costo y energía.
Escalando la infraestructura de IA a un ritmo trepidante
En una reunión de todos los empleados, el jefe de infraestructura de IA de Google, Amin Vahdat, anunció que la empresa debe duplicar su capacidad de servicio cada seis meses para satisfacer el crecimiento rápido de los servicios de inteligencia artificial. Vahdat, vicepresidente de Google Cloud, presentó diapositivas que indicaban la necesidad de escalar "los próximos 1000x en 4-5 años". Este objetivo ambicioso refleja la presión para entregar más poder de cómputo, almacenamiento y redes, manteniendo los costos, el consumo de energía y el uso de energía esencialmente sin cambios.
Vahdat enfatizó que lograr tal crecimiento no será fácil, pero expresó confianza en que la colaboración y el codiseño en toda la organización lo harán posible. Destacó el objetivo de construir una infraestructura que sea "más confiable, más performante y más escalable que lo que está disponible en cualquier otro lugar".
Paisaje competitivo
El esfuerzo de escalado de Google se lleva a cabo en un entorno competitivo feroz. OpenAI, un rival importante, planea construir seis centros de datos masivos en los Estados Unidos a través de su asociación Stargate con SoftBank y Oracle. La empresa se ha comprometido a invertir más de $400 mil millones en los próximos tres años para lograr casi 7 gigavatios de capacidad, con el objetivo de apoyar a sus 800 millones de usuarios semanales de ChatGPT. Incluso los suscriptores pagados encuentran regularmente límites de uso para características avanzadas como la síntesis de video y los modelos de razonamiento simulado.
La carrera para expandir la infraestructura de IA se describe como la parte más crítica y costosa de la competencia de IA más amplia. Si bien Google reconoce que gastará mucho, el enfoque está en entregar una plataforma que pueda satisfacer la demanda sin sacrificar la confiabilidad o la eficiencia.
Desafíos y restricciones
Las restricciones clave identificadas por Vahdat incluyen la necesidad de aumentar la capacidad, el cómputo y el almacenamiento de redes "por esencialmente el mismo costo y cada vez más, la misma energía, el mismo nivel de energía". La empresa debe equilibrar la expansión rápida de la capacidad con la sostenibilidad y la eficiencia de costo. Además, no está claro cuánto de la demanda proyectada se debe al interés de los usuarios orgánico versus la integración interna de características de IA en servicios existentes como Search, Gmail y Workspace.
Sin embargo, Google se compromete a cumplir con los objetivos de escalado, con el objetivo de mantenerse por delante de los competidores al entregar una infraestructura de IA superior que pueda manejar las cargas de trabajo en crecimiento de los clientes externos y los equipos de productos internos.