Google Orienta Funcionários a Dobrar Capacidade de Infraestrutura de IA a Cada Seis Meses

Pontos principais
- A Google deve dobrar a capacidade de atendimento de IA a cada seis meses.
- Objetivo: aumentar a computação, o armazenamento e a rede em cerca de mil vezes em 4-5 anos.
- Amin Vahdat enfatiza a manutenção da eficiência de custo, energia e potência.
- A OpenAI planeja seis novos centros de dados nos EUA, investindo mais de $400 bilhões para 7 GW de capacidade.
- A OpenAI atende 800 milhões de usuários semanais do ChatGPT, enfrentando limites de uso em recursos avançados.
- A Google visa uma infraestrutura mais confiável, performática e escalável do que a dos concorrentes.
- Desafio-chave: escalar enquanto mantém os custos e o consumo de energia estáveis.
O líder de infraestrutura de IA da Google informou aos funcionários que a empresa deve dobrar sua capacidade de atendimento a cada seis meses para atender à demanda crescente por IA. O vice-presidente Amin Vahdat estabeleceu um objetivo para aumentar a capacidade de computação, armazenamento e rede em cerca de mil vezes nos próximos quatro a cinco anos, mantendo a eficiência de custo e energia.
Escalando Infraestrutura de IA a uma Velocidade Alucinante
Em uma reunião de todos os funcionários, o chefe de infraestrutura de IA da Google, Amin Vahdat, anunciou que a empresa deve dobrar sua capacidade de atendimento a cada seis meses para atender ao crescimento rápido dos serviços de inteligência artificial. Vahdat, vice-presidente da Google Cloud, apresentou slides indicando a necessidade de escalar "os próximos 1000x em 4-5 anos". Esse objetivo ambicioso reflete a pressão para entregar mais poder de computação, armazenamento e rede, mantendo os custos, o consumo de energia e o uso de energia essencialmente inalterados.
Vahdat enfatizou que alcançar tal crescimento não será fácil, mas expressou confiança de que a colaboração e a co-projetagem em toda a organização tornarão isso possível. Ele destacou o objetivo de construir uma infraestrutura que seja "mais confiável, mais performática e mais escalável do que o que está disponível em qualquer outro lugar".
Paisagem Competitiva
O esforço de escalonamento da Google está ocorrendo em um ambiente competitivo feroz. A OpenAI, um rival importante, está planejando construir seis grandes centros de dados nos Estados Unidos por meio de sua parceria Stargate com a SoftBank e a Oracle. A empresa comprometeu-se a gastar mais de $400 bilhões nos próximos três anos para alcançar quase 7 gigawatts de capacidade, visando apoiar seus 800 milhões de usuários semanais do ChatGPT. Mesmo os assinantes pagos encontram regularmente limites de uso para recursos avançados, como síntese de vídeo e modelos de raciocínio simulado.
A corrida para expandir a infraestrutura de IA é descrita como a parte mais crítica e dispendiosa da competição mais ampla de IA. Embora a Google reconheça que gastará pesadamente, o foco está em entregar uma plataforma que possa atender à demanda sem sacrificar a confiabilidade ou a eficiência.
Desafios e Restrições
As principais restrições identificadas por Vahdat incluem a necessidade de aumentar a capacidade, a computação e a rede de armazenamento "por essencialmente o mesmo custo e, cada vez mais, o mesmo nível de energia". A empresa deve equilibrar a expansão rápida da capacidade com a sustentabilidade e a eficiência de custo. Além disso, permanece incerto quanto da demanda projetada decorre do interesse orgânico do usuário versus a integração interna de recursos de IA em serviços existentes, como Busca, Gmail e Workspace.
No entanto, a Google está comprometida em atingir os objetivos de escalonamento, visando permanecer à frente dos concorrentes, entregando uma infraestrutura de IA superior que possa lidar com as cargas de trabalho crescentes de ambos os clientes externos e equipes de produtos internas.