Modelos de Vídeo de IA Gerativa Enfrentam Desafios Energéticos Significativos

Pontos principais
- Modelos de vídeo de IA de código aberto consomem cerca de 90 watt-horas por clipe.
- A geração de vídeo é cerca de 30 vezes mais intensiva em energia do que a geração de imagens.
- A geração de vídeo é cerca de 2.000 vezes mais intensiva em energia do que a geração de texto.
- Um vídeo de dez segundos a 240 fps requer a criação de 2.400 frames individuais.
- O uso de energia é comparável ao de um televisor de 65 polegadas durante cerca de 37 minutos por vídeo.
- Estudo realizado em um processador Nvidia H100 SXM GPU, um processador comum em centros de dados.
- Chamadas para as empresas de IA divulgarem métricas detalhadas de uso de energia.
- O aumento do uso de vídeo de IA pode sobrecarregar as redes elétricas à medida que a demanda aumenta.
Um estudo recente medindo o consumo de energia de ferramentas de vídeo de IA gerativa abertas encontrou que criar um único vídeo gerado por IA consome aproximadamente 90 watt-horas de eletricidade — muito mais do que a geração de imagens ou texto. A pesquisa, realizada em um GPU Nvidia H100, mostrou que a difusão de vídeo é cerca de trinta vezes mais cara do que a geração de imagens e duas mil vezes mais cara do que a geração de texto.
Demanda Energética da Geração de Vídeo de IA
A inteligência artificial gerativa se tornou um grande motor de consumo de eletricidade, especialmente à medida que os modelos de criação de vídeo entram no uso mainstream. Embora as consultas de IA baseadas em texto já exijam recursos computacionais notáveis, a mudança para a geração de imagens em movimento multiplica dramaticamente a carga de trabalho.
Metodologia e Resultados do Estudo
Pesquisadores examinaram vários modelos de difusão de vídeo de código aberto usando um processador Nvidia H100 SXM GPU, um processador de alto desempenho comum em centros de dados de IA modernos. Ao variar fatores como comprimento do vídeo, resolução e intensidade de denoising, a equipe mediu a eletricidade consumida para cada configuração. Para um clipe típico de dez segundos renderizado a 240 frames por segundo, o modelo gerou 2.400 imagens separadas, um processo que se provou substancialmente mais voraz de energia do que a geração de texto ou imagem.
O estudo quantificou o uso de energia da seguinte forma:
- Um vídeo gerado por IA consumiu aproximadamente 90 watt-horas.
- Gerar uma única imagem exigiu cerca de 2,9 watt-horas.
- Produzir uma resposta de texto usou cerca de 0,047 watt-horas.
Esses números traduzem-se em uma difusão de vídeo trinta vezes mais cara do que a geração de imagens e duas mil vezes mais cara do que a geração de texto. Para colocar o consumo em termos cotidianos, uma lâmpada LED eficiente em energia consome 8-10 watts, enquanto um televisor típico de 65 polegadas consome cerca de 146 watts. Executar um modelo de IA de geração de vídeo por um clipe é comparável a alimentar esse televisor por cerca de trinta e sete minutos.
Contexto Mais Amplo e Resposta da Indústria
Os resultados chegam em um momento em que grandes fornecedores de IA estão lançando ferramentas de vídeo voltadas para o consumidor. Embora o estudo tenha se concentrado em modelos de código aberto e excluído produtos de alto perfil, como o Sora da OpenAI e o Veo 3 do Google, as implicações de energia provavelmente se extendem a essas plataformas também. À medida que a adoção de IA acelera, a demanda por redes elétricas e capacidade de centro de dados cresce em paralelo, levando líderes da indústria a investir pesadamente em nova infraestrutura.
Chamadas para uma maior transparência intensificaram-se, com especialistas instando as empresas de IA a divulgar métricas precisas de uso de energia. Sem dados claros, os usuários não podem tomar decisões informadas sobre o impacto ambiental de suas interações de IA. A pesquisa destaca a necessidade de arquiteturas de modelo mais eficientes e relatórios mais claros sobre o consumo de energia.
Implicações para Usuários e Formuladores de Políticas
Para os usuários finais, o estudo sugere a necessidade de avaliar a necessidade de conteúdo de vídeo gerado por IA, especialmente quando existem alternativas. Formuladores de políticas e reguladores de energia também podem precisar considerar o efeito cumulativo de cargas de trabalho de IA sobre os suprimentos de energia regionais, particularmente à medida que os serviços impulsionados por IA se tornam ubíquos.
No geral, a pesquisa pinta um quadro de uma tecnologia com impressionantes capacidades criativas, mas com um alto preço de energia. Abordar esse desafio exigirá esforços coordenados por desenvolvedores de modelo, fabricantes de hardware e o ecossistema de IA mais amplo.