Modelos de video de IA generativa enfrentan importantes desafíos de energía

Puntos clave
- Los modelos de video de IA de código abierto consumen aproximadamente 90 vatios-hora por clip.
- La generación de video es aproximadamente 30 veces más intensiva en términos de energía que la generación de imágenes.
- La generación de video es aproximadamente 2,000 veces más intensiva en términos de energía que la generación de texto.
- Un video de diez segundos a 240 fps requiere la creación de 2,400 frames individuales.
- El uso de energía es comparable a ejecutar un televisor de 65 pulgadas durante aproximadamente 37 minutos por video.
- El estudio se realizó en una GPU Nvidia H100 SXM, un procesador común en los centros de datos.
- Llamadas a las empresas de IA para que divulguen métricas detalladas de uso de energía.
- El aumento del uso de video de IA podría tensar las redes eléctricas a medida que aumenta la demanda.
Un estudio reciente que midió el consumo de energía de herramientas de video de IA generativa de código abierto encontró que crear un solo video generado por IA consume aproximadamente 90 vatios-hora de electricidad, mucho más que la generación de imágenes o texto. La investigación, realizada en una GPU Nvidia H100, mostró que la difusión de video es aproximadamente treinta veces más costosa que la generación de imágenes y dos mil veces más costosa que la generación de texto.
Demanda de energía de la generación de video de IA
La inteligencia artificial generativa se ha convertido en un importante impulsor del consumo de electricidad, especialmente a medida que los modelos de creación de video entran en uso mainstream. Mientras que las consultas de IA basadas en texto ya requieren recursos de cómputo notables, el cambio a la generación de imágenes en movimiento multiplica dramáticamente la carga de trabajo.
Metodología y hallazgos del estudio
Los investigadores examinaron varios modelos de difusión de video de código abierto utilizando una GPU Nvidia H100 SXM, un procesador de alto rendimiento común en los centros de datos de IA modernos. Al variar factores como la longitud del video, la resolución y la intensidad de desenoise, el equipo midió la electricidad utilizada para cada configuración. Para un clip típico de diez segundos renderizado a 240 frames por segundo, el modelo generó 2,400 imágenes separadas, un proceso que resultó sustancialmente más voraz de energía que la generación de texto o imágenes.
El estudio cuantificó el uso de energía de la siguiente manera:
- Un video generado por IA consumió aproximadamente 90 vatios-hora.
- Generar una sola imagen requirió aproximadamente 2.9 vatios-hora.
- Producir una respuesta de texto utilizó aproximadamente 0.047 vatios-hora.
Estos números traducen que la difusión de video es treinta veces más costosa que la generación de imágenes y dos mil veces más costosa que la generación de texto. Para poner el consumo en términos cotidianos, una bombilla LED eficiente en energía consume 8-10 vatios, mientras que un televisor típico de 65 pulgadas consume alrededor de 146 vatios. Ejecutar un modelo de IA generador de video durante la duración de un clip es comparable a alimentar ese televisor durante aproximadamente treinta y siete minutos.
Contexto más amplio y respuesta de la industria
Los hallazgos llegan en un momento en que los principales proveedores de IA están lanzando herramientas de video orientadas al consumidor. Aunque el estudio se centró en modelos de código abierto y excluyó productos de alto perfil como Sora de OpenAI y Veo 3 de Google, las implicaciones de energía probablemente se extiendan a esas plataformas también. A medida que la adopción de IA se acelera, la demanda de redes eléctricas y capacidad de centros de datos crece en paralelo, lo que lleva a los líderes de la industria a invertir pesadamente en nueva infraestructura.
Las llamadas a una mayor transparencia se han intensificado, con expertos instando a las empresas de IA a divulgar métricas precisas de uso de energía. Sin datos claros, los usuarios no pueden tomar decisiones informadas sobre el impacto ambiental de sus interacciones con IA. La investigación subraya la necesidad de arquitecturas de modelo más eficientes y una informe más claro sobre el consumo de energía.
Implicaciones para los usuarios y los formuladores de políticas
Para los usuarios finales, el estudio sugiere una necesidad de evaluar la necesidad de contenido de video generado por IA, especialmente cuando existen alternativas. Los formuladores de políticas y reguladores de energía también pueden necesitar considerar el efecto acumulado de las cargas de trabajo de IA en los suministros de energía regionales, particularmente a medida que los servicios impulsados por IA se vuelven ubicuos.
En general, la investigación pinta un cuadro de una tecnología con impresionantes capacidades creativas pero con un alto precio en términos de energía. Abordar este desafío requerirá esfuerzos coordinados en todo el ecosistema de IA, incluidos desarrolladores de modelos, fabricantes de hardware y la industria en general.