Google Presenta Veo 3.1, Modelo de IA que Mejora la Generación de Video a Partir de Imágenes

Google ha lanzado Veo 3.1, una actualización de su modelo de generación de video de IA que mejora la adherencia a las instrucciones y agrega la capacidad de convertir imágenes en video mientras genera audio simultáneamente. El nuevo modelo está disponible a través de la API Gemini y alimenta el editor de video Flow, donde introduce características como "Frame to Video", que permite a los usuarios subir frames de inicio y fin y que el sistema complete el movimiento.

Presentando Veo 3.1

Google anunció una nueva versión de su modelo de generación de video de IA Veo, llamado Veo 3.1. La actualización se centra en una mejor "adherencia a las instrucciones", lo que significa que el modelo sigue las instrucciones textuales más de cerca que las iteraciones anteriores. Además, Veo 3.1 puede transformar imágenes estáticas en secuencias de video en movimiento mientras genera audio acompañante, una capacidad que no estaba disponible en Veo 3.

Disponibilidad e Integración

El modelo actualizado está disponible hoy a través de la API Gemini de Google. También alimenta el editor de video Flow de la empresa, donde trae nuevos controles creativos a los usuarios. Una característica destacada, llamada "Frame to Video", permite a los usuarios subir un primer y último frame, y el modelo completa el movimiento intervenido, produciendo un clip sin problemas. Esta característica se asemeja a una oferta similar de Adobe Firefly, pero la implementación de Flow también incluye la generación de audio simultánea.

Flujos de Trabajo Creativos Mejorados

Con Veo 3.1, Flow puede no solo generar nuevo contenido de video, sino también extender clips existentes e insertar objetos en metraje, todo mientras maneja audio en tiempo real. Google posiciona estas capacidades como herramientas dirigidas a profesionales que trabajan con video, en lugar de como un medio para generar fragmentos de redes sociales virales.

Rendimiento y Calidad Visual

Los videos de muestra compartidos por Google demuestran que Veo 3.1 todavía produce una calidad visual "inquietante" que varía dependiendo de la instrucción y el tema. Si bien la realidad no coincide con la de OpenAI’s Sora 2, las mejoras en la fidelidad de las instrucciones y la adición de la conversión de imagen a video representan un paso notable hacia adelante para la plataforma.

Dirección Estratégica

Al mejorar la practicidad de sus herramientas de video de IA, Google parece estar apuntando a creadores y empresas que necesitan generación de video confiable y controlable. La integración con la API Gemini y Flow sugiere una estrategia de ecosistema más amplia, que permite a los desarrolladores y editores incorporar las capacidades de Veo 3.1 directamente en sus flujos de trabajo.