Google Veo 3.1 Amplía la Generación de Video de IA con Clips Más Largos y Soporte Multi-Prompt

Puntos clave
- Veo 3.1 entrega una salida de video nativa de 1080p.
- Soporta clips de video de hasta un minuto de duración.
- La capacidad de multi-prompt permite secuencias de multi-toma.
- Los preajustes cinematográficos brindan movimientos de cámara y opciones de iluminación preconfiguradas.
- Mantiene la consistencia de los personajes en todos los fotogramas.
- Funciona con fotos, ilustraciones y personajes de dibujos animados.
- Disponible ahora a través de plataformas de terceros como Higgsfield, Imagine Art y Envato.
- Todavía no se ha integrado en Google Gemini.
El generador de video de IA de Google, Veo 3.1, se está implementando a través de servicios de terceros, ofreciendo resolución nativa de 1080p, consistencia de personajes en todos los fotogramas y la capacidad de producir videos de hasta un minuto de duración.
Descripción General
La última versión del herramienta de generación de video de IA de Google, Veo 3.1, está comenzando a aparecer en servicios de video de IA de terceros. La actualización mejora la tecnología, entregando una salida de mayor resolución y tiempos de ejecución más largos mientras mantiene la coherencia visual que definió a su predecesor.
Características y Capacidades
Las mejoras más visibles incluyen la salida de video nativa de 1080p y el soporte para clips de hasta un minuto de duración, un aumento sustancial con respecto a los clips de ocho segundos típicos de versiones anteriores. La capacidad de multi-prompt permite a los usuarios proporcionar varias instrucciones que generan múltiples escenas desde una sola imagen, permitiendo la narración de historias con múltiples tomas y personajes consistentes y transiciones de entorno sin problemas.
Se enfatiza la consistencia de los personajes: el modelo evita cambios como cambios en el color de los ojos o variaciones en el número de dedos entre tomas. Los preajustes cinematográficos brindan a los creadores movimientos de cámara preconfigurados - tomas aéreas, panorámicas, zoom y tomas de seguimiento - y opciones de iluminación y tono, reduciendo la necesidad de instrucciones manuales intrincadas.
Además de las entradas fotográficas, Veo 3.1 ha sido entrenado para trabajar con ilustraciones y personajes de dibujos animados, ampliando su aplicabilidad para proyectos creativos diversos.
Disponibilidad
Aunque Veo 3.1 aún no se ha incorporado al chatbot Gemini de Google, está accesible a través de varias plataformas de terceros. Servicios como Higgsfield, Imagine Art y Envato alojan el modelo, permitiendo a los usuarios experimentar con sus nuevas capacidades. Los desarrolladores interesados pueden unirse a las listas de espera en estos sitios para obtener acceso temprano.
Posición en el Mercado y Perspectiva
El conjunto ampliado de características posiciona a Veo 3.1 como un rival potencial a Sora 2 de OpenAI, particularmente con su funcionalidad de multi-prompt y multi-toma y soporte para videos más largos. Al ofrecer una resolución más alta, una duración extendida y una compatibilidad de entrada más amplia, Google busca proporcionar una experiencia similar a la de un estudio de producción para contenido de video generado por IA.
Mientras la integración con Gemini sigue pendiente, la implementación actual a través de servicios externos sugiere un enfoque estratégico para recopilar comentarios de los usuarios y refinar el modelo antes de una versión más amplia de lanzamiento interno.