El Proyecto Genie de Google Permite a los Usuarios Crear Mundos Interactivos de IA desde Fotos o Prompts

Puntos clave
- El Proyecto Genie convierte fotos o prompts de texto en mundos 3D interactivos y cortos.
- Cada mundo generado se puede explorar durante un máximo de 60 segundos antes de que finalice la sesión.
- Los usuarios pueden remixar mundos preestablecidos con nuevos personajes y estilos visuales.
- El prototipo se ejecuta en la suscripción de AI Ultra de Google, con un precio de $250 por mes.
- El acceso está limitado a una aplicación web dedicada y no es parte de Gemini.
- Las limitaciones incluyen retraso en la entrada, una sola sesión de 60 segundos y restricciones de contenido en evolución.
- Las pruebas iniciales permitieron versiones de juegos de estilo, pero más tarde los prompts fueron bloqueados debido a preocupaciones de terceros.
Google ha presentado el Proyecto Genie, un prototipo de investigación que transforma una foto o un prompt de texto en un mundo 3D interactivo y corto. Los usuarios pueden explorar cada entorno generado durante un máximo de 60 segundos, remixar escenas preestablecidas y descargar grabaciones de video de su experiencia.
Presentando el Proyecto Genie
El último experimento de IA de Google, el Proyecto Genie, permite a los usuarios convertir una simple foto o un prompt de texto en un mundo 3D interactivo que se puede explorar durante un máximo de 60 segundos. El sistema genera un video corto de la exploración, que los usuarios pueden descargar para su uso posterior. Además de crear nuevos mundos, Genie permite a los usuarios "remixar" entornos preestablecidos existentes agregando nuevos personajes y estilos visuales, expandiendo las posibilidades creativas dentro de la plataforma.
Cómo Funciona la Experiencia
Una vez que se ingresa un prompt, Genie produce un video de IA generativo que simula un entorno inmersivo. Los usuarios pueden ejecutar el mismo prompt varias veces, recibiendo resultados ligeramente diferentes cada vez debido al proceso generativo subyacente. El prototipo incluye una función que permite a los usuarios explorar el mundo durante un período breve, típicamente 60 segundos, antes de que finalice la sesión. Durante este tiempo, el sistema puede exhibir algún retraso en la entrada, reflejando las demandas computacionales de la generación de video de IA en tiempo real.
Limitaciones Actuales
Google enfatiza que el Proyecto Genie es aún un prototipo de investigación, y varias limitaciones están incorporadas en la experiencia. La sesión interactiva se limita a una sola exploración de 60 segundos, y la función de "eventos promocionales" demostrada en versiones anteriores no está disponible aún. Los testers han informado de inexactitudes ocasionales en la física y elementos visuales que no se comportan como se espera. Las restricciones de contenido también evolucionan; las pruebas iniciales permitieron la generación de versiones de juegos populares como Super Mario y The Legend of Zelda, pero más tarde esos prompts fueron bloqueados debido a preocupaciones sobre contenido de terceros.
Acceso y Precio
Actualmente, el Proyecto Genie solo es accesible a través de una aplicación web dedicada y no está integrado en la aplicación o sitio web de Gemini de Google. El acceso requiere una suscripción de AI Ultra, que cuesta $250 por mes. Google nota que el alto costo refleja el gasto de generar video de IA a gran escala, y la empresa planea ampliar la disponibilidad con el tiempo.
Perspectiva Futura
Aunque todavía es experimental, el Proyecto Genie demuestra la ambición de Google de combinar video generativo con experiencias interactivas. La capacidad de remixar mundos, descargar videos de exploración y generar rápidamente nuevos entornos desde prompts simples destaca una posible nueva dirección para la creación de contenido impulsada por IA. A medida que Google continúa perfeccionando el prototipo, puede abordar los actuales problemas de rendimiento, extender la duración de las sesiones y relajar las restricciones de contenido, haciendo que la herramienta sea más accesible para una audiencia más amplia.