Runway Apresenta Modelo de Texto para Vídeo Gen-4.5 com Precisão Física Sem Precedentes

A Runway anunciou seu novo modelo de IA de texto para vídeo Gen-4.5, alegando que ele entrega precisão física e precisão visual sem precedentes. O modelo lida melhor com prompts complexos, renderizando movimento de objetos realistas, dinâmica de fluidos e uma variedade de estilos visuais sem sacrificar a qualidade do vídeo.

Runway Apresenta o Modelo Gen-4.5

Em um post de blog publicado na segunda-feira, a Runway detalhou o lançamento de seu sistema de IA de texto para vídeo mais recente, designado Gen-4.5. A empresa descreve o modelo como alcançando "precisão física e precisão visual sem precedentes", posicionando-o como um passo à frente das versões anteriores.

De acordo com a Runway, o Gen-4.5 melhora a aderência aos prompts do usuário, permitindo a geração de cenas detalhadas enquanto mantém a qualidade do vídeo. O modelo é capaz de renderizar objetos com peso, momento e força realistas e simular líquidos que fluem com dinâmica adequada. A Runway também observa que o sistema pode produzir uma variedade de estilos visuais, desde fotorealistas até estilizados e cinematográficos.

Lançamento e Desempenho

A Runway planeja um lançamento gradual do Gen-4.5 para todos os usuários, prometendo a mesma velocidade e eficiência de seu antecessor. Apesar das melhorias, a empresa reconhece desafios existentes. Especificamente, o Gen-4.5 pode ter dificuldades com a permanência de objetos e o raciocínio causal, levando a cenários em que os efeitos precedem as causas - por exemplo, uma porta se abrindo antes de o trinco ser usado.

Contexto da Indústria: Esforços Paralelos da OpenAI

O anúncio chega enquanto a OpenAI também está expandindo suas capacidades de texto para vídeo. A OpenAI destacou melhorias de física em seu modelo Sora 2, lançado em setembro. O Sora 2 é descrito como capaz de modelar ações complexas com precisão, como saltos para trás em uma prancha de paddleboard, com dinâmica de fluidos e flutuação realistas.

Implicações para Vídeo Gerado por IA

Tanto a Runway quanto a OpenAI estão avançando em direção a um vídeo gerado por IA que rivaliza com gravações do mundo real. A Runway afirma que visuais fotorealistas criados com o Gen-4.5 podem ser "indistinguíveis de footagens do mundo real com detalhes e precisão realistas". A convergência de simulação de física avançada e estilização visual refinada sugere um futuro em que o conteúdo de vídeo de IA pode se tornar cada vez mais indistinguível e mais difícil de diferenciar da mídia tradicional.

Olhando para o Futuro

O Gen-4.5 da Runway e o Sora 2 da OpenAI representam marcos significativos na evolução da tecnologia de vídeo gerativo. Embora as melhorias na realidade e na fidelidade dos prompts sejam evidentes, questões em andamento, como a permanência de objetos e o raciocínio causal, destacam áreas para pesquisas adicionais. À medida que essas ferramentas se tornam mais amplamente disponíveis, criadores e audiências alike provavelmente encontrarão conteúdo de vídeo impulsionado por IA que desdobra a linha entre experiências visuais sintéticas e autênticas.