Runway Apresenta Primeiro Modelo de Mundo e Melhora o Gen 4.5 com Áudio Nativo

Runway releases its first world model, adds native audio to latest video model

Pontos principais

  • Runway lança o GWM-1, seu primeiro modelo de mundo baseado em previsão de vídeo frame a frame.
  • Três variantes especializadas são introduzidas: GWM-Worlds, GWM-Robotics e GWM-Avatars.
  • GWM-Worlds gera cenas interativas a 24 fps e resolução 720p.
  • GWM-Robotics cria dados sintéticos com condições variáveis para testes de robôs.
  • GWM-Avatars produz avatares humanos realistas para comunicação e treinamento.
  • Modelo de vídeo Gen 4.5 recebe áudio nativo, edição de diálogo e capacidades de multi-tiros.
  • Gen 4.5 atualizado permite vídeos mais longos e coesos com personagens e som consistentes.
  • Ambas as inovações estão disponíveis para usuários de planos pagos; um SDK para GWM-Robotics está por vir.
  • Runway está engajada com empresas de robótica e empresas para aplicar suas novas ferramentas de simulação.

Runway introduziu seu inaugural modelo de mundo, GWM-1, um sistema de IA video-cêntrico que prevê pixels frame a frame para simular física, geometria e iluminação. O lançamento inclui três variantes especializadas - GWM-Worlds para cenas interativas, GWM-Robotics para geração de dados sintéticos e GWM-Avatars para simulações humanas realistas. Em paralelo, a empresa atualizou seu modelo de vídeo Gen 4.5 com áudio nativo, edição de diálogo e geração de multi-tiros, permitindo que os usuários criem vídeos mais longos e coesos com personagens e som de fundo consistentes.

Lançamento do Modelo de Mundo

Runway anunciou o GWM-1, seu primeiro modelo de mundo construído em uma abordagem de previsão de vídeo frame a frame. Ao aprender uma simulação interna de como o mundo se comporta, o modelo pode raciocinar sobre física, geometria e iluminação sem precisar de treinamento explícito para cada cenário. A empresa posiciona o GWM-1 como uma solução mais geral em comparação com as ofertas existentes, enfatizando sua capacidade de servir como um motor de simulação para domínios diversificados.

Variantes Especializadas: Worlds, Robotics e Avatars

Três extensões personalizadas acompanham o modelo principal. O GWM-Worlds permite que os usuários criem projetos interativos ao solicitar uma cena ou fornecer uma referência de imagem; o modelo então preenche o espaço com física realista a 24 fps e resolução 720p. O GWM-Robotics se concentra em dados sintéticos enriquecidos com variáveis como mudanças climáticas e obstáculos, visando revelar como os robôs podem violar políticas em diferentes condições. O GWM-Avatars tem como alvo o comportamento humano, oferecendo avatares realistas para comunicação, treinamento e outras aplicações. Embora cada variante opere como um modelo separado hoje, a Runway planeja unificá-las em um único sistema.

Atualização do Gen 4.5: Áudio Nativo e Geração de Multi-Tiros

Além do lançamento do modelo de mundo, a Runway atualizou seu modelo de vídeo Gen 4.5. A melhoria adiciona capacidades de áudio nativo, permitindo que os usuários gerem diálogo, som de fundo e editem faixas de áudio existentes diretamente dentro de projetos de vídeo. A geração de multi-tiros agora suporta histórias mais longas e com múltiplos ângulos com personagens consistentes em todos os tiros. Os usuários podem produzir vídeos de um minuto que combinam movimentos de câmera complexos, diálogo nativo e paisagens sonoras realistas, reduzindo a distância com suites de vídeo competidoras.

Disponibilidade e Parcerias

Os GWM-Robotics e o modelo Gen 4.5 atualizado estão disponíveis para todos os assinantes de planos pagos. A Runway também anunciou que um SDK para o GWM-Robotics será lançado, e a empresa está em discussões ativas com várias empresas de robótica e empresas para explorar aplicações práticas de suas capacidades de dados sintéticos e avatares. O lançamento sinaliza a mudança da Runway de pesquisas em nível de protótipo para ferramentas de produção prontas para criadores, desenvolvedores e parceiros da indústria.

#Runway#GWM-1#Modelo de Mundo#Gen 4.5#Áudio Nativo#Vídeo de Multi-Tiros#Geração de Vídeo de IA#Robótica#Avatares#Dados Sintéticos

Também disponível em:

Runway Apresenta Primeiro Modelo de Mundo e Melhora o Gen 4.5 com Áudio Nativo | AI News