O Gerador de Vídeo Sora da OpenAI Não Atende às Expectativas no Teste de Explicador de FIV

Pontos principais
- Repórter usou o Sora para gerar cliques de vídeo relacionados à FIV para um explicador.
- A maioria das saídas continha imprecisões científicas e texto com erros de digitação.
- Erros visuais incluíam membros extras, anatomia malformada e fluidos irrealistas.
- Alguns cliques de bebês recém-nascidos se aproximaram do realismo após uma extensa ajuste de prompts.
- O teste destaca as limitações atuais do vídeo gerado por IA para tópicos médicos especializados.
- Criadores devem antecipar a necessidade de edição significativa ou fontes alternativas de imagens.
- Melhorias futuras podem tornar o Sora mais viável para narrativas visuais precisas.
Um repórter que passa por FIV testou o gerador de vídeo Sora da OpenAI para criar imagens para um explicador sobre a indústria de fertilidade. Embora a ferramenta tenha produzido alguns cliques úteis, a maioria das saídas continha erros científicos gritantes, textos sem sentido e erros visuais, como anatomia mal posicionada e membros extras. O experimento destaca as limitações atuais do vídeo gerado por IA para narrativas médicas especializadas e sugere que os criadores devem abordar o Sora com cautela até que suas capacidades melhorem.
Contexto e Motivação
Um jornalista que atualmente está passando por fertilização in vitro (FIV) buscou utilizar o Sora, um sistema de geração de vídeo impulsionado por IA da OpenAI, para produzir imagens realistas de B-roll para um explicador sobre a indústria de fertilidade. O objetivo era reduzir os desafios da produção em câmera e obter elementos visuais que complementassem o comentário pessoal.
Processo de Teste
O repórter acessou o Sora diretamente por meio de sua interface de chat e inseriu prompts que descreviam cenas específicas relacionadas à FIV, como desenvolvimento de embriões, anatomia reprodutiva feminina e configurações de medicação. Vários prompts foram iterados, com ajustes feitos para melhorar a fidelidade visual e corrigir erros textuais.
Principais Conclusões
A maioria dos cliques gerados apresentou deficiências significativas. Detalhes científicos frequentemente eram imprecisos - pratos de embriões mostravam objetos mal posicionados, e diagramas anatômicos continham terminologia com erros de digitação. Sobreposições de texto apresentavam palavras sem sentido e frases confusas, claramente indicando conteúdo gerado por IA. Anomalias visuais incluíam dedos extras, membros malformados e representações de fluidos irrealistas em equipamentos médicos.
Alguns cliques, como um close-up de um bebê recém-nascido, se aproximaram do realismo e foram considerados aceitáveis. No entanto, mesmo esses só obtiveram sucesso após uma extensa refinação de prompts e ainda apresentaram erros ocasionais, como contagem de dedos incorreta.
Implicações para Criadores de Conteúdo
O experimento destaca que, embora o Sora possa produzir material visual básico, ele luta com a precisão específica do domínio e os detalhes visuais nuances necessários para narrativas médicas. Criadores que visam tópicos de alto risco, especialmente aqueles que envolvem imagens científicas precisas, devem antecipar a necessidade de edição pós-produção extensiva ou fontes suplementares de imagens em stock.
Conclusão
O Sora da OpenAI mostra promessa em democratizar a criação de vídeo, mas suas limitações atuais o tornam inadequado para representações detalhadas e precisas de procedimentos médicos complexos. O repórter planeja revisitar a ferramenta uma vez que novas versões se tornem disponíveis, mas aconselha cautela para aqueles que buscam conteúdo visual confiável e sem erros em campos especializados.