- Google lançou a família de modelos generativos Omni, começando pela versão Omni Flash, que gera vídeos a partir de entrada de imagem, vídeo ou texto e pode manter personagens consistentes ao longo das cenas, disponível na plataforma Flow.
- Em testes, a autora deepfakeou o brinquedo de pelúcia do filho, Buddy, para simular férias, avaliando a diferença entre diversão com IA e usos mais invasivos.
- Omni aceita prompts textuais para editar vídeos existentes, e, em comparação com a versão Veo, apresentou melhorias na incorporação de informações do mundo real, embora nem tudo saia perfeito.
- Os resultados continuam variados: algumas criações ficaram mais fiéis ao prompt, mas ainda surgem falhas perceptíveis, como mudanças de orientação durante cenas de pular de paraquedas ou objetos que aparecem/ sumem de forma inconsistente.
- Gerar vídeos envolve créditos, variando de quinze a quarenta créditos por cena, com quarenta créditos para cada rodada de edições; planos pagos, como o AI Pro de vinte dólares por mês, oferecem crédito mensal que pode se esgotar após várias criações.
O Google anunciou Omni, a nova família de modelos generativos da linha Gemini, capaz de transformar inputs como foto, vídeo e texto em novas imagens ou clipes. Em Flow, a plataforma de geração e edição de vídeos, Omni já substitui Veo em parte das funções.
A experiência descrita envolve um usuário que testou a ferramenta em vídeos. O objetivo foi avaliar a capacidade de manter consistência de personagens, realismo e aplicação de prompts de texto para editar cenas já gravadas. A ideia era comparar os resultados com Veo.
Omni permite enviar um vídeo e combiná-lo a um prompt textual para gerar criações. A empresa afirma que o modelo possui maior conhecimento de mundo real e melhor consistência de personagens ao longo do material. Resultados, porém, variam conforme o conteúdo.
Desempenho e custos
Os clipes gerados consomem créditos, com valores variados conforme duração e elementos usados. Um ciclo de edições pode chegar a 40 créditos. Planos pagos permitem abatimento mensal, mas o saldo pode cair rapidamente com várias alterações.
Em testes, houve melhorias em relação a Veo, com maior fidelidade às instruções textuais. Ainda assim, algumas falhas aparecem, como mudanças de orientação ao realizar cenas de salto e elementos que aparecem ou somem sem justificativa.
O autor também testou deepfakes com vídeos próprios. Em uma sequência, apareceu uma pessoa ao fundo e detalhes artificiais no áudio. Apesar disso, clips pareceram convincentes para terceiros sem conhecimento prévio, o que reforça o desafio ético de uso de IA em vídeo.
Implicações e considerações
A reportagem destaca que, mesmo com avanços, o nível de realismo ainda revela pistas de geração artificial. A experiência mostra que ferramentas como Omni podem ampliar a possibilidade de criar conteúdos enganosos com pouco esforço, o que reforça a necessidade de uso responsável e de verificação de fatos.
Entre na conversa da comunidade