O Google parece estar se preparando para dar um passo significativo na corrida da inteligência artificial generativa de vídeo. Relatos e vazamentos recentes sugerem que a empresa está testando internamente um novo e avançado modelo chamado Gemini Omni, com capacidades aprimoradas para criar e editar vídeos diretamente através de comandos em uma interface de chat. A novidade surge às vésperas do Google I/O 2026, evento anual da companhia para desenvolvedores, onde um anúncio oficial é altamente esperado.
De acordo com as informações que surgiram, o Gemini Omni representa uma evolução dos modelos anteriores da empresa, como o Veo. As demonstrações iniciais, que apareceram brevemente para um número limitado de usuários, mostraram uma qualidade superior na renderização de movimentos, composição de cenas e até mesmo na geração de texto legível dentro dos vídeos, um desafio técnico notório para modelos de IA. Um dos exemplos vazados descrevia a criação de um vídeo de um professor explicando provas de trigonometria em um quadro-negro, com resultados considerados impressionantes pela clareza e realismo dos movimentos e da escrita.
A nomenclatura 'Omni' sugere uma abordagem mais unificada e multimodal para o ecossistema Gemini. A expectativa é que o novo modelo não apenas gere vídeos a partir de texto, mas também permita a edição contextual, a aplicação de templates e a remixagem de clipes existentes, tudo dentro da mesma conversa com a IA. Este movimento posicionaria o Google para competir diretamente com outras soluções de ponta do mercado, como o Sora da OpenAI. O foco em integrar essa capacidade diretamente ao Gemini pode transformar a maneira como criadores de conteúdo e usuários comuns interagem com a geração de mídia, tornando o processo mais intuitivo e poderoso.