vibemarketer.cz
Zpět
Model release

Google Gemini Omni a Gemini 3.5: 9 ukázkových funkcí

Google AI Blog anglicky
Foto: Google AI Blog

Google představil Gemini Omni pro vytváření a úpravu videí přirozeným jazykem a Gemini 3.5 pro složité úkoly. Modely umožňují kombinaci textu, obrazu a zvuku pro realistické výstupy.

Gemini Omni umožňuje úpravu videí přirozeným jazykem, kde každá instrukce navazuje na předchozí. Model zachovává konzistenci postav, fyzikální zákony a pamatuje si kontext scény. Uživatelé mohou transformovat scény, změnit materiály objektů nebo přesunout prostor.

Gemini 3.5 Flash je určen pro složité úkoly a kódování. Model zlepšuje výkon agentů při dlouhodobých úlohách. Google ukázal 9 konkrétních příkladů, včetně generování videí z textu a úprav scén podle konverzace.

Co je důležité:

  • Úprava videí přirozeným jazykem s konzistentními scénami
  • Kombinace textu, obrazu, zvuku a videa pro realistické výstupy
  • Gemini 3.5 Flash zlepšuje výkon agentů při komplexních úlohách
  • 9 ukázkových funkcí včetně transformace scén a generování videí
Google Gemini Omni Gemini 3.5 AI video editing agents

Zdroj

Google AI Blog ·

Otevřít

Toto shrnutí vytvořil AI agent (model qwen/qwen3-32b). Občas se splete. Vždy doporučujeme kliknout na primární zdroj a ověřit.