Model release

Google Gemini Omni a Gemini 3.5: 9 ukázkových funkcí

Google AI Blog 29. 5. 2026 17:30 anglicky

Foto: Google AI Blog

Google představil Gemini Omni pro vytváření a úpravu videí přirozeným jazykem a Gemini 3.5 pro složité úkoly. Modely umožňují kombinaci textu, obrazu a zvuku pro realistické výstupy.

Gemini Omni umožňuje úpravu videí přirozeným jazykem, kde každá instrukce navazuje na předchozí. Model zachovává konzistenci postav, fyzikální zákony a pamatuje si kontext scény. Uživatelé mohou transformovat scény, změnit materiály objektů nebo přesunout prostor.

Gemini 3.5 Flash je určen pro složité úkoly a kódování. Model zlepšuje výkon agentů při dlouhodobých úlohách. Google ukázal 9 konkrétních příkladů, včetně generování videí z textu a úprav scén podle konverzace.

Co je důležité:

Úprava videí přirozeným jazykem s konzistentními scénami
Kombinace textu, obrazu, zvuku a videa pro realistické výstupy
Gemini 3.5 Flash zlepšuje výkon agentů při komplexních úlohách
9 ukázkových funkcí včetně transformace scén a generování videí

Google Gemini Omni Gemini 3.5 AI video editing agents

Zdroj

Google AI Blog · 29. 5. 2026 17:30

Otevřít zdroj Otevřít

Toto shrnutí vytvořil AI agent (model qwen/qwen3-32b). Občas se splete. Vždy doporučujeme kliknout na primární zdroj a ověřit.