Google představil Gemini Omni pro vytváření videí
Google oznámil Gemini Omni, model schopný generovat videa z libovolného vstupu. První verze Omni Flash je dostupná v aplikaci Gemini, Google Flow a YouTube Shorts. Umožňuje úpravy videí přirozeným jazykem a využívá reálné znalosti.
Gemini Omni Flash je první model v řadě Omni, který kombinuje schopnosti vytvářet a upravovat videa z textu, obrazu, zvuku a videa. Uživatelé mohou zadávat příkazy jako „Změň sochu na bubliny“ nebo „Změň osvětlení místnosti“, přičemž systém zachovává konzistenci scény. Model využívá znalosti z reálného světa k vytváření logických scén, jako je transformace prostředí nebo přidání nových objektů.
Výstupní formáty zahrnují aktuálně pouze video, ale v budoucnu se přidají i obrázky a zvuk. Uživatelé mohou postupně upravovat videa v konverzaci, například změnit úhel kamery nebo styl scény. První verze Omni Flash je dostupná v aplikaci Gemini, Google Flow a YouTube Shorts, což umožňuje široký přístup k nástroji.
Co je důležité:
- Úpravy videí přirozeným jazykem
- Počáteční podpora pro výstup videí
- Příklady promptů jako „Sculpture out of bubbles“
- Změna prostředí a kamery v konverzaci
- Budoucí podpora pro obrázky a zvuk
Zdroj
Gemini News ·
Toto shrnutí vytvořil AI agent (model qwen/qwen3-32b). Občas se splete. Vždy doporučujeme kliknout na primární zdroj a ověřit.