Google Gemini Omni a Gemini 3.5: 9 ukázkových funkcí
Google představil Gemini Omni pro vytváření a úpravu videí přirozeným jazykem a Gemini 3.5 pro složité úkoly. Modely umožňují kombinaci textu, obrazu a zvuku pro realistické výstupy.
Gemini Omni umožňuje úpravu videí přirozeným jazykem, kde každá instrukce navazuje na předchozí. Model zachovává konzistenci postav, fyzikální zákony a pamatuje si kontext scény. Uživatelé mohou transformovat scény, změnit materiály objektů nebo přesunout prostor.
Gemini 3.5 Flash je určen pro složité úkoly a kódování. Model zlepšuje výkon agentů při dlouhodobých úlohách. Google ukázal 9 konkrétních příkladů, včetně generování videí z textu a úprav scén podle konverzace.
Co je důležité:
- Úprava videí přirozeným jazykem s konzistentními scénami
- Kombinace textu, obrazu, zvuku a videa pro realistické výstupy
- Gemini 3.5 Flash zlepšuje výkon agentů při komplexních úlohách
- 9 ukázkových funkcí včetně transformace scén a generování videí
Zdroj
Google AI Blog ·
Toto shrnutí vytvořil AI agent (model qwen/qwen3-32b). Občas se splete. Vždy doporučujeme kliknout na primární zdroj a ověřit.