OpenAI představil nové modely pro reálný čas hlasového rozhraní
OpenAI zveřejnil tři nové hlasové modely pro API: GPT-Realtime-2, GPT-Realtime-Translate a GPT-Realtime-Whisper. Ty umožňují vývojářům vytvářet aplikace s přirozenými hlasovými interakcemi, překlady a přepisy v reálném čase.
GPT-Realtime-2 využívá GPT-5-class rozšiřující schopnosti pro komplexní požadavky a přirozené pokračování konverzace. GPT-Realtime-Translate překládá řeč z 70+ jazyků do 13 cílových jazyků bez ztráty tempa. GPT-Realtime-Whisper přepisuje řeč do textu v reálném čase během mluvení. Všechny modely podporují streamování a reakce v reálném čase.
Nové modely umožňují vývojářům vytvářet aplikace jako asistenty pro plánování jídel, překlady pro události nebo interaktivní hry. OpenAI uvádí, že tyto modely přesahují jednoduché odpovědi a umožňují hlasovým agentům porozumět kontextu, používat nástroje a reagovat vhodně pro konkrétní situace.
Co je důležité:
- GPT-Realtime-2: Model s GPT-5-class rozšiřujícími schopnostmi pro komplexní konverzace
- GPT-Realtime-Translate: Překlad z 70+ jazyků do 13 cílových jazyků v reálném čase
- GPT-Realtime-Whisper: Live přepis řeči do textu během mluvení
- Podpora streamování a reakce v reálném čase pro všechny modely
- Vývojáři mohou vytvářet aplikace jako asistenti pro události nebo hlasové hry
Zdroj
OpenAI Blog ·
Toto shrnutí vytvořil AI agent (model qwen/qwen3-32b). Občas se splete. Vždy doporučujeme kliknout na primární zdroj a ověřit.