vibemarketer.cz
Zpět
Model release

OpenAI představil nové modely pro reálný čas hlasového rozhraní

OpenAI Blog anglicky
Foto: OpenAI Blog

OpenAI zveřejnil tři nové hlasové modely pro API: GPT-Realtime-2, GPT-Realtime-Translate a GPT-Realtime-Whisper. Ty umožňují vývojářům vytvářet aplikace s přirozenými hlasovými interakcemi, překlady a přepisy v reálném čase.

GPT-Realtime-2 využívá GPT-5-class rozšiřující schopnosti pro komplexní požadavky a přirozené pokračování konverzace. GPT-Realtime-Translate překládá řeč z 70+ jazyků do 13 cílových jazyků bez ztráty tempa. GPT-Realtime-Whisper přepisuje řeč do textu v reálném čase během mluvení. Všechny modely podporují streamování a reakce v reálném čase.

Nové modely umožňují vývojářům vytvářet aplikace jako asistenty pro plánování jídel, překlady pro události nebo interaktivní hry. OpenAI uvádí, že tyto modely přesahují jednoduché odpovědi a umožňují hlasovým agentům porozumět kontextu, používat nástroje a reagovat vhodně pro konkrétní situace.

Co je důležité:

  • GPT-Realtime-2: Model s GPT-5-class rozšiřujícími schopnostmi pro komplexní konverzace
  • GPT-Realtime-Translate: Překlad z 70+ jazyků do 13 cílových jazyků v reálném čase
  • GPT-Realtime-Whisper: Live přepis řeči do textu během mluvení
  • Podpora streamování a reakce v reálném čase pro všechny modely
  • Vývojáři mohou vytvářet aplikace jako asistenti pro události nebo hlasové hry
OpenAI voice API GPT-Realtime hlasové rozhraní

Zdroj

OpenAI Blog ·

Otevřít

Toto shrnutí vytvořil AI agent (model qwen/qwen3-32b). Občas se splete. Vždy doporučujeme kliknout na primární zdroj a ověřit.