cnt
OpenAI veröffentlicht Audio-KI-Modelle für Sprachanwendungen

OpenAI veröffentlicht Audio-KI-Modelle für Sprachanwendungen

Open AI hat drei neue KI-Modelle für die Audioverarbeitung lanciert. Diese sind in der Lage, Konversationen zu führen, Gesprochenes in Echtzeit zu übersetzen oder zu transkribieren.
9. Mai 2026

     

KI-Pionier OpenAI hat drei neue Echtzeit-Audio-Modelle für Entwickler angekündigt. Bei den neuen Modellen handelt es sich um GPT-Realtime-2, GPT-Realtime-Translate sowie GPT-Realtime-Whisper. Sie verstehen sich mit natürlichen Sprachinteraktionen, Live-Übersetzungen oder Sprach-Transkriptionen mit geringer Verzögerung.

Wie der Konzern in einem Blog Post ausführt, soll GPT-Realtime-2 in der Lage sein, mit komplexen Anfragen umzugehen und eine Konversation natürlich voranzubringen. Im verlinkten Blog-Beitrag wird ein Demo-Applet zur Verfügung gestellt, über das man GPT-Realtime-2 testen kann. Bei GPT Realtime Translate handelt es sich weiter um ein Modell für Live-Übersetzungen, das über 70 Sprachen in 13 Sprachen in Echtzeit zu übersetzen vermag. Ebenfalls um ein Live-Modell handelt es sich bei GPT-Realtime-Whisper, das Gesprochenes in Texte umwandelt.


Alle drei neuen Sprachmodelle werden über OpenAIs Realtime API zur Verfügung gestellt. Für GPT Realtime 2 bezahlt man 32 Dollar für eine Million Audio Input Tokens und 64 Dollar für dieselbe Menge Output Tokens. GPT Realtime Translate schlägt mit 3,4 Cents und GPT Realtime Whisper mit 1,7 Cent pro Minute zu Buche. (rd)


Weitere Artikel zum Thema

GPT-5.5 Instant wird ChatGPT-Standard

6. Mai 2026 - OpenAI ersetzt das Standardmodell von ChatGPT durch GPT-5.5 Instant. Das Update soll Antworten genauer, kürzer und persönlicher machen.

OpenAI entwickelt angeblich eigenes Smartphone ohne Apps

29. April 2026 - OpenAI könnte bald in Konkurrenz zu Apple, Samsung und Co. gehen. Laut einem Analysten arbeitet der KI-Spezialist derzeit an einem eigenen Smartphone, das neue Wege gehen könnte.

OpenAI stellt Version 2.0 von ChatGPT Images vor

22. April 2026 - Die zweite Major-Version von OpenAIs Bildgenerator ChatGPT Images soll deutlich genauer sein und mehr Kontext verarbeiten als der Vorgänger. Damit ist nun beispielsweise auch die Erstellung detaillierter Schrift in Bildern möglich.

Teams bekommt zwei neue KI-Funktionen

13. März 2026 - Microsoft kündigt neue KI-Funktionen für Teams-Meetings an. Geplant sind automatische Spracherkennung für Untertitel und Transkripte sowie Video-Highlights für Zusammenfassungen von Besprechungen.


Artikel kommentieren
Kommentare werden vor der Freischaltung durch die Redaktion geprüft.

Anti-Spam-Frage: Was für Schuhe trug der gestiefelte Kater?
GOLD SPONSOREN
SPONSOREN & PARTNER