OpenAI veröffentlicht Audio-KI-Modelle für Sprachanwendungen

Quelle: Depositphotos

OpenAI veröffentlicht Audio-KI-Modelle für Sprachanwendungen

Open AI hat drei neue KI-Modelle für die Audioverarbeitung lanciert. Diese sind in der Lage, Konversationen zu führen, Gesprochenes in Echtzeit zu übersetzen oder zu transkribieren.

9. Mai 2026

KI-Pionier OpenAI hat drei neue Echtzeit-Audio-Modelle für Entwickler angekündigt. Bei den neuen Modellen handelt es sich um GPT-Realtime-2, GPT-Realtime-Translate sowie GPT-Realtime-Whisper. Sie verstehen sich mit natürlichen Sprachinteraktionen, Live-Übersetzungen oder Sprach-Transkriptionen mit geringer Verzögerung.

Wie der Konzern in einem Blog Post ausführt, soll GPT-Realtime-2 in der Lage sein, mit komplexen Anfragen umzugehen und eine Konversation natürlich voranzubringen. Im verlinkten Blog-Beitrag wird ein Demo-Applet zur Verfügung gestellt, über das man GPT-Realtime-2 testen kann. Bei GPT Realtime Translate handelt es sich weiter um ein Modell für Live-Übersetzungen, das über 70 Sprachen in 13 Sprachen in Echtzeit zu übersetzen vermag. Ebenfalls um ein Live-Modell handelt es sich bei GPT-Realtime-Whisper, das Gesprochenes in Texte umwandelt.

Alle drei neuen Sprachmodelle werden über OpenAIs Realtime API zur Verfügung gestellt. Für GPT Realtime 2 bezahlt man 32 Dollar für eine Million Audio Input Tokens und 64 Dollar für dieselbe Menge Output Tokens. GPT Realtime Translate schlägt mit 3,4 Cents und GPT Realtime Whisper mit 1,7 Cent pro Minute zu Buche. (rd)

Weitere Artikel zum Thema

GPT-5.5 Instant wird ChatGPT-Standard

6. Mai 2026 - OpenAI ersetzt das Standardmodell von ChatGPT durch GPT-5.5 Instant. Das Update soll Antworten genauer, kürzer und persönlicher machen.

OpenAI entwickelt angeblich eigenes Smartphone ohne Apps

29. April 2026 - OpenAI könnte bald in Konkurrenz zu Apple, Samsung und Co. gehen. Laut einem Analysten arbeitet der KI-Spezialist derzeit an einem eigenen Smartphone, das neue Wege gehen könnte.

OpenAI stellt Version 2.0 von ChatGPT Images vor

22. April 2026 - Die zweite Major-Version von OpenAIs Bildgenerator ChatGPT Images soll deutlich genauer sein und mehr Kontext verarbeiten als der Vorgänger. Damit ist nun beispielsweise auch die Erstellung detaillierter Schrift in Bildern möglich.

Teams bekommt zwei neue KI-Funktionen

13. März 2026 - Microsoft kündigt neue KI-Funktionen für Teams-Meetings an. Geplant sind automatische Spracherkennung für Untertitel und Transkripte sowie Video-Highlights für Zusammenfassungen von Besprechungen.

Artikel kommentieren

Digitale Souveränität - fünf Handlungsempfehlungen

Digitale Souveränität - fünf Handlungsempfehlungen

Datensouveränität, Informationssicherheit und Minimierung digitaler Risiken für kleine und mittelgrosse Unternehmen, unterstützt durch Dokumentenmanagement – Jürg und Reto Zgraggen von Bluebat im Interview.

IBM FlashSystem 2026: Der schnelle Speicher mit KI-Immunsystem

IBM FlashSystem 2026: Der schnelle Speicher mit KI-Immunsystem

Das grösste IBM FlashSystem-Update seit fünf Jahren ist da: Mit der fünften Generation der FlashCore-Module setzt IBM neue Massstäbe bei Dichte und Sicherheit – mit KI-Unterstützung. Weitergehende agentenbasierte KI-Funktionalität soll im Herbst 2026 folgen.

Vom Dokument zur Entscheidungsplattform

Vom Dokument zur Entscheidungsplattform

Informationsmanagement entscheidet über Effizienz und Wettbewerbsfähigkeit. Doch viele Initiativen bleiben hinter den Erwartungen zurück. Warum Prozesse, Governance, KI und Integration entscheidend sind – und wie aus Dokumenten echte Entscheidungsgrundlagen werden.

CRA umsetzen, ohne Entwicklung auszubremsen

CRA umsetzen, ohne Entwicklung auszubremsen

Der Cyber Resilience Act wird zur Marktvoraussetzung für digitale Produkte. Die eigentliche Herausforderung ist nicht das Gesetz zu verstehen, sondern es in Entwicklung, Betrieb und Lieferkette konkret umzusetzen.

Meetingräume: Die Erfolgsfaktoren

Meetingräume: Die Erfolgsfaktoren

Meetingraumlösungen sind heute technologisch ausgereift und breit verfügbar. Ein gut ausgestatteter Meetingraum erhöht Produktivität, Zusammenarbeit und Professionalität, unabhängig davon, ob es sich um kurze Teammeetings, Workshops oder Kundenpräsentationen handelt.

Smarte Analyseplattform statt MDM

Smarte Analyseplattform statt MDM

MDM-Lösungen verwalten Geräte, analysieren sie aber nur begrenzt. Neue Plattformen wie HP WXP schaffen mehr Transparenz, erkennen Probleme frühzeitig und helfen IT-Abteilungen, ihre Infrastruktur proaktiv und effizient zu steuern.

GOLD SPONSOREN

SPONSOREN & PARTNER