OpenAIs Voice Engine imitiert Stimmen

OpenAIs Voice Engine imitiert Stimmen

In Entwicklung seit Ende 2022, ermöglicht Voice Engine von OpenAI, menschliche Stimmen realistisch nachzuahmen – und das auf Basis einer 15-sekündigen Audioaufnahme.
2. April 2024

     

OpenAI hat eine neue KI-Anwendung namens Voice Engine vorgestellt. Voice Engine imitiert Stimmen von Menschen täuschend echt auf Basis einer kurzen Audioaufnahme von 15 Sekunden Dauer. Die Technologie ist seit Ende 2022 in Entwicklung – OpenAI präsentiert in einem Blogbeitrag bereits verschiedene Praxisbeispiele und merkt an, die Software sei in der Lage, realistische Stimmen mit Gefühl zu generieren.

Als mögliche Anwendungsfälle für Voice Engine führt der Beitrag Leseunterstützung für Kinder und des Lesens nicht fähiger Personen, Übersetzung der Sprachinhalte von Videos und Podcasts, Unterstützung für nicht sprechfähige Menschen sowie die Unterstützung von Patienten beim Wiedererlangen der Sprechfähigkeit im Fall von onkologisch oder neurologisch bedingten Problemen auf.


OpoenAI gibt gleichzeitig an, sich des Risikos von stimmimitierenden Technologien bewusst zu sein. Man arbeite deswegen mit US- und internationalen Partnern wie Behörden, Medien, Unterhaltungsindustrie, Bildungswesen sowie der Zivilgesellschaft zusammen. "Wir sind der Meinung, dass jeder breite Einsatz synthetischer Sprachtechnologien mit einer Stimmauthentifizierung einhergehen sollte, die sicherstellt, dass der ursprüngliche Sprecher seine Stimme wissentlich dem Dienst hinzufügt, sowie mit einer No-Go-Stimmenliste, die die Erstellung von Stimmen, die prominenten Persönlichkeiten zu ähnlich sind, erkennt und verhindert", heisst es in dem Blogpost abschliessend. (ubi)


Weitere Artikel zum Thema

Von wegen gemeinnützig: Musk wollte OpenAI unter seine Kontrolle bringen

6. März 2024 - Elon Musk macht Schlagzeilen, indem er OpenAI verklagt, das er selbst mitgegründet hat. Nun kontern die anderen Gründer hart – und veröffentlichen gar E-Mails von Musk.

OpenAIs Sora wandelt Textprompts in Videos um

19. Februar 2024 - Das neue Text-to-Video-Modell Sora von OpenAI generiert aus simplen Texteingaben kurze Filme, die erstaunlich professionell daherkommen. Nutzbar vorerst für wenige Risokobewertungsexperten, dürfte Sora die Videoerstellung gehörig aufmischen, sobald es allgemein verfügbar wird.

OpenAI kennzeichnet KI-generierte Bilder

9. Februar 2024 - Ab dem 12. Februar werden alle via ChatGPT oder Dall-E3 erstellten Bilder mit Metadaten gekennzeichnet. Allerdings liefern die C2PA-Metadaten bestenfalls einen Hinweis, da sie problemlos manipuliert werden können.


Artikel kommentieren
Kommentare werden vor der Freischaltung durch die Redaktion geprüft.

Anti-Spam-Frage: Wieviele Fliegen erledigte das tapfere Schneiderlein auf einen Streich?
GOLD SPONSOREN
SPONSOREN & PARTNER