Swisscom entwickelt Spracherkennung für Schweizerdeutsch

von Rosa Pegam

26. April 2018 - Das KI-Team von Swisscom arbeitet an einem Spracherkennungssystem für Schweizerdeutsch. Das ist etwas Neues, denn wegen der vergleichsweise wenigen Sprecher gibt es bisher nur eine Handvoll Systeme, die Schweizerdeutsch verarbeiten können. Der Hauptfokus liegt bei dem Swisscom-Projekt auf Sprachdialogsystemen, die bei Hotlines Anwendung finden.

Sprachdialogsysteme finden mittlerweile auf breiter Front Verwendung. Allerdings orientieren sich die Entwickler solcher Systeme zumeist auf Sprachen, die viele Sprecher haben wie etwa Englisch oder Mandarin. Obwohl Dialekte dabei etwas stiefmütterlich behandelt werden, gibt es bereits einige wenige Systeme, die sich auf Schweizerdeutsch bedienen lassen. So gibt es etwa eine SBB-App für das Heraussuchen von Zugverbindungen und auch das Multimediasystem der neuen A-Klasse von Mercedes besitzt einen Lernalgorithmus, der sich mit der Zeit auf schweizerdeutsche Eingaben trainieren lassen können soll.

Swisscom steigt jetzt auch hier ein und arbeitet an Systemen mit Mundarterkennung und Stimmbiometrie-Lösungen. In erster Linie zielen die Entwickler dabei auf Interactive-Voice-Response, eine Sorte Sprachdialogsystem, die bei Hotlines Einsatz findet. Im Idealfall würden dann Dialekt sprechende Schweizer von der KI passende Antworten auf ihre Fragen erhalten. Sollte dies nicht funktionieren, soll das System den Kunden dann anhand von erkannten Stichwörtern an menschliche Sachbearbeiter weiterleiten können. Dank automatisierter Rückübersetzung werden dann sogar sprachübergreifende Auskünfte möglich, heisst es in einer Mitteilung von Swisscom dazu.

Es ist ein langer Weg, bis so ein System funktioniert: Der Spracherkenner ordnet zunächst schweizerdeutschen Ausdrücken jeweils das hochdeutsche Pendant zu. In iterativer Herangehensweise durch Korrekturen der Übersetzungen lernt der Algorithmus dann konstant dazu. So sollen auch unterschiedliche Dialekte verarbeitet werden können. Den Anfang machen Zürich- und Berndeutsch als meistegesprochene Dialekte. Da das System ganze Sätze verarbeiten können soll, seien für die Entwicklung und das Trainieren des Systems sind 3000 Stunden gesprochener Sprache notwendig, erklärt Philipp Egolf, Projektverantwortlicher für Spracherkennung bei Swisscom.

Die KI wird auch mit Daten aus den eigenen Reihen trainiert. Swisscom-Angestellte stellen Sprachsamples zur Verfügung, mit denen das System verbessert werden soll. Erste Tests wie die Heidi-und-Peter-Challenge, bei der Swisscom-Angestellte ihre Sprachproben abgeben konnten, verliefen gut, sind aber erst der Anfang: "Wir perfektionieren das System, indem wir erste Prototypen mit noch mehr Daten testen", erklärt Egolf. So soll die Lösung bald Schweizerdeutsch in seiner ganzen Dialektvielfalt meistern.

Copyright by Swiss IT Media GmbH / 2024