Google hat das Projekt Translatotron enthüllt. Wie der Technologiegigant in einem
Beitrag im hauseigenen AI-Blog bekannt gibt, will man damit ein System entwickeln, um gesprochene Sprache direkt und ohne Umwege in eine andere gesprochene Sprache zu übersetzen. Dass Computersysteme in der Lage sind, gesprochene Sprache zu verstehen und in eine andere gesprochene Sprache zu übersetzen, ist nicht neu. Bisherige Systeme nutzen allerdings drei verschiedene Komponenten beziehungsweise Schritte, um diese Aufgabe zu erfüllen. So wird zunächst automatische Spracherkennung zur Transkription der Ausgangssprache in einen Text eingesetzt und dieser dann maschinell in die Zielsprache übersetzt. Danach wird Text-to-Speech-Synthese (TTS) angewendet, um den übersetzten Text in gesprochene Sprache zu übertragen.
Translatotron hingegen übersetzt gesprochene Sprache direkt und synthetisiert daraus gesprochenen Text in der Zielsprache. Dieses Vorgehen hat laut den Entwicklern mehrere Vorteile gegenüber kaskadierten Systemen, darunter eine höhere Inferenzgeschwindigkeit, die natürliche Vermeidung von Fehlern zwischen Erkennung und Übersetzung, die Beibehaltung der Stimme des Originalsprechers nach der Übersetzung und eine bessere Handhabung von Wörtern, die nicht übersetzt werden müssen, wie beispielsweise Namen. Weiter erklären sie, dass Translatotron damit das erste End-to-End-Modell ist, das Sprache aus einer Sprache direkt in Sprache einer anderen Sprache übersetzen kann. Es ist auch in der Lage, die Stimme des Quellsprechers in der übersetzten Sprache beizubehalten.
(luc)