Googles Translatotron übersetzt gesprochene Sprache direkt in gesprochene Sprache

von Luca Cannellotto

16. Mai 2019 - Google entwickelt mit dem Projekt Translatotron einen Übersetzer, der in der Lage ist, gesprochene Sprache direkt in eine andere gesprochene Sprache zu übersetzen.

Google hat das Projekt Translatotron enthüllt. Wie der Technologiegigant in einem Beitrag im hauseigenen AI-Blog bekannt gibt, will man damit ein System entwickeln, um gesprochene Sprache direkt und ohne Umwege in eine andere gesprochene Sprache zu übersetzen. Dass Computersysteme in der Lage sind, gesprochene Sprache zu verstehen und in eine andere gesprochene Sprache zu übersetzen, ist nicht neu. Bisherige Systeme nutzen allerdings drei verschiedene Komponenten beziehungsweise Schritte, um diese Aufgabe zu erfüllen. So wird zunächst automatische Spracherkennung zur Transkription der Ausgangssprache in einen Text eingesetzt und dieser dann maschinell in die Zielsprache übersetzt. Danach wird Text-to-Speech-Synthese (TTS) angewendet, um den übersetzten Text in gesprochene Sprache zu übertragen.

Translatotron hingegen übersetzt gesprochene Sprache direkt und synthetisiert daraus gesprochenen Text in der Zielsprache. Dieses Vorgehen hat laut den Entwicklern mehrere Vorteile gegenüber kaskadierten Systemen, darunter eine höhere Inferenzgeschwindigkeit, die natürliche Vermeidung von Fehlern zwischen Erkennung und Übersetzung, die Beibehaltung der Stimme des Originalsprechers nach der Übersetzung und eine bessere Handhabung von Wörtern, die nicht übersetzt werden müssen, wie beispielsweise Namen. Weiter erklären sie, dass Translatotron damit das erste End-to-End-Modell ist, das Sprache aus einer Sprache direkt in Sprache einer anderen Sprache übersetzen kann. Es ist auch in der Lage, die Stimme des Quellsprechers in der übersetzten Sprache beizubehalten.

Copyright by Swiss IT Media GmbH / 2024