Spracherkennungsbibliothek von Mozilla umfasst jetzt 18 Sprachen
Quelle: Mozilla

Spracherkennungsbibliothek von Mozilla umfasst jetzt 18 Sprachen

Mozilla hat die neueste Version von Common Voice veröffentlicht, einer Open-Source-Sammlung von transkribierten Sprachdaten, die nun über 1400 Stunden Sprachproben von 42'000 Mitwirkenden in 19 Sprachen umfasst.
28. Februar 2019

     

Im vergangenen Jahr hat Mozilla daran gearbeitet, seine Common Voice Initiative um Open Source Spracherkennungsdatensätze in weiteren Sprachen zu erweitern. Mozilla hatte Common Voice im Juni 2017 erstmals angekündigt und lud Freiwillige aus der ganzen Welt ein, Textausschnitte mit ihrer Stimme über Web und mobile Apps aufzunehmen.

Jetzt hat die Organisation die neuste Version von Common Voice veröffentlicht, die nunmehr in 18 verschiedenen Sprachen verfügbar ist, darunter Niederländisch, Hakha-Chin, Esperanto, Farsi, Baskisch, Spanisch, Französisch, Deutsch, Mandarin-Chinesisch (traditionell), Walisisch und Kabyle. Die Sammlung besteht aus 1400 Stunden aufgezeichneten Sprachclips von 42'000 Mitwirkenden.


Dabei handelt es sich um einen der grössten mehrsprachigen Datensätze seiner Art, behauptet Mozilla, und der Korpus soll bald noch grösser werden. Das Unternehmen sagt, dass die Datenerhebung in 70 Sprachen aktiv im Gange ist. (swe)


Weitere Artikel zum Thema

Firefox 66 blockt automatische Tonwiedergabe

5. Februar 2019 - Automatisch abspielende Tonspuren und Videos auf Websites können ein Ärger für Benutzer sein. Mozilla verspricht mit der kommenden Firefox-Version endlich Abhilfe.

Mozilla beendet Experimentierprogramm Test Pilot

16. Januar 2019 - Der Firefox-Entwickler stellt das seit drei Jahren verfügbare Test-Pilot-Programm zum Austesten experimenteller Firefox-Features per sofort ein. In Zukunft werde es aber eher mehr als weniger Experimente geben.

Mozilla gibt 500 Stunden Sprachdaten frei

30. November 2017 - Mozilla hat hunderttausende Sprachaufnahmen gesammelt und diese jetzt zum kostenlosen Download freigegeben. Mit der offenen Datenbank können Forscher und Entwickler ihre Spracherkennungsprojekte weiter vorantreiben – denn Sprach-Interfaces werden im Umgang mit Geräten eine immer wichtigere Rolle spielen.


Artikel kommentieren
Kommentare werden vor der Freischaltung durch die Redaktion geprüft.

Anti-Spam-Frage: Was für Schuhe trug der gestiefelte Kater?
GOLD SPONSOREN
SPONSOREN & PARTNER