Start-up Vidby: Reden und schreiben, wie einem der Schnabel gewachsen ist
Quelle: Vidby

Start-up Vidby: Reden und schreiben, wie einem der Schnabel gewachsen ist

Vidby hat es sich zur Aufgabe gemacht, Echtzeit-Übersetzungslösungen für ­ge­schriebene und gesprochene Sprache anzubieten. Die Software ist für gängige Kommunikations­lösungen erhältlich und wird sogar von Youtube empfohlen.

Artikel erschienen in Swiss IT Magazine 2024/03

     

Online-Meetings sind in der Geschäftswelt zu einer Selbstverständlichkeit geworden und Gespräche mit einem Gegenüber, welches eine andere Sprache spricht, gehören ebenfalls vermehrt zur Tagesordnung. Spricht man nicht dieselbe Sprache, wird die Unterhaltung typischerweise auf Englisch geführt, wobei man ein englisches Meeting nur dann ganz entspannt führt, wenn man die Sprache praktisch perfekt beherrscht – da hapert es jedoch bei manchen Gesprächspartnern und, wenn man ehrlich ist, vielleicht auch bei einem selbst. Abhilfe verspricht das Schweizer Start-up Vidby, das Echtzeit-Übersetzungen sowohl für die geschriebene als auch die gesprochene Sprache anbietet. Die Geschichte des in Rotkreuz ansässigen Unternehmens, das von Eugen von Rubinberg und Alexander Konovalov 2021 gegründet wurde, reicht einige Jahre zurück.

Entwicklung eines Underdog

Die Anfänge des Echtzeitübersetzers reichen bis 2013 zurück, als von Rubinberg und Konovalov Drotr ins Leben riefen. Der Messenger für Text, Sprachanrufe und Videocalls war in der Lage, 104 geschriebene und 44 gesprochene Sprachen in Echtzeit zu übersetzen. «Forbes wurde auf dieses innovative Produkt aufmerksam und erkannte es als einen ernsthaften Konkurrenten von Skype und Viber an. Der Dienst belegte sogar den ersten Platz im Wettbewerb ‹Innovation Breakthrough 2013›», erzählt Konovalov stolz. Allerdings musste die Arbeit an der Software aufgrund von Problemen, auf die der Gründer nicht näher eingehen möchte, unterbrochen werden. 2021 starteten die beiden Männer dann mit Vidby einen neuen Anlauf.


Mit dem Wissen und mit Teilen der Software von Drotr gelang der Neustart schnell – allerdings lag der anfängliche Fokus nicht auf Meetings, sondern auf Video-Übersetzungen und -Synchronisierungen. «Vidby ist eine erschwingliche Alternative, die Übersetzungsagenturen und Synchronstudios ersetzt und schnell und genau in mehr als 70 Sprachen übersetzt», preist Konovalov sein Produkt an. Vidby hat es sogar geschafft, von Youtube offiziell als KI-Übersetzungstool empfohlen zu werden, ausserdem ist Vidby zertifizierter Microsoft-Partner.

Vielseitig aufgestellt

Nebst der Übersetzungsarbeit für You­tube-Videos bietet Vidby mittlerweile zahlreiche weitere Dienstleistungen an. So gehören die Dokumenten-Übersetzung sowie die Übersetzung und Untertitelung von Videos jeglicher Art zum Dienstleistungs-Portfolio. Auch im Programm ist der sogenannte Meet­up-Übersetzer. Dabei handelt es sich um einen Echtzeitübersetzer, der von einer beliebigen Anzahl Personen genutzt werden kann. Man tippt oder spricht als User den Input in seiner Sprache, während das oder die Gegenüber den Output als geschriebene Sprache in ihrer Sprache sehen. Besonders nützlich: Um beispielsweise mit Kunden diese Art der Kommunikation zu nutzen, reicht für diese das Scannen eines QR-Codes, um der Konversation beizutreten. Sie müssen keine dedizierte App herunterladen.


Das Steckenpferd des Unternehmens ist schliesslich der Call Translator, wie Konovalov unterstreicht. Er ermöglicht es, die eingangs erwähnten Online-Videomeetings zu führen, wobei jeder Teilnehmer in seiner eigenen Sprache spricht – Vidby kümmert sich schliesslich um die Echtzeit-Übersetzung. Die Software kann bereits jetzt nahtlos in Google Meet und demnächst in Zoom sowie Microsoft Teams integriert werden. Die Gründer bezeichnen Vidby als produkt­übergreifendes IT-Unternehmen, das sich auf Technologien des Verstehens und die Entwicklung von KI-gestützten Übersetzungslösungen spezialisiert habe. Derzeit unterstützt Vidby über 70 Sprachen. Vidby arbeitet ausserdem kontinuierlich daran, nicht nur die Standardsprache eines Landes, sondern auch jeweilige Dialekte korrekt zu interpretieren und wiederzugeben – etwa Bayerisch, Sizilianisch und natürlich auch Schweizerdeutsch in all seinen Facetten.

Viele Einzelpersonen als Kunden

Die Dienstleistungen von Vidby richten sich sowohl an Unternehmens- als auch an Privatkunden, wobei in der Anfangsphase letztere sogar im Fokus standen. Anfangs richtete sich der Videoübersetzer des Unternehmens an Private sowie Einzelunternehmer. Das dabei gewonnene Know-how und die kontinuierliche Produkt- sowie Übersetzungs-Verbesserung ermöglichten schliesslich den Einstieg in den B2B-Markt, so Konovalov. Den typischen Kunden beschreibt Konovalov als eine Einzelperson oder ein Unternehmen, das schnelle, akkurate und kostengünstige Übersetzungslösungen sucht. Dies reicht von der Erleichterung von Geschäftsgesprächen für Unternehmen bis hin zur Bereitstellung mehrsprachiger Videosynchronisationslösungen für Content Creator und Agenturen. Stand Ende 2023 zählte Vidby bereits über 90’000 Kunden, was gemäss dem Unternehmen einem Wachstum um den Faktor 18 verglichen mit dem Jahr 2022 entspricht. Rund zehn Prozent der Nutzer stammen dabei aus der Schweiz.


Wichtig sei es Vidby auch, mit seiner Preisstruktur alle Interessenten abzuholen. So ist beispielsweise die Video-Übersetzung als Basis-Produkt mit reiner KI ohne menschliche Interaktion kostenlos und die automatische Dokumenten-Übersetzung in eine Sprache kostet 22 Rappen pro Seite. Andererseits bezahlen Unternehmenskunden für den Call Translator pro Mitarbeitenden 22 Franken monatlich für 180 Minuten Meeting-Übersetzung inklusive, zusätzliche Minuten kosten extra. Für besonders grosse Kunden offeriert Vidby individuelle Angebote.

Spannende Finanzierungslösung

Begonnen hat Vidby mit Investitionen des Gründer-Duos sowie einigen weiteren privaten Investoren. Um eine fortlaufende Finanzierung und ein schnelles Wachstum zu realisieren, haben von Rubinberg und Konovalov auf eine unübliche Finanzierungsstrategie gesetzt: Sie haben die Unternehmensaktien in Token umgewandelt und sie privaten Kleinst­investoren zum Kauf angeboten. In der Anfangsphase ähnelte das Finanzierungsmodell dem Crowdfunding und wich damit vom traditionellen Weg des Risikokapitals ab. Voller Stolz weist Konovalov darauf hin, dass die Unternehmensaktien seit dem Beginn im Juli 2022 um über 500 Prozent gestiegen sind und somit diverse Start-up-Investoren angezogen werden konnten. Unter diesen Umständen geht das junge Unternehmen davon aus, den Break-even noch in diesem Jahr zu erreichen.

Breit aufgestelltes Team

Für ein Start-up ist Vidby ungewöhnlich gross, was auch damit zusammenhängt, dass viele Teammitglieder bereits bei der Entwicklung des indirekten Vorgängers Drotr involviert waren. Rund die Hälfte der F&E-Belegschaft etwa arbeitet in der Ukraine, der Heimat von Konovalov. Weitere Standorte nebst dem Sitz in Rotkreuz unterhält Vidby in den USA, in Algerien, Georgien und Spanien. Total zählt das Unternehmen über 100 Teammitglieder, wobei es den Gründern wichtig ist, auf dieser Bezeichnung zu bestehen: Klassische Arbeitsverträge werden nur in der Schweiz abgeschlossen, sodass die Bezeichnung Mitarbeitende nur hier treffend ist. Im Ausland werden Dienstleistungsverträge abgeschlossen, sodass diese Angehörigen von Vidby eben als Teammitglieder betitelt werden. Die gesamte Entwicklungsarbeit wickelt Vidby intern ab, es wird weder Personal noch Know-how oder Software dazugekauft.

Nie am Ende

Konovalov sagt, Vidby sei mit der Entwicklungsarbeit nie am Ende. Derzeit werden die Lippensynchronisation, Text-zu-Video-Ersetzung, Emotionserkennungen in der gesprochenen Sprache, Stimmklonen sowie KI-Sprachsynthese mit emotionalen Nuancen in geschlossenen Tests überprüft und entwickelt. «Im Bereich unserer IT-Produkte gibt es keinen Endpunkt, an dem wir fertig sind. Es ist ein endloser Weg der Verfeinerung», kommentiert Konovalov das Streben nach Perfektion. Der Gründer betont, dass Vidby ein ganzes Ökosystem schaffen möchte, um gesprochene und geschriebene Sprache nahtlos zu übersetzen, egal, welchen Ursprungs diese ist und ob sie gespeichert wird oder in Echtzeit stattfinden muss. «Unsere Technologie soll nicht nur Sprachbarrieren abbauen, sondern die sprachliche Vielfalt weltweit erhalten, indem für internationale Kommunikation nicht alles in Englisch abgewickelt werden muss», schliesst Konovalov ab. (dok)


Artikel kommentieren
Kommentare werden vor der Freischaltung durch die Redaktion geprüft.

Anti-Spam-Frage: Wieviele Zwerge traf Schneewittchen im Wald?
GOLD SPONSOREN
SPONSOREN & PARTNER