Videokommunikation neu definiert
Quelle: Perceptiko

Startup Perceptiko

Videokommunikation neu definiert

Perceptiko ist ein noch junges Spin-off der ETH und will mit Catcheye die Videochat-Welt erobern und revolutionieren. Die ­Lösung soll Menschen mit verbesserter Videokommunikation einander näher bringen.

Artikel erschienen in Swiss IT Magazine 2017/09

     

Das Problem ist so alt wie die Videokommunikation selbst: Wenn man in die Kameralinse schaut, dann sieht man im Normalfall das Bild des Gegenübers auf dem Bildschirm nicht, und umgekehrt schaut man dem Gegenüber nicht in die Augen, wenn man auf den Bildschirm starrt, anstatt in die Kamera zu sehen. Dieses Dilemma untergräbt eine zentrale Funktion der Videochat-Technologie, nämlich die Distanz zu überbrücken, die durch die digitale Kommunikation zwischen den Menschen entsteht. Das Zürcher Start-up Perceptiko, das Anfang 2017 als Spin-off der ETH gegründet wurde, hat sich diesem Problem angenommen und mit Catcheye eine Software entwickelt, die das Potential hat, die Videokommunikation zu revolutionieren. "Swiss IT Magazine" hat sich mit Jan Rüegg, Chief Technology Officer bei Perceptiko, über das Unternehmen und die Technologie hinter Catcheye unterhalten.
"Entstanden ist die Idee zu Catcheye bereits während der Doktorarbeit von Claudia Plüss, der heutigen CEO von Perceptiko, die sie an der ETH unter der Aufsicht von Professor Markus Gross verfasst hat", erklärt Jan Rüegg. Das Thema ihrer Forschung war Telepresence, also die Entwicklung von Lösungen für die Videokommunikation, um Menschen einander näher zu bringen, die sich in Wirklichkeit nicht am selben Ort befinden. Eines von vielen Projekten drehte sich rund um das Problem des fehlenden Augenkontaktes während eines Videochats. Claudia Plüss hat ihre Beobachtungen in einem wissenschaftlichen Paper veröffentlicht, worauf die ETH ein Patent auf die darin beschriebene Technologie angemeldet hat. Laut Jan Rüegg stiess dies auf reges Interesse und es gab in der Folge immer wieder Anfragen zum Stand der Entwicklung. Daraus entstand die Idee, mit einem Pioneer Fellowship der ETH ein Start-up zu gründen und die Technologie zu kommerzialisieren. Neben Claudia Plüss waren anfänglich Markus Gross und Craig Gotsman, Professor für Computer Engineering am Technion – Israel Institute of Technology, an der Entwicklung beteiligt. Es war schliesslich Gross, der Jan Rüegg an Bord holte, nachdem dieser 2012 bei ihm den Master-Abschluss mit einer Spezialisierung in Visual Computing gemacht hatte. Zu viert entwickelten sie die Lösung unter dem Namen Catcheye. Seit 2015 arbeiten Jan Rüegg und Claudia Plüss nun Vollzeit an der Technologie.

Augenkontakt bringt die ­Menschen einander näher

Die Software generiert ein 3D-Modell der Gesichter der Teilnehmer eines Videochats und überlagert das reale Bild, das von der Kamera aufgenommen wird, in Echtzeit mit einer digitalen Version des Gesichtes, dessen Augen in die Kamera schauen, selbst wenn es die Person davor in Wirklichkeit nicht tut, sondern in den Bildschirm schaut. Die grösste Hürde dabei ist jedoch, das Ganze so natürlich wie möglich aussehen zu lassen, ohne dass das Gegenüber merkt, dass die Augen, die ihn ansehen, nur das Produkt eines Algorithmus sind. "Am besten funktioniert die Korrektur bis zu einem Winkel von circa 15 Grad", erklärt Rüegg. Wird der Winkel grösser, können Bildartefakte entstehen, doch daran arbeiten die jungen Unternehmer noch. Dasselbe gelte auch für Mobilgeräte, für die ebenfalls eine Lösung entwickelt werden soll: "Der Abstand zwischen dem Gesicht und der Kamera ist bei einem Mobilgerät in der Regel kleiner als bei einem PC, dennoch bleibt der Winkel, in dem sich das Gesicht zur Kameralinse befindet, in etwa der gleiche." Catcheye ist allerdings nicht der erste Versuch einer Lösung des Problems mit dem Augenkontakt, wie Rüegg erklärt: "Schon viele haben sich damit auseinandergesetzt, auch in der Forschung. Es gibt auch schon erste Produkte, so zum Beispiel Hardware, die mit Spiegel arbeitet. Solche Lösungen sind allerdings für viele Szenarien wenig praktikabel und dazu noch teuer. Aus diesem Grund haben wir uns entschieden, eine reine Software-Lösung anzustreben, die vielfältig einsetzbar ist."
Die Korrektur des Blickwinkels ist aber nur eine von mehreren Funktionen, mit denen Catcheye aktuell ausgestattet ist. "Wir haben schon bald begonnen, uns zu fragen, wie man die Videokommunikation noch weiter verfeinern könnte. Da die Software bereits die wichtigsten Merkmale des Gesichtes der Nutzer bestimmt und wir dadurch wissen, wo die Augen liegen, können wir die Informationen nutzen, um personalisierte Verbesserungen des Bildes anzubieten." Es gibt zum Beispiel eine Zoomfunktion, die den Nutzer vor der Kamera vergrössert und so überschüssigen Hintergrund ausblendet. Dieser liesse sich aber auch komplett verbergen beziehungsweise durch irgendein Bild ersetzen. Man kann den Hintergrund auch verschwimmen lassen, sodass der Fokus auf die Person im Vordergrund gerichtet ist, und nicht zuletzt lässt sich die Ausleuchtung der Szene verbessern, was vor allem dann zum Tragen kommt, wenn das Bild zu hell, zu dunkel oder das Licht unregelmässig verteilt ist. Auch kann die Software die Proportionen des Gesichtes korrigieren. Wie Jan Rüegg ausführt, werden Gesichter von der Kamera durch die geringe Distanz zur Linse oft verzerrt dargestellt. Auch dieses Problem lässt sich mit der Hilfe des virtuellen 3D-Gesichtes zumindest teilweise entschärfen. Die Berechnungen führt Catcheye direkt auf der jeweiligen Hardware aus, weshalb diese eine gewisse Leistung benötigt. "Wir optimieren den Code natürlich laufend, aber momentan wird der Grossteil der Rechenlast auf die Grafikkarte ausgelagert, weshalb diese mindestens OpenGL 4.3 unterstützen muss. Das ist jedoch kaum ein Problem, denn selbst neuere integrierte Grafikkarten schaffen die Berechnungen ohne grosse Mühe", versichert Rüegg.

Auf die richtigen Investoren kommt es an

Um Kapital für das Projekt aufzunehmen und dessen Fortbestehen zu sichern, hat das junge Start-up verschiedene Wege beschritten. Eine erste Einlage kam von der Plattform Venture Kick in Form von Seed-Kapital und weitere Zuschüsse flossen über mehrere Start-up-Wettbewerbe in das Projekt. Das Pioneer Fellowship blieb bis zu dessen Auslaufen im Dezember 2016 aber die wichtigste Einnahmequelle. "Zu dieser Zeit waren wir bereits mit diversen potentiellen Investoren im Gespräch", so Rüegg. Aus diesem Grund habe man sich für die Gründung der Firma Perceptiko entschieden. "Seitdem finanzieren wir uns aus dem Rest des Gründungskapitals und hatten auch schon ein erstes Kundenprojekt. Ausserdem stehen wir kurz vor Abschluss einer Finanzierungsrunde." Damit wolle man weitere Mitarbeiter finanzieren, freut sich Rüegg, der die Lösung aktuell noch zusammen mit Claudia Plüss quasi im Alleingang weiterentwickelt. Das Ziel sei, in einem Jahr rund acht Mitarbeiter zu beschäftigen.
Catcheye ist schon weit fortgeschritten, weshalb die junge Firma auf ihrer Webseite eine Demoversion umsonst zum Download anbietet. Nach der Installation wird Catcheye als Kamera aufgeführt, die man mit verschiedenen Videochat-Programmen nutzen kann. Einzige Einschränkung: im Bild wird das Firmenlogo angezeigt. Wie Jan Rüegg betont, besteht die Zielgruppe des Produktes jedoch nicht aus Privatkunden: "Die Demoversion ist nur als Testumfeld gedacht. Wir erhalten dadurch sehr viele wertvolle Rückmeldungen und Verbesserungsvorschläge." Letztlich ginge es vor allem darum, die Technologie an Unternehmen zu lizenzieren, damit diese sie in ihre Soft- oder Hardware implementieren können. Gespräche laufen bereits, noch kann Perceptiko aber keine Details preisgeben. (luc)


Artikel kommentieren
Kommentare werden vor der Freischaltung durch die Redaktion geprüft.

Anti-Spam-Frage: Aus welcher Stadt stammten die Bremer Stadtmusikanten?
GOLD SPONSOREN
SPONSOREN & PARTNER