Umfragenanalyse mit Codit.co

Das Zürcher Start-up Codit.co ist ein Projekt zweier ETH-Absolventen, die mit ihrer Machine-Learning-Lösung die Analyse und Verarbeitung offener Textantworten in Umfragen effizienter gestalten wollen.

Artikel erschienen in Swiss IT Magazine 2018/11

Maurice Gonzenbach und Pascal de Buren sind die Inhaber von Caplena mit Sitz in Zürich. Die beiden Endzwanziger sind Abgänger der Eidgenössischen Technischen Hochschule und kennen sich bestens aus mit grossen Datenmengen und Machine Learning. Gemeinsam arbeiten sie in einem Coworking-Space in der ehemaligen Tennishalle des Hotel Bellerive an der Zürcher Kreuzstrasse an ihren Projekten. Ihr jüngster Spross heisst Codit.co und ist eine Plattform, die darauf spezialisiert ist, offene Textantworten in Umfragen automatisch zu analysieren und die Inhalte zu kategorisieren und zu quantifizieren.

Gonzenbach, der einen Abschluss in Computational Sciences und Engineering besitzt, und de Buren, der ein Studium in Interdisciplinary Sciences absolviert hat, haben sich während der Arbeit für die studentische Unternehmung ETH Juniors kennengelernt. Hier kam die Idee auf, gemeinsam etwas Eigenes auf die Beine zu stellen. "Als wir fast gleichzeitig mit dem Studium fertig wurden, haben wir angefangen, uns zu überlegen, was wir zusammen entwickeln könnten", so Maurice Gonzenbach. Und Pascal de Buren ergänzt: "Maurice hatte für seine Masterarbeit eine Technologie auf der Basis von Machine Learning entwickelt, mit deren Hilfe man Sentiment-Analysen durchführen kann. Wir hatten also eine Cutting-Edge-Technologie, aber noch keine Anwendung dafür. Wir wussten aber, dass diese etwas mit künstlicher Intelligenz und mit Text zu tun haben musste." Auch de Buren hatte bereits Erfahrung mit Machine Learning, hauptsächlich auf dem Gebiet der Chemie und der Physik.

Auf der Suche nach der zündenden Idee

Die beiden ETH-Absolventen begannen, verschiedene Geschäftsideen auszuprobieren, jedoch seien diese nicht zielführend gewesen, so Gonzenbach: "Wir waren in dieser Zeit aber viel unterwegs und haben Konferenzen besucht, um unsere Use Cases zu präsentieren. An einer solchen Konferenz in Berlin kamen nach unserem Vortrag zwei Marktforschungsunternehmen auf uns zu und erklärten uns, dass die Verarbeitung offener Textantworten in ihren Umfragen zu aufwendig sei, und dass sie auf der Suche nach einer Lösung dafür seien." Die beiden Entwickler erhielten daraufhin Daten von den interessierten Unternehmen und begannen, damit zu experimentieren. "Weil unser Ansatz gut funktionierte, haben wir entschieden, dass es sich lohnen könnte, daraus ein Produkt zu entwickeln. So ist unsere Geschäftsidee entstanden", erzählt Maurice Gonzenbach.

Ihre Reisen und die Entwicklung der Prototypen haben die zwei Unternehmer zunächst aus den eigenen Ersparnissen finanziert, aber auch durch Nebenprojekte. "Wir haben unter anderem eine Bilderkennungslösung entwickelt, die Schäden an Fahrzeugen erkennen und klassifizieren kann", erklärt de Buren. Die Software sei in der Lage, sowohl das betroffene Bauteil als auch die Art des Schadens zu erkennen sowie die Schadenssumme zu beziffern. Wie Maurice Gonzenbach betont, sei das Ziel jedoch, sich mittelfristig gänzlich auf Codit.co konzentrieren zu können, aber das werde noch eine gewisse Zeit dauern: "Wir überlegen uns zwar laufend, ob es sich lohnen würde, Investoren an Bord zu holen, aber wir wollen zuerst unsere Lösung weiter verfeinern und unsere Marktnische noch besser verstehen. Ausserdem ist uns auch bewusst, dass wir durch den Einfluss von Investoren einen Teil unserer Unabhängigkeit aufgeben müssten, weshalb ein solcher Schritt zumindest in den nächsten Monaten nicht auf unserer Agenda steht."

Die KI liest mit

Im Oktober letzten Jahres haben die beiden Gründer mit der Entwicklung eines ersten Prototyps von Codit.co begonnen, und bereits im Dezember konnten ausgewählte Unternehmen mit einer Testversion arbeiten. Im Februar dieses Jahres ging schliesslich die erste Iteration der Lösung online und heute ist Codit.co bereits ein fertiges Produkt, das auch schon einige Kunden von sich überzeugen konnte. "Zu unserem Kundenstamm zählen unter anderem mehrere Marktforschungsinstitute, aber auch Telekommunikationsanbieter. Diese haben die Antworten auf offene Fragen in ihren Umfragen bis anhin meist von Hand in Excel kategorisiert beziehungsweise codiert und ausgewertet. Andere haben die Codierung bis vor wenigen Jahren sogar noch handschriftlich vorgenommen. Mit unserer Lösung ist der Prozess ähnlich wie bis anhin, aber sie nutzen dafür unsere Web App, die durch ein intuitives User Interface und verschiedene Features wie einer automatischen Übersetzung die Arbeit erleichtert", sagt Pascal de Buren.

Der Clou sei aber die künstliche Intelligenz, die im Hintergrund aus den Eingaben lerne, dadurch immer besser werde und die Codierung dann auch weitgehend selbst vornehmen könne, erklärt de Buren weiter. Die Nutzer müssten dann nur noch die wenigen unklaren Codierungen von Hand validieren, welche von der KI nicht genau genug erkannt wurden, wodurch der Aufwand letzten Endes viel geringer sei als mit herkömmlichen Methoden. Und Maurice Gonzenbach ergänzt: "Unsere Lösung kann mehr, als nur einzelne Wörter zu erkennen. Sie kann auch verstehen, wenn unterschiedliche Ausdrücke eine ähnliche Bedeutung haben. So erkennt der Algorithmus zum Beispiel, dass ‹das Personal war unfreundlich› und ‹das Personal war nicht sehr zuvorkommend› inhaltlich das Gleiche meinen."

Die Grundidee von Codit.co sei Augmented Intelligence, führt Gonzenbach weiter aus. Der Begriff beschreibe die Funktionsweise der Software gut, denn die künstliche Intelligenz unterstütze den Menschen bei seiner Arbeit und mache ihn dadurch effizienter. Dabei gebe es hauptsächlich zwei Probleme zu lösen: Zum einen die Interaktion zwischen Mensch und Maschine, damit sichergestellt sei, dass beide Seiten die gleiche Sprache sprechen, und zum anderen der technische Aspekt der Lösung, also dass der eingesetzte Algorithmus sinnvolle Vorhersagen machen könne: "Der Algorithmus funktioniert mit von Menschen vorgegebenen Beispielen, analysiert sie und versucht sie zu verstehen. Dabei kommt ein generalisiertes Wortmodell zum Einsatz, das rund zwei Millionen Wörter umfasst und deren Bedeutung der Algorithmus in sehr abstrakter Form als Vektor speichert. Das Modell beinhaltet dann Relationen zwischen den verschiedenen Wörtern. So weiss der Algorithmus beispielsweise, dass die Wörter ‘Mann’ und ‘Frau’ in Beziehung zueinander stehen, und dass dieses Verhältnis mathematisch ähnlich ist wie bei den Wörtern ‘König’ und ‘Königin’. Der Algorithmus wurde mit einer grossen Menge an Informationen vortrainiert und lernt dann die Feinjustierung, also den Kontext der jeweiligen Umfrage, anhand der Beispiele des Nutzers." Wichtig sei, so Gonzenbach, dass der Algorithmus schon mit einer relativ kleinen Datenmenge umzugehen lerne, um nicht auf riesige Datensätze angewiesen zu sein. Daran arbeite man gegenwärtig und sei auf gutem Wege, die Performance weiter zu verbessern.

Der Blick in die Zukunft

Codit.co läuft auf AWS-Servern in Deutschland und ist über die Web App zugänglich, die beiden Entwickler bieten aber auch die Möglichkeit, die Lösung mittels API an die Systeme der Kunden anzubinden, damit die eingehenden Datensätze einer Umfrage direkt in die Datenbank von Codit.co eingespielt und dort analysiert werden können. "Was wir bis anhin noch nicht anbieten, sind fertige Integrationen. In Zukunft werden wir dies aber womöglich ins Auge fassen, vielleicht auch als Partner einer etablierten Software", so Gonzenbach.

Zwar gebe es bereits Lösungen in diesem Segment, diese würden allerdings anders funktionieren oder hätten nicht denselben Fokus. Einen direkten Konkurrenten, der eine vergleichbare Lösung auf der Basis von Machine Learning im Bereich der Marktforschung anbietet, kenne man jedoch nicht, so die beiden Entwickler. Die Genauigkeit der Analyse und der Ergebnisse von Codit.co ist laut Pascal de Buren im besten Fall besser als die menschliche Kodierung, im schlechtesten Fall "nur" besser als die Kodierung mit anderen Lösungen.

Aus diesem Grund haben die beiden Unternehmer auch relativ klare Ziele vor Augen, wie etwa, den Algorithmus so zu verbessern, dass er immer weniger auf den Input des Menschen angewiesen ist. Aber auch das Wachstum des Start-ups haben sie im Blick, wie Maurice Gonzenbach sagt: "Natürlich haben wir Wachstumspläne und entsprechende Ziele. Allerdings handelt es sich bei unseren Kunden um Unternehmen, teilweise auch grössere, bei denen es länger dauert, bis man die richtigen Ansprechpersonen gefunden hat und Entscheidungen getroffen werden. Vom ersten Kundenkontakt bis zu dem Moment, in dem Geld auf unserem Konto eingeht, dauert es eben eine Weile."

Und es gibt auch technologische Grenzen. So handle es sich beim Machine Learning nicht um eine Intelligenz, wie die eines Menschen, und auch das Sprachverständnis sei noch weit von den Fähigkeiten eines Menschen entfernt. Heute verfügbare Algorithmen seien zwar sehr raffinierte Gebilde, jedoch lediglich in der Lage, komplexe Muster relativ schnell zu erkennen. Eine grosse Herausforderung bleibe deshalb weiterhin, eine solche Technologie, die im wissenschaftlichen Kontext gut funktioniere, in ein erfolgreiches Produkt zu überführen, betont Gonzenbach. Aus diesem Grund arbeiten Maurice Gonzenbach und Pascal de Buren weiter an der Verbesserung von Codit.co. Im Vordergrund stehen derzeit die weitere Automation der Plattform, die Verfeinerung des Algorithmus und nicht zuletzt die Implementierung von Enterprise Features, die von Kunden angefragt wurden, wie beispielsweise ein User-Rollen-Management. So dirigieren die beiden Jungunternehmer ihr Start-up mit bedachten Schritten zielgerichtet in die nächste Wachstumsphase. (luc)

Artikel kommentieren