Google macht Objekterkennungs-API frei zugänglich

Die von Google intern für die Bildersuche und Street View genutzte Tensor Flow Object Detection API dient der automatischen Erkennung von Objekten auf Bildern. Das Unternehmen hat das System nun als Open-Source-Projekt frei zugänglich gemacht.

20. Juni 2017

Google hat mit der Tensor Flow Object Detection API ein System entwickelt, mittels welchem sich auf Bildern automatisch Objekte erkennen lassen. Das Unternehmen nutzt diese Technologie bereits in verschiedenen Anwendungen, wie etwa der Bildersuche, Street View oder auch in der Android-Photo-App. Nun hat Google das System als Open-Source-Projekt veröffentlicht, wodurch dieses frei zugänglich ist.

Das Framework baut dabei auf das von Google entwickelte Machine-Learning Framework Tensor Flow auf. Zur Objekterkennung sind bereits einige Erkennungsmodelle enthalten, darunter ein Single Shot Multibox Detector (SSD), Region-based Convolutional Neural Neworks (R-CNN) und Region-based Fully Convolutional Networks (R-FCN) sowie auch darauf aufbauende Erweiterungen. Ebenfalls inbegriffen ist ein Jupyter Notebook. Mit einer Version des Faster R-CNN hatte Google 2016 die Microsoft COCO (Common Objects in Context) Detection Challenge gewonnen.

Google hat bereits im September 2016 mit "Show and Tell" ein Framework veröffentlicht, mit welchem automatisch Bildunterschriften erstellt werden können, während Konkurrent Facebook im Sommer 2016 mit Deepmask und Sharpmask ebenfalls Open-Source-Bibliotheken veröffentlichte, welche Objekte innerhalb von Bildern erkennen können. Auch Microsoft und IBM bieten mit den Cognitive Services, respektive der Watson API Bilderkennungsfunktionen an. (swe)