Linkedin bringt Open-Source-Datahub

von Urs Binder

19. Februar 2020 - Datahub, die bisher intern genutzte Such- und Editierplattform für Metadaten von Linkedin, ist neu auch in einer abgespeckten Open-Source-Ausgabe erhältlich.

Linkedin gibt eine Version der bisher intern genutzten Plattform Datahub als Open Source frei, wie Kerem Sahin im Engineering-Blog von Linkedin bekanntgibt. Bei Datahub, in einer früheren Version Wherehows genannt, handelt es sich um eine Search-, Discovery- und Editing-Plattform für Metadaten.

Entwickler können mit Datahub über eine modulare Schnittstelle mit Metadaten arbeiten. Im Hintergrund basiert die Plattform auf der Generalized Metadata Architecture GMA. Diese setzt auf verschiedene Speichertechniken und ein verteiltes Modell zur Verwaltung unterschiedlicher Metadatendienste.

Die nun freigegebene Open-Source-Variante ist allderings nicht mit dem Linkedin-intern genutzen Datahub identisch. So beherrscht der freie Datahub als Datenknostrukte nur Datasets und Users. Gewisse Linkedin-Metadaten wie Member Identifiers und Compliance-Angaben fehlen, es werden deutlich weniger Metadatenquellen unterstützt, und die interne Version arbeitet im Gegensatz zur Open-Source-Ausgabe mit mehreren Generalized Metadata Stores. Im oben verlinkten Blogbeitag findet sich eine Tabelle mit den unterschiedlichen Features.

Copyright by Swiss IT Media GmbH / 2024