Datenmigration: Ein strategisches Projekt

von Simon Wegmüller

31. August 2019 - Know-how Die Migration von Daten kann vielerlei Gründe haben. Sei es der Wechsel von einem System zu anderen, von Datenbank zu Datenbank oder Kundendaten in die Cloud: Migrationsprojekte werden früher oder später vor Herausforderungen gestellt.

Big Data treibt heute viele moderne Unternehmen an. Das bedeutet aber auch, dass für die Datenintegration und die Migration von Daten etablierte, nahtlose Prozesse vorhanden sein müssen - egal, ob Daten von einem Repository in ein anderes oder von einem Data Warehouse in oder durch die Cloud migriert werden. Ohne einen kompetenten Migrationsplan können Unternehmen ihr Budget überschreiten, plötzlich vor nicht zu meisternden Datenprozessen stehen oder feststellen, dass ihre Datenoperationen die darin gesetzten Erwartungen nicht erfüllen.

Probleme von Beginn weg verhindern

Unabhängig vom genauen Zweck einer Datenmigration gilt in der Regel das Ziel, dadurch die Leistung und Wettbewerbs­fähigkeit zu verbessern. Weniger oder nicht erfolgreiche Datenmigrationen können aber beispielsweise zu ungenauen Daten führen, die Redundanzen und unbekannte Anomalien enthalten. Dies kann selbst dann geschehen, wenn die Quelldaten bislang problemlos nutzbar und dem Zweck gerecht wurden. Darüber hinaus können alle Probleme, die in den Quelldaten vorhanden sind, verstärkt werden, wenn sie in ein neues, komplexeres System migriert werden.

Eine vollständige und gut durchdachte Datenmigrationsstrategie verhindert genau solche Probleme. Abgesehen von verpassten Deadlines und Budgetüberschreitungen können fehlerhafte Migrationspläne aber auch dazu führen, dass Migrationsprojekte ganz scheitern. Bei der Planung und Strategie der Arbeit muss der Migration deshalb die volle Aufmerksamkeit geschenkt werden.


Strategische Datenmigration

Ein strategisch durchdachter Datenmigrationsplan sollte zumindest die folgenden kritischen Faktoren beinhalten:
Kenntnis der Daten: Vor der Migration sollten die Quelldaten einem vollständigen Audit unterzogen werden. Unerwartete Probleme können auftreten, wenn dieser Schritt ignoriert wird.
Bereinigung: Sobald Probleme mit den Quelldaten identifiziert wurden, müssen diese behoben werden. Dies kann je nach Umfangs und Art der nötigen Arbeiten zusätzliche Softwaretools und Ressourcen Dritter erfordern.
Wartung und Schutz: Daten können mit der Zeit degradieren, was sie unzuverlässig machen kann. Deshalb sollten regelmässig Kontrollen zur Aufrechterhaltung der Datenqualität durchgeführt werden.
Governance: Die Nachverfolgung der Datenqualität ist wichtig, da dadurch ein besseres Verständnis der Datenintegrität ermöglicht wird. Die Prozesse und Werkzeuge, die zur Erstellung dieser Informationen verwendet werden, sollten benutzerfreundlich sein und nach Möglichkeit Funktionen automatisieren.

Zusätzlich zu einem strukturierten, schrittweisen Vorgehen sollte ein Datenmigrationsplan auch einen Prozess zur Bereitstellung der richtigen Software und Tools für das Projekt beinhalten. Es existieren verschiedene Vorgehensweisen, eine Datenmigrationsstrategie zu entwickeln. Die spezifischen Geschäftsanforderungen eines Unternehmens können helfen, festzustellen, welche Strategie am besten geeignet ist. Die meisten Strategien lassen sich jedoch in eine von zwei Kategorien einteilen: Eine "explosive" Migration (Big-Bang-Migration), oder eine langsamere, inkrementale Übertragung von ­Daten (Trickle-Migration). Bei einer schnellen Datenmigration wird die vollständige Übertragung innerhalb eines begrenzten Zeitfensters abgeschlossen: Live-Systeme können ausfallen, etwa wenn während der ­Migration in eine neue Datenbank Daten die ETL-­(Extract, Transform, Load)-Verarbeitung durchlaufen.

Der Clou dieser Methode ist aber, dass alles in einem Zeitrahmen passiert, der relativ klein ist. Dadurch kann der Druck auf das Team und das gesamte Unternehmen jedoch wiederum sehr hoch sein, da das Unternehmen möglicherweise mit einer seiner Ressourcen offline arbeiten muss. Dies birgt die Gefahr einer fehlerhaften Umsetzung.

Bei Trickle-Migrationen hingegen wird der Migrationsprozess in mehreren Phasen vollzogen. Während der Implementierung werden das alte und das neue System parallel betrieben, wodurch Ausfallzeiten oder Betriebsunterbrechungen vermieden werden können. Prozesse, die in Echtzeit laufen, können die Daten kontinuierlich migrieren lassen.

Im Vergleich zum schnel­len Ansatz kann hierbei die Umsetzung komplexer sein. Diese zusätzliche Komplexität reduziert jedoch in der Regel die Risiken, anstatt solche hinzuzufügen.


Best Practices

Unabhängig davon, welche Implementierungsmethode angewendet wird, gibt es einige Best Practices zu beachten:
Sicherung der Daten: Falls bei der Implementierung etwas schief geht, kann es sich ein Unternehmen meist nicht leisten, Daten zu verlieren. Es gilt sicherzustellen, dass Backups existieren.
Strategie beibehalten: Oft werden Datenmigrationsstrategien erstellt und dann wieder über Bord geworfen, wenn der Prozess nicht reibungslos verläuft oder wenn Dinge ausser Kontrolle geraten. Hier gilt es, sich an den Plan zu halten, auch wenn es bei der Umsetzung zu Schwierigkeiten kommt.
Testen: Während der Planungs- und Designphase sowie während der Implementierung und Wartung sollten stets Tests durchgeführt werden, um sicherzustellen, dass letztendlich das gewünschte Ergebnis erzielt wird.


Die wichtigsten Schritte bei der Migration

Jede Strategie variiert in den Besonderheiten, basierend auf den Bedürfnissen und Zielen des Unternehmens. Bevor aber Daten migriert werden, muss klar sein, was überhaupt migriert werden soll, aber auch, wie die zu migrierenden Daten in das Zielsystem passen respektive angepasst werden müssen. So kann es beispielsweise Datenbanksätze mit vielen Feldern geben, von denen einige im Zielsystem nicht abgebildet werden müssen oder können. Oder aber es fehlen Datenfelder innerhalb der Quelldaten, die von einem anderen Standort abgerufen werden müssen.

Neben der Abklärung der zu erfüllenden Anforderungen an die zu übertragenden Datenfelder sollte auch ein Audit der darin enthaltenen Ist-Daten durchgeführt werden. Wenn schlecht ausgefüllte Felder, viele unvollständige Datensätze, Ungenauigkeiten oder andere Probleme existieren, sollten Unternehmen genau abklären, ob der Prozess der Migration dieser Daten wirklich durchgeführt werden sollte.

In der Designphase definieren Unternehmen die Art der zu bewältigenden Migration – wie bereits beschrieben. Dazu gehört auch die Ausarbeitung der technischen Architektur der Lösung und die Detaillierung der Migrationsprozesse.

Unter Berücksichtigung des Designs, der zu migrierenden Daten und des Zielsystems kann dann mit der Definition von Zeitplänen und eventuellen Projektanliegen begonnen werden. Am Ende dieses Schrittes sollte das gesamte Projekt dokumentiert werden.

Und bereits bei der Planung ist es zudem wichtig, Sicherheitspläne für die Daten zu berücksichtigen. Von allen Daten, die geschützt werden müssen, sollten stets Backups erstellt werden.

Der Testprozess ist ebenfalls zu jedem Zeitpunk essenziell. Es ist wichtig, das Datenmigrationsdesign mit echten Daten zu testen, um die Genauigkeit der Implementierung und die Vollständigkeit der Anwendung zu gewährleisten. Erst nach einem abschliessenden Test sollte deshalb die Implementierung mit dem im Plan definierten Stil final durchgeführt werden. Sobald die Implementierung letztlich in Betrieb genommen wurde, ist ausserdem anzuraten, ein System zur Überprüfung der Daten einzurichten, um die Genauig­keit der Migration zu ­gewährleisten.

Copyright by Swiss IT Media 2019