Daten im virtuellen Raum

Von einem virtualisierten Speichersystem können sowohl Systemadministratoren als auch Unternehmen profitieren.

Artikel erschienen in Swiss IT Magazine 2007/21

     

Virtualisierung ist derzeit in aller Munde. Egal ob Server, Netzwerke oder Speicher: Nahezu sämtliche Bereiche der Informationstechnologie finden sich heute in virtuellen Welten wieder. Dabei ist die Virtualisierung speziell im Storage-Bereich eine bereits seit langer Zeit gängige Methode, um Serversysteme mit partitionierbarem, hoch verfügbarem Plattenspeicher auszustatten.


Host-basierte Virtualisierung

Viele Systemadministratoren sind sich unter Umständen gar nicht bewusst, dass RAID-Controller, die in Servern oder externen Storage-Systemen ihren Dienst verrichten, bereits eine einfache Form der blockbasierten Virtualisierung darstellen. Über einen solchen RAID-Controller in SCSI-, SATA-, SAS- oder PATA-Technologie sind sie in der Lage, physikalische Platten in einem RAID-Verbund zusammenzufassen und dem Betriebssystem ein oder mehrere logische Laufwerke in nahezu frei definierbarer, nur durch die Physik eingeschränkter Grösse bereitzustellen.



Je nach Implementierung bieten RAID-Controller zudem häufig die Möglichkeit, logische Laufwerke im laufenden Betrieb zu vergrössern und so dynamisch auf erhöhte Plattenplatzanforderungen einer Anwendung zu reagieren. Gegebenenfalls auf den RAID-Controllern integrierter Cache-Speicher liefert einen zusätzlichen Performance-Schub, indem er Schreib-/Lesezugriffe zunächst im schnellen RAM puffert, bevor diese an die physikalischen Platten weitergeleitet werden.






Eigenschaften virtueller Volumes


Volume-Manager erhöhen Flexibilität

Neben den bereits angesprochenen Hardware-basierten RAID-Systemen existieren auch Software-basierte Lösungen in Form von Volume-Managern, die meist integraler Bestandteil des Betriebssystems sind oder in Form von Produkten wie der Symantec Storage Foundation hinzugekauft werden können. Da Volume-Manager-Implementierungen in der Regel nicht über zusätzliche Caching-Möglichkeiten verfügen, kann der Systemverwalter durch Einführung von RAID-Funktionalität zwar die Datenverfügbarkeit erhöhen, jedoch im Vergleich zu einer Hardwarelösung keine signifikanten Performance-Vorteile verbuchen.

Allerdings bringen Volume-Manager im Sinne der Virtualisierung Vorteile, wenn der Administrator beispielsweise über zwei externe Hardware-basierte RAID-Systeme verfügt, die sich an unterschiedlichen Standorten befinden, und er mit Hilfe des Volume-Managers eine ebenso simple wie kostengünstige Datenspiegelung realisiert. Auch die dynamische Erweiterung von Plattenplatz oder die Erzeugung von Snapshots für ein effizientes Backup sind Stärken von Volume-Manager-Produkten, die nur durch den Einsatz entsprechender Virtualisierungsebenen möglich werden.


Speichernetze fördern Virtualisierung

Da ein in einen Server eingebauter RAID-Controller mit lokalem Speicher nur dezentral administrierbar ist und deutliche Limitationen in den Bereichen Skalierbarkeit, Flexibilität und zentraler Administration aufweist, stellt der als Direct-Attached-Storage bezeichnete Ansatz eine Insellösung dar, die seit einigen Jahren zunehmend von Storage Area Networks (SAN) abgelöst oder ergänzt wird.

Die Motivation von Speichernetzen liegt in der Konsolidierung und Zentralisierung von Speicherressourcen. Administration und Bereitstellung von Speicher sollen hierdurch vereinfacht und beschleunigt werden. SAN-Speicher selbst sind dabei wiederum spezialisierte RAID-Systeme, die per iSCSI- oder Fibre-Channel-Protokoll über das Speichernetzwerk mit den Servern kommunizieren.


Ähnlich wie beim Host-basierten RAID-Controller virtualisiert der SAN-Speicher physikalische Platten und stellt diese über das SAN als Logical Units zur Verfügung. Alle Eigenschaften der Host-basierten RAID-Systeme gelten prinzipiell auch für SAN-Speicher, allerdings mit dem Vorteil, dass viele Server mit gegebenenfalls unterschiedlichen Betriebssystemen parallel auf ein Storage-System zugreifen können und der vorhandene Plattenspeicher wesentlich effizienter nutzbar ist. SAN-Speicherlösungen sind darüber hinaus meist in der Lage, Funktionen wie synchrone oder asynchrone Replikationen zu realisieren, um Daten in Echtzeit oder zeitverzögert in ein entferntes Rechenzentrum zu spiegeln. Auch Snapshot- und Cloning-Funktionen zur vereinfachten Datensicherung finden sich bei den meisten SAN-Storage-Systemen. Ohne zusätzliche Virtualisierungsebene stehen diese Funktionen jedoch nur Hersteller-spezifisch zur Verfügung. Eine Replikation ist so nur zwischen zwei HP-Systemen möglich, nicht aber zwischen HP und EMC.



Mit Produkten wie Tagmastore von HDS oder der V-Series von Network Appliance gehen einige Hersteller jedoch in Sachen Virtualisierung schon einen Schritt weiter, indem sie nicht nur physikalische Platten in hauseigenen Chassis bereitstellen, sondern ganze Speichersysteme ihrer Mitbewerber in ihr Storage-Konzept integrieren. Mit Hilfe der V-Series von Network Appliance wird der Systemverwalter beispielsweise in die Lage versetzt, gegebenenfalls im Unternehmen existierende Speichersysteme von HDS, HP oder anderen Herstellern mit einem NetApp-Filer-Kopf zu konsolidieren.

Funktionalitäten wie Snapshot, Mirroring oder Backup, die in jeweils proprietären Ausprägungen der einzelnen Hersteller nicht kompatibel zueinander sind, lassen sich per Virtualisierungs-Appliance herstellerübergreifend nutzen.


In-Band für hersteller-übergreifende Funktionen

Da SAN-basierte Storage-Systeme neben Einschränkungen bei der Interoperabilität auch Grenzen hinsichtlich der Skalierbarkeit haben, wurden in den letzten Jahren Virtualisierungstechnologien entwickelt, um diese Probleme zu adressieren. Einen der gängigsten Lösungsansätze stellt hierbei die In-Band-Virtualisierung dar. Dabei wird eine Appliance in den Datenpfad geschaltet, die gewissermassen als Portal für den Zugriff auf SAN-Ressourcen fungiert.

Die Appliance konsolidiert hierbei die Storage-Ressourcen eines oder mehrerer RAID-Systeme und stellt den Speicher je nach Anforderung als logisches Volume zur Verfügung. Des weiteren sind, abhängig von der Implementierung der Appliance, zusätzliche Funktionen denkbar, die über eine reine Konsolidierung hinausgehen. So verfügen einige Lösungen über die Möglichkeit, Daten per SAN oder IP-Netzwerk an entfernte Standorte zu spiegeln, um ein effektives Disaster Recovery zu ermöglichen. So lassen sich mit einer entsprechenden In-Band-Virtualisierung Daten von einem EMC-Storage auf einen HP-Speicher spiegeln und umgekehrt. Zudem ist die Bedienoberfläche der Appliance immer dieselbe. Das erleichtert dem Systemverwalter die Administration und verringert potentielle Fehlerquellen.





In-Band-Virtualisierung / Out-of-Band Virtualisierung


Quality-of-Service möglich

Auch die Sicherstellung einer Quality-of-Service ist mit der entsprechenden Software realisierbar, wie sie beispielsweise in Datacores SANsymphony-Produkt enthalten ist. Hierbei kann der Systemverwalter einzelnen besonders kritischen Serversystemen eine frei definierbare Bandbreite von beispielsweise 50 MByte/s garantieren. Auch die Bereitstellung von virtuellen Volumes mit nahezu beliebiger Grösse wird durch entsprechende Appliances möglich.

Der Systemverwalter definiert dazu beispielsweise ein virtuelles Volume mit einer Grösse von zwei TByte und stellt dieses zur Verfügung. Der physikalisch notwendige Plattenplatz wird jedoch nicht von Anfang an reserviert, sondern je nach Datenwachstum des Volume dynamisch beansprucht. Die In-Band-Virtualisierung gilt als technisch vergleichs-
weise einfach realisierbar, setzt jedoch eine leistungsfähige Hardware voraus, die in der Lage ist, auch hohen Belastungen standzuhalten. Da die Appliance im Datenpfad liegt, gilt sie zudem als Single-Point-of-Failure, da bei einem Ausfall kein Datenverkehr mehr möglich ist. In-Band-Virtualisierungslösungen wie der IBM SAN Volume Controller, die
V-Series von Network Appliance oder Datcore SANsymphony werden daher in der Regel als Cluster-Lösung mit mindestens zwei Appliances installiert, was die Kosten in die Höhe treibt.

Aufgrund der hohen Anforderung sehen viele Anwender in dieser Technologie zudem einen potentiellen Flaschenhals. Durch zusätzliche Appliances ist zwar die Skalierbarkeit sichergestellt, allerdings zumeist auf Kosten einer vereinfachten Administration.


Out-of-Band-Virtualisierung eliminiert Flaschenhals

Um dem Problem des Flaschenhalses Herr zu werden, wurde die Out-of-Band-Virtualisierung entwickelt. Dabei befindet sich keine Appliance im Datenpfad, wodurch ein möglicher Flaschenhals von vornherein ausgeschlossen ist. Statt dessen kommt ein sogenannter Metadaten-Controller zum Einsatz, der als Appliance oder als Zusatzkomponente in einem Fibre-Channel-SAN-Switch realisiert sein kann. Im Metadaten-Controller ist die Information hinterlegt, welcher Server auf welchen Speicherbereich zugreifen darf.

Der eigentliche Datenfluss hingegen läuft stets direkt zwischen dem Server und dem Storage-System ab. Die durch den Metadaten-Controller verursachte zusätzliche Latenz fällt laut Herstellerangaben in der Praxis kaum ins Gewicht. Allerdings ist der Metadatencontroller eine kritische Komponente, die zur Steigerung der Verfügbarkeit in der Regel als Cluster betrieben wird. Zudem sind für einige Out-of-Band-Lösungen zusätzliche Treiber erforderlich, welche Stabilität und Performance beeinflussen können.



Anders als bei In-Band-Virtualisierungslösungen kann beim Out-of-Band-Ansatz auf zusätzliche Metadaten-Controller zur Verbesserung der Skalierbarkeit verzichtet werden. Der Funktionsumfang unterscheidet sich bei der Out-of-Band-Virtualisierung je nach Implementierung des Herstellers meist nur geringfügig von den verfügbaren In-Band-Lösungen. So lassen sich beispielsweise im Hintergrund Datenmigrationen durchführen, wenn beim physikalischen Speicher ein Technologie- oder Herstellerwechsel ansteht.

Da ein Server lediglich virtualisierten Speicher zu Gesicht bekommt, kann die Virtualisierungs-App­liance die Daten im laufenden Betrieb vom alten auf das neue Speichersystem migrieren und so einen nahezu unterbrechungsfreien Technologiewechsel ermöglichen. Auch andere Funktionalitäten wie Remote-Replikation, Cloning und Snapshots sind mit den meisten Out-of-Band-Lösungen realisierbar.


iSCSI als preiswerte Basistechnologie

Eine der Basistechnologien für preiswerte blockbasierte Virtualisierungslösungen ist iSCSI, das sich vor allem für kleinere Umgebungen eignet und in der Praxis nahezu ausschliesslich als In-Band-Lösung realisiert wird. Mit einem Produkt wie Datacore SANmelody ist es dem Systemverwalter möglich, einen beliebigen PC in eine iSCSI-Virtualisierungs-Appliance zu verwandeln. Das dahinterstehende Konzept ist dabei ebenso einfach wie genial: Man nehme einen Standard-Intel-Server mit Windows 2003 Server als Betriebssystem und stelle dessen physikalischen Plattenspeicher per iSCSI-Protokoll zur Verfügung. Der physikalische Speicher kann je nach Anforderung wiederum aus einzelnen Festplatten oder RAID-Systemen bestehen, die per SCSI, SATA,

Fibre Channel oder anderen Technologien angebunden sind. In jedem Fall ist der Systemverwalter in der Lage, aus dem physikalischen Speicher virtuelle Platten in Form von Logical Units zu definieren und diese per IP-Verbindung über das Unternehmens-LAN zur Verfügung zu stellen. Insbesondere für virtualisierte Server, die beispielsweise in einer VMware-Umgebung laufen, eignet sich diese Methode, ist es doch so möglich, eine neue virtuelle Maschine mit der benötigten Speicherkapazität innerhalb weniger Minuten bereitzustellen. Auch Funktionen wie die synchrone oder asynchrone Spiegelung, die für eine erhöhte Datenverfügbarkeit sorgen, sind mit iSCSI-Virtualisierungs-Lösungen wie SANmelody, Falconstor iSCSI Storage Server oder dem IP-Storage Gateway 9200 von Reldata einfach und günstig umsetzbar.


Dateibasierte Virtualisierung

Neben den bereits beschriebenen vielfältigen Ansätzen der blockbasierten Virtualisierung, existieren auch Lösungen zur dateibasierten Virtualisierung. Findige Marketingstrategen haben hierfür den Begriff des File Area Network (FAN) geprägt. In einem FAN werden die im Netzwerk befindlichen Datei-Server-Ressourcen in einer Benutzer-individuellen Sicht zusammengefasst.

Das heisst, der Anwender greift aus seiner Sichtweise nicht mehr auf unterschiedliche physikalische Systeme zu, sondern erhält gewissermassen einen Einsprungpunkt in Form eines Verzeichnisses. Dieses enthält wiederum Unterverzeichnisse, die ihrerseits auf Netzwerkfreigaben unterschiedlicher Server verweisen. Greift der Anwender über seinen Einsprungpunkt auf eines der dort hinterlegten Unterverzeichnisse zu, wird er automatisch und für ihn transparent mit dem betreffenden Server verbunden und kann dort seine Daten ablegen. Selbst wenn sich der physikalische Speicherort einmal ändern sollte, spielt dies für den Anwender keine Rolle, solange der Systemverwalter den entsprechenden Verweis unterhalb des Einsprungpunktes anpasst. Von dieser Form der Virtualisierung profitiert sowohl der Anwender, der stets dieselbe Sichtweise auf seine Daten behält, als auch der Systemverwalter, der bei Änderungen an der Infrastruktur lediglich Verweise auf physikalische Server anpassen muss. Eine der bekanntesten Lösungen in diesem Umfeld ist das Distributed File System (DFS), welches von Microsoft bereits mit Windows NT 4.0 eingeführt und stetig weiterentwickelt wurde.


Die Virtualisierung des Namensraums ist aber nur ein Aspekt, der in FANs eine Rolle spielt. Ähnlich wie bei der Virtualisierung im SAN sind auch im FAN zahlreiche Zusatzfunktionalitäten verfügbar. Dazu zählt die automatisierbare Datenmigration, die es dem Systemverwalter erlaubt, Daten im laufenden Betrieb von einem Dateiserver auf einen anderen zu kopieren und so etwa die Ablösung einer veralteten Hardware mit minimalem Aufwand und geringen Ausfallzeiten zu realisieren. Auch die Klassifizierung von Daten im Sinne eines Information-Lifecycle-Management-Ansatzes (ILM) kann durch den Einsatz von FANs erleichtert werden. Produkte wie Brocades Softwarelösung StorageX, die sich nahtlos in Microsoft DFS einfügt, oder Appliance-Lösungen wie Acopias ARX und EMCs Rainfinity bieten hierbei vielfältige Optionen.





Datei-basierte Virtualisierung


Fazit: Virtualisierung macht Sinn

Die Storage-Virtualisierung ist heute eine ausgereifte Technologie, die dem Systemverwalter das Leben in vielerlei Hinsicht erleichtern kann. Speziell in Umgebungen, die auf eine schnelle Bereitstellung von Ressourcen angewiesen sind, stellt die Virtualisierung eine sinnvolle Ergänzung dar. Auch Technologie- oder Herstellerwechsel können erleichtert werden. Welche Virtualisierungslösung im Einzelfall sinnvoll ist, hängt dabei natürlich nicht nur von den technischen Anforderungen ab, sondern auch von den finanziellen Rahmenbedingungen.




Artikel kommentieren
Kommentare werden vor der Freischaltung durch die Redaktion geprüft.

Anti-Spam-Frage: Wieviele Zwerge traf Schneewittchen im Wald?
GOLD SPONSOREN
SPONSOREN & PARTNER