Routing-Fehler schuld an Amazon-Cloud-Ausfall
Quelle:

Routing-Fehler schuld an Amazon-Cloud-Ausfall

Der Ausfall der Cloud-Server von Amazon ist auf einen Routing-Fehler zurückzuführen, der eine Kettenreaktion auslöste. Mit verschiedenen Massnahmen soll ein solcher Ausfall künftig vermieden werden.
2. Mai 2011

     

Amazon kämpfte Mitte April mit Problemen beim Cloud-Dienst EC2. Dabei gingen auch Kundendaten verloren (Swiss IT Magazine berichtete). Nun hat Amazon die Ursache für den Ausfall der Cloud-Server gefunden, wie es auf der Webseite heisst. Schuld soll ein Routing-Fehler gewesen sein, der im Rahmen eines Netzwerk-Upgrades für den Cloud-Service Amazon Elastic Block Store (EBS) aufgetaucht sei. Dieser Dienst verfüge über zwei Netzwerke, wobei das zweite weniger Kapazität bietet als das erste. Der Netzwerkverkehr für das Update wurde beim Ausfall nicht auf den redudanten Router des ersten Netzes sondern auf das zweite Netz umgeleitet, welches nicht dafür ausgelegt ist. Dadurch wurde eine Kettenreaktion ausgelöst, die schlussendlich zum Datenverlust führte.


Indem Veränderungen genauer geprüft und automatisiert werden, sollen solche Ausfälle in Zukunft vermieden werden. Ausserdem soll der EBS-Service fehlertoleranter werden und mehr Kapazitäten erhalten, damit auch bei Ausfällen genügend Ressourcen vorhanden sind. (abr)


Artikel kommentieren
Kommentare werden vor der Freischaltung durch die Redaktion geprüft.

Anti-Spam-Frage: Wieviele Fliegen erledigte das tapfere Schneiderlein auf einen Streich?
GOLD SPONSOREN
SPONSOREN & PARTNER