Content: Blog

In Sachen Redundanz

← zurück zum Blog

Martin Altorfer

Martin Altorfer
18.03.2014

Wir setzen grossen Wert auf die Stabilität und Verfügbarkeit unserer Dienstleistungen. Für mich sollten IT- und Telekom-Services möglichst 100% uptime aufweisen. Damit das erreicht werden kann, benötigt man geeignete Redundanzen in Netzen und Systemen. Schliesslich soll ein immer möglicher Ausfall eines Systems nicht gerade den ganzen Service beeinflussen.

Die Frage ist immer wo die Redundanz Sinn macht und wo Sie aufgrund der steigenden Komplexität von redundanten Systemen eher zum Boomerang wird. Eine solche Situation erlebte Cyberlink mit dem Umzug seiner beiden Datacenter. Unser Bestreben beim Umzug war den Kunden sowenig "Downtime" wie möglich zuzumuten. Schliesslich befinden sich unserem Datacenter Anwendungen welche auf eine permanente Verfügbarkeit angewiesen sind. Also haben wir den Umzug so geplant, dass von gewissen Systemen exakte Replicas installiert und konfiguriert wurden, so dass wir lediglich "ein paar Patchungen" ändern sollten und schon ist wieder alles online. Das war der Plan. In der Realität sind wir dann während dem ersten Teil des Umzugs über diverse Komplexitäten unseres Netzwerks gestossen und ich behaupte, dass der Umzug mit weniger Kollateralschaden für Kunden (und uns selber) hätte durchgeführt werden können, wenn wir von jedem System nur ein Stück gehabt hätten. Natürlich hätte es einen Unterbruch gegeben währende wir das entsprechende System transportiert hätten, aber was uns am Tag widerfahren ist, könnte das kaum toppen.

Sie überlegen jetzt, was das jetzt soll? Soll man in Zukunft einfach wieder weg von der Idee einer hochredundanten Landschaft und Single-Point-of-Failures bewusst akzeptieren? Für mich persönlich eine sehr schwierig zu beantwortende Frage, aber tendentiell sollte sich jedes Technologie-Unternehmen bewusst sein, dass Ingenieure dazu tendieren die Dinge zu kompliziert zu bauen - nicht zuletzt aufgrund der gefühlten Anforderungen der Auftraggeber...

Lesen in der Beilage unseren Post Incident Report (191,2 KB) zu den Vorfällen während unseres Datacenter Umzugs.


Die «smart, kompetent und leidenschaftlich» - Services für Unternehmen