Technologie-Partner
Gold-Sponsor:
Dienstag, 10.07.2012
Von Feuern, Fehlalarmen, geschmolzenen USVs und gebratenen Eichhörnchen

Laut Mike Christian, Business-Continuity-Experte bei Yahoo, können auch die bestgeschützten RZs ausfallen. Und zuviel Redundanz, glaubt er, kann sogar schädlich sein.
 
Mike Christian, Business-Continuity-Experte bei Yahoo, hat kürzlich an der "O'Reilly Velocity" –Konferenz in Santa Clara einen Vortrag über die Katastrophenplanung bei Yahoo gehalten. Dafür trug er auch ein Sammelsurium von kleineren und grösseren Katastrophen zusammen, die in den letzten Jahren zu Totalausfällen von Rechenzentren von Yahoo und anderen Betreibern geführt haben. Die Liste der möglichen Gründe für RZ-Ausfälle ist lang und und reicht von Feuern, Flutkatastrophen, Erdbeben und Hurricans über löchrige Dächer, ausgefallene Generatoren, Stromverteiler und Kühleinheiten, geschmolzene USVs, schiefgelaufene Wartungsarbeiten und Migrationen bis zu Banalitäten wie einem Abschaltknopf für den Feuerschutz, den im entscheidenden Moment niemand drückte, fehlendem Benzin für die Generatoren oder einem Eichhörnchen, das einen Kurzschluss in einem Starkstromschalter verursachte.
 
Christians trockenen, aber mit feinem Humor gespickten Vortrag kann man sich in diesem knapp eine Viertelstunde langen Clip auf YouTube ansehen.
 
USVs als Sicherheitsproblem?
Der Yahoo-Experte schilderte diese RZ-Katastrophen aber nicht nur, um seine Zuhörer zu erschrecken (oder zu amüsieren). Er wollte damit vor allem seine Hauptthese untermalen: RZ-Ausfälle, glaubt Christian, lassen sich auch mit den besten Katastrophenplänen, technischen Schutzmassnahmen und haufenweise redundanten Systemen nie ganz verhindern. Zu viele Schutzsysteme und Redundanzen sind nicht nur teuer sondern können gemäss Christians Meinung sogar schädlich sein, da sie mehr Komplexität und mögliche Fehlerquellen mit sich bringen. Besonders kritisch scheint Christian dabei gegenüber den in Rechenzentren eigentlich allgegenwärtigen unterbrechungsfreien Stromversorgungen (USVs) zu sein. Bei Yahoo hätten diese ebensoviele Probleme verursacht, wie sie gelöst hätten, und laut einer Studie seien fehlerhaft arbeitende USVs für fast 30 Prozent alller RZ-Ausfälle verantwortlich.
 
Bei Yahoo sehen man daher als unvermeidlich an, dass Rechenzentren irgendwann auch komplett ausfallen können und versuche dies von Anfang an im Verfügbarkeitskonzept zu berücksichtigen. Das Zauberwort dazu heisst nahtloses "Failover" zwischen geografisch verteilten Rechenzentren. Yahoo übe und teste solche Failovers dauernd im laufenden Betrieb und möglichst sogar in Zeiten, wo der Traffic Spitzenwerte erreicht. Dadurch, so Christian, lerne man dauernd dazu und stärke auch das Vertrauen in die eigenen Sicherheitsmassnahmen. (Hans Jörg Maron)
Kommentar schreiben
 
Newsletter abonnieren
E-Mail-Adresse
HOT Stories
Neu auf altText
Kolumnen
Features