Von Feuern, Fehlalarmen, geschmolzenen USVs und gebratenen Eichhörnchen

10. Juli 2012, 12:53
  • rechenzentrum
  • strategie
image

Laut Mike Christian, Business-Continuity-Experte bei Yahoo, können auch die bestgeschützten RZs ausfallen. Und zuviel Redundanz, glaubt er, kann sogar schädlich sein.

Laut Mike Christian, Business-Continuity-Experte bei Yahoo, können auch die bestgeschützten RZs ausfallen. Und zuviel Redundanz, glaubt er, kann sogar schädlich sein.
Mike Christian, Business-Continuity-Experte bei Yahoo, hat kürzlich an der "O'Reilly Velocity" –Konferenz in Santa Clara einen Vortrag über die Katastrophenplanung bei Yahoo gehalten. Dafür trug er auch ein Sammelsurium von kleineren und grösseren Katastrophen zusammen, die in den letzten Jahren zu Totalausfällen von Rechenzentren von Yahoo und anderen Betreibern geführt haben. Die Liste der möglichen Gründe für RZ-Ausfälle ist lang und und reicht von Feuern, Flutkatastrophen, Erdbeben und Hurricans über löchrige Dächer, ausgefallene Generatoren, Stromverteiler und Kühleinheiten, geschmolzene USVs, schiefgelaufene Wartungsarbeiten und Migrationen bis zu Banalitäten wie einem Abschaltknopf für den Feuerschutz, den im entscheidenden Moment niemand drückte, fehlendem Benzin für die Generatoren oder einem Eichhörnchen, das einen Kurzschluss in einem Starkstromschalter verursachte.
Christians trockenen, aber mit feinem Humor gespickten Vortrag kann man sich in diesem knapp eine Viertelstunde langen Clip auf YouTube ansehen.
USVs als Sicherheitsproblem?
Der Yahoo-Experte schilderte diese RZ-Katastrophen aber nicht nur, um seine Zuhörer zu erschrecken (oder zu amüsieren). Er wollte damit vor allem seine Hauptthese untermalen: RZ-Ausfälle, glaubt Christian, lassen sich auch mit den besten Katastrophenplänen, technischen Schutzmassnahmen und haufenweise redundanten Systemen nie ganz verhindern. Zu viele Schutzsysteme und Redundanzen sind nicht nur teuer sondern können gemäss Christians Meinung sogar schädlich sein, da sie mehr Komplexität und mögliche Fehlerquellen mit sich bringen. Besonders kritisch scheint Christian dabei gegenüber den in Rechenzentren eigentlich allgegenwärtigen unterbrechungsfreien Stromversorgungen (USVs) zu sein. Bei Yahoo hätten diese ebensoviele Probleme verursacht, wie sie gelöst hätten, und laut einer Studie seien fehlerhaft arbeitende USVs für fast 30 Prozent alller RZ-Ausfälle verantwortlich.
Bei Yahoo sehen man daher als unvermeidlich an, dass Rechenzentren irgendwann auch komplett ausfallen können und versuche dies von Anfang an im Verfügbarkeitskonzept zu berücksichtigen. Das Zauberwort dazu heisst nahtloses "Failover" zwischen geografisch verteilten Rechenzentren. Yahoo übe und teste solche Failovers dauernd im laufenden Betrieb und möglichst sogar in Zeiten, wo der Traffic Spitzenwerte erreicht. Dadurch, so Christian, lerne man dauernd dazu und stärke auch das Vertrauen in die eigenen Sicherheitsmassnahmen. (Hans Jörg Maron)

Loading

Mehr zum Thema

image

2023 zieht Helvetia den eigenen RZs den Stecker

Helvetia will komplett in die Cloud. Wir haben mit CTO Achim Baumstark, Cloud-Leiter Raphael Graber und Michael Hanisch von AWS über die Migration gesprochen.

publiziert am 15.9.2022
image

Swissbit entwickelt jetzt auch SSDs für Rechenzentren

Der Schweizer Speicherhersteller spannt mit dem US-Unternehmen Burlywood zusammen und will in den RZ-Bereich vorstossen.

publiziert am 15.9.2022
image

Equinix hat wieder ausgebaut

Das ZH4 von Equinix hat weitere 850 Quadratmeter Fläche erhalten.

publiziert am 15.9.2022
image

Gebaut auf Brandruine: OVHcloud eröffnet neues Rechenzentrum in Strassburg

18 Monate nach dem verheerenden Brand nimmt OVH ein Nachfolge-RZ in Betrieb. Man habe mit neuen Sicherheitsvorkehrungen Lehren aus dem Unfall gezogen.

publiziert am 14.9.2022