Menschlicher Fehler zwingt AWS S3 in die Knie

Amazon Web Services (AWS) hat publiziert, warum in beträchtlichen Teilen der USA am 28. Februar der AWS S3-Cloud-Speicher-Dienst mehrere Stunden lang down war.
Ein autorisierter Mitarbeiter habe beim Debuggen im S3-Abrechnungssystem einen Tippfehler gemacht, worauf viel mehr Server als geplant heruntergefahren seien. Dies wiederum löste eine Kettenreaktion aus. Offenbar war in der Folge auch das Wieder-hoch-fahren nicht ganz so einfach und schnell.
 
Amazon schreibt im Report, man habe einen Weg gefunden, um solche Ausfälle künftig zu vermeiden.
 
S3 (Simple Storage Service) ist das skalierbare Cloud-Speicher-Angebot von Amazon. Betroffen waren in der Northern Virginia-Region (US-EAST-1) diverse Services, Websites, aber offenbar auch Thermostat-Apps seien down gewesen, ebenso einzelne Services von Amazon selbst. US-EAST-1 ist eine von 14 Regionen und die älteste. Sie liegt an der US-Ostküste günstig und ist auch aus preislichen Gründen speziell attraktiv.
 
'The Register' schreibt basierend auf Aussagen der Analytics-Firma Cyence S&P 500-Firmen hätten durch den Ausfall etwa 150 Millionen Dollar verloren und Finanzdienstleister weitere 160 Millionen.
 
Sieht man sich die Reports von Microsofts Azure-Plattform an, so notiert 'Techcrunch', dass auch beim AWS-Konkurrent in den USA am 19. Februar ein fünfstündiger Ausfall zu verzeichnen war.
 
Die Lehren daraus? Alle Fachleute sind sich einig: Die Abhängigkeit von funktionierenden Cloud-Services wächst, Ausfälle kosten Geld und wird es immer wieder geben. Entsprechend seien redundante Systeme nicht nur On-Premise Pflicht, sondern auch in der Cloud. (mag)