Github will nach Total-Ausfall umdenken

1. November 2018, 10:47
  • technologien
  • github
image

Am 21.

Am 21. Oktober fiel Github für 24 Stunden aus. Softwareteams rund um den Globus wurden am Sonntag und Montag durch den Ausfall blockiert, weil Entwickler die wichtige Code-Repository-Plattform nicht nutzen konnten.
Für ein Aufatmen sorgte ein Statusupdate von Jason Warner, Senior Vice President Technology bei GitHub, dass keine Daten verloren gegangen seien. Allerdings gab es viel Konfusion bei den Entwicklern, das zeigen diverse Kommentare. Und für Fragen sorgte, dass die Gründe für den Ausfall nicht sehr klar waren.
Nun schütten sich die Github-Verantwortlichen viel Asche übers Haupt ("Mit diesem Vorfall haben wir versagt und es tut uns sehr leid"), aber präsentieren auch ihre Analysen in einem recht detaillierten und illustrierten Blog-Post.
Bei routinemässigen Wartungsarbeiten zum Ersetzen von schadhaftem Equipment fiel die Konnektivität zwischen dem US-Ostküsten-Netzwerkhub und dem primären US-Ostküsten-Rechenzentrum aus. Die Konnektivität zwischen diesen Standorten wurde zwar innert 43 Sekunden wiederhergestellt, "aber dieser kurze Ausfall löste eine Kette von Ereignissen aus, die zu einer Verschlechterung der Dienste während 24 Stunden und 11 Minuten führte", so der Post.
Neben technischen Massnahmen, die man im Blog-Post nachlesen kann, anerkennt Github auch kommunikative Mängel und gelobt Besserung: "In unserem Bestreben, euch während des Vorfalls aussagekräftige Informationen zukommen zu lassen, haben wir einige öffentliche Einschätzungen zur Reparatur-Zeit vorgenommen, und zwar basierend auf der Verarbeitungsrate des Daten-Backlogs. Rückblickend berücksichtigten unsere Schätzungen nicht alle Variablen. Wir entschuldigen uns für die Verwirrung und werden uns bemühen, in Zukunft genauere Informationen zu liefern."
Und überhaupt, so schliesst der Blog-Post, müsse und werde man bezüglich Verlässlichkeit, Verfügbarkeit und "Chaos Engineering" umdenken. "Wir werden auch systematisch beginnen, Fehlerszenarien zu überprüfen, bevor diese Euch beeinträchtigen können".
Das wird der neue Github-Besitzer, Microsoft, gerne hören und sicher unterstützen. Allerdings war auch Azure nicht vor Ausfällen gefeit. (mag)

Loading

Mehr zum Thema

image

APIs bei Twitter werden kostenpflichtig

Schon in weniger als einer Woche werden Entwicklerinnen und Entwickler zur Kasse gebeten. Ein Preismodell gibts noch nicht.

publiziert am 3.2.2023
image

ChatGPT wächst so schnell wie keine andere App

Der KI-Chatbot bricht Rekorde und verzeichnet 100 Millionen aktive Nutzer innert nur 2 Monaten. Nun soll bald ein Abo-Modell eingeführt werden.

publiziert am 2.2.2023
image

Zurich wechselt in die AWS-Cloud

Bis 2025 sollen bei der Versicherung rund 1000 Anwendungen auf AWS migriert werden. Damit will Zurich 30 Millionen Dollar im Jahr sparen können.

publiziert am 31.1.2023
image

Hausmitteilung: 1 Jahr nach unserem Relaunch

Wir gingen heute vor einem Jahr mit der neuen Website live. Was ist in dieser Zeit geschehen?

publiziert am 31.1.2023 1