Big TTN outage because of Microsoft's Azure "thermal problem" - Lessions learned

Gerhard Peter

Initiator of TTN Berlin and Community Happyness Manager

Posted on 20-06-2018

Da wir hier stets ehrlich berichten - manchen vom "Lenorsprech" Beeinflußten passt das gar nicht, aber egal - gilt es, auch den über 9 stündigen Ausfall von TTN hier zu erwähnen, welcher sich vergangenen Abend und die Nacht hinzog, und insbesondere zu hinterfragen, was dies für die künftige Nutzung bedeuten kann:

1.) "Second cloud" als fallback - Lösung scheint nun zwingend.

2.) Wirkliche, sicherheitsempfindliche Anwendungen sind mit Vorsicht zu geniessen und eher derzeit (noch) nicht zu empfehlen.

3.) Wir wissen, und das erneut, dass auch Microsoft nicht unfehlbar ist :) !

4.) Zu den "live" stati geht es da lang: TTN status - Azure status

Als Grund des Ausfalls von Azure Microsoft, wurden, eben in jenem wolkigen "Lenorsprech" des aktuellen Zeitgeists und sehr unkonkret, nebulöse "thermische Probleme" in einem Rechenzentrum formuliert. Dass dazu noch die Notwendigkeit besteht, zu betonen, dass man an der Lösung des Problems arbeite, ist sowohl eine Selbstverständlichkeit, ebenso wie eine Binsenweisheit. Füllwörter und Füllsätze, wenn man nichts Konkretes sagen kann. Krisennullkommunikation.

Mit anderen Worten, will heissen: Es wurde dort offenbar schlicht zu heiss, da Kühlung versagte. In der Folge konnte das TTN ebenfalls nicht mehr richtig arbeiten, da sich TTN, offensichtlich derzeit noch monothematisch, nur auf diese eine cloud abstützt. Eine Doppelcloud Lösung würde die Ausfallwahrscheinlichkeit weiter reduzieren. Das wird sicher kommen.