Am Mittwoch, dem 4. September 2019, waren von Xtra-Hosting gehosteten Webseiten für ca. 4 Stunden von ungefähr 13 bis 17 Uhr nicht erreichbar, wie in nachfolgender Grafik des Server-Uptime-Monitors ersichtlich ist.
Die Ursache war anscheinend fehlerhafte Software auf den Routern im Rechenzentrum. Kurz nach der Downtime erfolgte um 17:34 Uhr eine E-Mail mit dem Betreff „Serverausfall vom 04.09.2019“, in welcher die Kunden vom Geschäftsführer über den Ausfall und die Gründe benachrichtigt wurden:
Geschätzte Kundinnen und Kunden
Heute Nachmittag war ein gossteil unserer Diensleistungen für ca. 2 Stunden nicht erreichbar.
Wir entschuldigen uns für die Umstände. Das Problem wurde vollständig behoben und die Services sind wieder online.
Das Problem war die Router Firmware. Diese hatte einen Bug innerhalb der Redundanzfunktion. Dies führte dazu, dass die Router Pakete fehlerhaft transportiert hatten, was dann wiederum nach und nach zu einem Totalausfall führte. Auslöser dieser Kettenreaktion war ein Hardwaredefekt eines Routers, der ebenfalls inzwischen ausgetauscht wurde.
Die Lösung hat mehr Zeit benötigt, da der Router-Hersteller hierzu erst den Bug finden und ein entsprechendes Update bereit stellen musste. Nach der Installation der Firmware wurde die Redundanzfunktion geprüft, diese funktioniert wieder fehlerfrei.
Mit freundlichen Grüssen
Andreas Wyder
CEO Xtra-Hosting – Swiss Hosting Service