Sehr geehrte Kunden
Zur gestrigen Störung erreichte uns von unserem Partner der Outbox AG folgende Mail:
Sehr geehrte Kunden,
am heutigen 23.06.09 kam es im Zeitraum 06.00 Uhr bis ca. 12.00 Uhr zu einem Totalausfall unserer Dienste. Im Nachgang dieser Störung kam es zu einzelnen kleineren Nach-Störungen (wobei seit 12.00 Uhr rund 90% aller Produkte und Services wieder verfügbar waren).
Grund dieser Störung war ein Ausfall all unserer Layer3-Switche, die die einzelnen Serverschränke untereinander und nach außen hin mit IP versorgen. Es handelt sich hierbei nicht um einen (austauschbaren) Hardware-Schaden, sondern um einen Software-Fehler, der durch das Stack-Management (alle Switche verhalten sich wie ein großes logisches System) auch automatisch immer alle Geräte (auch die neu eingebauten Ersatzgeräte) betraf. Als letzter Ausweg wurden alle wichtigen Systeme komplett neu verkabelt, neue Switche eines anderen Herstellers verbaut sowie teilweise auf Basis von Linux-Servern Router-Provisorien gebaut. Seit
11.42 Uhr war daher nahezu alles wieder erreichbar.
Sofern bei Ihnen noch Einzel-Störungen auftreten (mir liegen konkret eine knappe Handvoll Störungsmeldungen von einzelnen Kunden vor), werden wir diese im Laufe des Abends und der Nacht beheben bzw. nach Abschluss der Arbeiten ohnehin alle Produkte nochmals durchtesten. Darüber hinaus stellen sowohl unser Customer Care als auch unser Voice-Team morgen einen sog. Frühdienst, so dass per Mail gemeldete Nach-Störungen noch vor der regulären Bürozeit bearbeitet werden. Bitte haben Sie aber Verständnis dafür, dass alleine aufgrund des erhöhten Mailaufkommens heute (auch unser Ticketsystem kann erst ab ca. Mitternacht wieder Mails verarbeiten) es morgen noch zu etwas verspäteten Antworten kommen kann.
Für heute Abend kann ich mich nur für den Ausfall entschuldigen und verbleibe
mit besten Grüßen aus Köln,
Joern Dost
Vorstand Technik & Netzbetrieb