Ausfall der CountryMusicNews.de Webseite am 26. September 2011

CountryMusicNews.de

Hallo liebe Leser,

gestern kam es immer wieder zum Ausfall unserer Webseite. Leider lag das technische Problem jenseits unserer Kontrolle und die Kollegen aus der Technik haben regen Kontakt mit den Technikern der 1 und 1 Internet AG, die unseren Server betreuen, gehalten.

Folgende Antwort auf das Problem wurde uns heute übermittelt:

"Durch einen Softwarefehler kam es gestern zwischen 15.00 und 17.30 Uhr und erneut zwischen 20.00 und 23.00 Uhr zu einer fehlerhaften Netzwerk-Konfiguration bei den Dedicated, Virtual und Dynamic Cloud Servern unserer Kunden. Dadurch waren diese Server vorübergehend nicht im Internet erreichbar.

Die weitaus größere Anzahl von Kunden mit Hosting-Paketen (Shared/Dual-Hosting/Cloud/Do-It-Yourself) war nicht von dieser Störung betroffen.

Die Netzwerkeinstellungen werden in einer zentralen Sybase-Datenbank verwaltet. Insbesondere bei unseren Dedicated Servern ändern sich diese Einstellungen häufig, etwa beim Ändern von Firewall-Einstellungen. Diese Änderungen müssen allen Netzwerkkomponenten (Router, Switches) mitgeteilt werden. Vor ca. einem Monat haben wir eine so genannte Middleware installiert, die in regelmäßigen Abständen die Einstellungen der Datenbank abfragt und zentral an die Netwerkkomponenten verteilt.

Dieses System lief bis gestern reibungslos. Gestern hatte der Sybase-Server eine hohe Last und entsprechend verzögerte Antwortzeiten. Durch einen Fehler in der Middleware, einem so genannten Sybase::DBI Connector, interpretierte die Software die lange Wartezeit als "leere" Antwort und überschrieb so die Netzwerkeinstellungen der Router und Switches in unseren Server-Segmenten.

Nachdem der Fehler identifiziert war, mussten die korrekten Netzwerkdaten zunächst manuell wiederhergestellt werden. Gleichzeitig haben wir vorübergehend die automatische Datenbankabfrage durch die Middleware gestoppt. In dieser Zeit waren keine Änderungen an Firewall-Einstellungen und Einrichtung neuer IP-Adressen möglich.

Damit eine solche Störung nicht mehr auftreten kann, haben wir die zusätzlichen Prüfroutinen in unserem Netzwerk implementiert, die den aufgetretenen Fehler verhindern. Änderungen an den Netzwerkeinstellungen sind im 1&1 Control Center nun wieder möglich, werden aber aufgrund der Prüfmechanismen erst mit ca. 15 Minuten Verzögerung aktiviert.

Gleichzeitig befinden wir uns in Gesprächen mit dem Softwarehersteller, um die Fehler in der Middleware schnellstmöglich zu beheben." - soweit die 1&1 Internet AG

Wir hoffen, dass Sie sich an dem Ausfall nicht zu sehr gestört haben und bitte für alle Unannehmlichkeiten um Entschuldigung.

Keep It Country!
Ihr CountryMusicNews.de-Team

{discuss forum:1} Technischer Hinweis