Softwarefehler

Facebook: Schlimmster Ausfall seit 4 Jahren

24.09.2010


Die Homepage war stundenlang nicht mehr erreichbar.

Zur Vollversion des Artikels
© Reuters
Zur Vollversion des Artikels

Wie viele Internet-User wahrscheinlich bemerkt haben, gab es am Donnerstagabend zwischen 21:00 und 23:00 Uhr bei Facebook massive technische Probleme. Nutzer in den USA, Europa und Südamerika hatten stundenlang Schwierigkeiten, die Website aufzurufen. Facebook sprach in einem offiziellen Blog-Eintrag vom "schlimmsten Ausfall, den wir seit über vier Jahren hatten".

Über zwei Stunden offline
Schuld war ein Softwarefehler, der dazu führte, dass die gesamte Seite vorübergehend geschlossen werden musste. Laut der Plattform habe der Ausfall zwischen zwei und zweieinhalb Stunden gedauert. Wer die Seite aufrufen wollte, bekam nur den Eintrag "Service Unavailable - DNS failure" zu sehen. Egal ob man über ein Smartphone, den PC oder ein Tablet zugreifen wollte, der Server war einfach nicht erreichbar. Einige User berichteten zwar, dass sie die Seite zwar öffnen konnten, dann funktionierte der Dienst jedoch nur sehr eingeschränkt und zeigte nur mehrere Stunden alte Einträge an. Die Live Chat-Funktion war ebenfalls tot.

Eigene Programmierer schuld
Der Softwarefehler trat in einem System auf, welches eigentlich dafür sorgen soll, Fehler in den Einstellungen im Cache der Nutzer-Clients aufzuspüren und gegebenenfalls zu reparieren. Des Weiteren wurde mittlerweile bekannt, dass die Programmierer den Bug selbst verursacht haben. Sie haben im Quellcode der Seite einen Wert verändert, der im Anschluss daran vom System als falsch eingestuft wurde. Deshalb hat die automatische Korrekturfunktion versucht, den "Fehler" selbstständig auszumerzen.

Verschlimmert wurde das Ganze noch von den Usern selbst. Sie haben alle das Klicken auf den "Refresh-Button", ohne es zu wissen, denselben automatischen Reparaturprozess eingeleitet, weshalb sich der Fehler rasant ausweitete. So wurde die Facebook-Datenbank innerhalb kürzester Zeit mit einigen Hunderttausend Abfragen pro Sekunde förmlich überschwemmt. Dies führte letztendlich zur Überlastung/zum Zusammenbruch der Server.

Mittlerweile bestätigte auch der Facebook-Software-Entwickler Robert Johnson die Richtigkeit dieser Angabe. In seinem Blog-Eintrag heißte es: "Ein automatisiertes System zur Überprüfung von Konfigurationseinstellungen hat mehr Schaden angerichtet als geholfen. Beim Wechsel auf die ursprünglichen Einstellungen ist es dann zu einer Überlastung der Datenbanken gekommen, die in einem sogenannten Cluster gebündelt sind." Um den Fehler zu beheben, habe Facebook den Datenverkehr schließlich stilllegen müssen, um die Datenbank zu reparieren.
 

Zu wenig Server?
Bei dem sozialen Netzwerk sind weltweit rund 500 Millionen Nutzer registriert. Insgesamt betreibt das Unternehmen 60.000 Server, um den Andrang meistern zu können. Wie die aktuelle Panne zeigt, scheint das jedoch immer noch nicht auszureichen.

Kein Einzelfall
Doch auch andere Social Networks bleiben von Pannen nicht verschont. So löste ein japanischer Hacker erst kürzlich ein wahres Chaos beim beliebten Micro-Blogging-Dienst Twitter aus.

Und auch Facebook hatte in diesem Jahr bereits mit mehreren Sicherheitslücken zu kämpfen. So verschickten Hacker im März Spam-Mails an über 400 Millionen Mitglieder und Ende Juli stellte ein anderer Cyberkrimineller Daten von über 100 Millionen Facebook-Nutzern ins Internet.

Provider-Wechsel
Auch schon am Mittwoch war es zu vereinzelten Ausfällen oder Zugangsproblemen bei Facebook gekommen. Das Branchenmagazin "c'net" spekulierte, dass die Probleme möglicherweise auch mit einem Wechsel zu einem neuen Service-Provider zu tun haben könnte. Zur gleichen Zeit habe nämlich der US-Provider Quest seine Kunden über einen Ausfall informiert.
 

Zur Vollversion des Artikels
Weitere Artikel