Eine professionelle Wissensdatenbank zu globalen IT-Infrastrukturausfällen, technischen Hintergründen und Resilienz-Strategien.
Die Architektur moderner IT-Systeme ist komplex. Das sind die häufigsten "Single Points of Failure".
Wenn das DNS oder BGP-Routing versagt, sind Server technisch online, aber für niemanden erreichbar.
Ungestetete Konfigurationsänderungen oder fehlerhafte Software-Patches sind die Ursache Nr. 1 für globale Ausfälle.
Gezielte DDoS-Attacken oder Ransomware-Infektionen zwingen Unternehmen oft, Systeme präventiv abzuschalten.
Durch eine Fehlkonfiguration im BGP (Border Gateway Protocol) kappte Facebook versehentlich die Verbindung seiner DNS-Server zum Internet. Das Unternehmen war 6 Stunden lang digital "nicht existent". Fakten
Wie moderne IT-Abteilungen Risiken minimieren.
3 Kopien der Daten, auf 2 verschiedenen Medien, davon 1 Kopie extern (Offsite). Dies ist der einzige wirksame Schutz gegen Datenverlust durch Ransomware oder physische Zerstörung. Quelle
Proaktives Herbeiführen von Fehlern (z.B. Server abschalten), um die Selbstheilungskräfte des Systems zu testen. Bekannt durch Netflix' "Chaos Monkey". Quelle
Verteilung kritischer Dienste auf mehrere Rechenzentren in unterschiedlichen Regionen. Schützt vor lokalen Katastrophen wie Stromausfällen oder Überschwemmungen. BSI Quelle