Een storm op internet maandagavond: Facebook, Whatsapp en Instagram lagen er urenlang uit. De domeinen reageerden niet meer en de IP-adressen van de organisatie waren urenlang onbereikbaar. Bijna alsof iemand de kabel uit Facebook had getrokken en het van het internet had afgesloten. Hoe kon dat gebeuren? Hanif Azis en Renier van Gestel, network engineers bij True, nemen je erin mee.
Onbereikbaar door een uitval van BGP
Het internet is een netwerk van allemaal losse netwerken. Om deze netwerken met elkaar te verbinden, bestaat het Border Gateway Protocol, ook wel BGP. “Met dit protocol delen netwerken route-informatie met elkaar. Je geeft er eigenlijk de route naar je website of app op een server aan. Via BGP worden de routes naar een IP-adres bepaald. Is een specifieke route dan niet beschikbaar, dan zorgt BGP ervoor dat er een andere route wordt gebruikt”, zegt Renier van Gestel, network engineer bij True. “Zonder BGP is er geen internet mogelijk; er zouden geen verbindingen bekend zijn.”
Renier van Gestel
Hanif Azis
“Als bijvoorbeeld een router uit valt, stopt ook de BGP. De IP’s achter deze router worden niet meer “aangekondigd” op het internet, en zijn dan ook niet meer bereikbaar. De andere netwerken van het internet weten dan niet meer waar ze de website of data kunnen vinden”, zegt Hanif Azis, network engineer bij True. “Dat kan gebeuren als een router uitvalt, maar ook als de configuratie wordt overschreven of als BGP wordt uitgezet.”
In het geval van Facebook lag het aan veranderingen in de configuratie van de routers, gaf de organisatie later in een verklaring aan.
Renier: “Met de uitval van BGP verdwenen ook de routes naar de Domain Name Server (DNS) van Facebook. Door de DNS hoef je niet een IP-adres als 31.13.64.35 te onthouden, maar kun je naar het mensvriendelijker www.facebook.com. Als een DNS-resolver het IP-adres van een domeinnaam niet kan vinden, dan maakt hij een connect naar de DNS van Facebook om het IP-adres te achterhalen. Alleen waren deze nameservers ook niet meer bereikbaar vanwege de BGP-problemen.”
Compleet offline, ook gebouwen niet toegankelijk
“Het vreemde aan de situatie is wel waarom het 7 uur heeft geduurd voordat Facebook weer bereikbaar was”, zegt Hanif. “Normaal heb je een out-of-bounds (OOB) verbinding. Via deze OOB kun je ook op het netwerk komen als alles offline is, om wijzigingen door te voeren en BGP weer draaiende te krijgen. Gezien de tijd die het duurde voor Facebook weer bereikbaar was, moet ook deze verbinding niet bereikbaar zijn geweest.”
Facebook was daarmee flink offline. Wereldwijd werden 3,5 miljard gebruikers getroffen, medewerkers konden gebouwen niet meer binnen en software voor interne communicatie was niet te gebruiken.
Renier: “Gisteren werd weer duidelijk wat het gevolg is van uitval van BGP: dan staat alles in je netwerk offline. Zonder BGP ben je niet aanwezig op internet.”