Som nogen måske allerede er opmærksomme på fik en annoncering med et 32-bit ASN i går fik en del Quagga routere til at crashe (samt løsninger som Vyatta der er baseret på Quagga), som følge af et bug i håndteringen af 32-bit AS numre. Annonceringen blev lavet i forbindelse med det kommende AfNOG-10 arrangement i Cairo, der lige netop skulle bevise at verden var klar til 32-bit AS numre. Ironisk nok.
Forhåbentlig bliver verden dog mere klar til det efter denne episode, eftersom tilgængeligheden af 16-bit AS numre falder og man pr. 1/1 i år begyndte at allokere 32-bit as numre som standard mens det fra 1/1 2010 ikke bliver muligt længere at vælge mellem 16 og 32-bit (i hvert fald hos RIPE).
Flere danske udbydere, inklusive vores, var desværre ramt af det pågældende bug og fik som følge af det flere timers netværksproblemer søndag fra kl. 14 og frem mens der blev fejlsøgt og patchet.
Det pågældende bug var desværre ikke engang helt nyt, så rettidig omhu kunne have forhindret den uheldige affære. Noget de fleste af de berørte udbydere forhåbentlig har lært af, vi vil i hvert fald stille krav til vores udbyder omkring ændring i fremtidige rutiner på dette område.
At vi også blev berørt af problemet var frustrerende eftersom vi intet selv kunne stille op ud over at afvente at vores udbyder løste det, særligt taget i betragtning af at jeg havde læst om problemet flere dage forinden og forventede at vores udbyder var opmærksom på den slags. De fleste kunder har dog heldigvis taget den meget beklagelige episode pænt grundet omstændighederne. Dog kan man jo selvfølgelig ikke fralægge sig ansvaret blot fordi at det er ens leverandør der klokker i det, så det vil naturligvis få konsekvenser længere oppe i fødekæden samt i fremtidig planlægning.
Bottom line: Software er lavet af mennesker og mennesker laver fejl så at der er et bug i Quagga gør det ikke nødvendigvis til en dårlig løsning, men holder man sig ikke opdateret med hvad der sker og får patchet sine routere så kan det sjovt nok få fatale konsekvenser - uanset om der er tale om en router fra Cisco eller en server med Quagga eller lignende. Redundans kan man ligeledes have nok så meget af, hvis enhederne kører samme software vil de jo alle være berørte af problemet. Forhåbentlig en søndag mange lærte noget af.



