http://www.sunech.com/

Katastrofal datacenterflytning


Skrevet af Sune Christesen fredag d. 3 august 2007 kl. 17:43
Kategorier:
Hosting
Datacentre
Servere

For næsten en uge siden skulle Hostway flytte knap 4.000 dedikerede servere fra Miami til et nyt datacenter i Tampa (Florida, USA), og det gik langt fra som forventet. Den forventede nedetid var max 12-15 timer men her snart en uge efter, er flere kunder fortsat ikke kommet i luften igen.

I følge udtalelser til WHIR, skulle omkring 500 ud af de 4.000 servere være blevet ramt af hardware fejl i forbindelse med flytningen. Hostway havde ekstra reservedele klar og forventede at der ville blive problemer, dog ikke i den grad. Virksomheden har efterfølgende arbejdet i døgndrift og indkaldt ekstra mandskab, for at få kunderne i luften hurtigst muligt.

Årsagen er fortsat ukendt, men man kan spekulere i om Hostway ikke har taget højde nok for statisk elektricitet eller rystelser i forbindelse med flytningen. Samtidig er det et kendt faktum at nogle komponenter efter at have været i drift længe, simpelthen ikke kan mere når de bliver lukket ned og skal i drift igen.

De berørte kunder vil blive kompenseret individuelt for de problemer de har oplevet.

Generelt problem
En flytning af mange servere vil altid kræve nøje overvejelser og mange forberedelser, både i tilfælde som Hostway’s hvor de skal flyttes over lange strækninger - men også i mindre tilfælde som f.eks. flytning fra et serverrum til et andet i samme bygning. Det er svært at gardere sig fuldstændig mod de ting der kan opstå, men man bliver nødt til at have en rimelig andel reservedele klar samt en nøje udtænkt strategi for hvordan situationen skal gribes an, for at kunderne berøres mindst muligt.

Som nævnt i artiklen hos WHIR om episoden, var kommunikationen et af de største problemer Hostway oplevede - er der 500 servere der ikke kommer op igen og blot halvdelen af dem ringer og brokker sig, vil ens interne kommunikationssystem alt andet end lige ikke være i stand til at håndtere det. Det skal derfor, set fra en kundes perspektiv, ikke nødvendigvis stemples som dårlig service hvis en leverandør ikke tager telefonen mens der er et stort nedbrud.

Relaterede indlæg

Følg svar til dette indlæg via mit RSS feed. Du kan efterlade et svar eller lave trackback fra din egen side.

Tilføj kommentar