Disaster recovery test toont veelgemaakte fouten aan

U heeft een disaster recovery plan opgesteld, uw back-up proces en procedures zijn beschreven en ingeregeld. U maakt gebruik van software, bijvoorbeeld van Veritas, Arcserve of Veeam. U heeft een IT-beheerder in de arm genomen. Uw Disaster recovery is dus geborgd bij het optreden van downtime.

Wij nemen u graag mee naar de dagelijkse praktijk, mogelijke oorzaken van downtime, veel voorkomende fouten én het belang van een periodieke disaster recovery test.

De belangrijkste oorzaken van downtime

Er zijn al veel onderzoeken gedaan naar downtime en de belangrijkste oorzaken ervan. Als we er goed over nadenken zijn de oorzaken ook best vanzelfsprekend. We zetten de meest voorkomende even op een rij.

  1. Hard- of software fouten
    Een harde schijf die crasht, een software update mislukt of een switch die uitvalt. Een server die door oververhitting uitschakelt.
  2. Menselijke fouten
    Niet opzettelijk, maar gewoon omdat we per abuis een virtuele machine wissen, verkeerde data verwijderen of juist terugzetten. Soms vergeten we gewoon eenvoudig een stekker in het stopcontact te steken of -veel serieuzer- is er een vorm van sabotage aanwezig in het bedrijf.
  3. Cyberaanvallen
    Jaren geleden was dit al een probleem maar deed het zich vooral voor bij grotere bedrijven. Vandaag de dag is het een probleem voor ieder MKB bedrijf. Ransomware infecteert uw netwerk waardoor data niet meer beschikbaar is en uw processen accuut stilvallen.
  4. Stroomonderbreking
    Dit lijkt onschuldig en zelden voor te komen in Nederland. In België is er bij stroomtekort een afschakelplan dat in werking treed. Een afschakelkaart laat bedrijven zien hoe het in hun regio is geregeld. In Nederland kennen we dit niet, maar komt het toch met regelmaat voor dat een stroomstoring zich voordoet met downtime als gevolg.
  5. Overige calamiteiten
    Waarbij brand en wateroverlast het vaakst naar voren komen. Een switch die uitbrand of brand bij de buren waardoor er wateroverlast is. Uw pand is niet meer bereikbaar, ook dit betekent downtime in uw dienstverlening.
  • Veelvoorkomende fouten Disaster Recovery

Veel voorkomende disaster recovery fouten

Naast de belangrijkste oorzaken die downtime tot gevolg hebben kunnen we ook inzage geven in veel gemaakt fouten tijdens disaster recovery. We hebben er 7 voor u op een rij gezet.

  1. Back-ups niet gecontroleerd
    Het back-up proces is ingeregeld en actief, u bent in de veronderstelling dat ná herstel alles weer naar behoren aanwezig is en functioneert. Helaas blijkt dat niet alle data of subsets aan data meegenomen zijn in de back-ups. U doet er dus verstandig aan dit met regelmaat te controleren.
  2. Back-up procedures niet up tot date
    De procedures voor disaster recovery hebben onderhoud nodig; het is géén ‘fire and forget’ scenario. De back-up procedures zijn vaak complex, on-premise en cloud procedures lopen door elkaar heen. Veranderingen zijn van alle dag en dit vraagt om controles, aanpassingen en communicatie.
  3. Back-ups missen data
    De back-ups gaan verder dan alleen de centrale data en sub-sets aan data. Vaak staat een deel van toch cruciale data opgeslagen op devices van medewerkers. Lopen deze devices ook mee in uw back-ups? Bij downtime kunnen deze devices niet voorhanden zijn doordat er geen toegang meer is tot de locatie en de data niet beschikbaar is.
  4. Hardware niet op voorraad of aanwezig
    Vervangende hardware is niet op voorraad of aanwezig op de uitwijklocatie. Zorg voor periodieke voorraad controles zodat u bij downtime niet voor een verrassing komt te staan. Een koerier te moeten laten rijden kost extra tijd. Erger nog, de benodigde hardware kan ondertussen niet meer verkrijgbaar zijn en een alternatief is niet voorhanden of bekend/getest.
  5. Incompatibiliteit issues hardware en software
    Updates en aanpassingen zijn dagelijkse praktijk, de impact hiervan in relatie tot disaster recovery wordt vaak vergeten. Het werkte namelijk bij de 1ste opzet prima. Zo kan toegang tot applicaties geweigerd worden en is een down- of upgrade nodig. De calamiteiten-schakeling van telefonie is niet actief na een laatste update of firmware is verouderd.
  6. Geen vervangende werkplekken
    Bij het optreden van downtime kunnen ook uw werkplekken verloren gaan. Is in uw disaster recovery plan rekening gehouden met alternatieve werkplekken? Waar gaan uw medewerkers heen, wat heeft u nodig en hoe zijn de werkplekken uitgerust. Is de beoogde locatie wel bereikbaar? Thuiswerken, kan voor een uur of wat, maar niet voor langere tijd.
  7. Wachtwoorden niet beschikbaar
    U heeft de wachtwoorden nodig om systemen op te kunnen starten na downtime. Zorg ervoor dat deze allemaal beschikbaar zijn. Anders kan het zomaar dat niet alle systemen op het juiste moment in de lucht komen.

Plan een periodieke disaster recovery test

Wacht zeker niet tot het moment van downtime daar is. Disaster recovery is een cyclisch proces. Borg dit door het periodiek testen van uw disaster recovery plan. Niet alleen theoretisch. Zet een crisissimulatie op en neem het gehele plan door. Werk op vervangende werkplekken om zo alle facetten te hebben doorlopen zonder dat uw interne- en externe omgeving er hinder van ondervind. Vraag uw business continuïty partner naar de mogelijkheden die zij bieden.

Mocht u naar aanleiding van dit artikel vragen hebben, neem gerust contact met ons op voor advies op maat.