In 10 stappen een effectieve diagnose stellen en MTTF te reduceren

Bob Melgers

Hoe kan je op een effectieve manier de oorzaak van netwerkproblemen achterhalen? De ervaring leert dat diagnose stellen bij netwerkproblemen vaak een tijdrovende bezigheid is, omdat het vaak geen “harde” fout betreft. Daarmee bedoel ik dat bijvoorbeeld een server is gecrasht of dat er een stekker uit ligt.

Maar omdat het netwerk vandaag de dag van cruciaal belang is voor bedrijfsprocessen en de continuïteit is het wel zaak problemen zo snel mogelijk de wereld uit te helpen. De zogenaamde MTTF (mean time to fix) is dan ook een uitdaging voor iedere organisatie bij het stellen van een diagnose.

Deze blog gaat over aantal basis methodieken voor het tackelen van periodieke problemen. Als in een organisatie gebruikers klagen over de performance van applicaties, dan zijn daarbij meerdere technische disciplines betrokken. Vaak is een van de partijen een outsourcing partner. Om toch een effectieve diagnose te stellen is meten noodzakelijk. Het biedt feitelijk inzicht, oorzaken en gevolgen zijn goed aan te wijzen en te alloceren.

De baseline

Uitgangspunt is wat ik de baseline noem: wat is de normale performance en wat zijn de trends? Zonder te meten zijn deze waardes een gevoelskwestie. Vaak vindt men iets functioneel, dus dan zal het automatisch wel goed zijn. Bij veel van onze opdrachtgevers blijkt echter dat er niet-zichtbare trends zijn die op korte en lange termijn problemen gaat geven. Dit komt door de (wild)groei van toegepaste technologieën. Het is te vergelijken met een groot treinongeluk. Uit onderzoek blijkt vaak niet een grote oorzaak, maar een samenloop van allerlei omstandigheden de oorzaak van een ramp. In het netwerk kun je denken aan out of specs werkende apparatuur, het doorsturen van data met corrupte informatie, meer wachtrijen van taken in servers, applicaties die CPU en memory resources opeten, etc.

Stappen voor een snelle diagnose

Inzicht in de technische keten is dus essentieel bij het snel kunnen vinden van de oorzaak van een performance probleem. Een snellere server kopen biedt wellicht op korte termijn verlichting, maar blijkt al snel geen structurele oplossing. Het performance probleem steekt de kop weer op.

Volg de tien stappen om een effectieve en snelle diagnose te stellen:

  1. Inzet van meetinstrumenten en tools voor inzicht in afwijkingen
  2. Een blokschema voor het inzichtelijk hebben van de technische keten
  3. Het verzamelen van feiten over de onderdelen in de keten
  4. Het delen van de informatie (hoe technisch ook)
  5. Het stellen van de volgende vragen:
    • Waar en wanneer spelen er out of specs situaties?
    • Wat is een normale situatie?
    • Wat is de kwantiteit van de data?
    • Wat kunnen we uitsluiten?
  6. Het inlassen van een evaluatie moment voor inspecties en bevindingen
  7. Vaststellen van eventuele resource problemen of kantelpunten
  8. Het uitvoeren van de voorstellen ter verbetering
  9. Controle op triggers en out of specs
  10. Nieuwe operationeel baseline niveau vastleggen.

Met het volgen van de stappen en het inzetten van de juiste tools is het vinden van de oorzaak van uw netwerkproblemen een stuk eenvoudiger. U kunt de MTTF radicaal verkorten! Er zijn gratis tools maar deze nemen zeer veel tijd in beslag om de gegevens te kunnen distilleren. Een betaalde tool heeft vaak een expert systeem. Deze geeft precies aan waar de fouten zitten. Bovendien kost dit u op deze manier nog nauwelijks tijd.

Eerder schreef ik al deze blog over Wireshark en de Observer Protocol Analyzer.

Wij leveren oplossingen in de vorm van diensten en producten die bijdragen aan een stabiele IT omgeving. Wilt u meer informatie, bel ons gerust!