Gefopt door statistiek (over het ‘gemiddelde’)
Ik kom steeds meer bedrijven tegen die zich bezig houden met bouwen van dashboards. Er is blijkbaar behoefte aan praktisch overzichten bij managers en pro’s. Een veel gebruikte logica op deze dashboards is ‘het gemiddelde’ uitdrukken in één getal. Helaas: op de waarde van ‘het gemiddelde’ valt heel vaak iets af te dingen. Vandaar dit artikeltje.
Het idee gemiddelde is handig want het maakt dat je een serie gegevens netjes terug kunt brengen tot één simpel getal. En dat is iets waar ons brein van houdt. Er zijn wel een paar dingen die je beter heel goed in de gaten kunt houden als je gaat sturen op dit getal.
Het bestaat niet in de werkelijkheid
“Het Nederlandse gezin heeft gemiddeld 1,7 kind.”
Een 0,7 kind bestaat uiteraard niet. En zo is het heel veel gemiddelden. Het getal is een abstractie.
Het verhult de data erachter
“Gemiddeld 45 % van de deelnemende medewerkers geeft aan dat zij het koud hebben op het werk.”
Hoeveel medewerkers er zijn ondervraagd betekent iets voor de waarde van het gemiddelde.
Niet altijd zinnig
Een gemiddelde berekenen heeft alleen maar zin in een situatie waarin er rust heerst en er geen hele grote uitschieters mogelijk zijn.
- De gemiddelde lengte van de Nederlandse man is een getal wat betekenis zou kunnen hebben voor de kledingindustrie en dergelijke.
- Het gemiddelde vermogen van de Nederlander berekenen is betekenisloos omdat een paar hele grote uitschieters zorgen voor een groot deel van dit percentage.
Drie manieren om een gemiddelde te berekenen
- Tel alle data op en deel ze door het aantal (zie voorbeeld hieronder). Dit getal heet de ‘mean’.
- Zoek het getal op met de middelste waarde (net zoveel hoger en net zoveel lager). Dit gemiddelde heet de ‘mediaan’.
- Kijk naar welk getal het meest voorkomt. Dit getal heet de ‘modus’ (zoals in Jan Modaal).
Voorbeeld
Als ik een reeks heb van 2 -11-12-12-16-21-27-34-72 dan
is de mean: 207/9=23 (alle getallen opgeteld gedeeld door het aantal)
is de mediaan: 16 (4 eronder en 4 erboven)
is de modus: 12 (want komt het meeste voor)
Zoals je kunt zien is er nogal een verschil tussen de verschillende gemiddelden.
Hetgeen betekent dat wanneer je ergens een gemiddelde hoort noemen het handig is om te weten van welk van deze drie gemiddelden gebruikt wordt.
“Wij zijn een hele goede werkgever want het gemiddelde brutoloon is € 4500. “
Wanneer de directiesalarissen zijn meegeteld dan zegt dit niet zoveel (mean). Als dit het middelste loon is zegt het ook nog niet zo veel maar iets meer (mediaan). Wanneer dit het modale loon is dan is het wel een echt goede werkgever (als je kijkt naar salaris).
“Het gemiddelde ziekteverzuim is 3,4 %.”
Wanneer alle afdelingen zijn meegeteld dan hebben we iets wat we kunnen volgen als trend (mean). Als gebruikt gemaakt is van de mediaan dan worden we gefopt want dan vallen de afdelingen met de hoogste scores er uit (net als die met de laagste scores uiteraard maar die werken minder sterk door want lager dan nul kan niet). Als we hier de modus gebruiken zegt het ook niet zo veel.
De moraal van het verhaal
Omdat de meeste van ons een broertje of zusje dood hebben aan statistiek zijn we makkelijk te foppen met cijfers. Wees derhalve gezond kritisch als je het begrip gemiddelde voorbij ziet komen. En omgekeerd wees heel helder wat je hebt berekend als je zelf een gemiddelde wilt gebruiken als betekenisvol getal of als onderdeel van een argument.
Tip! Ben je een Apple/Mac gebruiker? Kijk dan eens op de website MacMonk