De mediaan in de statistiek

De mediaan is een centrummaat die een dataset in twee helften verdeelt indien deze in oplopende of aflopende volgorde is gesorteerd. Bijvoorbeeld, in de verzameling van de getallen 2, 5, 6, 7 en 9 is de mediaan 6. Als er een even aantal getallen is, is de mediaan het gemiddelde van de twee middelste waarden.

Voordelen van de mediaan

  1. Resistent: De mediaan is bestand tegen afwijkingen. Als een enkele uitschieter, zoals 99 in plaats van 9, per ongeluk wordt ingevoerd in een dataset, kan het gemiddelde sterk scheefgetrokken zijn, maar de mediaan blijft grotendeels onaangetast.

  2. Reflecteert de centrale tendens: De mediaan zorgt ervoor dat 50% van de waarnemingen erboven ligt en 50% eronder. Deze eigenschap is gunstig bij het vergelijken van bijvoorbeeld salarissen. In een groep met salarissen van 2100, 1850, 2307, 1789, 6199, … euro kan 90% onder het gemiddelde verdienen, maar nooit onder de mediaan.

  3. Voorspellend voor echte scenario’s: Indien een score van 5 overeenkomt met geslaagd en de gemiddelde score van de studenten is ook 5, dan betekent dat niet noodzakelijk dat de helft van de studenten geslaagd is. Echter indien de mediaan van de score 5 is, is het zeker dat 50% geslaagd is.

Samengevat

De mediaan biedt een centrale waarde die de verdeling van een dataset weerspiegelt en biedt inzichten die vaak representatiever zijn dan het gemiddelde, vooral in de aanwezigheid van uitschieters. Toch wordt in statistische analyses vaak gekozen voor het rekenkundig gemiddelde omdat deze over mooiere wiskundige eigenschappen bezit.