De waarde van het “gemiddelde” in de statistiek

Stel je voor dat je wilt weten hoe lang de leerlingen op je school zijn. Het is niet praktisch om de lengte van iedereen op te sommen. In plaats daarvan vraag je waarschijnlijk: “Wat is de gemiddelde lengte?”.

In de statistiek geeft het “gemiddelde” ons een snelle momentopname, één enkel getal dat een heleboel getallen vertegenwoordigt. Het is superhandig voor het samenvatten van gegevens en het maken van vergelijkingen. Als je bijvoorbeeld hoort dat de gemiddelde testscore in een klas 85% is, krijg je meteen een idee van de algemene prestaties van de klas.

Maar hoewel gemiddelden nuttig zijn, geven ze niet alles weer. Als twee basketbalteams een gemiddelde lengte van 1,80 m hebben, kan het zijn dat bij het ene team alle spelers bijna 1,80 m zijn, terwijl het andere team kortere en veel langere spelers heeft. Dus, hoewel gemiddelden krachtig zijn, is het ook essentieel om naar andere aspecten van de gegevens te kijken voor een compleet beeld.

Het rekenkundig gemiddelde is omwille van aangename wiskundige eigenschap het populairst:

Het rekenkundig gemiddelde \(\overline{x}\) van een rij gegevens \((x_1, x_2, \ldots, x_n)\) is als volgt gedefinieerd:

\[\overline{x} = \dfrac{1}{n} \sum_{i=1}^n x_i\]

Het gemiddelde zegt niet alles

Hoewel het rekenkundig gemiddelde eenvoudig te berekenen en begrijpen is, is het niet het begin- en eindpunt van elke analyse. Er zijn namelijk wel enkele beperkingen.

Onthoud dat het “gemiddelde” een startpunt is om gegevens te begrijpen, maar er ligt altijd meer onder de oppervlakte!

“Een statisticus waadde vol vertrouwen door een rivier die gemiddeld één meter diep was. Hij verdronk.”

Godfried Bomans - Nederlands schrijver 1913-1971