De biostatisticus Charles Winsor (1895–1951) introduceerde dit begrip. Het is een aanvulling op de meer gekende gemiddelden: het rekenkundige gemiddelde en de mediaan, zie https://nl.wikipedia.org/wiki/Winsorgemiddelde1
Indien de reeks getallen uitschieters bevat, dan heeft dit een grote impact op het rekenkundige gemiddelde. De mediaan houdt helemaal geen rekening met uitschieters.
Bij de berekening van het Winsorgemiddelde worden een aantal van de laagste en de hoogste waarden vervangen door de naastliggende laagste en hoogste waarde.
Men spreekt van het \(k\)-voudig Winsorgemiddelde als de \(k\) kleinste en de \(k\) grootste waarnemingen vervangen worden.
Voor de geordende waarnemingen \(x_{(1)}<= ... <=x_{(n)}\) is het \(k\)-voudige Winsorgemiddelde gedefiniëerd de som:
gedeeld door het aantal getallen \(n\).
Schrijf twee functies:
De functie Winsor_gemiddelde(getallen) berekent het \(1\)-voudig Winsorgemiddelde. De functie heeft als enige parameter een lijst met getallen. Voor het \(1\)-voudig Winsorgemiddelde wordt het grootste getal vervangen door het tweede grootste getal, en het kleinste getal wordt vervangen door het tweede kleinste getal. Daarna bereken je het rekenkundige gemiddelde.
De functie Winsor_k_gemiddelde(getallen, k) berekent het \(k\)-voudig Winsorgemiddelde. De functie heeft een een tweede paramater k die bepaalt hoeveel van de hoogste en laagste waarden moeten vervangen worden door de naastliggende laagste en hoogste waarde.
Je mag veronderstellen dat \(0<= k < n/2\).
>>> getallen = [ 1, 2, 3, 3, 4, 5, 6, 6, 6, 7, 7, 8, 9, 10, 18, 21]
>>> Winsor_gemiddelde(getallen)
7.125
>>> Winsor_k_gemiddelde(getallen,2)
6.25
>>> Winsor_k_gemiddelde(getallen,7)
6.0