De biostatisticus Charles Winsor (1895–1951) introduceerde dit begrip. Het is een aanvulling op de meer gekende gemiddelden: het rekenkundige gemiddelde en de mediaan, zie https://nl.wikipedia.org/wiki/Winsorgemiddelde
Indien de reeks getallen uitschieters bevat, dan heeft dit een grote impact op het rekenkundige gemiddelde. De mediaan houdt helemaal geen rekening met uitschieters.
Bij de berekening van het Winsorgemiddelde worden een aantal van de kleinste en de grootste waarden vervangen door de naastliggende kleinste en grootste waarde.
Men spreekt van het \(k\)-voudig Winsorgemiddelde als de \(k\) kleinste en de \(k\) grootste waarnemingen vervangen worden.
Voor de geordende waarnemingen \(x_{(1)}<= ... <=x_{(n)}\) is het \(k\)-voudige Winsorgemiddelde gedefiniëerd door de som:
gedeeld door het aantal getallen \(n\).
Schrijf twee functies:
De functie Winsor_gemiddelde(getallen) berekent het \(1\)-voudig Winsorgemiddelde. De functie heeft als enige parameter een lijst met getallen. Voor het \(1\)-voudig Winsorgemiddelde wordt het grootste getal vervangen door het tweede grootste getal, en het kleinste getal wordt vervangen door het tweede kleinste getal. Daarna bereken je het rekenkundige gemiddelde.
De functie Winsor_k_gemiddelde(getallen, k) berekent het \(k\)-voudig Winsorgemiddelde. De functie heeft een een tweede paramater k die bepaalt hoeveel van de grootste en kleinste waarden moeten vervangen worden door de naastliggende kleinste en grootste waarde.
Je mag veronderstellen dat \(0<= k < n/2\).
>>> getallen = [ 1, 2, 3, 3, 4, 5, 6, 6, 6, 7, 7, 8, 9, 10, 18, 21]
>>> Winsor_gemiddelde(getallen)
7.125
>>> Winsor_k_gemiddelde(getallen,2)
6.25
>>> Winsor_k_gemiddelde(getallen,7)
6.0