In de vorige sectie hebben we vastgesteld dat het steekproefgemiddelde
van steekproef tot steekproef varieert rond het populatiegemiddelde dat
we willen schatten. Om die reden wensen we in deze sectie een interval
rond het steekproefgemiddelde te bepalen waarbinnen we het
populatiegemiddelde met gegeven kans (bvb. 95% kans) kunnen verwachten.
In Sectie 5.4.1 zullen we dit uitwerken voor
het geval waar de populatievariantie
Wanneer de individuele observaties
Het bevat met 95% kans het steekproefgemiddelde van een lukrake
steekproef. Dit interval kunnen we niet expliciet berekenen op basis van
de geobserveerde gegevens, omdat
Hoewel dit laatste interval nog steeds kan geïnterpreteerd worden als
een referentie-interval voor het steekproefgemiddelde, kunnen we er een
veel nuttigere interpretatie aan geven. Immers, de ongelijkheid
Dit leidt tot volgende definitie.
Het interval
bevat met 95% kans het populatiegemiddelde
Einde definitie
Een 95% betrouwbaarheidsinterval bepaalt met andere woorden een reeks waarden waarbinnen de gezochte populatieparameter waarschijnlijk (namelijk met 95% kans) valt.
Stel dat we in een steekproef een bloeddrukdaling van -18.93mmHg
observeren en dat we weten dat de standaarddeviatie van de
bloeddrukmetingen 9mmHg bedraagt. Dan vinden we een
betrouwbaarheidsinterval voor de gemiddelde bloeddrukdaling van
De reden waarom over “95% kans” gesproken wordt, is omdat de eindpunten van het 95% betrouwbaarheidsinterval toevalsveranderlijken zijn die variëren van steekproef tot steekproef. Met andere woorden, verschillende steekproeven leveren telkens andere betrouwbaarheidsintervallen op, vermits die intervallen berekend zijn op basis van de gegevens in de steekproef. Men noemt het om die reden stochastische intervallen. Voor 95% van alle steekproeven zal het berekende 95% betrouwbaarheidsinterval de gezochte waarde van de populatieparameter bevatten, en voor de overige 5% niet. Dat wordt geïllustreerd a.d.h.v. een simulatiestudie in Sectie 5.4.3 (nadat we de intervallen hebben uitgebreid voor de meer realistische setting waarbij de variantie in de populatie ongekend is).
Uiteraard kunnen de onderzoekers o.b.v. een gegeven
betrouwbaarheidsinterval niet besluiten of het de gezochte
parameterwaarde bevat of niet, vermits ze precies op zoek zijn naar die
onbekende waarde. Maar ze gebruiken een procedure die in 95% van de
gevallen werkt; m.a.w. die in 95% van de gevallen de gezochte waarde
bevat. Of nog, als men dagelijks gegevens zou verzamelen en telkens een
95% betrouwbaarheidsinterval zou berekenen voor een nieuwe parameter
Tot nog toe zijn we ervan uitgegaan dat de individuele observaties
Normaal verdeeld zijn en dat hun variantie gekend is (want als de
variantie
Wanneer bovendien de variantie ongekend is, kan me ze schatten door
gebruik te maken van de steekproefvariantie
set.seed(3146)
samp50 <- sample(fem$DirectChol,50)
ll <- mean(samp50 %>% log2) - 1.96*sd(samp50 %>% log2)/sqrt(50)
ul <- mean(samp50 %>% log2) + 1.96*sd(samp50 %>% log2)/sqrt(50)
popMean <- mean(fem$DirectChol%>%log2)
c(ll=ll,ul=ul,popMean=popMean)
## ll ul popMean ## 0.4326245 0.6291622 0.5142563
Bij 1 steekproef ligt het populatie gemiddelde binnen het BI of niet.
res$ll <- res$mean-1.96*res$se
res$ul <- res$mean+1.96*res$se
mu <- fem$DirectChol%>%
log2%>%
mean
res$inside<- res$ll <= mu & mu <= res$ul
res$n <- as.factor(res$n)
res %>%
group_by(n) %>%
summarize(coverage=mean(inside)) %>%
spread(n,coverage)
## # A tibble: 1 x 3 ## `10` `50` `100` ## <dbl> <dbl> <dbl> ## 1 0.92 0.942 0.954
Merk op dat de omvang in de steekproeven met 10 waarnemingen te laag is omdat we geen rekening houden met de onzekerheid in de schatting van de standaarddeviatie.
Als we kijken naar de eerste 20 intervallen, bevat 1 van de 20 niet het populatiegemiddelde.
res %>%
filter(n==10) %>%
slice(1:20) %>%
ggplot(aes(x = sample,y = mean,color = inside)) +
geom_point() +
geom_errorbar(aes(ymin = mean-1.96*se,ymax = mean+1.96*se))+
geom_hline(yintercept = fem$DirectChol %>% log2 %>% mean) +
ggtitle("20 CI for N = 10") +
ylim(range(fem$DirectChol %>% log2))
res %>%
filter(n == 50) %>%
slice(1:20) %>%
ggplot(aes(x = sample,y = mean,color = inside)) +
geom_point() +
geom_errorbar(aes(ymin = mean-1.96*se,ymax = mean+1.96*se))+
geom_hline(yintercept = fem$DirectChol %>% log2 %>% mean) +
ggtitle("20 CI for N = 50") +
ylim(range(fem$DirectChol %>% log2))
res %>%
filter(n == 100) %>%
slice(1:20) %>%
ggplot(aes(x = sample,y = mean,color = inside)) +
geom_point() +
geom_errorbar(aes(ymin = mean-1.96*se,ymax = mean+1.96*se))+
geom_hline(yintercept = fem$DirectChol %>% log2 %>% mean) +
ggtitle("20 CI for N = 100") +
ylim(range(fem$DirectChol %>% log2))
Om een betrouwbaarheidsinterval met een ander betrouwbaarheidsniveau,
De breedte van een
Betrouwbaarheidsintervallen worden niet enkel gebruikt voor het populatiegemiddelde, maar kunnen in principe voor om het even welke populatieparameter worden gedefinieerd. Zo kunnen ze bijvoorbeeld gedefinieerd worden voor een verschil tussen 2 gemiddelden, voor een odds ratio, voor een variantie, … De manier om die intervallen te berekenen is vaak complex en sterk afhankelijk van de gebruikte schatter voor de populatieparameter. Er wordt daarom niet van u verwacht dat u voor alle populatieparameters die we in deze cursus ontmoeten, een betrouwbaarheidsinterval kunt berekenen, maar wel dat u het kunt interpreteren.
Een
Einde Definitie