In de vorige sectie hebben we vastgesteld dat het steekproefgemiddelde van
steekproef tot steekproef varieert rond het populatiegemiddelde dat we
willen schatten.
Om die reden wensen we in deze sectie een interval rond het
steekproefgemiddelde te bepalen waarbinnen we het populatiegemiddelde met
gegeven kans (bvb. 95% kans) kunnen verwachten.
In Sectie 5.4.1 zullen we dit uitwerken voor het geval waar de populatievariantie
Wanneer de individuele observaties
Het bevat met 95% kans het steekproefgemiddelde van een lukrake
steekproef. Dit interval kunnen we niet expliciet berekenen op basis van de
geobserveerde gegevens, omdat
Hoewel dit laatste interval nog steeds kan geïnterpreteerd worden als
een referentie-interval voor het steekproefgemiddelde, kunnen we er een veel
nuttigere interpretatie aan geven. Immers, de ongelijkheid
Dit leidt tot volgende definitie.
Definitie 24 (95% betrouwbaarheidsinterval voor populatiegemiddelde)
Het interval
bevat met 95% kans het populatiegemiddelde
Einde definitie
Een 95% betrouwbaarheidsinterval bepaalt met andere woorden een reeks waarden waarbinnen de gezochte populatieparameter waarschijnlijk (namelijk met 95% kans) valt.
Stel dat we in een steekproef een bloeddrukdaling van -18.93mmHg observeren en dat we weten dat de standaarddeviatie van de bloeddrukmetingen 9mmHg bedraagt. Dan vinden we een betrouwbaarheidsinterval voor de gemiddelde bloeddrukdaling van
De reden waarom over “95% kans” gesproken wordt, is omdat de eindpunten van het 95% betrouwbaarheidsinterval toevalsveranderlijken zijn die variëren van steekproef tot steekproef. Met andere woorden, verschillende steekproeven leveren telkens andere betrouwbaarheidsintervallen op, vermits die intervallen berekend zijn op basis van de gegevens in de steekproef. Men noemt het om die reden stochastische intervallen. Voor 95% van alle steekproeven zal het berekende 95% betrouwbaarheidsinterval de gezochte waarde van de populatieparameter bevatten, en voor de overige 5% niet. Dat wordt geïllustreerd a.d.h.v. een simulatiestudie in Sectie 5.4.3 (nadat we de intervallen hebben uitgebreid voor de meer realistische setting waarbij de variantie in de populatie ongekend is).
Uiteraard kunnen de onderzoekers o.b.v. een gegeven betrouwbaarheidsinterval
niet besluiten of het de gezochte parameterwaarde bevat of niet, vermits ze
precies op zoek zijn naar die onbekende waarde. Maar ze gebruiken een
procedure die in 95% van de gevallen werkt; m.a.w. die in 95% van de
gevallen de gezochte waarde bevat. Of nog, als men dagelijks gegevens zou
verzamelen en telkens een 95% betrouwbaarheidsinterval zou berekenen voor
een nieuwe parameter
Tot nog toe zijn we ervan uitgegaan dat de individuele observaties Normaal verdeeld zijn en dat hun variantie gekend is (want als de variantie
Wanneer bovendien de variantie ongekend is, kan me ze schatten door gebruik te maken van de
steekproefvariantie
set.seed(3146)
samp50 <- sample(fem$DirectChol,50)
ll <- mean(samp50 %>% log2) - 1.96*sd(samp50 %>% log2)/sqrt(50)
ul <- mean(samp50 %>% log2) + 1.96*sd(samp50 %>% log2)/sqrt(50)
popMean <- mean(fem$DirectChol%>%log2)
c(ll=ll,ul=ul,popMean=popMean)
## ll ul popMean ## 0.4326245 0.6291622 0.5142563
Bij 1 steekproef ligt het populatie gemiddelde binnen het BI of niet.
res$ll <- res$mean-1.96*res$se
res$ul <- res$mean+1.96*res$se
mu <- fem$DirectChol%>%
log2%>%
mean
res$inside<- res$ll <= mu & mu <= res$ul
res$n <- as.factor(res$n)
res %>%
group_by(n) %>%
summarize(coverage=mean(inside)) %>%
spread(n,coverage)
## # A tibble: 1 × 3 ## `10` `50` `100` ## <dbl> <dbl> <dbl> ## 1 0.92 0.942 0.954
Merk op dat de omvang in de steekproeven met 10 waarnemingen te laag is omdat we geen rekening houden met de onzekerheid in de schatting van de standaarddeviatie.
Als we kijken naar de eerste 20 intervallen, bevat 1 van de 20 niet het populatiegemiddelde.
res %>%
filter(n==10) %>%
slice(1:20) %>%
ggplot(aes(x = sample,y = mean,color = inside)) +
geom_point() +
geom_errorbar(aes(ymin = mean-1.96*se,ymax = mean+1.96*se))+
geom_hline(yintercept = fem$DirectChol %>% log2 %>% mean) +
ggtitle("20 CI for N = 10") +
ylim(range(fem$DirectChol %>% log2))
res %>%
filter(n == 50) %>%
slice(1:20) %>%
ggplot(aes(x = sample,y = mean,color = inside)) +
geom_point() +
geom_errorbar(aes(ymin = mean-1.96*se,ymax = mean+1.96*se))+
geom_hline(yintercept = fem$DirectChol %>% log2 %>% mean) +
ggtitle("20 CI for N = 50") +
ylim(range(fem$DirectChol %>% log2))
res %>%
filter(n == 100) %>%
slice(1:20) %>%
ggplot(aes(x = sample,y = mean,color = inside)) +
geom_point() +
geom_errorbar(aes(ymin = mean-1.96*se,ymax = mean+1.96*se))+
geom_hline(yintercept = fem$DirectChol %>% log2 %>% mean) +
ggtitle("20 CI for N = 100") +
ylim(range(fem$DirectChol %>% log2))
Om een betrouwbaarheidsinterval met een ander betrouwbaarheidsniveau,
De breedte van een
Betrouwbaarheidsintervallen worden niet enkel gebruikt voor het populatiegemiddelde, maar kunnen in principe voor om het even welke populatieparameter worden gedefinieerd. Zo kunnen ze bijvoorbeeld gedefinieerd worden voor een verschil tussen 2 gemiddelden, voor een odds ratio, voor een variantie, … De manier om die intervallen te berekenen is vaak complex en sterk afhankelijk van de gebruikte schatter voor de populatieparameter. Er wordt daarom niet van u verwacht dat u voor alle populatieparameters die we in deze cursus ontmoeten, een betrouwbaarheidsinterval kunt berekenen, maar wel dat u het kunt interpreteren.
Definitie 25 (Betrouwbaarheidsinterval)
Een
Einde Definitie