NHANES: Gender
library(NHANES)
NHANES %>% ggplot(aes(x=Gender)) + geom_bar()
- Gender is een binaire variabele.
- Het volgt een Bernoulli distibutie.
- De Bernoulli distributie heeft een parameter: het gemiddelde \(\pi\).
- We kunnen \(\pi\) schatten op basis van de steekproef door het steekproefgemiddelde te berekenen \(\bar x = \sum\limits_{i=1}^n x_i\)
- Merk op dat het steekproefgemiddelde zelf een toevallig veranderlijke is! Het wijzigt ook van steekproef tot steekproef!
NHANES %>%
dplyr::count(Gender) %>%
mutate(probability = n/sum(n))
## # A tibble: 2 × 3
## Gender n probability
## <fct> <int> <dbl>
## 1 female 5020 0.502
## 2 male 4980 0.498