Old Faithful1 is de beroemdste geiser in het Amerikaanse Yellowstone National Park. Van de vele geisers is deze de meest actieve, namelijk om de 60 tot 80 minuten worden hete dampen in de lucht geblazen.
Van de meeste uitbarstingen wordt de tijdsduur gemeten, alsook de tijd waarop er geen uitbarsting was. Via GeyserTimes2 kan je de meest recente uitbarstingen (tijdens de openingstijden van het park) volgen.
Importeer deze dataset3 met behulp van de volgende code.
# Een dataset met gegevens Old Faithful
data <- read.csv("https://raw.githubusercontent.com/gchoi/Dataset/master/OldFaithful.csv",
header = TRUE)
colnames(data) <- c("time_eruption", "time_waiting")
Via head(data)
om een voorsmaakje van de gegevens te verkrijgen.
time_eruption time_waiting
1 3.600 79
2 1.800 54
3 3.333 74
4 2.283 62
5 4.533 85
6 2.883 55
time_eruption
bevat de tijdsduur in minuten van de uitbarsting, terwijl time_waiting
de tijd in minuten bevat tussen de vorige en de beschouwde uitbarsting.
Binnen Yellowstone National Park noemt men een uitbarsting kort indien deze minder dan 3,5 minuten duurt. Bepaal een booleaanse vector kort
waarin je opslaat welke uitbarstingen van het korte type zijn.
Was de wachttijd voor de korte uitbarstingen verschillend dan deze voor de lange uitbarstingen?
Bepaal met behulp van de vorige booleaanse vector de vectoren wachttijd_kort
en wachttijd_lang
waar je de wachttijden voor een korte uitbarsting enerzijds en voor een lange uitbarsting anderzijds in opslaat. Bewaar het gemiddelde van deze wachttijden respectievelijk in gem_wachttijd_kort
en gem_wachttijd_lang
.
Bereken hoeveel procent van het totale aantal uitbarstingen een wachttijd hebben tussen gem_wachttijd_kort
en gem_wachttijd_lang
. Sla dit op in de variabele percentage_wachttijd
. Rond het percentage af op 2 cijfers na de komma.