De dataset stokstaartjesDat.txt
bestaat uit \(60\) observaties van de volgende variabelen:
gewicht
het gewicht van het stokstaartjetijdstip
tijdstip van de meting. "voor"
indien gewogen werd voor de verbanning, anders "na"
verbannen
\(1\) indien verbannen, \(0\) indien niet.#In het tekstbestand zijn er drie kolomnamen gegeven op de eerste lijn; gewicht, tijdstip en verbannen.
#Er zijn echter vier waarden vanaf de tweede lijn, waarbij de eerste waarde een rij nummer is.
#Dit zal dus voor problemen zorgen bij het inlezen.
#Om dit probleem te verhelpen gebruiken we skip = 1 om de eerste rij met de kolomnamen over te slaan.
#Daarna geven we zelf kolomnamen door met col_names.
#Met col_types vermelden we specifiek welk type variabele iedere kolom is.
#Met col_select selecteren we dan de kolommen die we wel degelijk nodig hebben.
stokstaartjes <- read_delim("https://raw.githubusercontent.com/statOmics/statistiekBasisCursusData/master/practicum3/stokstaartjesDat.txt",
delim = "\ " ,
skip = 1,
col_names = c("rij_nr","gewicht","tijdstip","verbannen"),
col_types = list(col_integer(), col_double(), col_factor(), col_factor()),
col_select = c("gewicht","tijdstip","verbannen"))
stokstaartjes <- stokstaartjes %>%
mutate(
index = factor(c(rep(1:15,2),rep(16:30,2)))
)