Vraag 1 Dataset inlezen

De dataset stokstaartjesDat.txt bestaat uit \(60\) observaties van de volgende variabelen:

gewicht het gewicht van het stokstaartje
tijdstip tijdstip van de meting. "voor" indien gewogen werd voor de verbanning, anders "na"
verbannen \(1\) indien verbannen, \(0\) indien niet.

#In het tekstbestand zijn er drie kolomnamen gegeven op de eerste lijn; gewicht, tijdstip en verbannen. 
#Er zijn echter vier waarden vanaf de tweede lijn, waarbij de eerste waarde een rij nummer is. 
#Dit zal dus voor problemen zorgen bij het inlezen. 
#Om dit probleem te verhelpen gebruiken we skip = 1 om de eerste rij met de kolomnamen over te slaan. 
#Daarna geven we zelf kolomnamen door met col_names. 
#Met col_types vermelden we specifiek welk type variabele iedere kolom is. 
#Met col_select selecteren we dan de kolommen die we wel degelijk nodig hebben.

stokstaartjes <- read_delim("https://raw.githubusercontent.com/statOmics/statistiekBasisCursusData/master/practicum3/stokstaartjesDat.txt", 
                            delim = "\ " , 
                            skip = 1, 
                            col_names = c("rij_nr","gewicht","tijdstip","verbannen"), 
                            col_types = list(col_integer(), col_double(), col_factor(), col_factor()), 
                            col_select = c("gewicht","tijdstip","verbannen"))

stokstaartjes <- stokstaartjes %>% 
  mutate(
	  index = factor(c(rep(1:15,2),rep(16:30,2)))
  )