Game of Thrones is een Amerikaanse fantasy-televisieserie die werd uitgezonden op de televisiezender HBO. Het is gebaseerd op de boeken uit de serie “A song of Ice and Fire” van de Amerikaanse schrijver George R.R. Martin. De serie liep van 17 april 2011 tot 19 mei 2019.

Maak gebruik van deze dataset1, die je kan inlezen via:
# Dataset Game of Thrones
data <- read.csv(paste0("https://raw.githubusercontent.com/MuazmaZ/got-data-analysis/master/got_csv_full_clean.csv"),
sep = ",", header = TRUE,
colClasses = c("numeric", "NULL", "numeric", rep("character",2), rep("NULL", 2), rep("numeric", 2), "NULL", rep("numeric",3)))
# De kolommen hernoemen
colnames(data) <- c("season", "episode", "name", "director",
"US_viewers_million", "runtime_mins", "IMDB_votes", "IMDB_score", "notable_deaths")
Via head(data) krijg je een overzicht van de dataset.
season episode name director US_viewers_million runtime_mins IMDB_votes IMDB_score notable_deaths
1 1 1 Winter Is Coming Tim Van Patten 2.22 62 27685 9.0 4
2 1 2 The Kingsroad Tim Van Patten 2.20 56 21256 8.8 3
3 1 3 Lord Snow Brian Kirk 2.44 58 20090 8.7 0
4 1 4 Cripples, Bastards, and... Brian Kirk 2.45 56 19123 8.8 1
5 1 5 The Wolf and the Lion Brian Kirk 2.58 55 20062 9.1 5
6 1 6 A Golden Crown Daniel Minahan 2.44 53 19908 9.2 4
De kolom US_viewers_million stelt het aantal Amerikaanse kijkers voor (in miljoen), runtime_mins het aantal minuten dat de aflevering (episode) duurt, IMDB_votes het aantal stemmers op de ratingwebsite IMDB, IMDB_score de score op 10 gegeven door de stemmers en notable_deaths het aantal hoofdpersonages die stierven in de aflevering. De betekenis van de andere kolommen is vanzelfsprekend.
De afleveringen duurden steeds ongeveer een uur. Bepaal hoeveel uur (dus niet het aantal minuten!) een aflevering gemiddeld duurt. Sla dit op in gem_speeltijd en rond af op 2 decimalen.
Sommige afleveringen kenden een lange speeltijd. Selecteer de namen van de afleveringen die minstens 1 uur en een kwartier duurden en sla dit op in lange_afleveringen.
Verschillende mensen beweren dat het eerste seizoen het beste seizoen is. Vergelijk de mediane score van het eerste en het achtste (laatste) seizoen. Sla dit op in mediaan_seizoen1 en mediaan_seizoen8.
Tip: bepaal eerst een booleaanse vector seizoen1 waar je de scores van de afleveringen uit het eerste seizoen in opslaat. Doe hetzelfde voor het laatste seizoen.