Gegeven

Via het Steam platform kan je samen met vrienden games spelen. Er wordt dan ook heel wat gegevens bewaard van verschillende computerspellen. Via onderstaande code kan je wat data ophalen:

# Steam data inlezen
data <- read.csv2("dataset.csv",
                  sep=",",dec=".",
                  colClasses = c("NULL", rep("character", 2), rep("numeric", 5), rep("NULL",2)))
data <- na.omit(data)
colnames(data) <- c("title", "year", "metascore", "rating", "positivity_ratio", "time_to_beat","time_to_beat_extra")
rownames(data) <- seq_len(nrow(data))

Dit leidt tot een dataframe van de vorm:

                   title year metascore rating positivity_ratio time_to_beat time_to_beat_extra
1    The Tiny Bang Story 2011        63      8         7.073879         3.60               3.60
2                Hacknet 2015        82      8        14.548520         7.06               8.73
3              SpaceChem 2011        84      8        11.440415        43.32              57.79
4            Baba Is You 2019        87      9        49.397183         6.84              19.28
5 Human Resource Machine 2015        78      8        15.220833         4.18               7.57
6            Opus Magnum 2017        90      9        37.977444        15.24              26.06

In deze dataframe vind je de titel, het jaar van publicatie, metascore stelt een beoordeling voor van één of meerdere professionele gamers, rating stelt de score van het publiek voor. positivity_ration is de verhouding van het aantal goede revieuws gedeeld door het aantal slechte reviews. time_to_beat en time_to_beat_extra stellen de tijd in uren voor die nodig zijn om het spel te beëindigen, respectievelijk zonder en met extra bonus materiaal.

Een gamer.

Een gamer.

Gevraagd

Worden games met een langere uitspeeltijd ook beter beoordeeld door de professionals?

Langere speeltijd versus metascore.

Langere speeltijd versus metascore.

Langere speeltijd versus metascore.

Langere speeltijd versus metascore.