We horen allemaal wel eens iets over statistieken. Of het nu in het nieuws is, met uitspraken als “uit een enquête blijkt dat minder jongeren drugs gebruiken” of “de premier heeft meer potentiële kiezers dan zijn rivaal”. Zelfs in de sport hoor je een commentator zeggen dat een voetbalteam meestal meer scoort in de tweede helft. Maar als we het over ‘statistieken’ hebben, hebben we het vaak alleen over getallen en hun verhalen. Het kan echter een hele puzzel zijn om erachter te komen wat deze getallen echt voorstellen en hoe nauwkeurig ze zijn.
Sommigen zullen misschien beweren dat statistiek niet zo rotsvast is als andere vakgebieden. Het feit dat een voetbalteam vaak scoort in de tweede helft is geen garantie dat dat altijd zo zal zijn. Wiskunde wordt gezien als meer definitief; als een team de “wiskundige” kampioen is, zijn ze ongetwijfeld de beste. En, laten we eerlijk zijn, soms kunnen politici statistieken twijfelachtig laten klinken omdat ze de cijfers ombuigen zodat ze in hun verhaal passen.
Maar statistiek gaat verder dan deze misvattingen. Het is cruciaal op gebieden zoals medisch onderzoek om te bepalen of een nieuw medicijn echt werkt, in de biologie om dierenpopulaties te monitoren, bij het maken van voorspellingen over onze dagelijkse elektriciteitsbehoeften en zelfs in de zakenwereld om uit te zoeken welk productontwerp mensen verkiezen. En dit is nog maar het topje van de ijsberg!
Stel je nu eens voor dat je dit alles versterkt met de kracht van computers en een tool als R-code
. Computers kunnen enorme hoeveelheden gegevens snel verwerken, meer dan een mens in een mensenleven aankan. Dankzij deze snelheid en nauwkeurigheid kunnen we dieper in gegevens duiken, patronen vinden en beter geïnformeerde beslissingen nemen.
En waarom R-code? R is een taal die speciaal is gemaakt voor statistiek en gegevensanalyse. Het is alsof je een superkracht hebt voor het kraken van getallen. Als je R beheerst, kun je gegevens op verbluffende manieren visualiseren, complexe analyses sneller uitvoeren en zelfs toekomstige trends voorspellen! Dus, door statistische kennis te combineren met R-code vaardigheden, begrijpen we niet alleen onze wereld - we geven er vorm aan.
We starten deze cursus met ons te verdiepen in elementen, variabelen en … variabelen. Want de manier hoe we spreken en denken over variabelen in statistiek
, verschilt van de strikt operationele manier
we die gebruiken binnen een programmeertaal zoals Python en R
.