In een onderzoek naar mentale gezondheid werden een aantal factoren zoals leeftijd, stress en meestgebruikte sociale media onderzocht.

Met behulp van head(data) krijgen we een eerste blik op deze resultaten.
user_id age stress_level social_media_platform happiness_index
1 U001 44 6 Facebook 10
2 U002 30 8 LinkedIn 10
3 U003 23 7 YouTube 6
4 U004 36 8 TikTok 8
5 U005 34 7 X (Twitter) 8
6 U006 38 7 LinkedIn 8
Vinden mensen boven de 30 die zichzelf als gestresseerd benoemen zichzelf ook minder gelukkig? En heeft hun meestgebruikte sociale media platform ook een invloed?
Maak een booleaanse vector plus30, die bepaalt welke mensen er ouder zijn dan 30 jaar.
We kunnen aan elke individuele bol in de grafiek een kleur toekennen op basis van de sociale media. Er zijn in deze dataset 6 verschillende sociale media, die we elk een andere kleur willen toekennen. Maak een vector colors met de kleuren dodgerblue, deeppink2, deepskyblue4, pink2, black en red.
Teken een spreidingsdiagram waarin je de happiness index van de sporters vergelijkt met hun stressniveau.
Voeg als parameter van de grafiek de parameter col toe die we gelijkstellen aan de vector colors, met als factor het meestgebruikte sociale mediaplatform col = colors[factor(data$social_media_platform)]
Teken de regressierechte van deze grafiek (in het groen).
Aangezien we nu meerdere kleuren in onze grafiek hebben, kunnen we een legende toevoegen voor de leesbaarheid. We gebruiken hiervoor de functie legend met 4 argumenten:
bottomleft gebruiken.col en dezelfde kleurenvector die we eerder aanmaakten.pch = 19legend, en stellen dit gelijk aan levels(...) van dezelfde factor als de grafiek.
