Vraag 13: Assumpties – Homoscedasticiteit (leesopdracht)

Tijdens de dataverkenning hebben we reeds opgemerkt dat de spreiding en range van de meetwaarden zeer vergelijkbaar is tussen de verschillende behandelingsgroepen (zie boxplots in vraag 4). Daarom is de assumptie dat de varianties gelijk zijn tussen de groepen zeer aannemelijk.

Wanneer we echter de varianties per groep uitrekenen zien we dat er grote verschillen tussen de groepen (zie tabel 2).

## bereken de variantie per behandelingsgroep. Met sapply itereer je over iedere behandelings groep. Zie google of de help als je wil weten hoe dit juist werkt. Je zou dit ook kunnen doen via een for loop.
variance_versgewicht <- sapply(levels(biochar$behandeling), 
                                function(b){var(biochar$versgewicht[b == biochar$behandeling])})
variance_versgewicht

Met slechts 7 meetwaarden is er weinig power om de echte variantie correct te schatten. Dergelijk verschillen in varianties zouden we ook kunnen verwachten onder een normale verdeling wanneer we slechts 7 datapunten hebben.

Voor deze oefening zullen we veronderstellen dat alle assumpties voor een ANOVA voldaan zijn.

Merk op Wanneer men niet bereid is om deze assumpties te aanvaarden (bijvoorbeeld wanneer eerdere studies reeds aangetoond hebben dat de data geen normale distributie volgt), kunnen we ook een niet-parametrische test uitvoeren. In deze testen nemen we geen distributionele assumpties (maar hebben over het algemeen minder power als de distributionele assumpties wel zouden opgaan). Hiervoor verwijzen we naar de lessen en practica over niet-parmetrische testen.