We leiden de methode af voor de meest eenvoudige uitbreiding met 3 groepen (prostacycline voorbeeld), maar de veralgemening naar g groepen met
Zoals bij de t-test kunnen we het probleem ook modelleren a.d.h.v een lineair model door gebruik te maken van dummy variabelen (Sectie 6.10). We zullen hierbij steeds 1 dummy variable minder nodig hebben dan er groepen zijn.
Voor het prostacycline voorbeeld zijn dus twee dummy variabelen nodig en kunnen we de data dus modelleren met onderstaand lineair regressiemodel:
Stel dat
waarbij de error term opnieuw i.i.d.[45] normaal verdeeld wordt verondersteld met een constante variantie,
en
De lage dosisgroep (L) met
Zoals in Sectie 6.10 kunnen we het regressie-model opnieuw herschrijven als een model voor elke groep:
met
met
met
Hieruit volgt direct de interpretatie van de modelparameters:
of anders geformuleerd:
We herformuleren de modellen gebruik makend van de
met
De oorspronkelijk nulhypothese
Gezien Model (3) een lineair regressiemodel is, kunnen de methoden van lineaire regressie gebruikt worden voor het schatten van de parameters en hun varianties, het opstellen van hypothesetesten en betrouwbaarheidsintervallen.
Het testen van
Voor het prostacycline voorbeeld bekomen we het volgende model in het software pakket R:
model1 <- lm(prostac ~ dose, data = prostacyclin)
summary(model1)
## ## Call: ## lm(formula = prostac ~ dose, data = prostacyclin) ## ## Residuals: ## Min 1Q Median 3Q Max ## -35.167 -17.117 -4.958 17.927 41.133 ## ## Coefficients: ## Estimate Std. Error t value Pr(>|t|) ## (Intercept) 40.108 6.150 6.521 2.10e-07 *** ## dose25 8.258 8.698 0.949 0.349 ## dose50 43.258 8.698 4.974 1.99e-05 *** ## --- ## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 ## ## Residual standard error: 21.3 on 33 degrees of freedom ## Multiple R-squared: 0.458, Adjusted R-squared: 0.4252 ## F-statistic: 13.94 on 2 and 33 DF, p-value: 4.081e-05
We zien dat R eveneens de lage klasse (dose10) kiest als referentie-klasse aangezien er enkel een intercept voorkomt en parameters voor dose25 (M) en dose50 (H).
De output laat dus onmiddellijk toe om het effect te vergelijken tussen de middelste en laagste dosisgroep en de hoogste en laagste dosisgroep a.d.h.v. twee t-testen.
De volledige nulhypothese