De Pearson Chi-kwadraat test voor ongepaarde gegevens
We zullen een toets ontwikkelen voor het testen van associatie tussen de categorische blootstelling (bvb. variant, X) en de categorische uitkomst (bvb. ziekte, Y).
Concreet zullen we
testen.
Beschouw de rijtotalen , enerzijds en de kolomtotalen en anderzijds. Zij verstrekken informatie
over de marginale verdeling van de blootstelling (bvb. variant, X) en de uitkomst (bvb. ziekte, Y),
maar niet over de associatie tussen die veranderlijken. Als de nulhypothese
waar is dat en onafhankelijk zijn, dan verwacht men dat een proportie
van controles met een Leu/Leu variant, of dat een Leu/Leu variant hebben omdat een proportie van alle geobserveerde individuen een Leu/Leu variant heeft.
Analoog kan men op basis van de marginale gegevens het verwachte aantal berekenen dat onder de nulhypothese in elke cel van de tabel zou liggen.
Dit verwachte aantal onder in de -de cel (conditioneel op de marges van de tabel) wordt aangeduid met en is het product
van het -de rijtotaal met het -de kolomtotaal gedeeld door het
algemene totaal. In bovenstaand voorbeeld vinden we
= het verwachte aantal onder in de (1,1)-cel = 145 800/1372 = 84.55 ;
= het verwachte aantal onder in de (1,2)-cel = 145 572/1372 = 60.45 ;
= het verwachte aantal onder in de (2,1)-cel = 1227 800/1372 = 715.5 ;
= het verwachte aantal onder in de (2,2)-cel = 1227 572/1372 = 511.5 ;
Een toets van de nulhypothese gebeurt nu op basis van een vergelijking
tussen de geobserveerde aantallen in cellen genoteerd met
en de verwachte aantallen . In dat opzicht levert de
toetsingsgrootheid
een goede discriminatie tussen de nulhypothese en de alternatieve hypothese.
Men kan aantonen dat ze onder de nulhypothese bij benadering een zogenaamde -verdeling volgt met 1 vrijheidsgraad. Deze verdeling neemt uiteraard alleen positieve waarden aan en is scheef naar rechts verdeeld, behalve als het aantal vrijheidsgraden groot is (minstens 100), in welk
geval ze meer symmetrisch wordt.
Figuur 58 toont haar algemene vorm.
Figuur 58: Dichtheidsfuncties voor enkele Chi-kwadraat verdelingen
Een grote waarde van de toetsingsgrootheid geeft een indicatie van een
afwijking van de nulhypothese. Concreet zal een toets op het
significantieniveau de nulhypothese verwerpen zodra de geobserveerde waarde
van de toetsingsgrootheid het -percentiel, , van de -verdeling overschrijdt. Ze kan niet verwerpen in
het andere geval. De p-waarde voor een 2-zijdige toets is in dit geval de
kans om een grotere waarde voor de toetsingsgrootheid te observeren dan de
geobserveerde waarde als de nulhypothese waar is. Dit is de kans dat
een -verdeelde toevalsveranderlijke waarden groter dan
aanneemt.
Omdat de observaties in feite discrete getallen zijn, kan de
toetsingsgrootheid slechts discrete waarden aannemen en kan een
continue verdeling zoals de -verdeling slechts een benadering zijn
voor haar werkelijke verdeling. Om de discrete verdeling beter bij de
continue -verdeling te doen aansluiten, heeft men in de
uitdrukking van de toetsingsgrootheid voor elke cel telkens 0.5 afgetrokken. Dit wordt een
continuïteitscorrectie genoemd. In dit geval gaat het om de
correctie van Yates en noemt men deze toets dan ook de Pearson
Chi-kwadraat toets met Yates correctie. Wanneer de correctie niet gebruikt
wordt (d.w.z. wanneer de getallen `0.5’ in de uitdrukking voor door 0
vervangen worden), dan spreekt men van de Pearson Chi-kwadraat toets.
In R kan je deze toetsen uitvoeren door de optie op TRUE of FALSE te zetten:
Zelfs wanneer de continuïteitscorrectie wordt gebruikt, zal de benadering voor de verdeling van de toetsingsgrootheid slechts
verantwoord zijn als in geen enkele van de cellen het verwachte aantal onder
kleiner is dan 5. Wanneer de -benadering niet verantwoord
is, kan men een exacte toets uitvoeren die rekening houdt met de
echte mogelijke verdelingen van de marginale tellingen over de individuele
cellen in de tabel. Dergelijke test maakt bijgevolg geen -benadering voor de verdeling van de toetsingsgrootheid onder de
nulhypothese. De test die met de exacte verdeling van de marginale tellingen
over de individuele cellen rekening houdt, wordt in de literatuur Fisher’s exact test genoemd.
De nulhypothese van deze test is eveneens dat en onafhankelijk zijn, en de alternatieve hypothese dat en
afhankelijk zijn. Een nadeel van de exacte test, is dat ze conservatief
is (d.w.z. dat ze een kleinere kans hebben op een Type I fout dan
vooropgesteld, en bijgevolg een grotere kans op Type II fouten). In R bekomt men deze test als volgt:
fisher.test(brcaTab2)
##
## Fisher's Exact Test for Count Data
##
## data: brcaTab2
## p-value = 0.4764
## alternative hypothesis: true odds ratio is not equal to 1
## 95 percent confidence interval:
## 0.7998798 1.6738449
## sample estimates:
## odds ratio
## 1.153279
Merk op dat deze functie tevens 95% betrouwbaarheidsintervallen rapporteert voor de bijhorende odds ratio.