Het secundaire doel is om de polio incidentie tussen alle groepen met elkaar vergelijken: gevaccineerden (cases), niet-gevaccineerden (control) en kinderen waarvan de ouders geen toestemming gaven voor vaccinatie (none). We zouden de analyse opnieuw kunnen doen met een chi-kwadraat toets. Dat zou echter heel omslachtig zijn om een post-hoc analyse uit te voeren. Bovendien is het interessanter om odds ratio’s en betrouwbaarheidsintervallen te kunnen rapporteren in de conclusie. Daarom maken we gebruik van logistische regressie.
De data analyse met logistische regressie waarbij we een categorische response hebben, kan op twee manieren:
Dat laatste is computationeel interessanter en we hebben die data reeds voorhanden in het salk
data object.
Merk op dat je bij het modelleren van binomiale data in R een matrix mee moet geven voor de response waarin het aantal “successes” en “failures (niet-polio)” staan in respectievelijk de eerste en tweede kolom.