Vraag 4: Voorwaarden regressiemodel (conclusie)

De variantie in genintensiteit lijkt toe te nemen met het gemiddelde. Dit konden we zowel zien op de eerste plot als op de derde plot. De QQ-plot van de residuen vertoont bovendien zowel in de linker- als rechterstaart afwijkingen van normaliteit of enkele outliers.

We maken ter controle een histogram en een QQ-plot van onze uitkomstvariabele, namelijk de genexpressie.

plot_hist <- kpna2 %>% ggplot(aes(x=gene)) + 
  geom_histogram(color="black", fill="white", bins = 10)
plot_hist
plot_qq <- kpna2 %>% ggplot(aes(sample = gene)) + 
                        geom_qq() + # qq-punten
                        geom_qq_line() + # qq-lijn
                        theme_bw() 
plot_qq