De variantie in genintensiteit lijkt toe te nemen met het gemiddelde. Dit konden we zowel zien op de eerste plot als op de derde plot. De QQ-plot van de residuen vertoont bovendien zowel in de linker- als rechterstaart afwijkingen van normaliteit of enkele outliers.
We maken ter controle een histogram en een QQ-plot van onze uitkomstvariabele, namelijk de genexpressie.
plot_hist <- kpna2 %>% ggplot(aes(x=gene)) +
geom_histogram(color="black", fill="white", bins = 10)
plot_hist
plot_qq <- kpna2 %>% ggplot(aes(sample = gene)) +
geom_qq() + # qq-punten
geom_qq_line() + # qq-lijn
theme_bw()
plot_qq