Een continue toevallig veranderlijke kan binnen bepaalde grenzen alle mogelijke waarden aannemen. De kans dat een continue toevallige veranderlijke exact één bepaalde waarde aan te nemen is daarom gelijk aan 0.
De distributie (verdeling) wordt daarom weergegeven a.d.h.v. de densiteitsfunctie of de dichtheidsfunctie \(f(x)\)
Veel biologische karakteristieken zijn approximatief normaal verdeeld (lengte, bloeddruk, IQ, concentratie metingen na logaritmische transformatie)
\[f(x) = \frac{1}{\sqrt{2\pi\sigma^2}} e^{-\frac{(x-\mu)^2}{2\sigma^2}}\]Dat wordt kort genoteerd als
\[f(x) = N(\mu,\sigma^2)\]Van het IQ is geweten dat het normale verdeling volgt met gemiddelde \(\mu=100\) en standaardafwijking \(\sigma=15\).
\[IQ \sim N(100,15^2)\]In R kunnen we de dnorm functie gebruiken om de densiteit te berekenen voor een bepaalde waarde X=x.
dnorm zijn mean (\(\mu\)) en sd (standaardafwijking \(\sigma\)).iq <- tibble(
IQ = seq(40,150,.1),
Densiteit = dnorm(seq(40,150,.1),mean=100,sd=15)
)
iq %>%
ggplot(aes(x=IQ,y=Densiteit)) +
geom_line()

Binnen bepaalde grenzen kunnen continue toevallig veranderlijken alle mogelijke waarden aannemen dus is \(\Omega\) oneindig groot.
Opnieuw is de cumulatieve distributie
\[F(X)=Pr(X\leq x).\]Omdat X continu is berekenen we deze probabiliteit a.d.h.v. een integraal
\[F(x)=\int \limits_{-\infty}^x f(x) dx\]Merk op dat \(f(x)=0\) als x niet tot de steekproefruimte behoord.
We kunnen \(F(x)\) berekenen voor een normaal verdeelde toevallig veranderlijke met de functie pnorm die opnieuw argumenten mean en sd heeft.
iq %>%
mutate(Probability=pnorm(IQ,mean=100,sd=15)) %>%
ggplot(aes(x=IQ,y=Probability)) +
geom_line()

De probabiliteit dat het IQ van een random subject lager is dan 80 wordt in R berekend door
pnorm(80,mean=100,sd=15)
## [1] 0.09121122


Voor de grootst mogelijke waarde voor \(X\) integreren we over de volledige steekproefruimte \(\Omega\) dus
\[\int \limits_{x \in \Omega} f(x) dx=1.\]De oppervlakte onder de dichtheidsfunctie is dus steeds 1!