Een continue toevallig veranderlijke kan binnen bepaalde grenzen alle mogelijke waarden aannemen. De kans dat een continue toevallige veranderlijke exact één bepaalde waarde aan te nemen is daarom gelijk aan 0.
De distributie (verdeling) wordt daarom weergegeven a.d.h.v. de densiteitsfunctie of de dichtheidsfunctie \(f(x)\)
Veel biologische karakteristieken zijn approximatief normaal verdeeld (lengte, bloeddruk, IQ, concentratie metingen na logaritmische transformatie)
\[f(x) = \frac{1}{\sqrt{2\pi\sigma^2}} e^{-\frac{(x-\mu)^2}{2\sigma^2}}\]Dat wordt kort genoteerd als
\[f(x) = N(\mu,\sigma^2)\]Van het IQ is geweten dat het normale verdeling volgt met gemiddelde \(\mu=100\) en standaardafwijking \(\sigma=15\).
\[IQ \sim N(100,15^2)\]In R kunnen we de dnorm functie gebruiken om de densiteit te berekenen voor een bepaalde waarde X=x.
dnorm
zijn mean
(\(\mu\)) en sd
(standaardafwijking \(\sigma\)).iq <- tibble(
IQ = seq(40,150,.1),
Densiteit = dnorm(seq(40,150,.1),mean=100,sd=15)
)
iq %>%
ggplot(aes(x=IQ,y=Densiteit)) +
geom_line()
Binnen bepaalde grenzen kunnen continue toevallig veranderlijken alle mogelijke waarden aannemen dus is \(\Omega\) oneindig groot.
Opnieuw is de cumulatieve distributie
\[F(X)=Pr(X\leq x).\]Omdat X continu is berekenen we deze probabiliteit a.d.h.v. een integraal
\[F(x)=\int \limits_{-\infty}^x f(x) dx\]Merk op dat \(f(x)=0\) als x niet tot de steekproefruimte behoord.
We kunnen \(F(x)\) berekenen voor een normaal verdeelde toevallig veranderlijke met de functie pnorm
die opnieuw argumenten mean
en sd
heeft.
iq %>%
mutate(Probability=pnorm(IQ,mean=100,sd=15)) %>%
ggplot(aes(x=IQ,y=Probability)) +
geom_line()
De probabiliteit dat het IQ van een random subject lager is dan 80 wordt in R berekend door
pnorm(80,mean=100,sd=15)
## [1] 0.09121122
Voor de grootst mogelijke waarde voor \(X\) integreren we over de volledige steekproefruimte \(\Omega\) dus
\[\int \limits_{x \in \Omega} f(x) dx=1.\]De oppervlakte onder de dichtheidsfunctie is dus steeds 1!