Stel dat we een dataset hebben die bestaat uit
In een traditionele analyse van meetgegevens gaat men ervan uit dat de
meetgegevens compleet zijn. Er zijn met andere woorden geen ontbrekende
gegevens. In dat geval berekenen we het steekproefgemiddelde
Het
Als er in de dataset
Als we enkel de metingen die niet onder de detectielimiet vallen in
rekening brengen, dan krijgen we echter een overschatting van het
gemiddelde en een onderschatting van de variantie en standaardafwijking,
omdat de gecensureerde data met lage waarden (onder de detectielimiet)
niet in rekening gebracht worden bij de bereking van de statistieken. De maximum-likelihood-methode
laat ons echter toe om een correctie uit te voeren op de berekende
statistieken, rekening houdend met het aantal metingen dat onder de
detectielimiet valt. Voor een gegeven detectielimiet
Dit gecorrigeerde gemiddelde en standaarddeviatie kan dan opnieuw gebruikt worden voor de berekening van het betrouwbaarheidsinterval.
De eerste drie regels van de invoer bevatten de volgende gegevens:
het aantal metingen
de detectielimiet
de waarde
Daarna volgen
Drie regels met daarop het gecorrigeerde steekproefgemiddelde, de gecorrigeerde steekproefvariantie en de gecorrigeerde standaardafwijking van de gegeven dataset. Het formaat van de uitvoer kan je afleiden uit onderstaand voorbeeld.
Invoer:
8 1.0 0.3386 - - 1.24 1.49 1.50 1.56 1.61 1.78
Uitvoer:
gemiddelde: 1.3505420000000001 variantie: 0.12639273999999895 standaardafwijking: 0.3555175663733073