Tijdens de Tweede Wereldoorlog leverden de geallieerden constant inspanningen om de omvang van de Duitse productie te bepalen. Ze deden dat op twee verschillende manieren: door middel van spionage en statistische schattingen. In heel wat gevallen bleek de statistische benadering een stuk accurater dan inlichtingen die op meer conventionele manier verkregen werden. Dat was bijvoorbeeld het geval voor hun schattingen van de productie van Panzerkampfwagen V tanks1 (beter bekend als de Panther) vlak voor D-day2.

panther
Panther tanks worden geladen voor transport naar de frontlinie (1943). Tijdens de Tweede Wereldoorlog werd de productie van Duitse tanks zoals de Panther door de inlichtendiensten van de geallieerden op een nauwkeurige manier ingeschat door middel van statistische methoden.

De geallieerde commandoposten dachten eerst dat de Panther tanks die ze in Italië gespot hadden — met hun schuine bepantsering, lange 75mm KwK/L70 kanonnen3 en brede rupsbanden — slechts in kleine aantallen zouden opduiken in het noorden van Frankrijk, net zoals de Tiger I4 tanks die in Tunesië waren opgedoken. Daardoor was het Amerikaanse leger ervan overtuigd dat hun M4 Sherman5 tanks goed zouden blijven presteren, net zoals ze gedaan hadden tegen de Panzer III6 en Panzer IV7 tanks in Noord-Afrika en Sicilië. Kort voor D-day begonnen ze echter geruchten op te vangen dat er grote aantallen Panther tanks zouden ingezet worden.

Om na te gaan of de geruchten gegrond waren, probeerden de geallieerden het aantal geproduceerde tanks te schatten. Hiervoor maakten ze gebruik van de serienummers op overmeesterde en vernielde tanks. De meest geschikte serienummers bleken die van de versnellingsbakken te zijn, omdat ze toegekend waren in twee ononderbroken reeksen. De serienummers van het chassis, de motor en de rupsbanden werden ook gebruikt, hoewel schattingen op basis daarvan een heel stuk complexer bleken te zijn. Verschillende andere onderdelen werden gebruikt om de analyses te verifiëren.

Volgens conventionele schattingen van de geallieerde inlichtingendiensten, produceerden de Duitsers tussen juni 1940 en september 1942 ongeveer 1.400 Panther tanks per maand. Op basis van een statistische analyse van de serienummers op de versnellingsbakken van de tanks die ze hadden kunnen onderscheppen, werd het aantal geproduceerde tanks geschat op 256 per maand, wat nog steeds aanzienlijk hoger was dan wat ze initieel vermoedden.

In documenten die de geallieerden na de oorlog in beslag namen uit het ministerie van Albert Speer8, vonden ze de exacte productiecijfers. Bleek dat de Duitsers in die periode van drie jaar gemiddeld 255 tanks per maand geproduceerd hadden. Onderstaande tabel toont meer gedetailleerde productiecijfers en schattingen van de geallieerden.

maand statistische schatting schatting door spionage Duitse productiecijfers
juni 1940 169 1.000 122
juni 1941 244 1.550 271
augustus 1942 327 1.550 342

De statistische benadering toonde zich dus een heel stuk betrouwbaarder dan conventionele spionage, en de term probleem van Duitse tanks9 (German tank problem) werd algemeen aangenomen als omschrijving voor dit soort statistische problemen.

Opgave

Veronderstel dat Duitse tanks bij productie opeenvolgend genummerd worden met $$1, 2, 3, \ldots, t$$, waarbij $$t$$ het totaal aantal geproduceerde tanks is dat we proberen te achterhalen. Veronderstel nu ook dat we vijf serienummers van tanks hebben kunnen onderscheppen: 21, 35, 42, 60 en 89. Daarmee kunnen we het aantal geproduceerde tanks $$t$$ vrij nauwkeurig schatten aan de hand van de volgende formule: \[t \approx \frac{(n + 1)m}{n} - 1\] Hierbij staat $$n$$ voor het aantal geobserveerde serienummers (hier $$n = 5$$) en $$m$$ voor het grootste serienummer dat werd waargenomen (hier $$m = 89$$). Aan de hand van bovenstaande formule bekomen we voor de voorbeeldreeks dan een schatting van $$t = 105,8$$. Daardoor kunnen we het aantal tanks die de Duitsers tot nu toe geproduceerd hebben schatten op 106.

Invoer

De invoer bestaat uit een reeks natuurlijke getallen, elk op een afzonderlijke regel. Alle getallen uit de reeks zijn verschillend van elkaar. Deze getallen stellen de serienummers voor van Duitse tanks die door de geallieerden overmeesterd of vernield werden. De reeks wordt afgesloten door een negatief geheel getal.

Uitvoer

De uitvoer moet bestaan uit het tekstfragment

Het aantal geproduceerde tanks wordt geschat op t.

waarbij t moet ingevuld worden met de schatting van het aantal geproduceerde tanks op basis van de serienummers uit de invoer en bovenstaande schattingsformule. Deze schatting moet afgerond worden naar het dichtsbijzijnde natuurlijke getal.

Waarschuwing

Gebruik voor het afronden naar het dichtstbijzijnde natuurlijk getal het standaard afrondgedrag van Python10. Het "dichtsbijzijnde" natuurlijk getal is immers niet uniek voor halve waarden die even dicht liggen bij de twee naburige natuurlijke getallen die net groter en net kleiner zijn dan de waarde. Python lost deze dubbelzinnigheid op door altijd het even getal te kiezen als er twee getallen even ver liggen.

>>> round(1.5)
2
>>> round(2.5)
2
>>> round(3.5)
4
>>> round(4.5)
4

Voorbeeld

Invoer:

60
21
89
42
35
-1

Uitvoer:

Het aantal geproduceerde tanks wordt geschat op 106.

Epiloog

Dezelfde formule werd ook gebruikt voor niet-militaire toepassingen. Bijvoorbeeld om te schatten hoeveel Commodore 6411 computers er in totaal geproduceerd werden. Het resultaat daarvan (12.5 miljoen) ligt tegen de ondergrens van de verschillende schattingen die op het Internet circuleren.

Commodore 64

Bronnen