In het tekstbestand WHO.txt1 hebben de regels de volgende vorm:
<land>,<jaar>,<sterftecijfer vrouw>,<sterftecijfer man>
Elke regel bevat gegevens — afkomstig van de World Health Organization — over het sterftecijfer in een bepaald land en in een bepaald jaar (2000 of 2006). Het bestand is opgeslagen in CSV formaat, m.a.w. de velden worden gescheiden door komma's en de inhoud van elk veld wordt ingesloten tussen dubbele aanhalingstekens. Het bestand bevat bovendien nog commentaarregels die beginnen met een hekje (#).
Gevraagd wordt om — gebruikmakend van de teksteditors vi of vim — een reeks commando's op te stellen die achtereenvolgens de volgende opdrachten uitvoeren. Probeer voor elke opdracht zo weinig mogelijk commando's te gebruiken en zorg er voor dat elk van deze commando's uit zo weinig mogelijk tekens bestaat. De commando's mogen geen programmeerbare filters (bv. awk) gebruiken. Alle opdrachten moeten na elkaar uitgevoerd worden. De opdrachten mogen de eerste regel (hoofding) niet wijzigen, tenzij dit expliciet anders vermeld staat. Ter controle kan je gebruikmaken van de meegeleverde bestanden WHO.i.txt, die telkens de inhoud van het bestand bevatten nadat de $$i$$-de opdracht werd uitgevoerd.
Zorg ervoor dat alle velden die geen gegevens bevatten vervangen worden door de tekst UK.UK (unknown). De regel voor China 2006 wordt bijvoorbeeld: "China","2006","87.0","UK.UK". (WHO.1.txt2)
Zet het huidige formaat om naar een iets overzichtelijker formaat door de dubbele aanhalingstekens te verwijderen, het scheidingsteken te vervangen door een spatie, de datum af te korten (zo wordt 2000 vervangen door 00 en 2006 door 06) en de wiskundige getalnotatie om te zetten naar schrijfstijl (zo wordt 448.0 vervangen door 448,0). Hierbij mag je ervan uitgaan dat de sterftecijfers steeds een punt bevatten. (WHO.2.txt3)
Reorganiseer het bestand zodat de records geordend zijn op land (alfabetisch) en daarna op jaar (waarbij de meest recente records bovenaan komen te staan). Zorg ervoor dat de regels na herorganisatie dezelfde vorm behouden. (WHO.3.txt4)
Reorganiseer het bestand verder zodat er slechts één record per land overblijft. Informatie uit verschillende tijdsperiodes voor een zelfde land worden na elkaar weergegeven, zodat de gegevens na omzetting volgende vorm aannemen:
<land> <sterfte vrouw>(06)-<sterfte vrouw>(00) <sterfte man>(06)-<sterfte man>(00)
Zo wordt bijvoorbeeld
Belgium 06 61,0 111,0 Belgium 00 68,0 130,0
omgezet naar (WHO.4.txt5)
Belgium 61,0(06)-68,0(00) 111,0(06)-130,0(00)
Voeg een extra veld opmerkingen toe en vul daarin de tekst HMMR (high male mortality rate) voor alle regels waarbij het mannelijk sterftecijfer in 2000 hoger of gelijk was aan 200. Je mag ervan uitgaan dat de sterftecijfers tussen 0 en 1000 liggen. Zo wordt bijvoorbeeld
Brazil 121,0(06)-134,0(00) 230,0(06)-248,0(00)
omgezet naar (WHO.5.txt6)
Brazil 121,0(06)-134,0(00) 230,0(06)-248,0(00) HMMR
Volg aandachtig onderstaande richtlijnen bij het indienen van je oplossing:
Plaats je commando's voor de vijf delen van deze vraag onder de titels in het indienvenster.
Maak geen aanpassingen aan de regels die al in het venster staan. Deze worden immers gebruikt om de ingediende oplossing op te splitsen in de verschillende deelantwoorden. Op de feedbackpagina kan je controleren of de opsplitsing gelukt is.