Opgave

In het tekstbestand WHO.txt1 hebben de regels de volgende vorm:

<land>,<jaar>,<sterftecijfer vrouw>,<sterftecijfer man>
    

Elke regel bevat gegevens — afkomstig van de World Health Organization — over het sterftecijfer in een bepaald land en in een bepaald jaar (2000 of 2006). Het bestand is opgeslagen in CSV formaat, m.a.w. de velden worden gescheiden door komma's en de inhoud van elk veld wordt ingesloten tussen dubbele aanhalingstekens. Het bestand bevat bovendien nog commentaarregels die beginnen met een hekje (#). Gevraagd wordt om — gebruik makend van de teksteditors vi of vim — een reeks commando's op te stellen die achtereenvolgens de volgende opdrachten uitvoeren. Probeer voor elke opdracht zo weinig mogelijk commando's te gebruiken en zorg ervoor dat elk van deze commando's bestaat uit zo weinig mogelijk tekens. Alle opdrachten moeten na elkaar uitgevoerd worden, waarbij de regel met hoofding steeds ongewijzigd moet blijven. Ter controle kan je gebruik maken van de meegeleverde bestanden WHO.$$i$$.txt (1 ≤ $$i$$ ≤ 5), die telkens de inhoud van het bestand bevatten nadat de $$i$$-de opdracht werd uitgevoerd.

  1. Zorg ervoor dat alle velden die geen gegevens bevatten vervangen worden door de tekst UK.UK (unknown). De regel voor China 2006 wordt bijvoorbeeld: "China","2006","87.0","UK.UK". (WHO.1.txt2)

  2. Zet het huidige formaat om naar een iets overzichtelijker formaat door de dubbele aanhalingstekens te verwijderen, het scheidingsteken te vervangen door een spatie, de datum af te korten (zo wordt 2000 vervangen door 00 en 2006 door 06) en de wiskundige getalnotatie om te zetten naar schrijfstijl (zo wordt 448.0 vervangen door 448,0). Hierbij mag je ervan uitgaan dat de sterftecijfers steeds een punt bevatten. (WHO.2.txt3)

  3. Reorganiseer het bestand zodat de records geordend zijn op land (alfabetisch) en daarna op jaar (waarbij de meest recente records bovenaan komen te staan). Zorg ervoor dat de regels na herorganisatie dezelfde vorm behouden. (WHO.3.txt4)

  4. Reorganiseer het bestand verder zodat er slechts één record per land overblijft. Informatie uit verschillende tijdsperiodes voor een zelfde land worden na elkaar weergegeven, zodat de gegevens na omzetting volgende vorm aannemen:

    <land> <sterfte vrouw>(06)-<sterfte vrouw>(00) <sterfte man>(06)-<sterfte man>(00)
            

    Zo wordt bijvoorbeeld

    Belgium 06 61,0 111,0
    Belgium 00 68,0 130,0
            

    omgezet naar (WHO.4.txt5)

    Belgium 61,0(06)-68,0(00) 111,0(06)-130,0(00)
            
  5. Voeg een extra veld opmerkingen toe en vul daarin de tekst HMMR (high male mortality rate) voor alle regels waarbij het mannelijk sterftecijfer in 2000 hoger of gelijk was aan 200. Je mag ervan uitgaan dat de sterftecijfers tussen 0 en 1000 liggen. Zo wordt bijvoorbeeld

    Brazil 121,0(06)-134,0(00) 230,0(06)-248,0(00)
            

    omgezet naar (WHO.5.txt6)

    Brazil 121,0(06)-134,0(00) 230,0(06)-248,0(00) HMMR
            

Richtlijnen bij het indienen

Volg aandachtig onderstaande richtlijnen bij het indienen van je oplossing: