Beroepen 2017-2019

Jaarlijks organiseert de Algemene Directie Statistiek van de FOD Economie een enquête naar de arbeidskrachten (EAK).

In deze oefening werken we met gegevensbestanden afkomstig uit de EAK. Per jaar (2017, 2018 en 2019) bevat dit bestand de top 100 van de meest voorkomende beroepen.

Hieronder zie je een schermafdruk van de eerste lijnen van het bestand van 2017 (bestandsnaam 2017.csv).

schermafdruk csv
2017.csv
Eerste lijnen in het bestand.

Elke rij in het databestand bevat 3 kolommen:

  1. Beroep
  2. Vrouwen: aantal vrouwen die dit beroep uitoefenen
  3. Mannen: aantal mannen die dit beroep uitoefenen

Notatie getallen: alle getallen zijn gehele getallen. Het scheidingsteken voor de duizendtallen is de komma. Als een gegeven ontbreekt, dan staat er "NoResp". Dit betekent dat geen enkele respondent dit beroep uitoefende. Je mag dit gelijkstellen aan het getal 0.

Databestanden

Encoding

De bestanden zijn in csv-formaat bewaard vanuit MS-Excel. Bij het openen in Python moet je specifiëren dat de encoding 'utf-8-sig' is.

f = open('2017.csv', 'r', encoding='utf-8-sig')
            

Programma debuggen

Je kan voor deze oefening de Python Tutor (na indienen op Dodona) niet gebruiken aangezien deze geen toegang heeft tot de bestanden. Als je de oefening wil debuggen, zal je deze lokaal moeten maken in PyCharm of in een Jupyter Notebook. Je moet dan het bestand downloaden en bewaren in dezelfde map als je .py of .ipynb bestand.

Je kan de bestanden hier downloaden:

Opgave

 

Bron: https://statbel.fgov.be/nl/themas/werk-opleiding/arbeidsmarkt/beroepen-belgie#documents