In deze oefening geven we een start voor het analyseren van tekst in een e-mail.

We beschikken over een aantal berichten in tekstfiles (.txt bestanden). De naam van het bestand is telkens MM-DD.txt (maand en dag).

Opgave

Databestanden

De bestanden zijnbeschikbaar in het working directory van Dodona.

Als je de oefening lokaal wilt maken (in PyCharm of in een Jupyter Notebook), dan moet je de bestanden downloaden en bewaren in dezelfde map als je .py of .ipynb bestand.

De bestanden kan je hier downloaden:

Voorbeeld

>>> woordenlijst(3, 2)
['beste', 'studenten', 'dit', 'is', 'een', 'kort', 'bericht', 'dat', 'niet', 'over', 'corona', 'gaat', 'vriendelijke', 'groeten', 'els', 'clarysse']

>>> voorkomens(3, 2, "groeten")
1

>>> voorkomens(3, 2, "vriendelijk")
0