Een woord in een tekst wordt gedefinieerd als een zo lang mogelijke reeks letters. Alle karakters die geen letter zijn, worden dus beschouwd als scheidingstekens voor woorden.
Schrijf een functie woorden_splitsen
waaraan de locatie van een tekstbestand (str
) moet doorgegeven worden. De functie moet een lijst (list
) teruggeven met de opeenvolgende woorden in het gegeven tekstbestand.
In onderstaande interactieve sessie gaan we ervan uit dat het tekstbestand data.nl.txt
1 zich in de huidige directory bevindt.
>>> woorden_splitsen('data.nl.txt')
['Monty', 'Python', 's', 'Flying', 'Circus', 'werd', 'uitgezonden', 'door', 'de', 'BBC', 'tussen', 'en', 'en', 'werd', 'bedacht', 'geschreven', 'en', 'uitgevoerd', 'door', 'haar', 'leden', 'Graham', 'Chapman', 'John', 'Cleese', 'Terry', 'Gilliam', 'Eric', 'Idle', 'Terry', 'Jones', 'en', 'Michael', 'Palin']