In deze oefening werken we met een transcript uit een aflevering van The Simpsons. Het stuk speelt zich af in Moe's Tavern, een bar in het stadje Springfield.

Het bestand begint een hoofding met een copyright melding. Die regel behoort niet tot de eigenlijke tekst. Vervolgens krijg je een aantal scenes die telkens afgescheiden zijn door twee regeleinden (\n\n).

Elke tekstregel begint met de persoon die aan het woord is, gevolgd door een dubbelpunt en spatie en vervolgens komt de tekstregel. Een tekstregel eindigt met één regeleinde (\n).

In de tekst staan regelmatig opmerkingen tussen haakjes. Dit zijn beschrijvingen van gedrag, maar behoren niet tot de uitgesproken tekst.

moving average
Transcript Simpsons

Databestand

Het bestand is geëncodeerd via utf-8 encoding. Je kan het openen via volgende instructie:
f = open('moes_tavern_lines.txt', encoding='utf-8')

Het bestand is beschikbaar in het working directory van Dodona. Als je de oefening echter lokaal wilt maken (in PyCharm of in een Jupyter Notebook), dan moet je het databastand downloaden en bewaren in dezelfde map als je .py of .ipynb bestand.

Je kan het bestand hier downloaden: moes_tavern_lines.txt1

Opgave

Voor deze opgave moet je geen functie maken. We werken met input/output tests zoals de oefeningen in reeks 1 t.e.m. 4.

Invoer

De invoer is één string en bevat de naam van een personnage zoals die voorkomt in het transcript.

Uitvoer

In de uitvoer komt achtereenvolgens, elk op een nieuwe regel:

Als de opgegeven naam niet voorkomt in de tekst, dan krijg je voor elke waarde een nul (zie voorbeeld).

Voorbeeld 1

Invoer:

Lisa_Simpson

Uitvoer:

Aantal scenes: 26
Aantal tekstregels: 57
Gemiddeld aantal woorden: 10.1

Voorbeeld 2

Invoer:

Len_Lemeire

Uitvoer:

Aantal scenes: 0
Aantal tekstregels: 0
Gemiddeld aantal woorden: 0.0