Een belangrijke techniek van een iedere programmeur is het kunnen parsen van webpagina's. Parsen wil zeggen dat we de HTML-code van de webpagina automatisch gaan analyseren met een computerprogramma zodat we de belangrijkste informatie eruit kunnen halen. Stel nu dat we de titel uit een webpagina willen halen. We weten (vanuit onze HTML-kennis) dat een titel meestal als volgt op een webpagina gecodeerd staat: <h1>Titel</h1>
. We zijn natuurlijk niet geïnteresseerd in de h1-tags, enkel in de tekst die tussen de tags staat. Schrijf een programma die een HTML-titel inleest, en die de tekst van deze titel terug afbeeldt op het scherm. Bijvoorbeeld: voor de input <h1>Recepten</h1>
moet er op het scherm Recepten
verschijnen.
Invoer:
<h1>Recepten</h1>
Uitvoer:
Recepten