Het tekstbestand reservoir.txt1 bevat een recensie van de film Reservoir Dogs2 uit 1992.

Opgave

Geef één of meer Unix commando's die ervoor zorgen dat de 5 meest voorkomende paren opeenvolgende woorden uit dit bestand opgelijst worden op standaard uitvoer (stdout). Hierbij gaan we ervan uit dat de woorden bestaan uit de langst mogelijke opeenvolging van letters (hoofdletters of kleine letters). De paren moeten opgelijst worden volgens dalend aantal voorkomens. Paren die even vaak voorkomen moeten verder alfabetische opgelijst worden — eerst volgens het eerste woord en daarna volgens het tweede woord — zonder onderscheid te maken tussen hoofdletters en kleine letters.

Voorbeeld

Voor een tekstbestand uitspraak.txt3 dat de volgende uitspraak van Linux Torvalds bevat

See, you not only have to be a good 
coder to create a system like Linux,
you have to be a sneaky bastard too.

moeten de paren opeenvolgende woorden op de volgende manier opgelijst worden

      2 be a
      2 have to
      2 to be
      1 a good
      1 a sneaky
      1 a system
      1 bastard too
      1 coder to
      1 create a
      1 good coder
      1 like Linux
      1 Linux you
      1 not only
      1 only have
      1 See you
      1 sneaky bastard
      1 system like
      1 to create
      1 you have
      1 you not

Hierbij zien we dat de woordparen be a, have to en to be elk tweemaal voorkomen in het tekstbestand. Daarvan moeten dan enkel de eerste 5 paren overgehouden worden (aangeduid in het vet).