Op 15 augustus 1977 ving een telescoop van de Ohio State University een sterk smalbandig radiosignaal op dat afkomstig was uit het sterrenbeeld Boogschutter. Terwijl de antenne dat deel van de hemel aan het afspeuren was, steeg de intensiteit van het signaal plots, hield gedurende 72 seconden aan en viel daarna weer terug. Dit komt overeen met een signaal van niet-aardse en niet-zonnestelselachtige oorsprong, en was voorheen nog nooit in dergelijke mate geobserveerd.

Sterrenkundige Jerry Ehman, die op het moment van de detectie in het observatorium van wacht was, was zo verbaasd over de intensiteitsvariatie van het gelokaliseerd signaal dat hij onmiddellijk het signaal 6EQUJ5 afdrukte en ernaast in de marge de tekst Wow! bijschreef. Deze commentaar gaf later ook de naam aan het signaal.

Bijna 40 jaar en meer dan 100 zoektochten later, is nog niemand er in geslaagd om het signaal opnieuw op te pikken. Zonder herhaalde observatie is het onmogelijk om uit te vissen wat Ehman&s telescoop die nacht heeft opgepikt, en is het niet meer dan een frustrerende plons in een grote, stille zee.

Opgave

Elke regel van het tekstbestand wow.txt1 bevat een signaal dat enkel bestaat uit hoofdletters, cijfers en leestekens, gevolgd door één enkele spatie en een woord dat enkel bestaat uit kleine letters en zelf geen spaties bevat. Gevraagd wordt:

  1. Bepaal reguliere expressies voor elk van onderstaande verzamelingen. Daarbij staat $$\mathcal{S}$$ voor de verzameling van alle mogelijke signalen die enkel bestaan uit hoofdletters, cijfers en leestekens. Probeer de reguliere expressies bovendien zo kort mogelijk te houden.

    • $$\alpha = \{ s \in \mathcal{S}\,|\,$$ alle cijfers komen hoogstens één keer in $$s$$ voor $$\}$$

      voorbeelden: -9----5---D------@--7--6*-------I----3-- $$\in \alpha$$
        -0--9----8@-3-OT---99-}9-[--------2----- $$\not\in \alpha$$
    • $$\beta = \{ s \in \mathcal{S}\,|\,$$ $$s$$ bevat een reeks van tien opeenvolgende cijfers en/of hoofdletters $$\}$$

      voorbeelden: 3----08--5-8--4E6PUOCA85HA3-5-3---27---- $$\in \beta$$
        -U<------T--1--=36-----7------*-72------ $$\not\in \beta$$
    • $$\gamma = \{ s \in \mathcal{S}\,|\,$$ $$s$$ bevat een reeks van vier cijfers die drie keer herhaald wordt $$\}$$

      voorbeelden: --04----19259--60-----9259-4---9259--8-- $$\in \gamma$$
        ------698--76-8-----3--3---2-----0-3---9 $$\not\in \gamma$$
    • $$\delta = \{ s \in \mathcal{S}\,|\,$$ $$s$$ bevat een alternerende reeks van cijfers en hoofdletters van lengte 9 $$\}$$

      voorbeelden: Q---6------8E8U5C9C3E-6--Y---4----U--2-- $$\in \delta$$
        -0--9----8@-3-OT---99-}9-[--------2----- $$\not\in \delta$$

    Gebruik een commando uit de grep familie om enkel die regels van het bestand wow.txt2 te selecteren, waarvan het signaal behoort tot de opgegeven verzameling.

  2. Beschouw de verzamelingen $$\alpha$$, $$\beta$$, $$\gamma$$ en $$\delta$$ zoals hierboven gedefinieerd. Gebruik nu deze verzamelingen om op de volgende manier een boodschap bestaande uit vier woorden te achterhalen:

    • Het eerste woord staat op unieke regel met het patroon uit de verzameling $$\alpha \cap \beta$$

    • Het tweede woord staat op unieke regel met het patroon uit de verzameling $$\beta \cap \gamma$$

    • Het derde woord staat op unieke regel met het patroon uit de verzameling $$\gamma \cap \delta$$

    • Het vierde woord staat op unieke regel met het patroon uit de verzameling $$\delta \cap \alpha$$

    Geef telkens een Unix commando dat elk van deze woorden opzoekt in het bestand en uitschrijft naar standaard uitvoer (zonder het patroon dat aan het woord voorafgaat). Hierbij is het dus niet toegelaten om het woord letterlijk uit te schrijven (bv. echo xxx).