Luciferase is een algemene naam voor een klasse van enzymen1 die gewoonlijk in de natuur voor bioluminescentie2 zorgen. De naam is afgeleid van het Latijnse woord voor "licht" (lux) en "dragen" (ferre). Het bekendste voorbeeld is een luciferase van de glimworm Photinus pyralis.

glimworm
Bioluminescentie door luciferase bij een glimworm.

In luminescente3 reacties wordt licht geproduceerd door de oxidatie4 van een luciferine5 (een pigment) en adenosinetrifosfaat6 (ATP). De reactiesnelheid7 van deze reactie tussen luciferine8 en zuurstof is bijzonder langzaam, tenzij ze door luciferase wordt gekatalyseerd9, dikwijls vergemakkelijkt door de aanwezigheid van calciumionen10 (vergelijkbaar met spiersamentrekking11). De reactie vindt plaats in twee stappen:

luciferine + ATP → luciferyladenylaat + PPi12

luciferyladenylaat + O2 → oxyluciferine + AMP13 + licht

Deze reactie is zeer efficiënt: bijna alle energie wordt in licht omgezet. Ter vergelijking, een gloeilamp verliest bijna 90% van haar vermogen in de vorm van warmte.

Luciferinen en luciferasen worden door verschillende diersoorten in verschillende vormen geproduceerd. Naast glimwormen zijn er onder andere paddenstoelen (Omphalotus olearius), insecten, vissen, weekdieren en algen zoals de zeevonk14 (het lichten van de zee15) bekend die met behulp van luciferase licht produceren. Sommige soorten hebben zelfs verschillende luciferasen die met dezelfde luciferine verschillende kleuren licht kunnen produceren.

Maar de meest duivelse van allemaal is wel Oceanobacillus caeni: een staafvormige, gram-positieve bacterie die geïloseerd werd uit actief slib van een afvalwaterzuiveringssysteem in Zuid-Korea. Haar luciferase (KPH7874316) bevat een peptide17 ASPGLUVALILELEU:

MKLSILDQSP ISKGKTPKDA LEASIELAKL TDELGYHRYW VAEHHDLGGL ASPAPDILLG IIGSQTEQIR
IGSGAVLLPN YSPYHIAERY NELATLYPNR VDLGLGRAPG GSAEVSIALA GNFLEKVRMY PKLVDEVILF
LHQDFPSDHM YAKVSATPVP KTPPVPWLLG TSNKSAKLAI EKRLPFVFGH FMSNEDGPSI VKEYMKNVLN
GKSNVIVTVS AICAETTEEA EEIAMSNYLW KILQDKGEGK EGVPSIEEAK AYPYSLEEKE RIERMKQNQI
VGNPSQVREQ LENLQSEYEV DELMIVTITH SYEARKKSYQ LLAEEFCLA

Opgave

Elke regel van het tekstbestand luciferase.txt18 bestaat uit een patroon $$p \in \mathcal{P}$$, gevolgd door één spatie en een woord $$w \in \mathcal{W}$$. De verzameling $$\mathcal{P}$$ bestaat uit alle mogelijke groepen van twee of meer hoofdletters die telkens door één spatie van elkaar gescheiden worden. De verzameling $$\mathcal{W}$$ bevat alle woorden die enkel uit kleine letters bestaan. Gevraagd wordt:

  1. Bepaal zo kort mogelijke reguliere expressies voor de volgende deelverzamelingen van $$\mathcal{P}$$:

    • $$\mathcal{P}_1 = \{\,p \in \mathcal{P}\,|\,$$vijf opeenvolgende groepen van $$p$$ beginnen respectievelijk met de letters D, E, V, I en L$$\,\}$$

      voorbeeld: TLGTYDKLEF FYYFTCYQAM YVWNNKYESQ DPGLQYVKGY EASKATKNVP VMNFVIYYCW IAAYMQYMCI LKCGLSVYNT mice $$\in \mathcal{P}_1$$
        SIRIIMIIFS SHQVMRFAED VTTAHFRWIH QVKYQTYNRC HLMNAHGYSN RAKKTDLYLV KTHLFCLLTW QEGLRACHPT menthol $$\not \in \mathcal{P}_1$$
    • $$\mathcal{P}_2 = \{\,p \in \mathcal{P}\,|\,$$minstens vijf groepen van $$p$$ eindigen op de laatste letter van het woord $$w\ ^{(*)}$$ $$\,\}$$

      (*) het woord $$w$$ dat op dezelfde regel staat als het patroon $$p$$

      voorbeeld: AAHFQWGEVP PPEWQYIEYG REEDFVAYCI TVAIMTSTRG VSHDGQKKCG VFNYKDCAFG QIASSNGGSG WKEESCCKRH ringing $$\in \mathcal{P}_2$$
        LVEWLLLLMD HRGPTPNMTG WGWPDHREAP GKMVEGMTRV AFMCSWVRAW DIWQMRWWRR IFWIIEMDPP QHEHGFDGSN launcher $$\not \in \mathcal{P}_2$$
    • $$\mathcal{P}_3 = \{\,p \in \mathcal{P}\,|\,$$elke groep van $$p$$ bevat minstens één letter van het woord BEELZEBUB$$\,\}$$

      voorbeeld: GNPIPVWIYE CHDEKNCMDW KCALKCSEKE MTNHWNIEMV VNPPHAPSEF RCPYGPIFUT WPRDASENRY PMGIAGEKPV beeper $$\in \mathcal{P}_3$$
        LDYEYLAYSF YSVFDYVFIV RNHGRASGIE QLDYVKIVQK AMVCYYNDYM MVAVQSTTVQ CGQTWAAHMM KARSRQKHEG curry $$\not \in \mathcal{P}_3$$
    • $$\mathcal{P}_4 = \{\,p \in \mathcal{P}\,|\,$$met de letters van de eerste groep van $$p$$ kan je het woord SATAN vormen$$\,\}$$

      voorbeeld: FDAAUSVNTE MWVIMYFFAL WWFDQENNMW GCMATIETQQ IFHVITEGHF ICYDMNTKQH AHFSSGHQIT QLVYISKEQV vigour $$\in \mathcal{P}_4$$
        WWSTRLSAPL QSFVLLKEPR DMTCLGPGHQ DPMQGTARIM RQCNHHCSDP MIITAPRPEY HNCKINWYPT NTPYTTFNDY runner $$\not \in \mathcal{P}_4$$

    Geef telkens een Unix commando waarin de reguliere expressie gebruikt wordt door een commando uit de grep familie om enkel de regels van het tekstbestand naar stdout te schrijven waarvan het patroon $$p$$ behoort tot $$\mathcal{P}_i\ (i = 1, 2, 3, 4)$$.

  2. Bepaal als volgt de woorden $$w_1\ w_2\ w_3\ w_4$$ van een geheime boodschap:

    • het woord $$w_1$$ staat op de unieke regel waarvan $$p$$ behoort tot $$\mathcal{P}_1 \cap \mathcal{P}_2$$

    • het woord $$w_2$$ staat op de unieke regel waarvan $$p$$ behoort tot $$ \mathcal{P}_2 \cap \mathcal{P}_3$$

    • het woord $$w_3$$ staat op de unieke regel waarvan $$p$$ behoort tot $$\mathcal{P}_3  \cap \mathcal{P}_4$$

    • het woord $$w_4$$ staat op de unieke regel waarvan $$p$$ behoort tot $$\mathcal{P}_4 \cap \mathcal{P}_1$$

    Geef telkens een Unix commando waarin de reguliere expressies voor de verzamelingen $$\mathcal{P}_i\ (i = 1, 2, 3, 4)$$ gebruikt worden door commando's uit de grep familie om het woord $$w_j\ (j = 1, 2, 3, 4)$$ op te zoeken in het tekstbestand en uit te schrijven naar stdout. Hierbij is het niet toegelaten om het woord $$w_j$$ letterlijk uit te schrijven (bv. echo $$w_j$$).