De oorlog tussen virussen en bacteriën is al meer dan een miljard jaar aan de gang. De aanleiding voor deze oorlog is dat een bepaald soort virus — bacteriofagen1 (of kortweg fagen) genaamd — een bacteriële gastheer nodig heeft om zich te kunnen voortplanten en daarvoor ongemerkt de bacteriële cellen moet zien binnen te dringen. Een dergelijke infiltratie kan echter alleen maar operationeel gebracht worden als de faag doorheeft hoe de genetische mechaniek in elkaar zit die bepalend is voor de cellulaire functies van de bacterie. Het enige doel van de faag is immers om zijn eigen DNA2 binnen te smokkelen in het bacteriële DNA, zodat het mee gekopieerd wordt met de bacterie en resulteert in de reproductie van zoveel mogelijk kopieën van de faag. Ook al heeft dit soms finaal de dood van de bacteriële cel tot gevolg.

Om zichzelf te beschermen, moet een bacteriële cel ofwel haar cellulaire functies camoufleren zodat de faag niet kan binnendringen, of beter nog, kan ze in de tegenaanval gaan door versterking in te roepen van de luchtmacht. Meer specifiek maakt de bacterie gebruik van een soort drones die restrictie-enzymen3 genoemd worden. Deze herkennen viraal DNA en knippen het in stukken om zo de faag te verminken. Maar naar welk soort DNA zijn de restrictie-enzymen nu specifiek op zoek?

EcoRV
DNA dat doorgeknipt wordt door het EcoRV restrictie-enzym.

Het restrictie-enzym is een homodimeer4, wat betekent dat het samengesteld is uit twee identieke substructuren. Om zijn werk te kunnen doen, splitst het restrictie-enzym zich op in deze twee substructuren die zich elk binden aan één streng van het DNA-molecuul van de faag, en die daarna de streng doormidden knippen. Beide substructuren zijn voorgeprogrammeerd om hetzelfde fragment van 4 tot 12 nucleotiden op te sporen in het DNA van de faag (zie bovenstaande figuur). De kans dat beide strengen van het faag-DNA zullen doorgeknipt worden om de faag voldoende te verminken, vergroot naarmate de doelfragmenten op beide strengen van het faag-DNA dichter bij elkaar liggen. Bij uitbreiding is de kans om de faag te ontwapenen het grootst als beide doelfragmenten recht tegenover elkaar liggen langs het faag-DNA. Een fenomeen dat optreedt wanneer het doelfragment precies gelijk is aan zijn omgekeerd complement5 (zie onderstaande figuur). Eeuwen van evolutie hebben er uiteindelijk toe geleid dat de meeste restrictie-enzymen nu doelfragmenten van deze vorm hebben.

palindroom
Voorbeeld van een palindromische restrictieplaats.

Opgave

In deze opgave stellen we een DNA-sequentie voor als een string die enkel bestaat uit de hoofdletters A, C, G en T. Het omgekeerd complement6 van een DNA-sequentie wordt bekomen door de string om te keren en daarna elk karakter te vervangen door zijn complement. Hierbij zijn A en T elkaars complement, en zijn ook C en G elkaars complement. Naast het bepalen van het complement moeten we de string ook omkeren vanwege de gerichtheid van DNA: DNA-replicatie en transcriptie gebeuren vanaf het 3' uiteinde naar het 5' uiteinde, en het 3' uiteinde van de ene streng ligt tegenover het 5' uiteinde van de complementaire streng. Als we dus enkel het complement zouden nemen, dan zou de complentaire streng in de verkeerde richting gelezen worden.

We zeggen dat een DNA-sequentie een omgekeerd palindroom7 is, als de DNA-sequentie gelijk is aan zijn omgekeerd complement. Uit bovenstaande figuur leiden we bijvoorbeeld af dat GATATC een omgekeerd palindroom is, omdat zijn omgekeerd complement gelijk is aan GATATC. Gevraagd wordt:

Voorbeeld

>>> omgekeerdComplement('GATATC')
'GATATC'
>>> omgekeerdComplement('GCATGC')
'GCATGC'
>>> omgekeerdComplement('AGCTTC')
'GAAGCT'

>>> omgekeerdPalindroom('GATATC')
True
>>> omgekeerdPalindroom('GCATGC')
True
>>> omgekeerdPalindroom('AGCTTC')
False

>>> restrictieplaatsen('TCAATGCATGCGGGTCTATATGCAT')
[(4, 'ATGCAT'), (5, 'TGCA'), (6, 'GCATGC'), (7, 'CATG'), (17, 'TATA'), (18, 'ATAT'), (20, 'ATGCAT'), (21, 'TGCA')]
>>> restrictieplaatsen('AAGTCATAGCTATCGATCAGATCAC', minLengte=5)
[(6, 'ATAGCTAT'), (7, 'TAGCTA'), (12, 'ATCGAT')]
>>> restrictieplaatsen('ATATTCAGTCATCGATCAGCTAGCA', maxLengte=5)
[(1, 'ATAT'), (12, 'TCGA'), (14, 'GATC'), (18, 'AGCT'), (20, 'CTAG')]

Epiloog

Bij het lezen van de inleiding heb je je misschien afgevraagd hoe bacteriën zichzelf beschermen en vermijden dat de restrictie-enzymen hun eigen DNA8 doorknippen. Het korte antwoord op deze vraag is dat bacteriële cellen hun eigen DNA afschermen om doorgeknipt te worden door een chemisch proces dat DNA-methylatie9 genoemd wordt. Bij DNA-methylatie bindt een cel methylgroepen ($$CH_3$$) aan sommige nucleotiden10, waardoor bepaalde chemische reacties afgeblokt worden (in het bijzonder andere bindingsreacties zoals transcriptie11).

DNA-methylatie
DNA met een gemethyleerd basepaar12.

Methylatie heeft een aantal bijzonder nuttige toepassingen. Een voorbeeld hiervan is dat de restrictie-enzymen13 die door bacteriën gebruikt worden normaal gezien geen onderscheid kunnen maken tussen vreemd DNA dat afkomstig is van een faag14 en het eigen DNA van de bacterie. Daarom methyleert de bacterie haar eigen DNA om het zo te beschermen tegen haar eigen restrictie-enzymen.

Bovendien biedt methylatie ook een opmerkelijke manier om de activiteit van genen te regelen15, omdat gemethyleerd DNA kan doorgegeven worden aan het nageslacht. Dit inzicht was de start van een volledig nieuw onderzoeksdomein dat epigenetica16 genoemd wordt. Hierbij worden functioneel relevante modificaties van het genoom17 onderzocht die geen wijzigen aan de nucleotiden van het genoom met zich meebrengen. Kortom, de ultieme waarheid is dat erfelijkheid veel meer inhoudt dan het eenvoudigweg repliceren van DNA18!

Methylatie doet zich meestal voor op CpG plaatsen19, waar cytosine20 en guanine21 na elkaar voorkomen. Recent onderzoek heeft aangetoond dat DNA-methylatie ook voorkomt bij hogere organismen en dat het belangrijk is voor hun normale ontwikkeling: gemethyleerde gebieden van het genoom worden beschermd tegen transcriptionele activatoren22 en blijven daardoor inactief. Deze "stille" gebieden van het genoom worden heterochromatine23 genoemd.