De ontdekking van skeletten van de Neanderthaler1 (Homo sapiens neanderthalensis) in verschillende delen van Europa heeft veel vragen opgeroepen omtrent de menselijke oorsprong, waaronder de zoektocht naar onze verwantschap met deze soort. Dergelijke vragen over de oorsprong van mensen en primaten worden doorgaans beantwoord door het bestuderen van het mitochondriaal DNA2 en in het bijzonder de hypervariabele gebieden daarbinnen. Deze gebieden vertonen een hoge variabiliteit binnen het menselijk ras, waardoor ze ideaal zijn voor de studie van verwantschappen tussen individuen. Het mitochondriaal DNA vertoont twee hypervariabele gebieden, die respectievelijk worden aangeduid als HVR-I en HVR-II.
Om de similariteit (maat van verwantschap) van DNA sequenties te bepalen, construeert men meestal eerst een alignering van alle onderzochte sequenties. Bij een dergelijke sequentiealignering3 worden de overeenkomstige onderdelen van twee of meer sequenties onder elkaar geplaatst. Hieronder staat een voorbeeld van een dergelijke sequentiealignering tussen twee sequenties.
CTG-GGG--GGTGTAC || ||| | || | CTACGGG---GCGTCC
Hierbij worden de overeenkomstige baseparen (matches) aangegeven met verticale strepen tussen de baseparen, en worden gaten voorgesteld door koppeltekens (-) binnen de sequenties (waardoor de gealigneerde sequenties altijd even lang zijn). Fouten (mismatches) kunnen verklaard worden door puntmutaties en gaten (gaps) door inserties of deleties.
Op basis van een sequentiealignering kan de similariteit tussen twee sequenties op de volgende manier berekend worden. Voor overeenkomstige baseparen wordt een score van +1 aangerekend, voor fouten een score van 0 en voor gaten een score van -1. Posities waarop beide sequenties een gat vertonen worden niet in rekening gebracht. De scores voor elke positie van de alignering worden dan bij elkaar opgeteld, en gedeeld door het aantal in rekening gebrachte posities. In het bovenstaande voorbeeld zijn er 9 overeenkomstige baseparen, 3 fouten, 2 gaten en worden in totaal 14 van de 16 posities in rekening gebracht (twee posities vertonen een gat in beide sequenties). Hierdoor is de similariteit van deze twee sequenties gelijk aan \[ \frac{ 9 \times (+1) + 3 \times 0 + 2 \times (-1) }{14} = 0.5 \]
Schrijf een functie score, die voor twee gegeven baseparen (die als argument aan de functie moeten doorgegeven worden) de corresponderende score teruggeeft op basis van de waarden uit de onderstaande tabel:
type | voorbeeld | score |
---|---|---|
overeenkomstige baseparen | A en A | +1 |
verschillende baseparen | A en G | 0 |
1 gat | A en - | -1 |
2 gaten | - en - | 0 |
Gebruik de functie score om een functie similarity te schrijven, die voor twee gegeven DNA sequenties uit een sequentiealignering de corresponderende similariteit berekent zoals hierboven werd beschreven. Deze functie moet de waarde van de similariteit als resultaat teruggeven. Zo moet de functie voor de DNA sequenties CTG-GGG--GGTGTAC en CTACGGG---GCGTCC uit bovenstaand voorbeeld de waarde 0.5 teruggeven.
Opmerking: Als je de functie similarity correct hebt gemaakt, dan wordt die gebruikt om een fylogenetische stamboom op te stellen op basis van het mitochondriaal DNA van enkele primaten. Kan je op basis van dit resultaat achterhalen of de moderne mens geëvolueerd is uit de Neanderthaler?
>>> similarity('CTG-GGG--GGTGTAC', 'CTACGGG---GCGTCC')
0.5
>>> similarity('CTG-GGG---GTGTAC', 'CTACGGG---GCGTCC')
0.6153846153846154
>>> similarity('CTG-GGG--GGTGTAC', 'CTACGGG---GCGTCA')
0.42857142857142855
Ongeveer 150.000 jaar geleden was een Neanderthalerman de grot Lamalunga in het zuiden van Italië aan het verkennen, toen hij in een verdwijngat4 viel. Te zwaar gewond om er weer uit te klimmen, stierf hij aan uitdroging of verhongering. In de daaropvolgende eeuwen dompelde het water dat langs de wanden van de grot liep het skelet van de man onder in een afzetting van calciumcarbinaat. Verscholen voor roofdieren en de weersomstandigheden, bleef het daar ongestoord liggen in een onberispelijke staat van bewaring totdat grotonderzoekers het uiteindelijk ontdekten in 1993.
Dit is een hele kluif voor paleoanthropologen — de man van Altamura is een van de meest complete skeletten uit het Paleolithicum die in Europe ontdekt werden — maar er is ook een keerzijde: de beenderen zijn zo nauw vergroeid met hun kalksteenpantser dat nog niemand een manier gevonden heeft om de kalksteen te verwijderen zonder het skelet te vernietigen. Daarom moet al het onderzoek tot nu toe in de grot zelf plaatsvinden.