Schrijf een functie translate_dna
die een .txt bestand als argument neemt. Deze txt file bevat een DNA sequentie waarbij de nucleotiden al gegroepeerd zijn per drie (dus per codon), gescheiden door een tab (\t). De functie moet de DNA sequentie omzetten naar een aminozuur sequentie. Elk codon (combinatie van 3 nucleotiden) zal vertaald worden naar een aminozuur zoals weergegeven in onderstaande dictionary codon_table
. Die dictionary moet je natuurlijk ook nog definiƫren in je code (copy-paste). De functie geeft na vertaling de aminozuur sequentie terug.
codon_table = {
'TTT': 'F', 'TTC': 'F', 'TTA': 'L', 'TTG': 'L',
'CTT': 'L', 'CTC': 'L', 'CTA': 'L', 'CTG': 'L',
'ATT': 'I', 'ATC': 'I', 'ATA': 'I', 'ATG': 'M',
'GTT': 'V', 'GTC': 'V', 'GTA': 'V', 'GTG': 'V',
'TCT': 'S', 'TCC': 'S', 'TCA': 'S', 'TCG': 'S',
'CCT': 'P', 'CCC': 'P', 'CCA': 'P', 'CCG': 'P',
'ACT': 'T', 'ACC': 'T', 'ACA': 'T', 'ACG': 'T',
'GCT': 'A', 'GCC': 'A', 'GCA': 'A', 'GCG': 'A',
'TAT': 'Y', 'TAC': 'Y', 'TAA': '*', 'TAG': '*',
'CAT': 'H', 'CAC': 'H', 'CAA': 'Q', 'CAG': 'Q',
'AAT': 'N', 'AAC': 'N', 'AAA': 'K', 'AAG': 'K',
'GAT': 'D', 'GAC': 'D', 'GAA': 'E', 'GAG': 'E',
'TGT': 'C', 'TGC': 'C', 'TGA': '*', 'TGG': 'W',
'CGT': 'R', 'CGC': 'R', 'CGA': 'R', 'CGG': 'R',
'AGT': 'S', 'AGC': 'S', 'AGA': 'R', 'AGG': 'R',
'GGT': 'G', 'GGC': 'G', 'GGA': 'G', 'GGG': 'G'
}
Input:
Output:
'CGALHDGPEDKRRLPHSRFCAFPGASSVEVGAASEKETNI*SPAQDSTPINAPDTPGLDVAFPSVDLGATPTTSASPDVTHSGLITLCV*VVRGKLCKGD'