3. Evolutionära implikationer
Tessera-koden utgör, såvitt vi vet, den första kvantitativa förklaringen till ursprunget till degeneration i förfädernas koder. Som sådan kan den vara relevant för att förklara utvecklingen av den genetiska koden. I den andra delen av denna artikel analyserar vi de möjliga evolutionära konsekvenserna av tessera-koden. I detta syfte påminner vi om den evolutionära hypotes som Watanabe & Yokobori presenterade och som bygger på analysen av översättning i existerande mitokondrier (se figur 4 anpassad från ). I figur 4 presenteras milstolpar som det råder viss enighet om och som representerar de evolutionära stegen från en primitiv genetisk kod till de nuvarande varianterna. Om vi utgår från bevarade varianter och går bakåt i tiden finner vi den första milstolpen, dvs. den universella genetiska koden från LUCA. Denna kod antas ha en struktur som liknar den nuvarande genetiska standardkoden för kärnvapen. Den enklaste varianten av existerande koder är ryggradsdjurens mitokondriella genetiska kod som, främst av denna anledning, har föreslagits som en modell för föregångaren till den universella LUCA-koden: den tidiga koden (den andra milstolpen från höger i figur 4). Den viktigaste evolutionära nyheten som övergången från den tidiga koden till den universella koden innebär är uppkomsten av posttranskriptionella modifieringar i tRNA. Detta stöds av det faktum att i vissa existerande mitokondrier från metazoer kan ett omodifierat U i den första positionen av anticodonet para ihop sig med alla baser i den tredje positionen av kodonet . Detta gör det möjligt att avkoda familjer av kodoner utan behov av modifierade nukleotider (en familj är en grupp av fyra kodoner som delar de två första baserna och kodar för samma aminosyra). I Watanabe & Yokoboris förslag härstammar den tidiga koden från en primitiv kod med färre, mer degenererade, aminosyror, dvs. Jukes kod . En sådan kod antas endast bildas av familjer med undantag för en aminosyra och stoppsignalen som har degeneration två, dvs. kodas av två kodoner.
Darställning av den genetiska kodens utveckling, anpassad från . Varje cirkel eller kvadrat representerar en milstolpe. Den nedre linjen visar utvecklingen av kodonlängden som vår teori innebär.
Nu är vårt huvudsakliga påstående att tessera-koden representerar en förfader till den tidiga koden, nämligen en förtidig kod, som är placerad mellan den primitiva och den tidiga koden. Det finns flera argument som stöder tessera-koden som en förtidig kod (den fyrkantiga milstolpen i figur 4). Först och främst har den exakt samma degenerationsstruktur som den tidiga genetiska koden. Dessutom stämmer tessera-koden överens med hypotesen från Baranov et al. som föreslår att koden uppstod med långa oligonukleotider, följt av en minskning av kodlängden tills det optimala antalet på 3 uppnåddes. Antagandet att den förtida koden har kodoner med längd 4 innebär att även den primitiva koden har kodoner med längd minst 4. Vi visar faktiskt att Jukes primitiva genetiska kod kan genomföras med generiska kodoner med längd 4. I den följande beskrivningen använder vi termen kodon för att beteckna kodoner med längd fyra eller tetrakodoner. Jukes kod har 15 aminosyror med degeneration 4, en aminosyra med degeneration 2 och två stoppkodoner. Sammanlagt finns det 15 element med degeneration 4 och 2 element med degeneration 2. Om vi antar att denna kod har sitt ursprung i kodoner med 4 nukleotider, innebär detta att man kan välja 17 element/aminosyror som kan kodas med antingen två eller fyra kodoner från en uppsättning på 44 = 256 kodoner. Observera att mängden 256 kodoner kan delas upp i en delmängd på 32 kodoner som har vissa symmetrier (dessa motsvarar de två första kolumnerna i tessera-koden i tabell 1) och en delmängd på 224 kodoner som inte har någon symmetri. Som framgår ovan motsvarar symmetriska kodoner aminosyror med degeneration 2, medan asymmetriska kodoner motsvarar aminosyror med degeneration 4. Om vi nu antar en slumpmässig mekanism för tilldelningen av kodoner till aminosyror motsvarar den degenerationsfördelning som har den högsta sannolikheten exakt den för Jukes kod. Vi har visat detta i det elektroniska tilläggsmaterialet B. Jukes antar att ett av elementen i degeneration 2 är förknippat med stoppsignalen. Med detta val är stoppkodoner mindre benägna att genereras av slumpmässiga fel, dvs. dessa element är mindre tvetydiga än de med degeneration 4. På samma sätt är det naturligt att anta att det andra elementet med degeneration 2 motsvarar den aminosyra som kodar för startsignalen.
Vi har visat att den primitiva koden (Jukes version) naturligt beskrivs med kodoner av längd 4. Nu beskriver vi en möjlig utvecklingsväg från Jukes kod till tessera-koden. I vårt tillvägagångssätt består den primitiva koden av två par symmetriska kodoner och 60 icke-symmetriska kodoner. Observera att valet av symmetriska kodoner, på grund av deras minskade benägenhet för punktmutationer, utgör ett första steg för att välja den symmetriska halvan av tessera-uppsättningen. Antag att en ny adapter med en symmetrisk anticodon dyker upp och konkurrerar (bär samma aminosyra) med en befintlig adapter med en asymmetrisk anticodon. Den nya adaptern kan binda till symmetriska kodoner som ingår i tessera-uppsättningen (de två första kolumnerna i tabell 1). En sådan adapter har en evolutionär fördel jämfört med den som har en icke-symmetrisk anticodon, eftersom den har två olika rumsliga konfigurationer som kan användas för att binda till kodonet. Adaptorn i figur 2 bär till exempel på den palindromiska anticodonen AUUA. Om adaptern är omvänd kan den fortfarande binda till kodonet/tessera UAAU. Detta selektiva tryck leder till att alla symmetriska kodoner (tetrakodoner)/tesserae fångas upp på bekostnad av icke-symmetriska kodoner. I slutet av denna process har vi en kod som består av 32 symmetriska tesserae och 32 icke-symmetriska tetrakodoner som inte nödvändigtvis tillhör tesserauppsättningen. Vid denna punkt nås ytterligare ett optimeringssteg genom att välja icke-symmetriska tesserae: som framgår av , är tesserae immuna mot punktmutationer4 och överlever därmed till icke-tessera tetracodons på grund av det evolutionära trycket av avkodningsnoggrannhet. De 32 symmetriska tesserae är immuna mot punktmutationer (det krävs två samtidiga, mycket osannolika, punktmutationer för att åstadkomma en övergång mellan två tesserae). Detta innebär att motsvarande tRNA inte leder till inkorporering av en icke-kognad aminosyra om de utsätts för en punktmutation. Denna egenskap av feldetektering innebär en evolutionär fördel när det gäller precisionen i proteinsyntesen. De återstående 32 icke-symmetriska tetracodonerna är inte nödvändigtvis tesserae, men de som är tesserae har egenskapen felimmunitet så att de gradvis kommer att väljas ut av ovanstående skäl. Därför erhåller vi den kompletta strukturen för den förtida tessera-koden vars degenerationsfördelning sammanfaller med den tidiga koden (och med den för den bevarade mitokondriella koden hos ryggradsdjur).
Vi har visat att övergången mellan Jukes kod och tessera-koden är den mest sannolika under minimala antaganden. Det är uppenbart att i denna övergång blir tessera-igenkänningen mer specifik än tetracodon-igenkänningen av Jukes’ kod. Tessera-kodens egenskap att upptäcka fel gör det möjligt att minska tvetydigheten när det gäller aminosyrebelastningen av tetracodonadaptrar. I sin tur gör den ökade precisionen i tessera-igenkänningen det möjligt att förfina valet av aminosyror på grund av det evolutionära trycket på proteinprestanda.
Vår hypotes om tessera-koden som en kod före den tidiga koden innebär också en annan viktig evolutionär övergång, nämligen övergången mellan tessera-koden och den tidiga koden. Eftersom den tidiga koden antas ha kodoner med en längd på tre är det största problemet som denna övergång innebär relaterat till förändringen av kodonlängden, som i allmänhet anses vara skadlig . Observera att i) alla teorier om kodens ursprung med en kodonlängd som skiljer sig från tre måste möta detta problem och att ii) en sådan övergång är skadlig när man når en evolutionär nivå där koden har frusit fast, eftersom detta innebär en dramatisk förändring av aminosyrasekvensen i alla proteiner i en organism; detta är dock inte nödvändigtvis fallet i tidigare evolutionära steg som ligger närmare kodens ursprung. Tessera-koden gör det möjligt att hitta en snygg lösning på problemet med övergången från tetrakodoner till kodoner. I själva verket är den information som bärs upp av tessera-uppsättningen överflödig. Om tre av fyra bokstäver i en tessera är kända kan den saknade bokstaven per definition härledas på ett entydigt sätt. Ur kodningsteorins synvinkel har därför tessera-koden och alla trinukleotiska genetiska koder samma informationsinnehåll. Detta innebär att en en-till-en-avbildning mellan tesserae och kodoner kan upprättas. Den väsentliga strukturen för en sådan kartläggning innebär att omvandlingarna mellan intilliggande bokstäver i en tessera blir nukleotiderna i en kodon. Med en tessera b1b2b3b4 kan vi ha tre kemiska transformationer mellan intilliggande bokstäver: t12 = f(b1b2) mellan b1 och b2, t23 = f(b2b3) mellan b2 och b3, och t34 = f(b3b4) mellan b3 och b4. Observera att endast två av dessa tre transformationer är oberoende eftersom t34 = t12. I tabell 4a har vi omorganiserat tessera-koden enligt transformationen t12 (rader) och t23 (kolumner). Vi föreslår att t12 och t23 ska avbildas på kodonets första respektive andra nukleotid (x1, x2). Denna korrespondens visas i tabell 3. Den fjärde bokstaven b4 är dessutom kopplad till den tredje nukleotiden i kodonet x3. En schematisk bild av denna koppling visas i figur 5. Observera att kolumnerna i tessera-uppsättningen enligt denna kartläggning kartläggs på kolumnerna i den genetiska koden så att t23 = I kartläggs på NAN-kodoner (degeneration non-4) och t23 = KM kartläggs på NCN-kodoner (som endast består av familjer); jämför tabell 44b med tabell 4c. Vi kan konstatera att dessa två kolumner i tesserakoden har samma degeneration som motsvarande kolumner i den genetiska koden (antingen 4 eller 2 + 2). Den naturliga kompletteringen av kartläggningen tilldelar t23 = SW till NUN-kodoner och t23 = YR till NGN-kodoner. De två sistnämnda tilldelningarna måste ta hänsyn till vissa undantag som bestäms av det faktum att i övergången från tesserae till kodoner bevaras faktiskt Rumers symmetri, men inte den självkompletterande symmetrin. Interaktionen mellan tessera-antitessera är mer specifik än interaktionen mellan kodon och antikodon, på grund av fyra Watson-Crick-liknande kemiska bindningar. När det gäller den befintliga genetiska koden bestäms dock degenerationen huvudsakligen av samspelet mellan kodon och anticodon för de två första baserna. Genom att anta att bindningsenergin under den tidiga kodtiden är jämförbar med Watson-Crick-energin bör därför tessera-antitessera-interaktionsenergin vara ungefär dubbelt så stor som den faktiska energin för kodon-anticodon.
Schematisk representation av mappningen mellan tessera (b1b2b3b4) på kodonet (x1x2x3).
Tabell 3.
Grundläggande struktur för mappningen mellan tessera och kodon. De fyra transformationerna mellan baserna i en tessera avbildas på de fyra nukleotiderna i en kodon.
tesserae transformationer t12,t23 | kodonbaser x1, x2 | |
---|---|---|
I | ⟶12345 | A |
SW | ⟶12345 | U |
KM | ⟶12345 | C |
YR | ⟶12345 | G |
Tabell 4.
(a) Tessera-koden organiserad enligt transformationerna: första-andra bokstaven t12 (rader) och andra-tredje bokstaven t23 (kolumner); (b) samma som (a) men med de ombytta kvarteterna enligt pilarna. (c) Degenerering av vertebraternas mitokondriella genetiska kod. Kodonerna i vertebraternas mitokondriella kod i (c) och tesserae (b) är besläktade genom den en-till-en-mappning som beskrivs i texten. Inom kvartetter kodar tesserae med samma färg för samma aminosyra: rosa och grönt = 2 + 2 och vitt = 4.
Så, ur biokemisk synvinkel, innebär övergången från tesserae till kodoner övergången mellan en fullständig fyrabaslång specifik Watson-Crick-liknande parning för avläsning av tesserae till wobble-strategin för avläsning av kodoner.
I synnerhet innebär detta teoretiska begränsningar för vissa symmetriegenskaper som finns i tesserans värld men inte i existerande koder, t.ex. förlusten av den självkompletterande symmetrin. Varje kolumn i tesserakoden har faktiskt en bestämd degeneration, men i befintliga koder gäller detta endast för två kolumner, dvs. kodoner av typen NMN (NAN eller NCN). De kolumner som motsvarar kodonerna NKN (NUN eller NGN) har i stället en blandad degeneration; i synnerhet är de olika kvadranterna mellan de två koderna de av typen SUN och WGN (vi kallar WSN eller SWN för blandade i motsats till den icke-mixade SSN WWN). Med andra ord har existerande koder kodoner av typen WGN som kodar aminosyror med degeneration 2 trots att den centrala basen är stark, och kodoner av typen SUN som kodar aminosyror med degeneration 4, trots att den centrala basen är svag .
En förklaring av sådana egenskaper i termer av energibegränsningar som beror på stereokemin i samspelet mellan kodon och anticodon föreslås i . I den existerande genetiska koden är ett svagt samspel normalt förknippat med en 2 + 2 degeneration. Detta är faktiskt fallet för kodoner av typen NAN, AUN och UUN. I fallet med ett U som andra bokstav gör en ytterligare stabilisering av purinets centrala bokstav N35 i tRNA:s anticodonslinga med hjälp av U33 det möjligt att avläsa en komplett familj trots den svaga karaktären hos N35.5 I det motsatta fallet, för kodoner av typen AGN och UGN, stabiliseras nukleoiden N35 inte tillräckligt av U33, och den associerade kvartetten får en degeneration på 2 + 2.
Dessa begränsningar av wobbelstrategin innebär att i kartläggningen från tesserae till kodoner byts kvadranten (YR-SW) ut mot kvadranten (SW-YR) och kvadranten (KM-SW) mot kvadranten (I-YR); se tabell 4 (övre paneler). Slutligen kopplas den fjärde bokstaven i en tessera till den tredje bokstaven i en kodon med följande undantag som säkerställer en korrekt gruppering: om b4 = K (T eller G) så är x3 = KM(b4), dvs. T och G är utbytta; annars är x3 = b4. Observera att kartläggningen inte nödvändigtvis är unik; Den nuvarande visar dock, såvitt vi vet, att det är möjligt att gå från tessera-koden till den existerande koden genom att beskriva alla kända degenerationsegenskaper hos den senare.
Om proteinkodningen ursprungligen innefattade kodoner som var längre än tre baser, borde översättningsmaskineriet ha ett visst minne av detta. Den lilla underenheten i de existerande ribosomerna uppvisar i själva verket en strukturell frihet som skulle kunna möjliggöra införandet av ytterligare en nukleotid i avkodningscentrumet så att avkodning av kodoner med fyra baser är möjlig. Observera att möjligheten av en förfödd kodning med fyrdubbel kodning hade nämnts i . 1973 upptäcktes fyrdubbel avkodning som en mekanism som är relaterad till ramförskjutningsundertryckning, och numera används den i stor utsträckning i biotekniska tillämpningar för att införliva icke-kanoniska aminosyror i proteiner . Dessutom har den biologiska genomförbarheten av kodoner med fyra längder och av en ortogonal ribosom som avkodar dem påvisats i laboratoriet . Det finns också bevis som pekar på att det finns överlappande gener som kodas av tetrakodoner ; dessutom har det visats att tetrakodoner spelar en viktig roll i fylogenetisk analys, (t.ex. ) och detta kan vara en indikation på ett genetiskt minne.
Ett imponerande antal egenskaper hos tessera-koden bevaras i nuvarande koder. Den tidiga koden och alla dess ättlingar ärver från tessera-koden antalet kodoner (64 tesserae genererar 64 kodoner) och det maximala antalet aminosyror (23). Tessera-koden gör det möjligt att koda för 24 grundämnen/aminosyror. Eftersom minst en av dessa måste representera en stoppsignal är det maximala teoretiska antalet representerbara aminosyror 23. Det är anmärkningsvärt att ingen existerande kod överskrider denna gräns, och det maximala antalet aminosyror som kodas direkt av vissa genomer är exakt 23: de 20 standardaminosyrorna plus två icke-standardiserade aminosyror (selenocystein och pyrrolysin) och den alternativa initieringsaminosyran N-formylmethionin uppgår till 23. Dessutom är antalet adaptrar som används i ryggradsdjurens mitokondriella genetiska kod 22: åtta tRNA som känner igen fyra kodoner vardera, 14 tRNA som känner igen två kodoner vardera och två par kodoner som inte är associerade med aminosyror . Det är anmärkningsvärt att 22 är det absoluta minimum som observerats bland alla kända versioner av den genetiska koden. Detta är också exakt den struktur som tessera-modellen implicerar: åtta primära adaptrar med degeneration 4 plus 16 adaptrar med degeneration 2 bildar en uppsättning med 24 adaptrar; om vi kastar bort två adaptrar med degeneration 2 som tilldelats stoppkodoner får vi exakt 22.
Den genetiska koden hos ryggradsdjurens mitokondrier och vår tesserabaserade modell av den tidiga koden har också ett antal egenskaper som är relaterade till symmetri (t.ex. tabell 5). Först och främst ändrar KM-transformationen, även känd som Rumers transformation, som tillämpas på den första dubbletten i ett kodon, degenereringen av motsvarande aminosyra. Denna universella egenskap observeras i de flesta kända versioner av den genetiska koden (både nukleär och mitokondriell). Tessera-koden har också denna egenskap. Tessera AUUA motsvarar till exempel en aminosyra med degeneration 2, och om vi tillämpar KM-transformationen på de två första nukleotiderna får vi tessera CGUA som motsvarar en aminosyra med degeneration 4. Observera att denna egenskap också gäller om vi tillämpar Rumers transformation på t12t23 i den mappning som förbinder tesserae och kodoner som beskrivs ovan. För ytterligare insikter, se .
Tabell 5.
Komparativ tabell mellan vertebraternas mitokondriella genetiska kod och tessera-koden.
Vertebraters mitokondriella genetiska kod | tessera-kod | |||||
---|---|---|---|---|---|---|
deg. | nå kodoner | deg. | nå. tesserae | |||
degeneration | 2 | 16 | 2 | 2 | 16 | |
4 | 8 | 4 | 8 | |||
tal antal kodoner | kodoner 64 | tesserae 64 | ||||
antal adaptrar | adaptrar 22 | adaptrar 22 | adaptrar 22 | |||
antal aminosyror | a.a. 20 | a.a. 20 | ||||
symmetrier | ||||||
Rumer | KM-transformationen på de två första baserna ändrar degenerationen i a.a. | KM-transformation på de två första baserna ändrar degenerationen av a.a. | ||||
Klein V-gruppen | De 16 kodoner som delar transformationen mellan den första och den andra bokstaven har samma degenerationsfördelning | De 16 mosaikstenar som delar transformationen mellan den första och den andra bokstaven har samma degenerationsfördelning |
En annan grundläggande aspekt av tessera-koden är att kodningen av ett protein kan göras robust mot +1 ramförskjutningar. Robustheten för ramunderhåll kan också relateras till cirkulära koder som har antagits spela en roll i processerna för ramsynkronisering . Förekomsten av en universell egenskap hos cirkulära koder har relaterats till den genetiska kodens ursprung som par av komplementära kodoner som kodar för antingen samma eller en liknande aminosyra . Samma gissning har stöd i andra sammanhang . Denna egenskap uppstår naturligt i tessera-koden där en tessera och dess omvända komplement alltid kodar för samma aminosyra.