3. Evolúciós következmények
Tudomásunk szerint a tesszerakód jelenti az első kvantitatív magyarázatot az elfajulás eredetére az őskódokban. Mint ilyen, releváns lehet a genetikai kód evolúciójának magyarázatában. A cikk második részében a tessera-kód lehetséges evolúciós következményeit elemezzük. Ennek érdekében felidézzük a Watanabe & Yokobori által bemutatott evolúciós hipotézist, amely az extant mitokondriumok transzlációjának elemzésén alapul (lásd a 4. ábrát a ) alapján. A 4. ábra olyan mérföldköveket mutat be, amelyekkel kapcsolatban van némi egyetértés, és amelyek a primitív genetikai kódtól a jelenlegi változatokig tartó evolúciós lépéseket jelentik. A létező változatokból kiindulva és az időben visszafelé haladva találjuk az első mérföldkövet, azaz a LUCA univerzális genetikai kódját. A feltételezések szerint ez a kód a jelenlegi nukleáris standard genetikai kódhoz hasonló felépítésű. A létező kódok legegyszerűbb változata a gerincesek mitokondriális genetikai kódja, amelyet elsősorban emiatt javasoltak az egyetemes LUCA-kód elődjének, a korai kódnak a modelljeként (a 4. ábrán jobbról a második mérföldkő). A fő evolúciós újdonság, amelyet a korai kódról az egyetemes kódra való átmenet jelent, a tRNS-ek poszt-transzkripciós módosításainak megjelenése. Ezt támasztja alá az a tény, hogy néhány létező Metazoan mitokondriumban az antikodon első pozíciójában lévő változatlan U párosulhat a kodon harmadik pozíciójában lévő összes bázissal . Ez lehetővé teszi a kodoncsaládok dekódolását anélkül, hogy módosított nukleotidokra lenne szükség (a család négy kodon csoportja, amelyeknek az első két bázisa közös, és ugyanazt az aminosavat kódolják). Watanabe & Yokobori javaslatában a korai kód egy kevesebb, degeneráltabb aminosavakat tartalmazó primitív kódból, azaz Jukes kódjából származik. Ilyen kódot feltehetően csak családok alkotnak, egy aminosav és a stopjel kivételével, amelyek degeneráltsága kettes, azaz két kodonnal kódoltak.
A genetikai kód evolúciójának ábrázolása, adaptálva a . Minden kör vagy négyzet egy-egy mérföldkövet jelöl. Az alsó sor az elméletünk által feltételezett kodonhosszúság evolúcióját mutatja.
Fő állításunk most az, hogy a tesszerkód a korai kód egyik ősét képviseli, nevezetesen egy pre-felső kódot, amely a primitív és a korai kód között helyezkedik el. Több érv is alátámasztja, hogy a tesszerkód egy korai kód előtti kód (a 4. ábrán a négyzet alakú mérföldkő). Az első és legfontosabb, hogy pontosan ugyanolyan degenerációs szerkezete van, mint a korai genetikai kódnak. Ezenkívül a tessera-kód összhangban van Baranov és társai hipotézisével, amely a kód hosszú oligonukleotidokkal való keletkezését javasolja, amit a kodonok hosszának csökkenése követett, amíg el nem érték az optimális 3-as számot. Feltételezve, hogy a korai kód 4 hosszúságú kodonokkal rendelkezik, feltételezzük, hogy a primitív kód is legalább 4 hosszúságú kodonokkal rendelkezik. Valóban, megmutatjuk, hogy Jukes primitív genetikai kódja megvalósítható 4 hosszúságú általános kodonokkal. A következő leírásban a kodon kifejezés alatt négy hosszúságú kodonokat vagy tetrakodonokat értünk. Jukes kódja 15 aminosavat tartalmaz 4-es degenerációval, egy aminosavat 2-es degenerációval és két stopkódont. Összességében 15 elem van 4-es degenerációval és 2 elem 2-es degenerációval. Ha feltételezzük, hogy ez a kód 4 nukleotid hosszúságú kodonokból származik, akkor ez azt jelenti, hogy 17 olyan elemet/aminosavat kell választani, amelyet két vagy négy kodonnal lehet kódolni a 44 = 256 kodonból álló halmazból. Megjegyzendő, hogy a 256 kodonból álló halmaz felosztható egy 32 kodonból álló, bizonyos szimmetriával rendelkező részhalmazra (ezek megfelelnek az 1. táblázat tessera kódjának első két oszlopának) és egy 224 kodonból álló, szimmetria nélküli részhalmazra. Mint fentebb látható, a szimmetrikus kodonok a 2-es degeneráltságú aminosavaknak, míg az aszimmetrikus kodonok a 4-es degeneráltságú aminosavaknak felelnek meg. Most, ha feltételezzük, hogy a kodonok aminosavakhoz való hozzárendelésének véletlenszerű mechanizmusa a legnagyobb valószínűségű degenerációs eloszlás pontosan megfelel a Jukes-kód eloszlásának. Ezt a B. elektronikus kiegészítő anyagban mutattuk be. Jukes feltételezi, hogy a 2. degeneráció egyik eleme a stopjelhez kapcsolódik. Ezzel a választással a stopkódonok kevésbé hajlamosak a véletlen hibák generálására, azaz ezek az elemek kevésbé kétértelműek, mint a 4-es degeneráltságúak. Hasonlóképpen természetes feltételezés, hogy a másik 2 degenerációs elem a start jelet kódoló aminosavnak felel meg.
Megmutattuk, hogy a primitív kód (Jukes változata) természetesen 4 hosszúságú kodonokkal írható le. Most egy lehetséges evolúciós utat írunk le a Jukes kódtól a tesszerkódig. A mi megközelítésünkben a primitív kód két pár szimmetrikus kodonból és 60 nem szimmetrikus kodonból áll. Megjegyezzük, hogy a szimmetrikus kodonok kiválasztása – a pontmutációs hibára való csökkent hajlamuk miatt – az első lépést jelenti a tesszerakészlet szimmetrikus felének kiválasztásához. Tegyük fel, hogy megjelenik egy új adaptor, amely szimmetrikus antikodonnal rendelkezik, és versenyez (ugyanazt az aminosavat hordozza) egy meglévő, aszimmetrikus antikodonnal rendelkező adaptorral. Az új adaptor képes kötődni a tesszerakészlet részét képező szimmetrikus kodonokhoz (az 1. táblázat első két oszlopa). Az ilyen adaptor evolúciós előnnyel rendelkezik a nem szimmetrikus antikodont hordozó adaptorral szemben, mivel két különböző térbeli konfigurációval rendelkezik, amelyeket a kodonhoz való kötődéshez felhasználhat. A 2. ábrán látható adaptor például a palindromikus AUUA antikodont hordozza. Ha az adaptort megfordítjuk, akkor is képes kötődni az UAAU kodon/tesszerához. Ez a szelekciós nyomás az összes szimmetrikus kodon (tetrakodon)/tesszéra befogását okozza a nem szimmetrikus kodonok rovására. A folyamat végén egy olyan kódot kapunk, amely 32 szimmetrikus tesszerából és 32 nem szimmetrikus tetrakodonból áll, amelyek nem feltétlenül tartoznak a tesszerakészlethez. Ezen a ponton egy további optimalizálási lépést érünk el a nem szimmetrikus tesszerák kiválasztásával: ahogyan a , a tesszerák immunisak a pontmutációkra4 , és így a dekódolási pontosság evolúciós nyomása miatt túlélnek a nem tesszerás tetrakodonokkal szemben. A 32 szimmetrikus tessera immunis a pontmutációkra (két egyidejű, nagyon valószínűtlen pontmutációra van szükség ahhoz, hogy két tessera közötti átmenet létrejöjjön). Ez azt jelenti, hogy a megfelelő tRNS-ek nem vezetnek nem megismerhető aminosav beépüléséhez, ha pontmutációnak vannak kitéve. A hibadetektálásnak ez a tulajdonsága evolúciós előnyt jelent a fehérjeszintézis pontossága szempontjából. A fennmaradó 32 nem szimmetrikus tetrakodon nem feltétlenül tetrakodon, de azok, amelyek tetrakodonok, rendelkeznek a hibamentesség tulajdonságával, így a fenti okok miatt fokozatosan szelektálódnak. Így megkapjuk a tessera előtti korai kód teljes szerkezetét, amelynek degenerációs eloszlása egybeesik a korai kódéval (és a ma élő gerincesek mitokondriális kódjával).
Megmutattuk, hogy a Jukes-kód és a tessera-kód közötti átmenet a legvalószínűbb minimális feltételezések mellett. Nyilvánvaló, hogy ebben az átmenetben a tessera-felismerés specifikusabbá válik, mint a Jukes-kód tetracodon-felismerése. Valójában a tessera kód hibafelismerési tulajdonsága lehetővé teszi a tetrakodon adaptorok aminosav-töltésével kapcsolatos kétértelműség csökkentését. A tessera-felismerés megnövekedett pontossága viszont lehetővé teszi az aminosavak kiválasztásának finomítását a fehérjék teljesítményének evolúciós nyomása miatt.
A tessera-kódnak mint korai kódnak a hipotézisünk egy másik jelentős evolúciós átmenetet is feltételez, nevezetesen a tessera-kód és a korai kód közötti átmenetet. Mivel a korai kód feltételezhetően hármas hosszúságú kodonokkal rendelkezik, az ezzel az átmenettel járó fő probléma a kodonhossz változásával kapcsolatos, amelyet általában károsnak tartanak . Megjegyzendő, hogy (i) a háromtól eltérő kodonhosszúságú kód eredetére vonatkozó bármely elméletnek szembe kell néznie ezzel a problémával, és (ii) az ilyen átmenet káros, ha olyan evolúciós szintet érünk el, ahol a kód befagyott, mivel ez drámai változást jelent a szervezet összes fehérjéjének aminosav-sorrendjében; ez azonban nem feltétlenül van így a kód eredetéhez közelebbi korábbi evolúciós lépések esetében. A tesszerkód lehetővé teszi, hogy rendezett megoldást találjunk a tetrakodonokról a kodonokra való átmenet problémájára. A tesszerakészlet által hordozott információ ugyanis redundáns. A definíció szerint, ha egy tessera négy betűje közül bármelyik három ismert, akkor a hiányzó betű egyértelmüen levezethető. Ezért a kódoláselmélet szempontjából a tesszerkód és bármely hárominukleotid genetikai kód ugyanazt az információtartalmat hordozza. Ez azt jelenti, hogy a tesszerák és a kodonok között egy az egyben leképezhető. Az ilyen leképezés lényegi struktúrája azt vonja maga után, hogy a tessera szomszédos betűi közötti transzformációk egy kodon nukleotidjaivá válnak. Konkrétan, egy b1b2b2b3b4 tessera esetén három kémiai transzformáció lehet a szomszédos betűk között: t12 = f(b1b2) b1 és b2 között, t23 = f(b2b3) b2 és b3 között, és t34 = f(b3b4) b3 és b4 között. Vegyük észre, hogy e három transzformációból csak kettő független, mivel t34 = t12. A 4a. táblázatban a tesszerkódot a t12 (sorok) és t23 (oszlopok) transzformációnak megfelelően rendeztük át. Javasoljuk, hogy a t12 és a t23 a kodon első, illetve második nukleotidjára (x1, x2) legyen leképezve. Ez a megfeleltetés a 3. táblázatban látható. Ezenkívül a b4 negyedik betűt az x3 kodon harmadik nukleotidjára képezzük le. A leképezés sematikus ábrázolása az 5. ábrán látható. Megjegyezzük, hogy ennek a leképezésnek megfelelően a tessékkészlet oszlopai a genetikai kód oszlopaira vannak leképezve úgy, hogy a t23 = I a NAN kodonokra (degeneráció nem-4), a t23 = KM pedig a (csak családokból álló) NCN kodonokra van leképezve; vö. a44b táblázatot a 4c táblázattal. Megfigyelhetjük, hogy a tesszerkód e két oszlopának degeneráltsága megegyezik a genetikai kód megfelelő oszlopaival (vagy 4, vagy 2 + 2). A leképezés természetes kiegészítése a t23 = SW-t a NUN kódokhoz, a t23 = YR-t pedig az NGN kódokhoz rendeli. Az utóbbi két hozzárendelésnél figyelembe kell venni néhány kivételt, amelyet az a tény határoz meg, hogy a tessékről a kodonokra való átmenetben a Rumer-szimmetria valóban megmarad, de az önkomplementer szimmetria nem. A tessera-antitessera kölcsönhatás a négy Watson-Crick-szerű kémiai kötés jelenléte miatt specifikusabb, mint a kodon-antikodon kölcsönhatás. A létező genetikai kód esetében azonban a degeneráltságot elsősorban az első két bázis kodon-antikodon kölcsönhatása határozza meg. Ezért, feltételezve, hogy a korai kód előtti időkben a kötési energia a Watson-Crick-hez hasonló, a tessera-antitessera kölcsönhatási energiának körülbelül kétszeresének kell lennie a tényleges kodon-antikodon energiának.
A tesszerák (b1b2b3b4) és a kodonok (x1x2x3) közötti leképezés sematikus ábrázolása.
3. táblázat.
A tesszerák és kodonok közötti leképezés alapszerkezete. A tesszerák bázisai közötti négy transzformáció leképeződik egy kodon négy nukleotidjára.
tesszéra transzformációk t12,t23 | kódon bázisok x1, x2 | |
---|---|---|
I | ⟶12345 | A |
SW | ⟶12345 | U |
KM | ⟶12345 | C |
YR | ⟶12345 | G |
4. táblázat.
(a) A transzformációk szerint rendezett tessékkód: első-második betű t12 (sorok) és második-harmadik betű t23 (oszlopok); (b) ugyanaz, mint (a), de a nyilakkal jelzett felcserélt kvartettekkel. (c) A gerincesek mitokondriális genetikai kódjának degenerációja. A gerincesek mitokondriális kódjának (c) és a (b) tessék-lássék kódjai a szövegben leírt egy-az-egyhez leképezéssel kapcsolódnak egymáshoz. A kvartetteken belül az azonos színű tesszerek ugyanazt az aminosavat kódolják: rózsaszín és zöld = 2 + 2, fehér = 4.
Az átmenet a tesszerekről a kodonokra biokémiai szempontból tehát átmenetet jelent a tesszerek olvasására szolgáló teljes négy bázis hosszúságú, specifikus Watson-Crick-szerű párosításról a kodonok olvasására szolgáló wobble stratégiára.
Ez különösen néhány olyan szimmetriatulajdonság elméleti korlátozását jelenti, amelyek a tesszerák világában jelen vannak, de a létező kódokban nem, például az önkomplementer szimmetria elvesztését. A tessera kód minden egyes oszlopa ugyanis határozott degenerációval rendelkezik, de a létező kódokban ez csak két oszlopra, azaz NMN (NAN vagy NCN) típusú kodonokra igaz. Ehelyett az NKN (NUN vagy NGN) típusú kodonoknak megfelelő oszlopok vegyes degenerációval rendelkeznek; különösen a két kód közötti eltérő kvadránsok a SUN és WGN típusúak (WSN vagy SWN vegyesnek nevezzük, szemben a nem vegyes SSN WWN-vel). Más szóval, a létező kódokban vannak olyan WGN típusú kodonok, amelyek 2 degenerációjú aminosavakat kódolnak annak ellenére, hogy a központi bázis erős, és olyan SUN típusú kodonok, amelyek 4 degenerációjú aminosavakat kódolnak annak ellenére, hogy a központi bázis gyenge .
Az ilyen jellemzők magyarázatát a kodon-antikodon kölcsönhatás sztereokémiájától függő energetikai kényszerekkel kapcsolatban javasolta a . A létező genetikai kódban a gyenge kölcsönhatás általában 2 + 2 degenerációval jár. Valóban ez a helyzet a NAN, AUN és UUN típusú kodonok esetében. Az U mint második betű esetén azonban a tRNS antikodonhurokjában a purin központi N35 betűjének U33 általi további stabilizálása lehetővé teszi egy teljes család leolvasását az N35 gyenge jellege ellenére.5 Tükörsima esetben az AGN és UGN típusú kodonok esetében az N35 nukleotidot az U33 nem stabilizálja eléggé, és a kapcsolódó kvartett 2 + 2 degenerációjúvá válik.
Ezek a wobble-stratégiai korlátozások azt jelentik, hogy a tesszerákról a kodonokra való leképezésben a kvadráns (YR-SW) felcserélődik a kvadránsra (SW-YR) és a kvadráns (KM-SW) a kvadránsra (I-YR); lásd a 4. táblázatot (felső panelek). Végül egy tessera negyedik betűje egy kodon harmadik betűjére kerül leképezésre a következő kivétellel, amely biztosítja a helyes csoportosítást: ha b4 = K (T vagy G), akkor x3 = KM(b4), azaz T és G felcserélődik; egyébként x3 = b4. Figyeljük meg, hogy a leképezés nem feltétlenül egyedi; azonban legjobb tudásunk szerint a mostani azt mutatja, hogy a tessék-lássék kódból át lehet jutni a létező kódba az utóbbi összes ismert degenerációs jellemzőjének leírásával.
Ha eredetileg a fehérjekódoláshoz három bázisnál hosszabb kodonok tartoztak, akkor a fordítógépezetnek valamilyen emléket kell hordoznia erről. A létező riboszómák kis alegysége ugyanis olyan szerkezeti szabadságot mutat, amely lehetővé teheti egy további nukleotid beépítését a dekódoló központba, így a négy bázisú kodonok dekódolása is megvalósítható. Megjegyzendő, hogy az ősi négyes kódolás lehetőségét már említették a . A négyes dekódolást 1973-ban fedezték fel, mint a frameshift elnyomással kapcsolatos mechanizmust, és manapság széles körben használják a biotechnológiai alkalmazásokban a nem kanonikus aminosavak fehérjékbe történő beépítésére. Sőt, laboratóriumban kimutatták a hossz-négyes kódok és az ezeket dekódoló ortogonális riboszóma biológiai megvalósíthatóságát . Emellett vannak olyan bizonyítékok, amelyek a tetrakodonok által kódolt átfedő gének létezésére utalnak ; továbbá kimutatták, hogy a tetrakodonok fontos szerepet játszanak a filogenetikai elemzésben, (pl. ) és ez a genetikai memória jele lehet.
A tesszerkód lenyűgöző számú tulajdonságát őrzik a jelenlegi kódok. A korai kód és minden leszármazottja a tessera kódtól örökölte a kodonok számát (64 tessera 64 kodont generál) és az aminosavak maximális számát (23). A tessera kód 24 elem/aminosav kódolását teszi lehetővé. Mivel ezek közül legalább egynek stopjelet kell jelentenie, a reprezentálható aminosavak maximális elméleti száma 23. Figyelemre méltó, hogy egyetlen létező kód sem lépi túl ezt a határt, és az egyes genomok által közvetlenül kódolt aminosavak maximális száma pontosan 23: a 20 standard aminosav plusz 2 nem standard (szelenocisztein és pirrolizin) és az alternatív indító aminosav N-formil-metionin összesen 23. Ezenkívül a gerincesek mitokondriális genetikai kódjában használt adaptorok száma 22: nyolc tRNS, amely egyenként négy kodont ismer fel, 14 tRNS, amely egyenként két kodont ismer fel, és két olyan kodonpár, amely nem kapcsolódik aminosavakhoz . Figyelemre méltó, hogy a 22 a genetikai kód összes ismert változata között megfigyelt abszolút minimum. Emellett pontosan ez az a struktúra, amelyet a tesszermodell implikál: nyolc 4-es degeneráltságú ősadapter plusz 16 2-es degeneráltságú adapter alkot egy 24 adapterből álló halmazt; ha elvetjük a stopkódonokhoz rendelt két 2-es degeneráltságú adaptert, pontosan 22-t kapunk.
A gerincesek mitokondriális genetikai kódja és a korai kód tesszerbázisú modellünk számos, a szimmetriával kapcsolatos jellemzőben is megegyezik (pl. 5. táblázat). Mindenekelőtt a KM-transzformáció, más néven Rumer-transzformáció, amelyet egy kodon első kettősére alkalmazunk, megváltoztatja a megfelelő aminosav degeneráltságát. Ez az univerzális tulajdonság a genetikai kód legtöbb ismert (nukleáris és mitokondriális) változatában megfigyelhető. A tessék-lássék kód is rendelkezik ezzel a tulajdonsággal. Például a tessera AUUA egy 2-es degeneráltságú aminosavnak felel meg, és ha az első két nukleotidra a KM transzformációt alkalmazzuk, akkor a tessera CGUA-t kapjuk, amely egy 4-es degeneráltságú aminosavnak felel meg. Megjegyezzük, hogy ez a tulajdonság akkor is érvényes, ha a Rumer-transzformációt alkalmazzuk a tesszerákat és a kodonokat összekötő, fent leírt leképezés t12t23-jára. További betekintésért lásd .
5. táblázat.
A gerincesek mitokondriális genetikai kódja és a tesszerkód közötti összehasonlító táblázat.
gerincesek mitokondriális genetikai kódja | tessera kód | |||||
---|---|---|---|---|---|---|
deg. | szám. kodonok | deg. | szám. tesszerák | |||
degeneráció | 2 | 16 | 2 | 2 | 16 | |
4 | 8 | 4 | 8 | |||
szám. kodonok | kódonok száma 64 | tesszerek 64 | ||||
adaptorok száma | adaptorok száma 22 | adaptorok 22 | ||||
aminosavak száma | a.a. 20 | a.a. 20 | ||||
szimmetriák | ||||||
Rumer | KM transzformáció az első két bázison megváltoztatja az a degenerációját.a. | KM-transzformáció az első két bázison megváltoztatja az a.a degeneráltságát. | ||||
Klein V csoport | Az első és a második betű közötti transzformáción osztozó 16 kodon degenerációs eloszlása megegyezik | Az első és a második betű közötti transzformáción osztozó 16 tézis | Az első és a második betű közötti transzformáción osztozó 16 tez. az első és a második betűvel azonos degenerációs eloszlással rendelkeznek |
A tesszerkód másik alapvető aspektusa, hogy a fehérje kódolása robosztussá tehető a +1 kereteltolódásokkal szemben. A keretfenntartási robusztusság összefüggésbe hozható a cirkuláris kódokkal is, amelyekről feltételezték, hogy szerepet játszanak a keretszinkronizációs folyamatokban . Az univerzális cirkuláris kód tulajdonságának meglétét a genetikai kód eredetével hozták összefüggésbe, mint az azonos vagy hasonló aminosavat kódoló komplementer kodonok párjaival . Ugyanezt a feltételezést más összefüggésekben is alátámasztják . Ez a tulajdonság természetesen a tesszerkódban merül fel, ahol egy tesszerkód és annak fordított komplementere mindig ugyanazt az aminosavat kódolja.