3. Implicații evolutive
Din câte știm noi, codul tessera reprezintă o primă explicație cantitativă pentru originea degenerescenței în codurile ancestrale. Ca atare, ar putea fi relevant pentru a explica evoluția codului genetic. În a doua parte a acestui articol, analizăm posibilele implicații evolutive ale codului tessera. În acest scop, reamintim ipoteza evoluționistă prezentată de Watanabe & Yokobori, care se bazează pe analiza traducerii în mitocondriile existente (a se vedea figura 4 adaptată din ). Figura 4 prezintă repere asupra cărora există un oarecare acord și care reprezintă etapele evolutive de la un cod genetic primitiv până la variantele actuale. Pornind de la variantele existente și mergând înapoi în timp, găsim prima piatră de hotar, și anume codul genetic universal al LUCA. Se presupune că acest cod are o structură similară cu cea a codului genetic standard nuclear actual. Cea mai simplă variantă a codurilor existente este codul genetic mitocondrial al vertebratelor care, în principal din acest motiv, a fost propus ca model al predecesorului codului universal LUCA: codul timpuriu (a doua piatră de hotar din dreapta în figura 4). Principala noutate evolutivă implicată de tranziția de la codul timpuriu la codul universal este apariția modificărilor post-transcripționale în ARNt. Acest lucru este susținut de faptul că, în unele mitocondrii de metazoare existente, un U nemodificat la prima poziție a anticodonului se poate împerechea cu toate bazele de la poziția a treia a codonului . Acest lucru permite decodificarea familiilor de codoni fără a fi nevoie de nucleotide modificate (o familie este un grup de patru codoni care împart primele două baze și care codifică același aminoacid). În propunerea lui Watanabe & Yokobori , codul timpuriu este derivat dintr-un cod primitiv cu mai puțini aminoacizi, mai degenerat, adică codul lui Jukes . Se presupune că un astfel de cod este format numai din familii, cu excepția unui aminoacid și a semnalului de oprire, care au degenerescența doi, adică sunt codificați de doi codoni.
Reprezentare a evoluției codului genetic, adaptată după . Fiecare cerc sau pătrat reprezintă o etapă importantă. Linia de jos arată evoluția lungimii codonilor implicată de teoria noastră.
Acum, principala noastră afirmație este că codul teslar reprezintă un strămoș al codului timpuriu, și anume, un cod pre-timpuriu, plasat între codul primitiv și cel timpuriu. Există mai multe argumente care susțin codul tessera ca fiind un cod preîntâi (piatra de hotar pătrată din figura 4). În primul rând, acesta are exact aceeași structură de degenerare ca și codul genetic timpuriu. Mai mult, codul tessera este în concordanță cu ipoteza lui Baranov et al. care propune o origine a codului cu oligonucleotide lungi, urmată de o diminuare a lungimii codonilor până când s-a ajuns la numărul optim de 3. Presupunând că codul primitiv are codoni de lungime 4 implică faptul că și codul primitiv are codoni de lungime de cel puțin 4. Într-adevăr, arătăm că codul genetic primitiv al lui Jukes poate fi implementat cu codoni generici de lungime 4. În următoarea descriere, folosim termenul de codon pentru a ne referi la codoni de lungime 4 sau tetracodoni. Codul lui Jukes are 15 aminoacizi cu degenerescența 4, un aminoacid cu degenerescența 2 și doi codoni de oprire. În total, există 15 elemente cu degenerescența 4 și 2 elemente cu degenerescența 2. Dacă presupunem că acest cod își are originea în codoni de 4 nucleotide, atunci acest lucru implică alegerea a 17 elemente/aminoacizi care pot fi codificați fie prin doi, fie prin patru codoni luați din setul de 44 = 256 de codoni. Rețineți că setul de 256 de codoni poate fi împărțit într-un subset de 32 de codoni care posedă anumite simetrii (acestea corespund primelor două coloane ale codului de teslă din tabelul 1) și un subset de 224 de codoni fără simetrie. După cum s-a arătat mai sus, codonii simetrici corespund aminoacizilor cu degenerescența 2, în timp ce codonii asimetrici corespund aminoacizilor cu degenerescența 4. Acum, dacă presupunem un mecanism aleatoriu de atribuire a codonilor la aminoacizi, distribuția de degenerare care are cea mai mare probabilitate corespunde exact cu cea a codului lui Jukes. Am arătat acest lucru în materialul electronic suplimentar B. Jukes presupune că unul dintre elementele de degenerare 2 este asociat cu semnalul de oprire. Cu această alegere, codonii stop sunt mai puțin predispuși să fie generați de erori aleatorii, adică aceste elemente sunt mai puțin ambigue decât cele cu degenerescența 4. De asemenea, este firesc să emitem ipoteza că celălalt element cu degenerescența 2 corespunde aminoacidului care codifică semnalul de start.
Am arătat că codul primitiv (versiunea lui Jukes) este descris în mod natural cu ajutorul codonilor de lungime 4. Acum, descriem o posibilă cale evolutivă de la codul lui Jukes la codul teslar. În abordarea noastră, codul primitiv este compus din două perechi de codoni simetrici și 60 de codoni nesimetrici. Rețineți că selectarea codonilor simetrici, datorită propensiunii lor diminuate la erori de mutații punctiforme, reprezintă un prim pas pentru selectarea jumătății simetrice a setului de tessere. Să presupunem că apare un nou adaptor care posedă un anticodon simetric și concurează (poartă același aminoacid) cu un adaptor existent care are un anticodon asimetric. Noul adaptor se poate lega la codonii simetrici care fac parte din setul de tessere (primele două coloane din tabelul 1). Un astfel de adaptor are un avantaj evolutiv față de cel care poartă un anticodon nesimetric, deoarece are două configurații spațiale diferite care pot fi folosite pentru legarea cu codonul. De exemplu, adaptorul din figura 2 poartă anticodonul palindromic AUUA. Dacă adaptorul este inversat, acesta se poate lega în continuare de codonul/tessera UAAU. Această presiune selectivă determină capturarea tuturor codonilor simetrici (tetracodoni)/tesserelor în detrimentul codonilor nesimetrici. La finalul acestui proces, avem un cod compus din 32 de tezeri simetrici și 32 de tetracodoni nesimetrici care nu aparțin neapărat setului de tezeri. În acest punct, se ajunge la o altă etapă de optimizare prin selectarea tesferelor nesimetrice: după cum se arată în , tesferele sunt imune la mutațiile punctuale4 și, astfel, supraviețuiesc tetracodonilor ne-testerici datorită presiunii evolutive a preciziei de decodare. Cele 32 de tessere simetrice sunt imune la mutațiile punctuale (sunt necesare două mutații punctuale simultane, extrem de improbabile, pentru a produce o tranziție între două tessere). Acest lucru înseamnă că ARNt corespunzătoare nu conduc la încorporarea unui aminoacid necunoscut dacă sunt supuse unei mutații punctuale. Această proprietate de detectare a erorilor implică un avantaj evolutiv în ceea ce privește precizia sintezei proteinelor. Restul de 32 de tetracodoni nesimetrici nesimetrici nu sunt neapărat tezari, dar cei care sunt tezari au proprietatea de imunitate la erori, astfel încât vor fi selectați treptat din motivele de mai sus. Prin urmare, obținem structura completă a codului pre-timpuriu tessera a cărui distribuție a degenerării coincide cu cea a codului timpuriu (și cu cea a codului mitocondrial existent la vertebrate).
Am arătat că tranziția dintre codul lui Jukes și codul tessera este cea mai probabilă în condițiile unor ipoteze minime. În mod clar, în această tranziție, recunoașterea tessera devine mai specifică decât recunoașterea tetracodonului din codul lui Jukes. Într-adevăr, proprietatea de detectare a erorilor din codul tessera permite reducerea ambiguității legate de încărcarea cu aminoacizi a adaptorilor tetracodonici. La rândul său, precizia crescută a recunoașterii tessera permite rafinarea alegerii aminoacizilor datorită presiunii evolutive a performanței proteice.
Ipoteza noastră privind codul tessera ca fiind un cod pre-timpuriu implică și o altă tranziție evolutivă majoră, și anume tranziția dintre codul tessera și codul timpuriu. Deoarece codul timpuriu se presupune că are codoni de lungime trei, problema majoră implicată de această tranziție este legată de schimbarea lungimii codonilor, care este în general considerată dăunătoare . Rețineți că (i) orice teorie privind originea codului cu o lungime a codonilor diferită de trei trebuie să se confrunte cu această problemă și (ii) o astfel de tranziție este dăunătoare atunci când se atinge un nivel evolutiv în care codul a înghețat, deoarece aceasta implică o schimbare dramatică a secvenței de aminoacizi a tuturor proteinelor unui organism; cu toate acestea, acest lucru nu este neapărat cazul în etapele evolutive anterioare mai apropiate de originea codului. Codul teslar permite găsirea unei soluții clare la problema tranziției de la tetracodoni la codoni. De fapt, informațiile purtate de setul de tessere sunt redundante. Prin definiție, dacă se cunosc trei din cele patru litere ale unei tessere, atunci litera lipsă poate fi derivată univoc. Prin urmare, din punctul de vedere al teoriei codificării, codul tesla și orice cod genetic trinucleotidic poartă același conținut informațional. Acest lucru implică faptul că se poate stabili o corespondență unu la unu între tesserae și codoni. Structura esențială a unei astfel de corespondențe implică faptul că transformările dintre literele adiacente ale unei tessere devin nucleotidele unui codon. În special, dată fiind o tessera b1b2b3b4, putem avea trei transformări chimice între literele adiacente: t12 = f(b1b2) între b1 și b2, t23 = f(b2b3) între b2 și b3 și t34 = f(b3b4) între b3 și b4. Observați că numai două dintre aceste trei transformări sunt independente, deoarece t34 = t12. În tabelul 4a, am rearanjat codul tezaurului în funcție de transformarea t12 (rânduri) și t23 (coloane). Propunem ca t12 și t23 să fie mapate pe primul și, respectiv, al doilea nucleotid al codonului (x1, x2). Această corespondență este prezentată în tabelul 3. În plus, a patra literă b4 este mapată pe a treia nucleotidă a codonului x3. O reprezentare schematică a cartografierii este prezentată în figura 5. Rețineți că, în conformitate cu această cartografiere, coloanele setului de tezaure sunt cartografiate pe coloanele codului genetic, astfel încât t23 = I este cartografiat pe codoni NAN (degenerare non-4), iar t23 = KM este cartografiat pe codoni NCN (compuși numai din familii); comparați tabelul tabel44b cu tabelul 4c. Putem observa că aceste două coloane ale codului tezaur împărtășesc aceeași degenerescență cu coloanele corespunzătoare ale codului genetic (fie 4, fie 2 + 2). Completarea naturală a corespondenței atribuie t23 = SW la codoni NUN și t23 = YR la codoni NGN. Ultimele două atribuiri trebuie să țină cont de unele excepții determinate de faptul că în trecerea de la tesle la codoni simetria lui Rumer este într-adevăr păstrată, dar simetria autocomplementară nu poate fi păstrată. Interacțiunea tessera-antitessera este mai specifică decât cea codon-anticodon, datorită prezenței a patru legături chimice de tip Watson-Crick. Cu toate acestea, în cazul codului genetic existent, degenerarea este determinată în principal de interacțiunea codon-anticodon a primelor două baze. Prin urmare, presupunând că energia de legare în perioada anterioară codului este comparabilă cu cea Watson-Crick, energia de interacțiune tessera-antitessera ar trebui să fie aproximativ dublă față de energia reală codon-anticodon.
Reprezentarea schematică a corespondenței dintre tessere (b1b2b3b4) pe codon (x1x2x3).
Tabelul 3.
Structura de bază a corespondenței dintre tessere și codoni. Cele patru transformări între bazele unei tessere sunt mapate pe cele patru nucleotide ale unui codon.
transformările teseriei t12,t23 | baze de codon x1, x2 | |||
---|---|---|---|---|
I | ⟶12345 | A | ||
SW | ⟶12345 | U | ||
KM | ⟶12345 | C | ||
YR | ⟶12345 | YR | ⟶12345 | G |
Tabela 4.
(a) Codul de tessere organizat în funcție de transformările: prima a doua literă t12 (rânduri) și a doua a treia literă t23 (coloane); (b) la fel ca (a), dar cu cvartetele schimbate, așa cum sunt indicate de săgeți. (c) Degenerarea codului genetic mitocondrial al vertebratelor. Codonii codului mitocondrial al vertebratelor din (c) și tesserele (b) sunt legați între ei prin cartografierea unu-la-unu descrisă în text. În interiorul cvartetelor, tesserele cu aceeași culoare codifică același aminoacid: roz și verde = 2 + 2 și alb = 4.
Atunci, din punct de vedere biochimic, tranziția de la tessere la codoni implică tranziția de la o împerechere specifică Watson-Crick cu o lungime completă de patru baze, de tipul Watson-Crick, pentru citirea tesserelor, la strategia wobble pentru citirea codonilor.
În special, acest lucru implică constrângeri teoretice asupra unor proprietăți de simetrie care sunt prezente în lumea tesserelor, dar nu sunt în codurile existente, de exemplu, pierderea simetriei autocomplementare. Într-adevăr, fiecare coloană a codului teseriei are o degenerare definită, dar în codurile existente acest lucru este valabil numai pentru două coloane, adică pentru codonii de tipul NMN (NAN sau NCN). În schimb, coloanele corespunzătoare codonilor NKN (NUN sau NGN) au o degenerescență mixtă; în special, cadranele care diferă între cele două coduri sunt cele de tipul SUN și WGN (pe care le numim WSN sau SWN mixte, spre deosebire de SSN WWN, care nu este mixt). Cu alte cuvinte, codurile existente au codoni de tipul WGN care codifică aminoacizi cu degenerescență 2, în ciuda faptului că baza centrală este puternică, și codoni de tipul SUN care codifică aminoacizi cu degenerescență 4, în ciuda faptului că baza centrală este slabă .
O explicație a acestor caracteristici în termeni de constrângeri energetice care depind de stereochimia interacțiunii codon-anticodon este propusă în . În codul genetic existent, o interacțiune slabă este în mod normal asociată cu o degenerescență 2 + 2. Într-adevăr, acesta este cazul codonilor de tipul NAN, AUN și UUN. Cu toate acestea, în cazul unui U ca a doua literă, o stabilizare suplimentară a literei centrale purinice N35 în bucla anticodonică a ARNt de către U33 permite citirea unei familii complete, în ciuda caracterului slab al lui N35.5 În cazul în oglindă, pentru codonii de tipul AGN și UGN, nucleotidul N35 nu este suficient de stabilizat de către U33, iar cvartetul asociat devine degenerativ 2 + 2.
Aceste restricții ale strategiei de wobble implică faptul că în cartografierea de la tesle la codoni, cadranul (YR-SW) este schimbat cu cadranul (SW-YR) și cadranul (KM-SW) cu cadranul (I-YR); vezi tabelul 4 (panourile superioare). În cele din urmă, cea de-a patra literă a unei tezere este pusă în corespondență cu cea de-a treia literă a unui codon, cu următoarea excepție care asigură o grupare corectă: dacă b4 = K (T sau G), atunci x3 = KM(b4), adică T și G sunt schimbate; în caz contrar, x3 = b4. Observați că această corespondență nu este neapărat unică; cu toate acestea, din câte știm noi, cel de față arată că este posibilă trecerea de la codul teslar la codul existent prin descrierea tuturor caracteristicilor de degenerare cunoscute ale acestuia din urmă.
Dacă, inițial, codificarea proteinelor a implicat codoni mai lungi de trei baze, atunci mașinăria de traducere ar trebui să poarte o oarecare memorie a acestui lucru. Într-adevăr, subunitatea mică a ribozomilor actuali prezintă o libertate structurală care ar putea permite includerea unei nucleotide suplimentare în centrul de decodare, astfel încât decodarea codonilor cu patru baze să fie fezabilă. Rețineți că posibilitatea codificării ancestrale cu cvadrupleți a fost menționată în . Într-adevăr, decodificarea cu cvadrupleți a fost descoperită în 1973 ca un mecanism legat de suprimarea framehift și, în prezent, este utilizată pe scară largă în aplicațiile biotehnologice pentru a încorpora aminoacizi necanonici în proteine . Mai mult, fezabilitatea biologică a codonilor cu patru lungimi și a unui ribozom ortogonal care îi decodifică a fost demonstrată în laborator . De asemenea, există dovezi care indică existența unor gene suprapuse codificate de tetracodoni ; în plus, s-a demonstrat că tetracodonii joacă un rol important în analiza filogenetică, (de ex. ) și acest lucru poate fi un indiciu al unei memorii genetice.
Un număr impresionant de proprietăți ale codului teslar este păstrat în codurile actuale. Codul timpuriu și toți descendenții săi moștenesc de la codul tessera numărul de codoni (64 de tessere generează 64 de codoni) și numărul maxim de aminoacizi (23). Codul tessera permite codificarea a 24 de elemente/aminoacizi. Deoarece cel puțin unul dintre acestea trebuie să reprezinte un semnal de oprire, numărul maxim teoretic de aminoacizi reprezentabili este de 23. În mod remarcabil, niciun cod existent nu depășește această limită, iar numărul maxim de aminoacizi care sunt codificați direct de unele genomuri este exact 23: cei 20 de aminoacizi standard plus 2 non-standard (selenocisteină și pirrolizină) și aminoacidul de inițiere alternativă N-formilmetionină însumează 23. Mai mult, numărul de adaptoare utilizate în codul genetic mitocondrial al vertebratelor este de 22: opt ARNt care recunosc câte patru codoni fiecare, 14 ARNt care recunosc câte doi codoni fiecare și două perechi de codoni neasociați cu aminoacizi . În mod remarcabil, 22 este minimul absolut observat printre toate versiunile cunoscute ale codului genetic. De asemenea, aceasta este exact structura implicată de modelul tesla: opt adaptoare primare de degenerescență 4, plus 16 adaptoare de degenerescență 2 formează un set de 24 de adaptoare; dacă eliminăm două adaptoare de degenerescență 2 atribuite codonilor de oprire, obținem exact 22.
Codul genetic mitocondrial al vertebratelor și modelul nostru bazat pe tesla de cod timpuriu au, de asemenea, în comun o serie de caracteristici legate de simetrie (de exemplu, tabelul 5). În primul rând, transformarea KM, cunoscută și sub numele de transformarea lui Rumer, aplicată primului dublet al unui codon modifică degenerarea aminoacidului corespunzător. Această proprietate universală este observată în majoritatea versiunilor cunoscute ale codului genetic (atât nuclear, cât și mitocondrial). Codul teslar posedă, de asemenea, această proprietate. De exemplu, tessera AUUA corespunde unui aminoacid de degenerescență 2, iar dacă aplicăm transformarea KM primelor două nucleotide obținem tessera CGUA care corespunde unui aminoacid de degenerescență 4. Rețineți că această proprietate este valabilă, de asemenea, dacă aplicăm transformarea lui Rumer la t12t23 din cartografierea care leagă testeriile și codonii descriși mai sus. Pentru mai multe informații, a se vedea .
Tabelul 5.
Tabel comparativ între codul genetic mitocondrial al vertebratelor și codul tezaurului.
codul genetic mitocondrial al vertebratelor | codul tezaur | |||||||
---|---|---|---|---|---|---|---|---|
deg. | numărul de codoni | deg. | numărul de codoni | deg. | numărul de codoni | deg. tessere | ||
degenerare | 2 | 16 | 2 | 2 | 2 | 16 | ||
4 | 8 | 4 | 4 | 8 | ||||
numărul de codoni | codoni 64 | tesseri 64 | ||||||
numărul de adaptoare | adaptoare 22 | adaptoare 22 | ||||||
numărul de aminoacizi | a.a. 20 | a.a. 20 | ||||||
simetrii | ||||||||
Rumer | transformarea KM pe primele două baze modifică degenerarea a.a. | Transformarea KM pe primele două baze modifică degenerarea a.a. | ||||||
Grupul Klein V | cei 16 codoni care împart transformarea între prima și a doua literă au aceeași distribuție de degenerare | cele 16 tezaure care împart transformarea între prima și a doua literă au aceeași distribuție de degenerare |
Un alt aspect fundamental al codului teslarilor este faptul că codificarea unei proteine poate fi făcută robustă la schimbările de cadru +1. Robustețea menținerii cadrelor poate fi legată și de codurile circulare despre care s-a emis ipoteza că joacă un rol în procesele de sincronizare a cadrelor . Existența unei proprietăți universale a codului circular a fost legată de originea codului genetic ca perechi de codoni complementari care codifică fie același aminoacid, fie un aminoacid similar . Aceeași conjectură este susținută și în alte contexte . Această proprietate apare în mod natural în codul teslar, unde un teslar și complementul său invers codifică întotdeauna pentru același aminoacid.