PMC

3. Implicazioni evolutive

Al meglio delle nostre conoscenze, il codice a tessere rappresenta una prima spiegazione quantitativa dell’origine della degenerazione nei codici ancestrali. Come tale, potrebbe essere rilevante per spiegare l’evoluzione del codice genetico. Nella seconda parte di questo articolo, analizziamo le possibili implicazioni evolutive del codice a tessere. A questo scopo, ricordiamo l’ipotesi evolutiva presentata da Watanabe & Yokobori che si basa sull’analisi della traduzione nei mitocondri esistenti (vedi figura 4 adattata da ). La figura 4 presenta delle pietre miliari sulle quali c’è un certo accordo e che rappresentano i passi evolutivi da un codice genetico primitivo alle varianti attuali. Partendo dalle varianti esistenti e andando indietro nel tempo troviamo la prima pietra miliare, cioè il codice genetico universale di LUCA. Si ipotizza che questo codice abbia una struttura simile a quella dell’attuale codice genetico standard nucleare. La variante più semplice dei codici esistenti è il codice genetico mitocondriale dei vertebrati che, soprattutto per questo motivo, è stato proposto come modello del predecessore del codice universale LUCA: il codice primitivo (la seconda pietra miliare da destra nella figura 4). La principale novità evolutiva implicata dal passaggio dal codice precoce al codice universale è la comparsa di modifiche post-trascrizionali nei tRNA. Questo è supportato dal fatto che, in alcuni mitocondri Metazoi esistenti, una U non modificata nella prima posizione dell’anticodone può accoppiarsi con tutte le basi nella terza posizione del codone. Questo permette di decodificare famiglie di codoni senza bisogno di nucleotidi modificati (una famiglia è un gruppo di quattro codoni che condividono le prime due basi e codificano per lo stesso amminoacido). Nella proposta di Watanabe & Yokobori , il codice primitivo deriva da un codice primitivo con meno amminoacidi, più degenerato, cioè il codice di Jukes . Si suppone che tale codice sia formato solo da famiglie ad eccezione di un amminoacido e del segnale di stop che hanno degenerazione due, cioè sono codificati da due codoni.

Rappresentazione dell’evoluzione del codice genetico, adattata da . Ogni cerchio o quadrato rappresenta una pietra miliare. La linea inferiore mostra l’evoluzione della lunghezza del codone implicita nella nostra teoria.

Ora, la nostra affermazione principale è che il codice a tessera rappresenta un antenato del codice primitivo, cioè un codice pre-precoce, posto tra il codice primitivo e il codice precoce. Ci sono diversi argomenti che supportano il codice a tessere come codice precoce (la pietra miliare quadrata in figura 4). Innanzitutto, ha esattamente la stessa struttura di degenerazione del codice genetico primitivo. Inoltre, il codice tessera è in accordo con l’ipotesi di Baranov et al. , che propone un’origine del codice con lunghi oligonucleotidi, seguita da una diminuzione della lunghezza dei codoni fino al raggiungimento del numero ottimale di 3. Supponendo che il codice precoce abbia codoni di lunghezza 4 implica che anche il codice primitivo abbia codoni di lunghezza almeno 4. Infatti, mostriamo che il codice genetico primitivo di Jukes può essere implementato con codoni generici di lunghezza 4. Nella seguente descrizione, usiamo il termine codone per indicare codoni di lunghezza quattro o tetracodoni. Il codice di Jukes ha 15 aminoacidi con degenerazione 4, un aminoacido con degenerazione 2 e due codoni di stop. Complessivamente, ci sono 15 elementi con degenerazione 4 e 2 elementi con degenerazione 2. Se assumiamo che questo codice abbia avuto origine da codoni di 4 nucleotidi, allora questo implica la scelta di 17 elementi/amminoacidi che possono essere codificati da due o quattro codoni presi dall’insieme di 44 = 256 codoni. Si noti che l’insieme di 256 codoni può essere suddiviso in un sottoinsieme di 32 codoni che possiedono alcune simmetrie (questi corrispondono alle prime due colonne del codice a tessere della tabella 1) e un sottoinsieme di 224 codoni senza simmetria. Come mostrato sopra, i codoni simmetrici corrispondono agli aminoacidi con degenerazione 2, mentre i codoni asimmetrici corrispondono agli aminoacidi con degenerazione 4. Ora, se assumiamo un meccanismo casuale per l’assegnazione dei codoni agli aminoacidi, la distribuzione di degenerazione che ha la massima probabilità corrisponde esattamente a quella del codice di Jukes. Lo abbiamo dimostrato nel materiale supplementare elettronico B. Jukes assume che uno degli elementi della degenerazione 2 sia associato al segnale di stop. Con questa scelta, i codoni di stop sono meno inclini ad essere generati da errori casuali, cioè questi elementi sono meno ambigui di quelli con degenerazione 4. Allo stesso modo, è naturale ipotizzare che l’altro elemento con degenerazione 2 corrisponda all’aminoacido che codifica per il segnale di inizio.

Abbiamo mostrato che il codice primitivo (versione di Jukes) è naturalmente descritto con codoni di lunghezza 4. Ora, descriviamo un possibile percorso evolutivo dal codice di Jukes al codice a tessera. Nel nostro approccio, il codice primitivo è composto da due coppie di codoni simmetrici e 60 codoni non simmetrici. Si noti che la selezione dei codoni simmetrici, a causa della loro minore propensione all’errore delle mutazioni puntiformi, rappresenta un primo passo per la selezione della metà simmetrica dell’insieme delle tessere. Supponiamo che un nuovo adattatore che possiede un anticodone simmetrico appaia e competa (porta lo stesso amminoacido) con un adattatore esistente che ha un anticodone asimmetrico. Il nuovo adattatore può legarsi ai codoni simmetrici che fanno parte dell’insieme delle tessere (prime due colonne della tabella 1). Tale adattatore ha un vantaggio evolutivo rispetto a quello che porta un anticodone non simmetrico, perché ha due diverse configurazioni spaziali che possono essere usate per legarsi al codone. Per esempio, l’adattatore in figura 2 porta l’anticodone palindromo AUUA. Se l’adattatore è invertito, può ancora legarsi al codone/tessera UAAU. Questa pressione selettiva provoca la cattura di tutti i codoni simmetrici (tetracodoni)/tessera a spese dei codoni non simmetrici. Alla fine di questo processo, abbiamo un codice composto da 32 tessere simmetriche, e 32 tetracodoni non simmetrici che non appartengono necessariamente all’insieme delle tessere. A questo punto, un ulteriore passo di ottimizzazione viene raggiunto selezionando le tessere non simmetriche: come mostrato in , le tessere sono immuni alle mutazioni puntiformi4 e, quindi, sopravvivono ai tetracodoni non-tessera a causa della pressione evolutiva della precisione di decodifica. Le 32 tessere simmetriche sono immuni alle mutazioni puntiformi (sono necessarie due mutazioni puntiformi simultanee, altamente improbabili, per produrre una transizione tra due tessere). Ciò significa che i tRNA corrispondenti non portano all’incorporazione di un amminoacido non riconosciuto se sono sottoposti a una mutazione puntiforme. Questa proprietà di rilevamento degli errori implica un vantaggio evolutivo in termini di precisione della sintesi proteica. I restanti 32 tetracodoni non simmetrici non sono necessariamente tessere, ma quelli che sono tessere hanno la proprietà di immunità all’errore in modo che saranno gradualmente selezionati per le ragioni di cui sopra. Quindi, otteniamo la struttura completa del codice precoce della tessera la cui distribuzione di degenerazione coincide con quella del codice precoce (e con quella del codice mitocondriale dei vertebrati estanti).

Abbiamo dimostrato che la transizione tra il codice di Jukes e il codice della tessera è la più probabile sotto ipotesi minime. Chiaramente, in questa transizione, il riconoscimento della tessera diventa più specifico del riconoscimento del tetracodone del codice di Jukes. Infatti, la proprietà di rilevamento degli errori del codice a tessere permette di ridurre l’ambiguità legata al caricamento degli amminoacidi degli adattatori tetracodonici. A sua volta, la maggiore precisione nel riconoscimento delle tessere permette di affinare la scelta degli amminoacidi a causa della pressione evolutiva delle prestazioni delle proteine.

La nostra ipotesi del codice a tessere come codice pre-precoce implica anche un’altra importante transizione evolutiva, cioè la transizione tra il codice a tessere e il codice precoce. Poiché si suppone che il codice precoce abbia codoni di lunghezza tre, il problema principale implicato da questa transizione è legato al cambiamento di lunghezza del codone che è generalmente considerato deleterio. Si noti che (i) qualsiasi teoria sull’origine del codice con codoni di lunghezza diversa da tre deve affrontare questo problema e (ii) tale transizione è deleteria quando si raggiunge un livello evolutivo in cui il codice si è congelato poiché ciò implica un cambiamento drammatico nella sequenza degli amminoacidi di tutte le proteine di un organismo; tuttavia, questo non è necessariamente il caso nei passi evolutivi precedenti più vicini all’origine del codice. Il codice a tessere permette di trovare una soluzione ordinata al problema del passaggio dai tetracodoni ai codoni. Infatti, l’informazione trasportata dall’insieme di tessere è ridondante. Per definizione, se tre delle quattro lettere di una tessera sono note, la lettera mancante può essere derivata in modo univoco. Quindi, dal punto di vista della teoria della codifica, il codice delle tessere e qualsiasi codice genetico trinucleotidico hanno lo stesso contenuto informativo. Ciò implica che si può stabilire una mappatura uno-a-uno tra tessere e codoni. La struttura essenziale di tale mappatura implica che le trasformazioni tra lettere adiacenti di una tessera diventano i nucleotidi di un codone. In particolare, data una tessera b1b2b3b4 possiamo avere tre trasformazioni chimiche tra lettere adiacenti: t12 = f(b1b2) tra b1 e b2, t23 = f(b2b3) tra b2 e b3, e t34 = f(b3b4) tra b3 e b4. Si noti che solo due di queste tre trasformazioni sono indipendenti poiché t34 = t12. Nella tabella 4a, abbiamo riorganizzato il codice delle tessere secondo le trasformazioni t12 (righe) e t23 (colonne). Proponiamo che t12 e t23 siano mappati sul primo e sul secondo nucleotide del codone, rispettivamente (x1, x2). Questa corrispondenza è mostrata nella tabella 3. Inoltre, la quarta lettera b4 è mappata sul terzo nucleotide del codone x3. Una rappresentazione schematica della mappatura è presentata nella figura 5. Si noti che, secondo questa mappatura, le colonne dell’insieme delle tessere sono mappate sulle colonne del codice genetico in modo che t23 = I è mappato sui codoni NAN (degenerazione non-4), e t23 = KM è mappato sui codoni NCN (composti solo da famiglie); confrontare la tabella44b con la tabella 4c. Possiamo osservare che queste due colonne del codice a tessere condividono la stessa degenerazione con le colonne corrispondenti del codice genetico (o 4 o 2 + 2). Il completamento naturale della mappatura assegna t23 = SW ai codoni NUN e t23 = YR ai codoni NGN. Queste ultime due assegnazioni devono rendere conto di alcune eccezioni determinate dal fatto che nel passaggio da tessere a codoni la simmetria di Rumer è effettivamente conservata, ma la simmetria autocomplementare no. L’interazione tessera-antitessera è più specifica di quella codone-anticodone, per la presenza di quattro legami chimici di tipo Watson-Crick. Tuttavia, nel caso del codice genetico esistente, la degenerazione è determinata principalmente dall’interazione codone-anticodone delle prime due basi. Quindi, assumendo che l’energia di legame nei tempi pre-codici sia paragonabile a quella di Watson-Crick, l’energia di interazione tessera-antitessera dovrebbe essere circa il doppio dell’energia reale codone-anticodone.

Rappresentazione schematica della mappatura tra la tessera (b1b2b3b4) sul codone (x1x2x3).

Tabella 3.

Struttura di base della mappatura tra tessere e codoni. Le quattro trasformazioni tra le basi di una tessera sono mappate sui quattro nucleotidi di un codone.

trasformazioni delle tessere t12,t23 basi del codone x1, x2
I ⟶12345 A
SW ⟶12345 U
KM ⟶12345 C
YR ⟶12345 G

Tabella 4.

(a) Il codice delle tessere organizzato secondo le trasformazioni: prima-seconda lettera t12 (righe) e seconda-terza lettera t23 (colonne); (b) lo stesso di (a) ma con i quartetti scambiati come indicato dalle frecce. (c) Degenerazione del codice genetico mitocondriale dei vertebrati. I codoni del codice mitocondriale dei vertebrati in (c) e le tessere (b) sono correlati attraverso la mappatura uno-a-uno descritta nel testo. All’interno dei quartetti, le tessere con lo stesso colore codificano per lo stesso amminoacido: rosa e verde = 2 + 2 e bianco = 4.

Quindi, da un punto di vista biochimico, il passaggio dalle tessere ai codoni implica il passaggio da un accoppiamento completo di quattro basi specifico tipo Watson-Crick per leggere le tessere alla strategia wobble per leggere i codoni.

In particolare, questo implica vincoli teorici su alcune proprietà di simmetria che sono presenti nel mondo delle tessere ma non lo sono nei codici esistenti, per esempio, la perdita della simmetria autocomplementare. Infatti, ogni colonna del codice della tessera ha una degenerazione definita, ma nei codici esistenti questo è vero solo per due colonne, cioè per i codoni del tipo NMN (NAN o NCN). Invece, le colonne corrispondenti ai codoni NKN (NUN o NGN) hanno degenerazione mista; in particolare, i quadranti che differiscono tra i due codici sono quelli del tipo SUN e WGN (chiamiamo WSN o SWN misto in contrapposizione al SSN WWN non misto). In altre parole, i codici esistenti hanno codoni del tipo WGN che codificano amminoacidi con degenerazione 2 nonostante il fatto che la base centrale sia forte, e codoni del tipo SUN che codificano amminoacidi con degenerazione 4, nonostante il fatto che la base centrale sia debole.

Una spiegazione di tali caratteristiche in termini di vincoli energetici dipendenti dalla stereochimica dell’interazione codone-anticodone è proposta in . Nel codice genetico esistente, un’interazione debole è normalmente associata a una degenerazione 2 + 2. Infatti, questo è il caso dei codoni del tipo NAN, AUN e UUN. Tuttavia, nel caso di una U come seconda lettera, un’ulteriore stabilizzazione della lettera centrale purinica N35 nell’ansa anticodone del tRNA da parte di U33 permette di leggere una famiglia completa nonostante il carattere debole di N35.5 Nel caso speculare, per i codoni del tipo AGN e UGN il nucleotide N35 non è sufficientemente stabilizzato da U33 e il quartetto associato diventa di degenerazione 2 + 2.

Queste restrizioni della strategia di oscillazione implicano che nella mappatura dalle tessere ai codoni il quadrante (YR-SW) è scambiato con il quadrante (SW-YR) e il quadrante (KM-SW) con il quadrante (I-YR); vedi tabella 4 (pannelli superiori). Alla fine, la quarta lettera di una tessera è mappata sulla terza lettera di un codone con la seguente eccezione che assicura un raggruppamento corretto: se b4 = K (T o G) allora x3 = KM(b4), cioè T e G sono scambiati; altrimenti x3 = b4. Si osservi che la mappatura non è necessariamente unica; Tuttavia, al meglio delle nostre conoscenze, il presente dimostra che è possibile passare dal codice a tessere al codice extant descrivendo tutte le caratteristiche di degenerazione conosciute di quest’ultimo.

Se, in origine, la codifica delle proteine coinvolgeva codoni più lunghi di tre basi, allora il macchinario di traduzione dovrebbe portarne una certa memoria. In effetti, la piccola subunità dei ribosomi esistenti presenta una libertà strutturale che potrebbe consentire l’inclusione di un nucleotide aggiuntivo nel centro di decodifica in modo che la decodifica di codoni a quattro basi sia fattibile. Si noti che la possibilità di codifica ancestrale con quadruplette era stata menzionata in . Infatti, la decodifica di quadruplette è stata scoperta nel 1973 come un meccanismo legato alla soppressione del frameshift e, al giorno d’oggi, è ampiamente utilizzata nelle applicazioni biotecnologiche per incorporare aminoacidi non canonici nelle proteine. Inoltre, è stata dimostrata in laboratorio la fattibilità biologica di codoni di lunghezza quattro e di un ribosoma ortogonale che li decodifica. Inoltre, ci sono prove che indicano l’esistenza di geni sovrapposti codificati da tetracodoni; inoltre, è stato dimostrato che i tetracodoni giocano un ruolo importante nell’analisi filogenetica, (ad esempio) e questo può essere un’indicazione di una memoria genetica.

Un numero impressionante di proprietà del codice a tessera è conservato nei codici attuali. Il primo codice e tutti i suoi discendenti ereditano dal codice a tessera il numero di codoni (64 tessere generano 64 codoni) e il numero massimo di amminoacidi (23). Il codice a tessere permette di codificare 24 elementi/amminoacidi. Poiché almeno uno di questi deve rappresentare un segnale di stop, il numero massimo teorico di amminoacidi rappresentabili è 23. È sorprendente che nessun codice esistente superi questo limite e che il numero massimo di amminoacidi codificati direttamente da alcuni genomi sia esattamente 23: i 20 amminoacidi standard più 2 non standard (selenocisteina e pirrolisina) e l’amminoacido di iniziazione alternativa N-formilmetionina sommano a 23. Inoltre, il numero di adattatori utilizzati nel codice genetico mitocondriale dei vertebrati è 22: otto tRNA che riconoscono quattro codoni ciascuno, 14 tRNA che riconoscono due codoni ciascuno, e due coppie di codoni non associati ad amminoacidi. È interessante notare che 22 è il minimo assoluto osservato tra tutte le versioni conosciute del codice genetico. Inoltre, questa è esattamente la struttura implicata dal modello a tessere: otto adattatori primordiali di degenerazione 4, più 16 adattatori di degenerazione 2 formano un insieme di 24 adattatori; se scartiamo due adattatori di degenerazione 2 assegnati ai codoni di stop otteniamo esattamente 22.

Il codice genetico mitocondriale dei vertebrati e il nostro modello a tessere del codice primordiale condividono anche una serie di caratteristiche relative alla simmetria (per esempio la tabella 5). Innanzitutto, la trasformazione KM, nota anche come trasformazione di Rumer, applicata alla prima doppietta di un codone cambia la degenerazione dell’amminoacido corrispondente. Questa proprietà universale si osserva nella maggior parte delle versioni conosciute del codice genetico (sia nucleare che mitocondriale). Anche il codice a tessere possiede questa proprietà. Per esempio, la tessera AUUA corrisponde a un amminoacido di degenerazione 2, e se applichiamo la trasformazione KM ai primi due nucleotidi otteniamo la tessera CGUA che corrisponde a un amminoacido di degenerazione 4. Si noti che questa proprietà vale anche se applichiamo la trasformazione di Rumer alle t12t23 della mappatura che collega tessere e codoni descritta sopra. Per ulteriori approfondimenti, vedi .

Tabella 5.

Tabella comparativa tra il codice genetico mitocondriale dei vertebrati e quello delle tessere.

codice genetico mitocondriale dei vertebrati codice tessera
deg. no. codoni deg. no. tessere
degenerazione 2 16 2 16
4 8 4 8
numero di codoni codoni 64 tessera 64
numero di adattatori adattatori 22 adattatori 22
numero di aminoacidi a.a. 20 a.a. 20
simmetrie
Rumer la trasformazione KM sulle prime due basi cambia la degenerazione dell’a.a. La trasformazione KM sulle prime due basi cambia la degenerazione dell’a.a.
Gruppo Klein V i 16 codoni che condividono la trasformazione tra la prima e la seconda lettera hanno la stessa distribuzione di degenerazione le 16 tessere che condividono la trasformazione tra la prima e la seconda lettera hanno la stessa distribuzione di degenerazione

Un altro aspetto fondamentale del codice a tessere è che la codifica di una proteina può essere resa robusta a +1 frame shift. La robustezza del mantenimento del frame può essere anche collegata ai codici circolari che sono stati ipotizzati giocare un ruolo nei processi di sincronizzazione dei frame. L’esistenza di una proprietà universale del codice circolare è stata collegata all’origine del codice genetico come coppie di codoni complementari che codificano lo stesso o un simile amminoacido. La stessa congettura è sostenuta in altri contesti. Questa proprietà sorge naturalmente nel codice a tessere dove una tessera e il suo complemento inverso codificano sempre per lo stesso amminoacido.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato.