PMC

3. Evolutionäre Implikationen

Nach unserem besten Wissen stellt der Tessera-Code eine erste quantitative Erklärung für den Ursprung der Entartung in den Codes der Vorfahren dar. Als solche könnte sie für die Erklärung der Evolution des genetischen Codes von Bedeutung sein. Im zweiten Teil dieses Artikels analysieren wir die möglichen evolutionären Implikationen des Tessera-Codes. Zu diesem Zweck erinnern wir an die von Watanabe & Yokobori vorgestellte Evolutionshypothese, die auf der Analyse der Translation in lebenden Mitochondrien beruht (siehe Abbildung 4, übernommen von ). Abbildung 4 zeigt Meilensteine, über die eine gewisse Übereinstimmung besteht und die die evolutionären Schritte von einem primitiven genetischen Code zu den heutigen Varianten darstellen. Ausgehend von den heutigen Varianten und rückwärts in der Zeit finden wir den ersten Meilenstein, d. h. den universellen genetischen Code von LUCA. Es wird angenommen, dass dieser Code eine ähnliche Struktur wie der heutige genetische Standard-Kernkode hat. Die einfachste Variante der existierenden Codes ist der mitochondriale genetische Code der Wirbeltiere, der vor allem aus diesem Grund als Modell für den Vorgänger des universellen LUCA-Codes vorgeschlagen wurde: der frühe Code (der zweite Meilenstein von rechts in Abbildung 4). Die wichtigste evolutionäre Neuerung, die der Übergang vom frühen zum universellen Code mit sich bringt, ist das Auftreten von posttranskriptionellen Modifikationen in den tRNAs. Dies wird durch die Tatsache unterstützt, dass in einigen Metazoen-Mitochondrien ein unmodifiziertes U an der ersten Position des Anticodons mit allen Basen an der dritten Position des Codons paaren kann. Auf diese Weise können Codon-Familien ohne modifizierte Nukleotide entschlüsselt werden (eine Familie ist eine Gruppe von vier Codons, die sich die ersten beiden Basen teilen und für dieselbe Aminosäure kodieren). Im Vorschlag von Watanabe & Yokobori wird der frühe Code von einem primitiven Code mit weniger, degenerierten Aminosäuren, dem Jukes-Code, abgeleitet. Es wird angenommen, dass ein solcher Code nur aus Familien besteht, mit Ausnahme einer Aminosäure und des Stoppsignals, die eine Degenerierung von zwei haben, d.h. von zwei Codons kodiert werden.

Darstellung der Evolution des genetischen Codes, adaptiert von . Jeder Kreis oder jedes Quadrat stellt einen Meilenstein dar. Die untere Linie zeigt die Entwicklung der Codonlänge, die von unserer Theorie impliziert wird.

Unsere Hauptbehauptung ist nun, dass der Tessera-Code einen Vorläufer des frühen Codes darstellt, nämlich einen vor-frühen Code, der zwischen dem primitiven und dem frühen Code liegt. Es gibt mehrere Argumente, die dafür sprechen, dass der Tessera-Code ein vor-früher Code ist (der quadratische Meilenstein in Abbildung 4). In erster Linie hat er genau die gleiche Degenerationsstruktur wie der frühe genetische Code. Außerdem stimmt der Tessera-Code mit der Hypothese von Baranov et al. überein, die einen Ursprung des Codes mit langen Oligonukleotiden vorschlägt, gefolgt von einer Verringerung der Codonlänge, bis die optimale Anzahl von 3 erreicht war. Wenn man annimmt, dass der frühe Code Codons der Länge 4 hat, bedeutet das, dass auch der primitive Code Codons der Länge 4 hat. Wir zeigen, dass der primitive genetische Code von Jukes mit generischen Codons der Länge 4 implementiert werden kann. In der folgenden Beschreibung verwenden wir den Begriff Codon für Codons der Länge 4 oder Tetracodons. Der Code von Jukes hat 15 Aminosäuren mit Degeneriertheit 4, eine Aminosäure mit Degeneriertheit 2 und zwei Stoppcodons. Insgesamt gibt es 15 Elemente mit Degeneriertheit 4 und 2 Elemente mit Degeneriertheit 2. Wenn wir davon ausgehen, dass dieser Code aus Codons von 4 Nukleotiden entstanden ist, dann bedeutet dies die Wahl von 17 Elementen/Aminosäuren, die entweder durch zwei oder vier Codons aus der Menge von 44 = 256 Codons codiert werden können. Man beachte, dass die Menge der 256 Codons in eine Teilmenge von 32 Codons, die einige Symmetrien aufweisen (diese entsprechen den ersten beiden Spalten des Tessera-Codes in Tabelle 1), und eine Teilmenge von 224 Codons ohne Symmetrie unterteilt werden kann. Wie oben gezeigt, entsprechen die symmetrischen Codons den Aminosäuren mit Degeneration 2, während die asymmetrischen Codons den Aminosäuren mit Degeneration 4 entsprechen. Wenn wir nun einen Zufallsmechanismus für die Zuordnung von Codons zu Aminosäuren annehmen, entspricht die Degenerationsverteilung mit der höchsten Wahrscheinlichkeit genau der des Jukes-Codes. Wir haben dies im elektronischen Zusatzmaterial B gezeigt. Jukes nimmt an, dass eines der Elemente der Entartung 2 mit dem Stoppsignal verbunden ist. Bei dieser Wahl sind Stoppcodons weniger anfällig für zufällige Fehler, d. h. diese Elemente sind weniger mehrdeutig als die mit Entartung 4. Ebenso liegt die Hypothese nahe, dass das andere Element mit der Degeneriertheit 2 der Aminosäure entspricht, die für das Startsignal kodiert.

Wir haben gezeigt, dass der primitive Code (Jukes‘ Version) auf natürliche Weise mit Codons der Länge 4 beschrieben wird. Nun beschreiben wir einen möglichen Evolutionspfad von Jukes‘ Code zum Tessera-Code. In unserem Ansatz besteht der primitive Code aus zwei Paaren von symmetrischen Codons und 60 nicht-symmetrischen Codons. Man beachte, dass die Auswahl der symmetrischen Codons aufgrund ihrer geringeren Neigung zu Punktmutationen einen ersten Schritt zur Auswahl der symmetrischen Hälfte des Tessera-Sets darstellt. Nehmen wir an, dass ein neuer Adaptor mit einem symmetrischen Anticodon auftritt und mit einem bestehenden Adaptor mit einem asymmetrischen Anticodon konkurriert (dieselbe Aminosäure trägt). Der neue Adaptor kann an symmetrische Codons binden, die Teil des Tessera-Sets sind (die ersten beiden Spalten der Tabelle 1). Ein solcher Adaptor hat einen evolutionären Vorteil gegenüber demjenigen, der ein nicht-symmetrisches Anticodon trägt, weil er zwei verschiedene räumliche Konfigurationen hat, die für die Bindung an das Codon genutzt werden können. Der Adaptor in Abbildung 2 trägt zum Beispiel das palindromische Anticodon AUUA. Wenn der Adaptor umgekehrt wird, kann er immer noch an das Codon/Tessera UAAU binden. Dieser Selektionsdruck führt dazu, dass alle symmetrischen Codons (Tetracodons)/Tessera auf Kosten der nicht-symmetrischen Codons erobert werden. Am Ende dieses Prozesses haben wir einen Code, der sich aus 32 symmetrischen Tessera und 32 nicht-symmetrischen Tetracodons zusammensetzt, die nicht notwendigerweise zum Tessera-Set gehören. An diesem Punkt wird ein weiterer Optimierungsschritt erreicht, indem nicht-symmetrische Tesserae ausgewählt werden: Wie in gezeigt, sind Tesserae immun gegen Punktmutationen4 und überleben daher aufgrund des evolutionären Drucks der Dekodiergenauigkeit gegenüber nicht-Tessera-Tetrakodons. Die 32 symmetrischen Tesserae sind immun gegen Punktmutationen (zwei gleichzeitige, höchst unwahrscheinliche Punktmutationen sind erforderlich, um einen Übergang zwischen zwei Tesserae zu erzeugen). Dies bedeutet, dass die entsprechenden tRNAs nicht zum Einbau einer nicht erkannten Aminosäure führen, wenn sie einer Punktmutation unterworfen werden. Diese Eigenschaft der Fehlererkennung impliziert einen evolutionären Vorteil in Bezug auf die Genauigkeit der Proteinsynthese. Die verbleibenden 32 nicht-symmetrischen Tetracodons sind nicht notwendigerweise Mosaiksteine, aber diejenigen, die Mosaiksteine sind, haben die Eigenschaft der Fehlerimmunität, so dass sie aus den oben genannten Gründen schrittweise ausgewählt werden. So erhalten wir die vollständige Struktur des Tessera-Vorzeitcodes, dessen Degenerationsverteilung mit der des frühen Codes (und mit der des heutigen mitochondrialen Codes der Wirbeltiere) übereinstimmt.

Wir haben gezeigt, dass der Übergang zwischen Jukes‘ Code und dem Tessera-Code unter minimalen Annahmen am wahrscheinlichsten ist. Es ist klar, dass bei diesem Übergang die Tessera-Erkennung spezifischer wird als die Tetracodon-Erkennung des Jukes-Codes. Die Eigenschaft der Fehlererkennung des Tessera-Codes ermöglicht es nämlich, die Mehrdeutigkeit in Bezug auf die Aminosäurebeladung von Tetracodon-Adaptern zu verringern. Die erhöhte Präzision bei der Tessera-Erkennung wiederum erlaubt es, die Auswahl der Aminosäuren aufgrund des evolutionären Drucks der Proteinleistung zu verfeinern.

Unsere Hypothese des Tessera-Codes als vor-früher Code impliziert auch einen anderen wichtigen evolutionären Übergang, nämlich den Übergang zwischen dem Tessera-Code und dem frühen Code. Da der frühe Code vermutlich Codons der Länge drei hat, ist das Hauptproblem, das dieser Übergang mit sich bringt, die Änderung der Codonlänge, die allgemein als schädlich angesehen wird. Es ist zu beachten, dass (i) jede Theorie über den Ursprung des Codes mit einer Codonlänge, die sich von drei unterscheidet, mit diesem Problem konfrontiert ist und (ii) ein solcher Übergang schädlich ist, wenn eine Evolutionsstufe erreicht wird, auf der der Code eingefroren ist, da dies eine dramatische Änderung der Aminosäuresequenz aller Proteine eines Organismus bedeutet; dies ist jedoch nicht notwendigerweise der Fall bei früheren Evolutionsstufen, die näher am Ursprung des Codes liegen. Der Tessera-Code ermöglicht eine saubere Lösung des Problems des Übergangs von Tetracodons zu Codons. Die von der Tessera-Gruppe getragene Information ist nämlich redundant. Wenn drei von vier Buchstaben eines Tesseras bekannt sind, kann der fehlende Buchstabe eindeutig abgeleitet werden. Aus der Sicht der Kodierungstheorie haben der Tessera-Code und jeder genetische Trinukleotid-Code den gleichen Informationsgehalt. Dies impliziert, dass eine Eins-zu-Eins-Zuordnung zwischen Tessera und Codons hergestellt werden kann. Die wesentliche Struktur einer solchen Abbildung bringt es mit sich, dass die Transformationen zwischen benachbarten Buchstaben eines Tesseras zu den Nukleotiden eines Codons werden. Bei einem Tessera b1b2b3b4 gibt es drei chemische Transformationen zwischen benachbarten Buchstaben: t12 = f(b1b2) zwischen b1 und b2, t23 = f(b2b3) zwischen b2 und b3, und t34 = f(b3b4) zwischen b3 und b4. Man beachte, dass nur zwei dieser drei Transformationen unabhängig sind, da t34 = t12. In Tabelle 4a haben wir den Tessera-Code entsprechend der Transformation t12 (Zeilen) und t23 (Spalten) neu geordnet. Wir schlagen vor, dass t12 und t23 auf das erste bzw. zweite Nukleotid des Codons (x1, x2) abgebildet werden. Diese Entsprechung ist in Tabelle 3 dargestellt. Außerdem wird der vierte Buchstabe b4 auf das dritte Nukleotid des Codons x3 abgebildet. Eine schematische Darstellung der Zuordnung ist in Abbildung 5 zu sehen. Man beachte, dass nach dieser Zuordnung die Spalten der Tessera-Menge auf die Spalten des genetischen Codes abgebildet werden, so dass t23 = I auf NAN-Codons (Degeneriertheit nicht 4) und t23 = KM auf NCN-Codons (nur aus Familien bestehend) abgebildet wird; vgl. Tabelle 44b mit Tabelle 4c. Es ist festzustellen, dass diese beiden Spalten des Tessera-Codes die gleiche Degeneriertheit aufweisen wie die entsprechenden Spalten des genetischen Codes (entweder 4 oder 2 + 2). Die natürliche Vervollständigung der Abbildung ordnet t23 = SW den NUN-Codons und t23 = YR den NGN-Codons zu. Bei den beiden letztgenannten Zuordnungen müssen einige Ausnahmen berücksichtigt werden, die dadurch bedingt sind, dass beim Übergang von Tessera zu Codons zwar die Rumersche Symmetrie erhalten bleibt, die selbstkomplementäre Symmetrie jedoch nicht. Die Tessera-Antitessera-Wechselwirkung ist spezifischer als die Codon-Anticodon-Wechselwirkung, was auf das Vorhandensein von vier Watson-Crick-artigen chemischen Bindungen zurückzuführen ist. Im Falle des bestehenden genetischen Codes wird die Entartung jedoch hauptsächlich durch die Codon-Anticodon-Wechselwirkung der ersten beiden Basen bestimmt. Wenn man also davon ausgeht, dass die Bindungsenergie in den frühen Code-Zeiten mit der Watson-Crick-Energie vergleichbar ist, sollte die Tessera-Antitessera-Wechselwirkungsenergie etwa doppelt so hoch sein wie die tatsächliche Codon-Anticodon-Energie.

Schematische Darstellung der Abbildung zwischen dem Tessera (b1b2b3b4) auf das Codon (x1x2x3).

Tabelle 3.

Grundstruktur der Abbildung zwischen Tessera und Codon. Die vier Transformationen zwischen den Basen eines Tesseras werden auf die vier Nukleotide eines Codons abgebildet.

Tessera-Transformationen t12,t23 Codonbasen x1, x2
I ⟶12345 A
SW ⟶12345 U
KM ⟶12345 C
YR ⟶12345 G

Tabelle 4.

(a) Der Tessera-Code, organisiert nach den Transformationen: erster-zweiter Buchstabe t12 (Zeilen) und zweiter-dritter Buchstabe t23 (Spalten); (b) wie (a), aber mit den vertauschten Quartetten, wie durch die Pfeile angezeigt. (c) Degeneriertheit des genetischen Codes der Wirbeltiermitochondrien. Die Codons des mitochondrialen Codes der Wirbeltiere in (c) und die Tesserae (b) sind durch die im Text beschriebene Eins-zu-Eins-Zuordnung miteinander verbunden. Innerhalb von Quartetten kodieren Mosaiksteine mit der gleichen Farbe für die gleiche Aminosäure: rosa und grün = 2 + 2 und weiß = 4.

Aus biochemischer Sicht bedeutet der Übergang von Mosaiksteinen zu Codons also den Übergang von einer vollständigen vier Basen langen spezifischen Watson-Crick-ähnlichen Paarung zum Lesen von Mosaiksteinen zur Wobble-Strategie zum Lesen von Codons.

Dies impliziert insbesondere theoretische Einschränkungen für einige Symmetrieeigenschaften, die in der Welt der Tesserae vorhanden sind, aber nicht in den existierenden Codes, zum Beispiel der Verlust der selbstkomplementären Symmetrie. In der Tat hat jede Spalte des Tessera-Codes eine bestimmte Entartung, aber in den bestehenden Codes gilt dies nur für zwei Spalten, d. h. für Codons der Art NMN (NAN oder NCN). Die Spalten, die den Codons NKN (NUN oder NGN) entsprechen, weisen hingegen eine gemischte Degenerierung auf; insbesondere unterscheiden sich die Quadranten zwischen den beiden Codes durch die Art SUN und WGN (wir nennen WSN oder SWN gemischt im Gegensatz zu dem nicht gemischten SSN WWN). Mit anderen Worten, die bestehenden Codes haben Codons der Art WGN, die Aminosäuren mit Degeneration 2 kodieren, obwohl die zentrale Base stark ist, und Codons der Art SUN, die Aminosäuren mit Degeneration 4 kodieren, obwohl die zentrale Base schwach ist.

Eine Erklärung solcher Merkmale in Form von energetischen Zwängen, die von der Stereochemie der Codon-Anticodon-Interaktion abhängen, wird in vorgeschlagen. Im bestehenden genetischen Code ist eine schwache Interaktion normalerweise mit einer 2 + 2-Degeneration verbunden. Dies ist in der Tat der Fall bei Codons der Art NAN, AUN und UUN. Im Falle eines U als zweitem Buchstaben erlaubt jedoch eine weitere Stabilisierung des purinischen Zentralbuchstabens N35 in der Anticodon-Schleife der tRNA durch U33, trotz des schwachen Charakters von N35 eine vollständige Familie zu lesen.5 Im umgekehrten Fall, für Codons der Art AGN und UGN, wird das Nukleotid N35 nicht ausreichend durch U33 stabilisiert und das zugehörige Quartett wird zu einer 2 + 2 Entartung.

Diese Einschränkungen der Wobble-Strategie bedeuten, dass bei der Zuordnung von Tesserae zu Codons der Quadrant (YR-SW) mit dem Quadranten (SW-YR) und der Quadrant (KM-SW) mit dem Quadranten (I-YR) vertauscht wird; siehe Tabelle 4 (obere Felder). Schließlich wird der vierte Buchstabe eines Tesseras auf den dritten Buchstaben eines Codons abgebildet, wobei die folgende Ausnahme eine korrekte Gruppierung gewährleistet: Wenn b4 = K (T oder G), dann ist x3 = KM(b4), d. h. T und G werden vertauscht; andernfalls ist x3 = b4. Beachten Sie, dass die Abbildung nicht unbedingt eindeutig ist; Die vorliegende Arbeit zeigt jedoch nach unserem besten Wissen, dass es möglich ist, vom Tessera-Code zum heutigen Code überzugehen, indem alle bekannten Degenerationsmerkmale des letzteren beschrieben werden.

Wenn die Proteincodierung ursprünglich Codons mit mehr als drei Basen umfasste, dann sollte die Übersetzungsmaschinerie eine gewisse Erinnerung daran tragen. Tatsächlich bietet die kleine Untereinheit der heutigen Ribosomen eine strukturelle Freiheit, die den Einbau eines zusätzlichen Nukleotids in das Dekodierungszentrum ermöglichen könnte, so dass die Dekodierung von vierbasigen Codons möglich ist. In der Tat wurde die Dekodierung von Vierbasen-Codons 1973 als Mechanismus zur Unterdrückung von Frameshift entdeckt und wird heute in der Biotechnologie häufig eingesetzt, um nicht-kanonische Aminosäuren in Proteine einzubauen. Darüber hinaus wurde die biologische Machbarkeit von Vier-Längen-Codons und eines orthogonalen Ribosoms, das sie entschlüsselt, im Labor nachgewiesen. Es gibt auch Hinweise auf die Existenz sich überschneidender Gene, die durch Tetracodons kodiert werden; außerdem wurde gezeigt, dass Tetracodons eine wichtige Rolle in der phylogenetischen Analyse spielen (z.B. ), was ein Hinweis auf ein genetisches Gedächtnis sein kann.

Eine beeindruckende Anzahl von Eigenschaften des Tessera-Codes ist in den heutigen Codes erhalten. Der frühe Code und alle seine Abkömmlinge erben vom Tessera-Code die Anzahl der Codons (64 Tessera erzeugen 64 Codons) und die maximale Anzahl der Aminosäuren (23). Der Tessera-Code ermöglicht die Codierung von 24 Elementen/Aminosäuren. Da mindestens eines dieser Elemente ein Stoppsignal darstellen muss, beträgt die maximale theoretische Anzahl der darstellbaren Aminosäuren 23. Bemerkenswerterweise überschreitet kein existierender Code diese Grenze, und die Höchstzahl der Aminosäuren, die von einigen Genomen direkt kodiert werden, beträgt genau 23: die 20 Standard-Aminosäuren plus 2 Nicht-Standard-Aminosäuren (Selenocystein und Pyrrolysin) und die alternative Initiations-Aminosäure N-Formylmethionin ergeben zusammen 23. Darüber hinaus beträgt die Zahl der im genetischen Code der Wirbeltiere verwendeten Adaptoren 22: acht tRNAs, die jeweils vier Codons erkennen, 14 tRNAs, die jeweils zwei Codons erkennen, und zwei Codon-Paare, die nicht mit Aminosäuren verbunden sind. Bemerkenswerterweise ist 22 das absolute Minimum, das bei allen bekannten Versionen des genetischen Codes beobachtet wurde. Außerdem ist dies genau die Struktur, die das Tessera-Modell impliziert: acht ursprüngliche Adaptoren der Degeneration 4 plus 16 Adaptoren der Degeneration 2 bilden einen Satz von 24 Adaptoren; wenn wir zwei Adaptoren der Degeneration 2, die Stoppcodons zugeordnet sind, verwerfen, erhalten wir genau 22.

Der genetische Code der Wirbeltiere und unser Tessera-basiertes Modell des frühen Codes teilen auch eine Reihe von Merkmalen, die mit der Symmetrie zusammenhängen (z.B. Tabelle 5). In erster Linie ändert die KM-Transformation, auch bekannt als Rumer-Transformation, die auf das erste Dublett eines Codons angewendet wird, die Degeneriertheit der entsprechenden Aminosäure. Diese universelle Eigenschaft wird in den meisten bekannten Versionen des genetischen Codes (sowohl im Kern als auch in den Mitochondrien) beobachtet. Auch der Tessera-Code weist diese Eigenschaft auf. Zum Beispiel entspricht der Tessera AUUA einer Aminosäure der Entartung 2, und wenn wir die KM-Transformation auf die ersten beiden Nukleotide anwenden, erhalten wir den Tessera CGUA, der einer Aminosäure der Entartung 4 entspricht. Man beachte, dass diese Eigenschaft auch gilt, wenn man die Rumer-Transformation auf das t12t23 der oben beschriebenen Abbildung anwendet, die Tessera und Codons verbindet. Für weitere Einblicke siehe

Tabelle 5.

Vergleichstabelle zwischen dem mitochondrialen genetischen Code der Wirbeltiere und dem Tessera-Code.

Genetischer Code der Wirbeltiermitochondrien Tessera-Code
Anzahl Codons Anzahl Anzahl. Tesserae
Degeneriertheit 2 16 2 16
4 8 4 8
Anzahl der Codons Codons 64 Tesserae 64
Anzahl der Adaptoren Adaptoren 22 Adaptoren 22
Anzahl der Aminosäuren a.a. 20 a.a. 20
Symmetrien
Rumer KM-Transformation auf den ersten beiden Basen verändert die Entartung der a.a. KM-Transformation auf den ersten beiden Basen ändert die Entartung des a.a.
Klein V Gruppe die 16 Codons, die die Transformation zwischen dem ersten und dem zweiten Buchstaben teilen, haben die gleiche Degeneriertheitsverteilung die 16 Tesserae, die die Transformation zwischen die 16 Tessera, die sich die Transformation zwischen dem ersten und dem zweiten Buchstaben teilen, haben die gleiche Degenerationsverteilung

Ein weiterer grundlegender Aspekt des Tessera-Codes ist, dass die Kodierung eines Proteins robust gegenüber +1 Frame Shifts gemacht werden kann. Die Robustheit gegenüber Rahmenverschiebungen kann auch mit zirkulären Codes in Verbindung gebracht werden, von denen angenommen wurde, dass sie bei der Synchronisierung von Rahmen eine Rolle spielen. Das Vorhandensein eines universellen zirkulären Codes wurde mit dem Ursprung des genetischen Codes als Paare komplementärer Codons in Verbindung gebracht, die entweder für die gleiche oder eine ähnliche Aminosäure kodieren. Die gleiche Vermutung wird auch in anderen Zusammenhängen vertreten. Diese Eigenschaft ergibt sich auf natürliche Weise aus dem Tessera-Code, bei dem ein Tessera und sein umgekehrtes Komplement immer für die gleiche Aminosäure kodieren.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.