PMC

3. Implikacje ewolucyjne

Według naszej najlepszej wiedzy, kod tessery stanowi pierwsze ilościowe wyjaśnienie pochodzenia degeneracji w kodach przodków. Jako taki, może on być istotny dla wyjaśnienia ewolucji kodu genetycznego. W drugiej części tego artykułu analizujemy możliwe ewolucyjne implikacje kodu tessery. W tym celu przypominamy hipotezę ewolucyjną przedstawioną przez Watanabe & Yokobori, która opiera się na analizie translacji w istniejących mitochondriach (patrz rysunek 4 zaadaptowany z ). Rysunek 4 przedstawia kamienie milowe, co do których istnieje pewna zgodność i które reprezentują kroki ewolucyjne od prymitywnego kodu genetycznego do obecnych wariantów. Zaczynając od wariantów istniejących i cofając się w czasie, znajdujemy pierwszy kamień milowy, tj. uniwersalny kod genetyczny LUCA. Hipotezuje się, że kod ten ma strukturę podobną do obecnego standardowego kodu genetycznego jądra atomowego. Najprostszym wariantem istniejących kodów jest mitochondrialny kod genetyczny kręgowców, który, głównie z tego powodu, został zaproponowany jako model poprzednika uniwersalnego kodu LUCA: kodu wczesnego (drugi kamień milowy od prawej na ryc. 4). Główną nowością ewolucyjną związaną z przejściem od kodu wczesnego do uniwersalnego jest pojawienie się posttranskrypcyjnych modyfikacji w tRNA. Przemawia za tym fakt, że w niektórych istniejących mitochondriach metazoan, niezmodyfikowane U na pierwszej pozycji antykodonu może parować się ze wszystkimi zasadami na trzeciej pozycji kodonu. Pozwala to na dekodowanie rodzin kodonów bez konieczności stosowania zmodyfikowanych nukleotydów (rodzina to grupa czterech kodonów dzielących dwie pierwsze zasady i kodujących ten sam aminokwas). W propozycji Watanabe & Yokobori , wczesny kod wywodzi się z prymitywnego kodu o mniejszej liczbie, bardziej zdegenerowanych, aminokwasów, czyli kodu Jukesa . Taki kod mają tworzyć tylko rodziny z wyjątkiem jednego aminokwasu i sygnału stop, które mają degenerację dwa, czyli są kodowane przez dwa kodony.

Prezentacja ewolucji kodu genetycznego, zaadaptowana z . Każde kółko lub kwadrat reprezentuje kamień milowy. Dolna linia pokazuje ewolucję długości kodonów implikowaną przez naszą teorię.

Teraz naszym głównym twierdzeniem jest, że kod tessery reprezentuje przodka wczesnego kodu, a mianowicie kod przedwczesny, umieszczony pomiędzy kodem pierwotnym a wczesnym. Istnieje kilka argumentów, które przemawiają za tym, że kod tessery jest kodem przedwczesnym (kwadratowy kamień milowy na rysunku 4). Przede wszystkim, ma on dokładnie taką samą strukturę degeneracji jak wczesny kod genetyczny. Co więcej, kod tessery jest zgodny z hipotezą Baranova i in., proponujących powstanie kodu z długich oligonukleotydów, po których następowało zmniejszanie długości kodonów aż do osiągnięcia optymalnej liczby 3. Zakładając, że przedwczesny kod ma kodony długości 4, implikujemy, że również prymitywny kod ma kodony długości co najmniej 4. Istotnie, pokazujemy, że prymitywny kod genetyczny Jukesa można zaimplementować za pomocą generycznych kodonów długości 4. W poniższym opisie używamy terminu kodon w znaczeniu kodonów długości 4 lub tetrakodonów. Kod Jukesa ma 15 aminokwasów o degeneracji 4, jeden aminokwas o degeneracji 2 i dwa kodony stop. W sumie jest to 15 elementów o degeneracji 4 i 2 elementy o degeneracji 2. Jeśli przyjmiemy, że kod ten pochodzi od kodonów o długości 4 nukleotydów, to oznacza to wybór 17 elementów/aminokwasów, które mogą być kodowane przez dwa lub cztery kodony ze zbioru 44 = 256 kodonów. Zauważmy, że zbiór 256 kodonów można podzielić na podzbiór 32 kodonów, które posiadają pewne symetrie (odpowiadają one dwóm pierwszym kolumnom kodu tessery z tabeli 1) oraz podzbiór 224 kodonów bez symetrii. Jak pokazano powyżej, kodony symetryczne odpowiadają aminokwasom o degeneracji 2, natomiast kodony asymetryczne odpowiadają aminokwasom o degeneracji 4. Jeśli założymy losowy mechanizm przypisywania kodonów do aminokwasów, to rozkład zdegenerowania, który ma największe prawdopodobieństwo, odpowiada dokładnie rozkładowi kodu Jukesa. Pokazaliśmy to w elektronicznym materiale uzupełniającym B. Jukes zakłada, że jeden z elementów degeneracji 2 jest związany z sygnałem stop. Przy takim wyborze kodony stop są mniej podatne na generowanie przez błędy losowe, tzn. elementy te są mniej niejednoznaczne niż te o degeneracji 4. Podobnie, naturalna jest hipoteza, że drugi element o degeneracji 2 odpowiada aminokwasowi, który koduje sygnał startu.

Wykazaliśmy, że prymitywny kod (wersja Jukesa) jest naturalnie opisany kodonami o długości 4. Teraz opisujemy możliwą ścieżkę ewolucji od kodu Jukesa do kodu tessery. W naszym podejściu prymitywny kod składa się z dwóch par symetrycznych kodonów i 60 niesymetrycznych kodonów. Zauważmy, że wybór kodonów symetrycznych, ze względu na ich mniejszą skłonność do błędów mutacji punktowych, stanowi pierwszy krok do wyboru symetrycznej połowy zbioru tesera. Załóżmy, że pojawia się nowy adaptor posiadający symetryczny antykodon i konkuruje (przenosi ten sam aminokwas) z istniejącym adaptorem posiadającym asymetryczny antykodon. Nowy adaptor może wiązać się z symetrycznymi kodonami, które są częścią zestawu teserów (pierwsze dwie kolumny tabeli 1). Taki adaptor ma ewolucyjn± przewagę nad tym posiadaj±cym niesymetryczny antykodon, ponieważ ma dwie różne konfiguracje przestrzenne, które mog± być wykorzystane do wi±zania się z kodonem. Na przykład, adaptor z rysunku 2 niesie palindromiczny antykodon AUUA. Jeśli adaptor zostanie odwrócony, to nadal może wiązać się z kodonem/teserą UAAU. Ta selektywna presja powoduje wychwytywanie wszystkich symetrycznych kodonów (tetrakodonów)/tessery kosztem kodonów niesymetrycznych. Na końcu tego procesu mamy kod składający się z 32 symetrycznych teserów i 32 niesymetrycznych tetrakodonów, które niekoniecznie należą do zestawu teserów. W tym momencie następuje kolejny etap optymalizacji poprzez wybór niesymetrycznych teserów: jak pokazano w , tesery są odporne na mutacje punktowe4 , a zatem przetrwają do nie-teserowych tetrakodonów z powodu ewolucyjnego nacisku na dokładność dekodowania. 32 symetryczne tessery są odporne na mutacje punktowe (do wytworzenia przejścia między dwoma tesserami potrzebne są dwie jednoczesne, wysoce nieprawdopodobne, mutacje punktowe). Oznacza to, że odpowiadające im tRNA nie doprowadzą do przyłączenia niepoznawalnego aminokwasu, jeśli zostaną poddane mutacji punktowej. Ta właściwość wykrywania błędów implikuje przewagę ewolucyjną w zakresie dokładności syntezy białek. Pozostałe 32 niesymetryczne tetrakodony niekoniecznie są tesserami, ale te, które są tesserami, mają własność odporności na błędy, więc będą stopniowo selekcjonowane z powyższych powodów. Stąd otrzymujemy kompletną strukturę przedwczesnego kodu tessera, którego rozkład degeneracji pokrywa się z rozkładem wczesnego kodu (oraz z rozkładem wymarłego mitochondrialnego kodu kręgowców).

Wykazaliśmy, że przejście między kodem Jukesa a kodem tessera jest najbardziej prawdopodobne przy minimalnych założeniach. Wyraźnie, w tym przejściu, rozpoznanie tessery staje się bardziej specyficzne niż rozpoznanie tetracodonu w kodzie Jukesa. Rzeczywiście, właściwość wykrywania błędów w kodzie tessery pozwala na zmniejszenie niejednoznaczności związanej z ładunkiem aminokwasów w adapterach tetrakodonowych. Z kolei zwiększona precyzja w rozpoznawaniu tessery pozwala na dopracowanie wyboru aminokwasów ze względu na ewolucyjną presję wydajności białka.

Nasza hipoteza kodu tessery jako kodu przedwczesnego implikuje również inne główne przejście ewolucyjne, tj. przejście między kodem tessery a kodem wczesnym. Ponieważ wczesny kod ma mieć kodony o długości trzech, główny problem implikowany przez to przejście związany jest ze zmianą długości kodonu, która ogólnie uważana jest za szkodliwą. Zauważmy, że (i) każda teoria pochodzenia kodu o długości kodonu innej niż trzy musi zmierzyć się z tym problemem i (ii) takie przejście jest szkodliwe, gdy osiągnie się poziom ewolucyjny, na którym kod uległ zamrożeniu, ponieważ implikuje to dramatyczną zmianę w sekwencji aminokwasów wszystkich białek organizmu; niekoniecznie jednak dzieje się tak na wcześniejszych etapach ewolucji, bliższych powstaniu kodu. Kod tesera pozwala na znalezienie zgrabnego rozwiązania problemu przejścia od tetrakodonów do kodonów. W rzeczywistości informacja niesiona przez zestaw teserów jest redundantna. Z definicji, je¶li znane s± trzy z czterech liter tesery, to brakuj±c± literę można wyprowadzić jednoznacznie. Stąd, z punktu widzenia teorii kodowania, kod tesery i dowolny trinukleotydowy kod genetyczny niosą tę samą zawartość informacyjną. Wynika z tego, że można ustalić odwzorowanie jeden do jednego pomiędzy teserami i kodonami. Istotna struktura takiego odwzorowania zakłada, że przekształcenia pomiędzy sąsiednimi literami tessery stają się nukleotydami kodonu. W szczególności, biorąc pod uwagę tesserę b1b2b3b4 możemy mieć trzy transformacje chemiczne pomiędzy sąsiednimi literami: t12 = f(b1b2) pomiędzy b1 i b2, t23 = f(b2b3) pomiędzy b2 i b3, oraz t34 = f(b3b4) pomiędzy b3 i b4. Zauważmy, że tylko dwa z tych trzech przekształceń są niezależne, ponieważ t34 = t12. W tabeli 4a uporządkowaliśmy kod tesery zgodnie z transformacją t12 (wiersze) i t23 (kolumny). Proponujemy, aby t12 i t23 odwzorować na pierwszy i drugi nukleotyd kodonu, odpowiednio (x1, x2). Korespondencja ta przedstawiona jest w tabeli 3. Ponadto, czwarta litera b4 jest odwzorowana na trzeci nukleotyd kodonu x3. Schematycznie odwzorowanie to przedstawiono na rysunku 5. Zauważmy, że zgodnie z tym odwzorowaniem, kolumny zbioru tessery są odwzorowane na kolumny kodu genetycznego w ten sposób, że t23 = I jest odwzorowane na kodony NAN (degeneracja non-4), a t23 = KM jest odwzorowane na kodony NCN (złożone tylko z rodzin); porównaj tabelę44b z tabelą 4c. Można zauważyć, że te dwie kolumny kodu tessery mają tę samą degenerację z odpowiadającymi im kolumnami kodu genetycznego (albo 4, albo 2 + 2). Naturalne dopełnienie mapowania przypisuje t23 = SW do kodonów NUN i t23 = YR do kodonów NGN. Te dwa ostatnie przyporządkowania muszą uwzględniać pewne wyjątki wynikające z faktu, że w przejściu od tesery do kodonów symetria Rumera jest rzeczywiście zachowana, ale symetria samospójna nie. Oddziaływanie tessera-antytessera jest bardziej specyficzne niż kodon-antykodon, ze względu na obecność czterech wiązań chemicznych typu Watson-Crick. Jednak w przypadku istniejącego kodu genetycznego, degeneracja jest zdeterminowana głównie przez oddziaływanie kodon-antykodon dwóch pierwszych zasad. Stąd, zakładając, że energia wiązania w czasach przedwczesnego kodu jest porównywalna z energią wiązania Watsona-Cricka, energia oddziaływania tessera-antytessera powinna być w przybliżeniu dwukrotnie większa od rzeczywistej energii oddziaływania kodon-antykodon.

Schematyczne przedstawienie odwzorowania między tesserą (b1b2b3b4) na kodon (x1x2x3).

Tabela 3.

Podstawowa struktura odwzorowania między tesserą a kodonami. Cztery transformacje między bazami tesery są odwzorowane na cztery nukleotydy kodonu.

teserae transformacje t12,t23 podstawy kodonu x1, KM ⟶12345 C
YR ⟶12345 G

Tabela 4.

(a) Kod tesery uporządkowany według przekształceń: pierwsza-druga litera t12 (wiersze) i druga-trzecia litera t23 (kolumny); (b) to samo co (a), ale z zamienionymi kwartetami, jak wskazują strzałki. (c) Degeneracja mitochondrialnego kodu genetycznego kręgowców. Kodony kodu mitochondrialnego kręgowców w (c) i tesserae (b) są powiązane poprzez mapowanie jeden do jednego opisane w tekście. Wewnątrz kwartetów tesserae o tym samym kolorze kodują ten sam aminokwas: różowy i zielony = 2 + 2, a biały = 4.

Tak więc, z biochemicznego punktu widzenia, przejście od tesserae do kodonów implikuje przejście od pełnego czterobazowego specyficznego parowania typu Watson-Crick do odczytywania tesserae do strategii wobble do odczytywania kodonów.

W szczególności, to implikuje teoretyczne ograniczenia na niektórych właściwości symetrii, które są obecne w świecie tesserae, ale nie są w extant kody, na przykład, utrata self-complementary symetrii. W istocie, każda kolumna kodu tessery ma określoną degenerację, ale w istniejących kodach jest to prawdziwe tylko dla dwóch kolumn, tj. kodonów typu NMN (NAN lub NCN). Zamiast tego, kolumny odpowiadające kodonom typu NKN (NUN lub NGN) mają degenerację mieszaną; w szczególności, kwadranty różniące się między tymi dwoma kodami to te typu SUN i WGN (nazywamy WSN lub SWN mieszanymi w przeciwieństwie do niemieszanych SSN WWN). Innymi słowy, istniejące kody mają kodony w rodzaju WGN, które kodują aminokwasy ze zwyrodnieniem 2, pomimo faktu, że centralna baza jest silna, oraz kodony w rodzaju SUN, które kodują aminokwasy ze zwyrodnieniem 4, pomimo faktu, że centralna baza jest słaba .

Wyjaśnienie takich cech w kategoriach ograniczeń energetycznych zależnych od stereochemii interakcji kodon-antykodon zaproponowano w . W istniejącym kodzie genetycznym słaba interakcja jest zwykle związana ze zwyrodnieniem 2 + 2. Istotnie, tak jest w przypadku kodonów typu NAN, AUN i UUN. Jednak w przypadku U jako drugiej litery, dalsza stabilizacja purynowych liter centralnych N35 w pętli antykodonowej tRNA przez U33 pozwala na odczytanie kompletnej rodziny pomimo słabego charakteru N35.5 W lustrzanym przypadku, dla kodonów w rodzaju AGN i UGN nukleotyd N35 nie jest wystarczająco ustabilizowany przez U33 i związany z nim kwartet staje się degeneracją 2 + 2.

Te ograniczenia strategii wobble implikują, że w mapowaniu z tesery na kodony kwadrant (YR-SW) jest zamieniany z kwadrantem (SW-YR), a kwadrant (KM-SW) z kwadrantem (I-YR); patrz tabela 4 (górne panele). Ostatecznie, czwarta litera tesery jest mapowana na trzecią literę kodonu z następującym wyjątkiem, który zapewnia prawidłowe grupowanie: jeśli b4 = K (T lub G), to x3 = KM(b4), czyli T i G są zamieniane; w przeciwnym razie x3 = b4. Zauważmy, że to odwzorowanie nie musi być unikalne; jednak, zgodnie z naszą najlepszą wiedzą, obecny pokazuje, że możliwe jest przejście z kodu tessera do kodu extant opisując wszystkie znane cechy degeneracji tego ostatniego.

Jeśli, pierwotnie, kodowanie białka zaangażowane kodony dłuższe niż trzy bazy, to maszyny tłumaczące powinny nosić jakąś pamięć o tym. Rzeczywiście, mała podjednostka extant rybosomów przedstawia strukturalną wolność, która może pozwolić na włączenie dodatkowego nukleotydu w centrum dekodowania tak, że dekodowanie kodonów czterech baz jest wykonalne. Zauważmy, że możliwość ancestralnego kodowania za pomocą poczwórnych kodonów została wspomniana w . Rzeczywiście, dekodowanie poczwórne zostało odkryte w 1973 roku jako mechanizm związany z tłumieniem przesunięć ramek i obecnie jest szeroko stosowane w biotechnologii w celu włączenia niekanonicznych aminokwasów do białek. Co więcej, biologiczna wykonalność kodonów długości cztery i ortogonalnego rybosomu, który je dekoduje, została zademonstrowana w laboratorium. Istnieją również dowody wskazujące na istnienie nakładających się genów kodowanych przez tetrakodony; co więcej, wykazano, że tetrakodony odgrywają ważną rolę w analizie filogenetycznej, (np. ) i może to świadczyć o istnieniu pamięci genetycznej.

Wspaniała liczba właściwości kodu tessery jest zachowana w obecnych kodach. Wczesny kod i wszystkie jego potomki dziedziczą po kodzie tessera liczbę kodonów (64 tessery generują 64 kodony) i maksymalną liczbę aminokwasów (23). Kod tessery pozwala na zakodowanie 24 pierwiastków/aminokwasów. Ponieważ co najmniej jeden z nich musi reprezentować sygnał stop, maksymalna teoretyczna liczba możliwych do reprezentacji aminokwasów wynosi 23. Co ciekawe, żaden istniejący kod nie przekracza tego limitu, a maksymalna liczba aminokwasów kodowanych bezpośrednio przez niektóre genomy wynosi dokładnie 23: 20 standardowych aminokwasów plus 2 niestandardowe (selenocysteina i pirrolizyna) oraz alternatywny aminokwas inicjacyjny N-formylometionina dają razem 23. Ponadto liczba adaptorów stosowanych w kręgowym kodzie genetycznym mitochondriów wynosi 22: osiem tRNA rozpoznających po cztery kodony, 14 tRNA rozpoznających po dwa kodony oraz dwie pary kodonów niezwiązanych z aminokwasami. Co niezwykłe, 22 to absolutne minimum zaobserwowane wśród wszystkich znanych wersji kodu genetycznego. Ponadto, jest to dokładnie taka struktura, jaką implikuje model teserowy: osiem pierwotnych adapterów o degeneracji 4, plus 16 adapterów o degeneracji 2 tworzą zestaw 24 adapterów; jeśli odrzucimy dwa adaptery o degeneracji 2 przypisane do kodonów stopu, otrzymamy dokładnie 22.

Mitochondrialny kod genetyczny kręgowców i nasz model wczesnego kodu oparty na teserach mają także wiele cech związanych z symetrią (np. tabela 5). Przede wszystkim, transformacja KM, znana też jako transformacja Rumera, zastosowana do pierwszego dubletu kodonu zmienia degenerację odpowiadającego mu aminokwasu. Ta uniwersalna właściwość obserwowana jest w większości znanych wersji kodu genetycznego (zarówno jądrowego, jak i mitochondrialnego). Kod tessery również posiada tę właściwość. Na przykład, tesera AUUA odpowiada aminokwasowi o degeneracji 2, a jeśli zastosujemy transformację KM do dwóch pierwszych nukleotydów, otrzymamy teserę CGUA, która odpowiada aminokwasowi o degeneracji 4. Zauważmy, że własność ta zachodzi również wtedy, gdy zastosujemy transformację Rumera do t12t23 odwzorowania łączącego tessery i kodony opisanego powyżej. Aby uzyskać dalsze spostrzeżenia, zobacz .

Tabela 5.

Tabela porównawcza między mitochondrialnym kodem genetycznym kręgowców a kodem tesera.

.

kod genetyczny mitochondrialny kręgowców kod tessera
deg. no. kodonów deg. no. tesserae
degeneracja 2 16 2 2 16
4 8 4 8
liczba kodonów kodonów 64 tesserae 64
liczba adaptorów adaptory 22 adaptory 22
liczba aminokwasów a.a. 20 a.a. 20
symetrie
Rumer transformacja KM na dwóch pierwszych bazach zmienia degenerację a.a. Transformacja KM na dwóch pierwszych bazach zmienia zwyrodnienie a.a.
Klein V grupa 16 kodonów dzielących transformację pomiędzy pierwszą i drugą literę ma taki sam rozkład degeneracji 16 teserów dzielących transformację pomiędzy pierwszą i drugą literą mają ten sam rozkład degeneracji

Innym fundamentalnym aspektem kodu teserowego jest to, że kodowanie białka może być odporne na przesunięcia ramki +1. Odporność na utrzymywanie ramki może być również związana z kodami okrężnymi, które, jak się przypuszcza, odgrywają rolę w procesach synchronizacji ramek. Istnienie uniwersalnej własności kodu kołowego zostało powiązane z pochodzeniem kodu genetycznego jako pary komplementarnych kodonów kodujących ten sam lub podobny aminokwas. To samo przypuszczenie jest wspierane w innych kontekstach. Ta właściwość pojawia się naturalnie w kodzie tessery, gdzie tesera i jej odwrotne dopełnienie zawsze kodują ten sam aminokwas.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany.