遺伝暗号における縮退の起源について

3 進化的意味合い

我々の知る限り、テッセラ暗号は祖先の暗号における縮退の起源について初めて定量的に説明したものである。そのため、遺伝暗号の進化を説明する上で関連性があるかもしれない。本稿の後半では、テッセラコードが進化上持ちうる意味を分析する。この目的のために、現存するミトコンドリアにおける翻訳の分析に基づいて渡辺&横堀が提示した進化仮説を思い出す（図4より引用）。図4は、原始的な遺伝暗号から現在の変異体への進化のステップを表す、ある程度同意の得られるマイルストーンを示している。現存する遺伝暗号から出発し、時間を遡っていくと、最初のマイルストーン、すなわちLUCAの普遍遺伝暗号に行き着く。このコードは、現在の核標準遺伝暗号と似た構造を持っていると仮定される。現存するコードの中で最も単純なものは脊椎動物のミトコンドリア遺伝コードであり、主にこの理由から、LUCAコードの前身である初期コード（図4で右から2番目のマイルストーン）のモデルとして提案されている。初期コードから普遍コードへの移行が意味する主な進化的新機軸は、tRNAの転写後修飾の登場である。このことは、現存するメタゾーンのミトコンドリアの一部では、アンチコドンの1位のUがコドンの3位のすべての塩基と対になることができることからも裏付けられている … これにより、修飾ヌクレオチドを必要とせずにコドンのファミリーを解読することができる（ファミリーとは、最初の2塩基を共有し、同じアミノ酸をコードする4つのコドンのグループである）。渡辺 & 横堀の提案では、初期コドンは、アミノ酸の数が少なく、より退化した原始的なコード、すなわちジュークス・コードから派生したものである、とされている。このようなコードは、縮退度2である1つのアミノ酸とストップシグナルを除くファミリー、すなわち2つのコドンでコードされるものだけで形成されると考えられる。

遺伝コードの進化の表現、から引用。それぞれの円や四角はマイルストーンを表す。下の線は我々の理論が示唆するコドン長の進化を示す。

さて、我々の主な主張は、テッセラコードが初期コードの祖先、すなわち原始コードと初期コードの間に位置するプレ初期コードを示すということである。テッセラコードが前初期コード（図4の四角いマイルストーン）であることを支持する論拠がいくつかある。まず第一に、初期遺伝暗号と全く同じ縮退構造を持っていることである。さらに、テッセラ暗号は、長いオリゴヌクレオチドが暗号の起源で、その後、最適な3個に達するまでコドン長が減少したとするBaranovらの仮説と一致する。実際、Jukesの原始的な遺伝暗号は長さ4の一般的なコドンで実装できることを示す。以下の説明では、コドンという言葉を長さ4のコドンまたはテトラコドンという意味で使用する。 Jukesのコードは、縮退4のアミノ酸が15個、縮退2のアミノ酸が1個、停止コドンが2個である。このコードが4ヌクレオチドのコドンに由来すると仮定すると、44=256個のコドンの集合から2個または4個のコドンでコード化できる17個の要素/アミノ酸が選択されることになる。 256個のコドンの集合は、何らかの対称性を持つ32個のコドンの部分集合（表1のテッセラコードの最初の2列に相当）と対称性のない224個のコドンの部分集合に分割できることに注意してください。上に示したように、対称コドンは縮退度2のアミノ酸に対応し、非対称コドンは縮退度4のアミノ酸に対応する。ここで、アミノ酸へのコドンの割り当てにランダムな機構を仮定すると、最も確率の高い縮退分布はJukesのコードと正確に対応することになる。 Jukesは縮退2の要素の1つを停止信号に関連付けると仮定している。この選択により、停止コドンはランダムエラーによって生成されにくくなり、すなわちこれらの要素は縮退4のものよりも曖昧さが少なくなる。同様に、縮退度2のもう一つの要素は、開始信号をコードするアミノ酸に対応すると仮定するのが自然である。

Jukes の原始コード（Jukes 版）が長さ4のコドンによって自然に記述されることを示した。我々のアプローチでは、原始符号は2組の対称コドンと60個の非対称コドンから構成される。対称コドンは点突然変異を起こしにくいので、テッセラコードの対称性の半分を選択するための最初のステップであることに注意。対称的アンチコドンを持つ新しいアダプターが現れ、非対称的アンチコドンを持つ既存のアダプターと競合（同じアミノ酸を運ぶ）したとする。この新しいアダプターは、テッセラセット（表1の最初の2列）の一部である対称コドンに結合することができる。このようなアダプターは、非対称アンチコドンを持つアダプターよりも進化的に有利である。なぜなら、コドンとの結合に利用できる空間配置が2種類あるからである。例えば、図2のアダプターは回文アンチコドンAUUAを搭載している。このアダプターを逆さにすると、コドン／テッセラUAAUに結合することができる。この選択圧により、非対称コドンを犠牲にして、すべての対称コドン（テトラコドン）／テッセラが捕捉される。このプロセスの最後に、32個の対称的なテッセラと、必ずしもテッセラセットに属さない32個の非対称的なテトラコドンからなるコードが得られる。このとき、非対称テッセラを選択することで、さらなる最適化のステップに到達する。 , テッセラは点変異4に対して免疫があるため、復号精度の進化的圧力により、非テッセラのテトラコドンに対して生き残ることができる。 32個の対称的な四角形は点突然変異の影響を受けない（二つの四角形の間の移行を生み出すには、同時に二つの、非常に起こりにくい点突然変異が必要である）。つまり、対応するtRNAが点突然変異を受けても、認識できないアミノ酸の取り込みには至らないということである。このエラー検出の特性は、タンパク質合成の精度という点で、進化的に有利であることを意味している。残りの32個の非対称テトラコドンは必ずしも四角形ではないが、四角形であるものはエラー免疫の性質を持っているので、上記の理由により徐々に選択されることになるだろう。したがって、縮退分布が初期コードと（現存する脊椎動物のミトコンドリアコードと）一致するテッセラ前初期コードの完全な構造が得られた。

Jukes’ codeとテッセラコードの間の移行が最小限の仮定で最も可能性が高いことを示した。明らかに、この遷移において、テッセラ認識はJukes’コードのテトラコドン認識よりも特異的になる。実際、テッセラコードの誤り検出の特性により、テトラコドンアダプターのアミノ酸ローディングに関する曖昧さを低減することが可能である。さらに、テッセラコードの認識精度の向上により、タンパク質性能の進化的圧力によるアミノ酸の選択を洗練させることが可能となった

テッセラコードを前早期コードとする我々の仮説は、もう一つの大きな進化の推移、すなわちテッセラコードと初期コードの間の推移も示唆している。すなわち、テッセラコードと初期コードの間の移行である。初期コードには長さ3のコドンがあるはずなので、この移行が意味する大きな問題は、一般に有害とされるコドン長の変化に関連するものである。 (i)コドンの長さが3つでないコードの起源に関するいかなる理論もこの問題に直面しなければならない。(ii)コードが凍結した進化レベルに達したとき、これは生物のすべてのタンパク質のアミノ酸配列の劇的変化を意味するので、この移行は有害であるが、コードの起源により近い以前の進化段階では必ずしもそうでないことに注意する必要がある。テッセラ暗号は、テトラコドンからコドンへの移行という問題に対して、きちんとした解決策を見出すことを可能にする。実は、テッセラセットが担う情報は冗長である。定義によれば、テッセラの4文字のうち3文字が既知であれば、足りない文字は一意に導き出すことができる。従って、符号化理論の観点からは、テッセラコードと3塩基の遺伝暗号は同じ情報量を持つことになる。このことは、テッセラとコドンの間に一対一の対応関係が成立することを意味する。このマッピングの本質的な構造は、テッセラの隣接する文字間の変換がコドンのヌクレオチドになることを意味する。具体的には、b1b2b3b4というテッセラがあった場合、隣接する文字間の化学変換は、b1とb2間でt12 = f(b1b2)、b2とb3間でt23 = f(b2b3)、そしてb3とb4間でt34 = f(b3b4) という3つが可能である。なお、t34 = t12なので、これら3つの変換のうち2つだけが独立である。表4aでは、変換t12（行）とt23（列）に従ってテッセラコードを並べ替えたものである。 t12とt23はそれぞれコドンの1番目と2番目のヌクレオチド（x1, x2）にマッピングされることを提案する。この対応付けを表3に示す。さらに、4番目の文字b4はコドンの3番目のヌクレオチドx3にマッピングされる。この対応付けを模式的に表したものが、図5である。この対応付けによれば、テッセラセットの列は、t23＝IがNANコドン（縮退非4）に、t23＝KMがNCNコドン（ファミリーのみで構成）に対応付けられるように遺伝コードの列に対応付けられることに注意されたい（表表44bと表4cを比較されたい）。テッセラコードのこの2列は、遺伝コードの対応する列と同じ縮退（4または2＋2）を持つことが観察される。このマッピングの自然な完成は、t23 = SWをNUNコドンに、t23 = YRをNGNコドンに割り当てることである。後者の2つの割り当ては、四角形からコドンへの移行において、ルメールの対称性は確かに保たれるが、自己相補的対称性は保たれないという事実によって決まるいくつかの例外を説明する必要がある。テッセラとアンチテッセラの相互作用は、4つのワトソン・クリック的化学結合の存在により、コドン-アンチコドン間よりも特異的である。しかし、現存する遺伝暗号の場合、縮退は主に最初の2塩基のコドン-アンチコドン相互作用によって決定される。したがって、コード時代以前の結合エネルギーがワトソン・クリックと同等であると仮定すれば、テッセラ-アンチテッセラ相互作用エネルギーは実際のコドン-アンチコドンエネルギーのおよそ2倍になるはずである。

テッセラ（b1b2b3b4）とコドン（x1x2x3）の間のマッピングの模式図。

表3．7512>

テッセラとコドン間のマッピングの基本的な構成図。テッセラの塩基間の4つの変換がコドンの4つのヌクレオチドに写像される。

テッセラの変換 t12,t23 コドンの塩基 x1, x2

I ⟶12345 A

SW ⟶12345 U

I B B B B B B B C55 KM ⟶12345 C

YR ⟶12345 G

表4.に示す。

(a) 変換に従って整理されたテッセラコード：1-2番目の文字t12（行）と2-3番目の文字t23（列）；(b) (a) と同じだが矢印で示すように4分割が入れ替わっているもの。 (c) 脊椎動物のミトコンドリア遺伝暗号の縮退。 c）の脊椎動物ミトコンドリアコードのコドンと（b）のテッセラは、本文で説明した1対1の対応付けによって関連している。カルテット内部では、同じ色のテッセラが同じアミノ酸をコードしている：ピンクと緑＝2＋2、白＝4。

テッセラの変換 t12,t23		コドンの塩基 x1, x2
I	⟶12345	A
SW	⟶12345	U
I	B		B	B	B	B	B	B	C55	KM	⟶12345	C
YR	⟶12345	G

したがって、生化学的に見ると、テッセラからコドンへの変化は、テッセラの読み取りには4塩基長の特定のワトソン-クリック様のペアリングが、コドンにはウォブル戦略という移行を意味しているのである。

特に、これは、テッセラの世界には存在するが現存するコードにはないいくつかの対称性、例えば自己相補的対称性の喪失に対する理論的制約を意味する。実際、テッセラコードの各列は明確な縮退を持つが、現存するコードではこれは2列、すなわちNMN（NANまたはNCN）の種類のコドンに対してのみ当てはまる。その代わり、コドンNKN（NUNまたはNGN）に対応する列は混合縮退を持つ。特に、2つのコードの間で異なる象限は、SUNとWGNの種類（混合しないSSN WWNに対して、WSNまたはSWNを混合と呼ぶ）である。つまり、現存する遺伝暗号には、中心塩基が強いにもかかわらず縮退度2でアミノ酸をコードするWGNという種類のコドンと、中心塩基が弱いにもかかわらず縮退度4でアミノ酸をコードするSUNという種類のコドンがある。こうした特徴を、コドン-アンチコドン相互作用の立体化学に応じたエネルギー的制約から説明することが、. 現存の遺伝暗号において、弱い相互作用を持つと2＋2縮退となることが一般的である。実際、NAN, AUN, UUNのようなコドンの場合、このようなことが起こる。しかし、2文字目がUの場合、tRNAのアンチコドンループにあるプリン中心文字N35がU33によってさらに安定化され、N35の弱い性質にもかかわらず完全なファミリーを読み取ることができる。

これらのウォブル戦略の制約は、四角形からコドンへのマッピングにおいて、四分円（YR-SW）と四分円（SW-YR）、四分円（KM-SW）と四分円（I-YR）を交換することを意味している；表4（上段）参照。最終的に、テッセラの4文字目はコドンの3文字目にマッピングされるが、正しいグループ化を保証するために次の例外がある：b4 = K (T or G) なら x3 = KM(b4) 、つまりTとGが入れ替わる、それ以外は x3 = b4。この写像は必ずしも一意でないことに注意。しかし、我々の知る限り、今回のものは、テッセラコードから現存するコードに、既知の縮退特性をすべて記述して移行することが可能であることを示している。

もし、もともと、タンパク質コーディングに3塩基より長いコドンが含まれていたなら、翻訳機構はその記憶をいくらか保持していなければなりません。実際、現存するリボソームの小サブユニットは、4塩基のコドンの解読が可能なように、解読中心に追加のヌクレオチドを含めることができるような構造的自由度を示している。実際、4塩基コドンはフレームシフト抑制に関連するメカニズムとして1973年に発見され、現在では非正規アミノ酸をタンパク質に組み込むためのバイオテクノロジーの応用に広く用いられている。さらに、長さ4コドンとそれを解読する直交リボソームの生物学的な実現可能性が実験室で実証されている。また、テトラコドンによってコード化された重複遺伝子の存在を指摘する証拠もある。さらに、テトラコドンは系統解析において重要な役割を果たすことが示されており（例えば）、これは遺伝的記憶の兆候となり得る。初期のコードとその子孫はすべてテッセラコードからコドンの数（64個のテッセラが64個のコドンを生成する）とアミノ酸の最大数（23個）を受け継いでいるのである。テッセラコードは24の元素／アミノ酸をコード化することができる。このうち少なくとも1つはストップシグナルを表す必要があるため、理論上の最大表現可能アミノ酸数は23個となる。 20種類の標準アミノ酸と2種類の非標準アミノ酸（セレノシステインとピロリジン）、そして代替開始アミノ酸であるN-ホルミルメチオニンの合計が23種類であるのである。さらに、脊椎動物のミトコンドリア遺伝暗号に使われているアダプターの数は、4つのコドンを認識する8つのtRNA、2つのコドンを認識する14のtRNA、アミノ酸とは関係のない2組のコドン、計22個である。驚くべきことに、この22個という数字は、既知の遺伝暗号の中で最も少ない数字である。また、これはまさにテッセラモデルが示唆する構造であり、縮退4の8つの原始アダプターに縮退2の16アダプターを加えた24アダプターのセットを形成し、停止コドンに割り当てられた縮退2の2アダプターを捨てると、ちょうど22が得られる。

脊椎動物ミトコンドリア遺伝暗号と我々のテッセラに基づく初期暗号モデルも対称性に関するいくつかの特徴を共有している（例えば、表5）。まず何よりも、コドンの最初のダブレットに適用されるKM変換（ルーマー変換とも呼ばれる）は、対応するアミノ酸の縮退を変化させる。この普遍的な性質は、既知の遺伝暗号（核とミトコンドリアの両方）のほとんどのバージョンで観察される。テッセラコードもこの性質を持っている。例えば、テッセラAUUAは縮退度2のアミノ酸に対応し、最初の2ヌクレオチドにKM変換を施すと縮退度4のアミノ酸に対応するテッセラCGUAが得られます。なお、この性質は、上述のテッセラとコドンを結ぶ写像のt12t23にRumerの変換を適用しても成立する。さらなる考察は、.

表5.

脊椎動物のミトコンドリア遺伝暗号とテッセラ暗号の比較表を参照。

コドン数

no. tesserae

アミノ酸数

	脊椎動物ミトコンドリア遺伝暗号		テセラ暗号
	deg.
degeneracy	2	16	216
degeneracy	4	8
number コドン数	codon 64		tesserae 64
アダプター数	adaptor 22
a．a. 20		a. 20
対称性
ルーマー	KM 変換で最初の2塩基で退化したa.を変更する。a.a.		最初の2塩基のKM変換でa.a.の縮退が変化する。
Klein V group	第1文字と第2文字の変換を共有する16個のコドンは同じdegenacy分布		第1文字と第2文字の変換を共有する16個のテッセラ（tesserae）は 5590>

テセラコードのもう一つの基本は、タンパク質のコード化を+1フレームシフトに強くできることである。フレーム維持の頑健性は、フレーム同期のプロセスで役割を果たすと仮定されている循環コードとも関連することができる。普遍的な円形コードの特性は、同一または類似のアミノ酸をコードする相補的なコドンのペアとしての遺伝コードの起源と関連している。同じ推測は他の文脈でも支持されている．この性質は、テッセラコードにおいて自然に生じ、テッセラとその逆相補体は常に同じアミノ酸をコードしている

。

PMC

3 進化的意味合い

表4.に示す。

表5.

コメントを残すコメントをキャンセル

3 進化的意味合い

表4.に示す。

表5.

コメントを残す コメントをキャンセル

コメントを残すコメントをキャンセル