真核生物の遺伝子は、コードする部分とコードしない部分のDNAからなり、それぞれエクソンとイントロンと呼ばれています。 しかし、これには進化上大きな利点があることが分かってきた。 1977年、真核生物の遺伝子のDNAは、対応するmRNAよりも長いという意外な事実が発見された。 その理由は、最初に形成された一次RNA転写物のある部分が、翻訳が行われる前に取り除かれるからである。 電子顕微鏡写真を見ると、DNAとそれに対応する転写産物(RNA)は異なる長さであることがわかる(1)。 mRNAとその相補的な一本鎖DNAをハイブリダイゼーションさせると、mRNAが一本鎖DNAの特定の部分としか結合しないため、一本鎖DNAのループが発生する。 (2)では、7つのループ(A〜G)と8つの混成部分(1〜7と先頭のL)を示しています。 この遺伝子の全DNA塩基対7700個のうち(3)、mRNAとハイブリダイズするのは1825個だけである。 ハイブリダイズするセグメントをエクソンと呼ぶ。 また、最初に転写されたDNAが、その後、一次転写物から取り除かれた部分をイントロンという。 エクソンとイントロンのサイズと配置は、すべての真核生物の遺伝子に特徴的である(エクソン/イントロン構造)。 (電子顕微鏡写真、Watson et al., 1987より)
介在するDNA配列(イントロン)
原核生物では、DNAはmRNAと一続きで、イントロンは含まれていない(1)。 真核生物では成熟したmRNAはDNAのある部分と相補的であるが、これは後者がイントロンを含んでいるからである(2)。 (図:Stryer, 1995より引用)
真核生物の基本的な遺伝子構造
エクソンとイントロンはコーディング鎖の5から3方向に番号付けされる。 エキソンとイントロンは共に前駆体RNA(一次転写物)に転写される。最初と最後のエキソンは通常、翻訳されない配列を含む。 これらは、エキソン1の5′非翻訳領域(5′UTR)および最後のエキソンの3′末端の3′UTRと呼ばれる。 非コード化セグメント(イントロン)は一次転写産物から除去され、両側のエクソンはスプライシングと呼ばれるプロセスによって連結される。 スプライシングは、正しい読み枠の望ましくない変化を避けるために、非常に正確でなければならない。 イントロンは、ほとんどの場合、5′から3′鎖のGT(RNAではGU)で始まり、AGで終わります。 イントロンのGTで始まる5′末端の配列をスプライスドナーサイト、AGで終わる3′末端の配列をスプライスアクセプターサイトと呼ぶ。 成熟したmRNAは、5’末端にキャップと呼ばれる安定化構造を付加し、3’末端に多くのアデニンを付加することで修飾される(ポリアデニル化)
Splicing pathway in GU-AG introns
RNA splicing is the complex process mediated by the large RNA-containing protein called a spliceosome. これは5種類の核小RNA分子(snRNA)と50種類以上のタンパク質(核小Riboprotein粒子)から構成されている。 スプライシングの基本的なメカニズムは、イントロンの5’末端で自己触媒的に切断され、ラリアートが形成されることを模式的に示している。 これは、イントロンの5′末端(UG)と塩基(A)が結合して形成される中間的な環状構造であり、このラリアートは、イントロンの5′末端(UG)とイントロン内の塩基(A)が結合して形成される。 この部位を分岐部位と呼ぶ。 次の段階では、3′部位で切断され、イントロンがラリアート状に放出される。 同時に右エキソンは左エキソンにライゲーション(スプライシング)される。 ラリアートは切断され、線状のイントロンとなり、これは急速に分解される。 分岐部位は、スプライスアクセプター部位で正確に切断されるための3′末端を特定する。 これは3-40ヌクレオチド上流(5-方向)に位置する。 (図はStrachan and Read, 1999より引用)