Geny eukariotyczne składają się z kodujących i niekodujących odcinków DNA, zwanych odpowiednio egzonami i intronami.Na pierwszy rzut oka wydaje się, że przenoszenie DNA bez oczywistych funkcji w obrębie genu jest niepotrzebnym obciążeniem. Uznano jednak, że ma to ogromne zalety ewolucyjne. Kiedy części różnych genów są rearanżowane na nowych miejscach chromosomalnych podczas ewolucji, nowe geny mogą być konstruowane z części wcześniej istniejących genów.
Eksony i introny
W 1977 roku nieoczekiwanie odkryto, że DNA genu eukariotycznego jest dłuższe niż odpowiadające mu mRNA. Powodem jest to, że pewne odcinki początkowo utworzonego pierwotnego transkryptu RNA są usuwane, zanim nastąpi translacja. Mikrografy elektronowe pokazują, że DNA i odpowiadający mu transkrypt (RNA) mają różne długości (1). Kiedy mRNA i jego komplementarny jednoniciowy DNA są hybrydyzowane, powstają pętle jednoniciowego DNA, ponieważ mRNA hybrydyzuje tylko z pewnymi odcinkami jednoniciowego DNA. W (2) pokazano siedem pętli (od A do G) i osiem hybrydyzuj±cych odcinków (od 1 do 7 i odcinek wiod±cy L). Z całkowitej liczby 7700 par zasad DNA tego genu (3), tylko 1825 hybrydyzuje z mRNA. Hybrydyzujący odcinek nazywany jest eksonem. Początkowo transkrybowany odcinek DNA, który jest następnie usuwany z pierwotnego transkryptu, to intron. Rozmiar i rozmieszczenie eksonów i intronów są charakterystyczne dla każdego genu eukariotycznego (struktura ekson/intron). (Mikrograf elektronowy z Watson i in., 1987).
Interferencyjne sekwencje DNA (introny)
W prokariotach, DNA jest współliniowe z mRNA i nie zawiera intronów (1). U eukariotów, dojrzały mRNA jest komplementarny tylko do niektórych odcinków DNA, ponieważ ten ostatni zawiera introny (2). (Rysunek zaadaptowany ze Stryer, 1995).
Podstawowa struktura genów eukariotycznych
Eksony i introny są ponumerowane w kierunku od 5′ do 3′ nici kodującej. Zarówno eksony, jak i introny są przepisywane na prekursor RNA (transkrypt pierwotny).Pierwszy i ostatni ekson zawierają zwykle sekwencje, które nie ulegają translacji. Są one nazywane 5′ nieulegającym translacji regionem (5′ UTR) eksonu 1 oraz 3′ UTR na 3′ końcu ostatniego eksonu. Segmenty niekodujące (introny) są usuwane z pierwotnego transkryptu, a eksony po obu stronach są łączone w procesie zwanym splicingiem. Splicing musi być bardzo precyzyjny, aby uniknąć niepożądanej zmiany prawidłowej ramki odczytu. Introny prawie zawsze zaczynają się od nukleotydów GT w łańcuchu 5′ do 3′ (GU w RNA) i kończą się AG. Sekwencje na 5′ końcu intronu zaczynające się od GT nazywane są miejscem donorowym splotu, a na 3′ końcu, kończące się AG, nazywane są miejscem akceptorowym splotu. Dojrzałe mRNA jest modyfikowane na 5’końcu przez dodanie struktury stabilizującej zwanej „czapeczką” oraz przez dodanie wielu adenin na 3’końcu (poliadenylacja).
Scieżka splicingu w intronach GU-AG
Splicing RNA jest złożonym procesem, w którym pośredniczy duże białko zawierające RNA zwane spliceosomem. Składa się on z pięciu typów małych jądrowych cząsteczek RNA (snRNA) i ponad 50 białek (małych jądrowych cząsteczek ryboprotein). Podstawowy mechanizm splicingu polega na autokatalitycznym rozszczepieniu na 5’końcu intronu, w wyniku czego powstaje lariat. Jest to pośrednia kolista struktura powstająca przez połączenie 5′ terminusa (UG) z zasadą (A) w obrębie intronu. Miejsce to nazywane jest miejscem rozgałęzienia. W kolejnym etapie, rozszczepienie w miejscu 3′ uwalnia intron w formie lariatów. W tym samym czasie prawy ekson jest ligowany (spliced) do lewego eksonu. Lariat ulega rozszczepieniu, dając liniowy intron, który ulega szybkiej degradacji. Miejsce rozgałęzienia identyfikuje koniec 3′ do precyzyjnego rozszczepienia w miejscu akceptora splicingu. Znajduje się ono 18-40 nukleotydów w górę (w kierunku 5′) od miejsca 3′ splicingu. (Rysunek zaadaptowany z Strachan i Read, 1999)
.