Eukaryotické geny se skládají z kódujících a nekódujících úseků DNA, tzv. exonů a intronů.Na první pohled se zdá, že nést v genu DNA bez zjevné funkce je zbytečná zátěž. Bylo však zjištěno, že to má velké evoluční výhody. Když se během evoluce přeskupí části různých genů na nových chromozomálních místech, mohou být z částí dříve existujících genů vytvořeny nové geny.
Exony a introny
V roce 1977 bylo nečekaně zjištěno, že DNA eukaryotického genu je delší než odpovídající mRNA. Důvodem je, že určité úseky původně vytvořeného primárního transkriptu RNA jsou odstraněny předtím, než dojde k translaci. Elektronové mikrofotografie ukazují, že DNA a jí odpovídající transkript (RNA) jsou různě dlouhé (1). Při hybridizaci mRNA a její komplementární jednovláknové DNA vznikají smyčky jednovláknové DNA, protože mRNA hybridizuje pouze s určitými úseky jednovláknové DNA. Na obrázku (2) je znázorněno sedm smyček (A až G) a osm hybridizujících úseků (1 až 7 a vedoucí úsek L). Z celkového počtu 7700 párů bází DNA tohoto genu (3) jich pouze 1825 hybridizuje s mRNA. Hybridizující úsek se nazývá exon. Původně přepisovaný úsek DNA, který je následně odstraněn z primárního transkriptu, se nazývá intron. Velikost a uspořádání exonů a intronů jsou charakteristické pro každý eukaryotický gen (struktura exon/intron). (Elektronový mikrograf podle Watsona a kol., 1987).
Vnitřní sekvence DNA (introny)
U prokaryot je DNA kolineární s mRNA a neobsahuje introny (1). U eukaryot je zralá mRNA komplementární pouze k některým úsekům DNA, protože ta obsahuje introny (2). (Obrázek převzat ze Stryera, 1995).
Základní struktura eukaryotického genu
Exony a introny jsou číslovány ve směru od 5′ ke 3′ kódujícího vlákna. Exony i introny jsou přepisovány do prekurzorové RNA (primární transkript). první a poslední exon obvykle obsahují sekvence, které nejsou překládány. Ty se nazývají 5′ nepřekládaná oblast (5′ UTR) exonu 1 a 3′ UTR na 3′ konci posledního exonu. Nekódující úseky (introny) jsou z primárního transkriptu odstraněny a exony na obou stranách jsou spojeny procesem zvaným sestřih. Splicing musí být velmi přesný, aby nedošlo k nežádoucí změně správného čtecího rámce. Introny téměř vždy začínají nukleotidy GT v 5′ až 3′ řetězci (GU v RNA) a končí AG. Sekvence na 5′ konci intronu začínající GT se nazývají dárcovské místo sestřihu a na 3′ konci končící AG se nazývají akceptorové místo sestřihu. Zralá mRNA je na 5? konci modifikována přidáním stabilizační struktury zvané „čepička“ a přidáním mnoha adeninů na 3’konec (polyadenylace).
Splicing pathway in GU-AG introns
Splicing RNA je složitý proces, který zprostředkovává velký protein obsahující RNA zvaný spliceosome. Ten se skládá z pěti typů malých jaderných molekul RNA (snRNA) a více než 50 proteinů (malých jaderných riboproteinových částic). Základní mechanismus sestřihu schematicky zahrnuje autokatalytické štěpení na 5’konci intronu, jehož výsledkem je tvorba lariátu. Jedná se o mezilehlou kruhovou strukturu, která vzniká spojením 5´konce (UG) s bází (A) uvnitř intronu. Toto místo se nazývá místo větvení. V další fázi se štěpením v místě 3′ uvolní intron ve formě lariátu. Současně se pravý exon liguje (splicuje) s levým exonem. Lariat se odštěpí a vznikne lineární intron, který se rychle rozloží. Místo větvení určuje 3′ konec pro přesné štěpení v místě akceptoru sestřihu. Leží 18-40 nukleotidů proti proudu (ve směru 5′) od 3′ místa sestřihu. (Obrázek převzat ze Strachan a Read, 1999)