Eukaryotiska gener består av kodande och icke-kodande DNA-segment, som kallas exoner respektive introner.Vid första anblicken verkar det vara en onödig börda att bära DNA utan uppenbara funktioner i en gen. Man har dock insett att detta har stora evolutionära fördelar. När delar av olika gener arrangeras om på nya kromosomala platser under evolutionen kan nya gener konstrueras av delar av tidigare existerande gener.
Exons och introns
År 1977 upptäckte man oväntat att DNA:t i en eukaryotisk gen är längre än dess motsvarande mRNA. Orsaken är att vissa delar av det ursprungligen bildade primära RNA-transkriptet avlägsnas innan översättning sker. Elektronmikrografer visar att DNA och dess motsvarande transkript (RNA) är olika långa (1). När mRNA och dess komplementära enkelsträngade DNA hybridiseras uppstår slingor av enkelsträngat DNA eftersom mRNA hybridiserar endast med vissa avsnitt av det enkelsträngade DNA. I (2) visas sju slingor (A till G) och åtta hybridiserande avsnitt (1 till 7 och det ledande avsnittet L). Av de totalt 7700 DNA-basparen i denna gen (3) hybridiserar endast 1825 med mRNA. Ett hybridiserande segment kallas en exon. Ett ursprungligen transkriberat DNA-avsnitt som senare avlägsnas från det primära transkriptet är en intron. Storleken och placeringen av exoner och introner är karakteristisk för varje eukaryotisk gen (exon/intronstruktur). (Elektronmikrograf från Watson et al., 1987).
Interna DNA-sekvenser (introner)
I prokaryoter är DNA colinear med mRNA och innehåller inga introner (1). I eukaryoter är moget mRNA komplementärt till endast vissa delar av DNA eftersom det senare innehåller introner (2). (Figur anpassad från Stryer, 1995).
Grundläggande eukaryotisk genstruktur
Exonerna och intronerna är numrerade i den kodande strängens 5′ till 3′ riktning. Både exoner och introner transkriberas till ett prekursor-RNA (primärt transkript). de första och sista exonerna innehåller vanligtvis sekvenser som inte översätts. Dessa kallas 5′ untranslated region (5′ UTR) i exon 1 och 3′ UTR i 3′-änden av det sista exonet. De icke-kodande segmenten (introner) avlägsnas från det primära transkriptet och exonerna på vardera sidan kopplas samman genom en process som kallas splicing. Splicingen måste vara mycket exakt för att undvika en oönskad förändring av den korrekta läsramen. Introner börjar nästan alltid med nukleotiderna GT i 5′ till 3′-strängen (GU i RNA) och slutar med AG. De sekvenser i 5′-änden av intronet som börjar med GT kallas splektdonatorplats och i 3′-änden, som slutar med AG, kallas splekt acceptatorplats. Moget mRNA modifieras i 5′-ändan genom att lägga till en stabiliserande struktur som kallas ”cap” och genom att lägga till många adeniner i 3′-ändan (polyadenylering).
Splicing pathway in GU-AG introns
RNA-splicing är en komplex process som medieras av ett stort RNA-innehållande protein som kallas för en spliceosom. Denna består av fem typer av små nukleära RNA-molekyler (snRNA) och mer än 50 proteiner (små nukleära riboproteinpartiklar). Den grundläggande mekanismen för splicing innebär schematiskt sett en autokatalytisk klyvning i 5′-ändan av intronet, vilket resulterar i lariatbildning. Detta är en mellanliggande cirkulär struktur som bildas genom att koppla 5′-terminen (UG) till en bas (A) i intronet. Denna plats kallas för förgreningsstället. I nästa steg frigörs intronet i lariatform genom klyvning vid 3′-platsen. Samtidigt ligeras (skarvas) det högra exonet till det vänstra exonet. Lariatet avgrenas för att ge ett linjärt intron som snabbt bryts ned. Förgreningsstället identifierar 3′-ändan för exakt klyvning vid splejsningsacceptorstället. Den ligger 18-40 nukleotider uppströms (i 5′-riktningen) från 3′-splittningsstället. (Figur anpassad från Strachan och Read, 1999)