Eukaryotiske gener består af kodende og ikke-kodende DNA-segmenter, kaldet henholdsvis exoner og introner.Ved første øjekast synes det at være en unødvendig byrde at bære DNA uden åbenlyse funktioner i et gen. Det er imidlertid blevet erkendt, at dette har store evolutionære fordele. Når dele af forskellige gener omarrangeres på nye kromosomale steder i løbet af evolutionen, kan nye gener konstrueres af dele af tidligere eksisterende gener.
Exons og introner
I 1977 fandt man uventet ud af, at DNA’et i et eukaryote gen er længere end dets tilsvarende mRNA. Årsagen er, at visse dele af det oprindeligt dannede primære RNA-transkript fjernes, før oversættelsen finder sted. Elektronmikrografer viser, at DNA og dets tilsvarende transkript (RNA) er af forskellig længde (1). Når mRNA og dets komplementære enkeltstrengede DNA hybridiseres, opstår der sløjfer af enkeltstrenget DNA, fordi mRNA kun hybridiserer med visse dele af det enkeltstrengede DNA. I (2) er der vist syv loops (A til G) og otte hybridiseringsafsnit (1 til 7 og det ledende afsnit L). Af de i alt 7700 DNA-basepar i dette gen (3) hybridiserer kun 1825 med mRNA. Et hybridiserende segment kaldes en exon. Et oprindeligt transskriberet DNA-afsnit, der efterfølgende fjernes fra det primære transkript, er et intron. Størrelsen og placeringen af exoner og introner er karakteristisk for alle eukaryote gener (exon/intron-struktur). (Elektronmikroskopisk billede fra Watson et al., 1987).
Interonsekvenser i DNA-sekvenser (introner)
I prokaryoter er DNA kolineært med mRNA og indeholder ingen introner (1). I eukaryoter er det modne mRNA kun komplementært til visse dele af DNA, fordi sidstnævnte indeholder introner (2). (Figuren er tilpasset fra Stryer, 1995).
Grundlæggende eukaryote genstruktur
Exons og introns er nummereret i 5′ til 3′-retningen i den kodende streng. Både exons og introns transskriberes til et forløber-RNA (primær transkript). den første og den sidste exon indeholder normalt sekvenser, der ikke oversættes. Disse sekvenser kaldes den 5′ utranslaterede region (5′ UTR) i exon 1 og 3′ UTR i 3′-enden af det sidste exon. De ikke-kodende segmenter (introner) fjernes fra det primære transkript, og exonerne på hver side forbindes ved en proces, der kaldes splejsning. Splejsning skal være meget præcis for at undgå en uønsket ændring af den korrekte læseramme. Introner begynder næsten altid med nukleotiderne GT i 5′ til 3′-strengen (GU i RNA) og slutter med AG. De sekvenser i 5′-enden af intronet, der begynder med GT, kaldes splejsedonorsted, og i 3′-enden, der slutter med AG, kaldes splejsedonorsted. Modent mRNA modificeres i 5′-enden ved at tilføje en stabiliserende struktur kaldet en “cap” og ved at tilføje mange adeniner i 3′-enden (polyadenylering).
Splicing pathway in GU-AG introns
RNA-splicing er en kompleks proces, der formidles af et stort RNA-holdigt protein kaldet et spliceosom. Dette består af fem typer af små nukleare RNA-molekyler (snRNA) og mere end 50 proteiner (små nukleare riboproteinpartikler). Den grundlæggende mekanisme for splejsning indebærer skematisk set autokatalytisk spaltning i 5′-enden af intronet, hvilket resulterer i lariatdannelse. Dette er en mellemliggende cirkulær struktur, der dannes ved at forbinde 5′-terminus (UG) med en base (A) i intronet. Dette sted kaldes forgreningsstedet. I den næste fase frigøres intronet i lariat-form ved spaltning på 3′-stedet. Samtidig bliver det højre exon ligeret (splejset) til det venstre exon. Lariatet afgrenes for at give et lineært intron, og dette nedbrydes hurtigt. Forgreningsstedet identificerer 3′-enden med henblik på præcis spaltning på splejsningsacceptorstedet. Den ligger 18-40 nukleotider opstrøms (i 5′-retningen) fra 3′-splejsestedet. (Figur tilpasset fra Strachan og Read, 1999)