Eukaryotische Gene bestehen aus kodierenden und nicht kodierenden DNA-Abschnitten, den so genannten Exons bzw. Introns, die auf den ersten Blick eine unnötige Belastung darstellen, da sie DNA ohne offensichtliche Funktion in einem Gen enthalten. Man hat jedoch erkannt, dass dies große evolutionäre Vorteile mit sich bringt. Wenn Teile verschiedener Gene im Laufe der Evolution an neuen Chromosomenstellen neu angeordnet werden, können neue Gene aus Teilen bereits existierender Gene konstruiert werden.
Exons und Introns
Im Jahr 1977 wurde unerwartet festgestellt, dass die DNA eines eukaryotischen Gens länger ist als die entsprechende mRNA. Der Grund dafür ist, dass bestimmte Abschnitte des ursprünglich gebildeten primären RNA-Transkripts entfernt werden, bevor die Translation stattfindet. Elektronenmikroskopische Aufnahmen zeigen, dass die DNA und das entsprechende Transkript (RNA) unterschiedlich lang sind (1). Wenn mRNA und ihre komplementäre einzelsträngige DNA hybridisiert werden, entstehen Schleifen aus einzelsträngiger DNA, weil mRNA nur mit bestimmten Abschnitten der einzelsträngigen DNA hybridisiert. In (2) sind sieben Schleifen (A bis G) und acht Hybridisierungsabschnitte (1 bis 7 und der führende Abschnitt L) dargestellt. Von den insgesamt 7700 DNA-Basenpaaren dieses Gens (3) hybridisieren nur 1825 mit der mRNA. Ein hybridisierender Abschnitt wird als Exon bezeichnet. Ein ursprünglich transkribierter DNA-Abschnitt, der später aus dem primären Transkript entfernt wird, ist ein Intron. Die Größe und Anordnung von Exons und Introns ist für jedes eukaryontische Gen charakteristisch (Exon/Intron-Struktur). (Elektronenmikroskopische Aufnahme aus Watson et al., 1987).
Intronierende DNA-Sequenzen (Introns)
In Prokaryoten ist die DNA kolinear mit der mRNA und enthält keine Introns (1). Bei Eukaryonten ist die reife mRNA nur zu bestimmten Abschnitten der DNA komplementär, da letztere Introns enthält (2). (Abbildung übernommen von Stryer, 1995).
Grundlegende eukaryotische Genstruktur
Exons und Introns sind in der 5′- bis 3′-Richtung des kodierenden Strangs nummeriert. Sowohl Exons als auch Introns werden in eine Vorläufer-RNA (primäres Transkript) umgeschrieben, wobei das erste und das letzte Exon in der Regel Sequenzen enthalten, die nicht übersetzt werden. Diese werden als die 5′ untranslatierte Region (5′ UTR) von Exon 1 und die 3′ UTR am 3′-Ende des letzten Exons bezeichnet. Die nicht kodierenden Segmente (Introns) werden aus dem primären Transkript entfernt, und die Exons auf beiden Seiten werden durch einen als Spleißen bezeichneten Prozess miteinander verbunden. Das Spleißen muss sehr präzise erfolgen, um eine unerwünschte Veränderung des korrekten Leserasters zu vermeiden. Introns beginnen fast immer mit den Nukleotiden GT im 5′ bis 3′-Strang (GU in RNA) und enden mit AG. Die Sequenzen am 5′-Ende des Introns, die mit GT beginnen, werden als Spleiß-Donor-Stelle und am 3′-Ende, das mit AG endet, als Spleiß-Akzeptor-Stelle bezeichnet. Die reife mRNA wird am 5?-Ende durch das Hinzufügen einer stabilisierenden Struktur, der so genannten „Kappe“, und durch das Hinzufügen vieler Adenine am 3′-Ende (Polyadenylierung) modifiziert.
Spleißweg in GU-AG-Introns
Das Spleißen von RNA ist ein komplexer Prozess, der durch ein großes RNA-enthaltendes Protein, das so genannte Spliceosom, vermittelt wird. Dieses besteht aus fünf Arten von kleinen Kern-RNA-Molekülen (snRNA) und mehr als 50 Proteinen (kleine Kern-Riboproteinpartikel). Der grundlegende Mechanismus des Spleißens beinhaltet schematisch eine autokatalytische Spaltung am 5′-Ende des Introns, die zur Bildung eines Lariats führt. Dabei handelt es sich um eine kreisförmige Zwischenstruktur, die durch die Verbindung des 5′-Terminus (UG) mit einer Base (A) innerhalb des Introns gebildet wird. Diese Stelle wird als Verzweigungsstelle bezeichnet. In der nächsten Phase wird das Intron durch Spaltung an der 3′-Stelle in Form eines Lariats freigesetzt. Gleichzeitig wird das rechte Exon an das linke Exon ligiert (gespleißt). Das Lariat wird abgezweigt, um ein lineares Intron zu erhalten, das schnell abgebaut wird. Die Verzweigungsstelle identifiziert das 3′-Ende für die präzise Spaltung an der Spleißakzeptorstelle. Sie liegt 18-40 Nukleotide stromaufwärts (in 5′-Richtung) von der 3′-Spleißstelle. (Abbildung angepasst von Strachan und Read, 1999)