Genele eucariote sunt alcătuite din segmente de ADN codificatoare și necodificatoare, numite exoni și, respectiv, introni.La prima vedere, pare a fi o povară inutilă să se transporte ADN fără funcții evidente în cadrul unei gene. Cu toate acestea, a fost recunoscut faptul că acest lucru are mari avantaje evolutive. Atunci când părți din diferite gene sunt rearanjate pe noi situsuri cromozomiale în timpul evoluției, noi gene pot fi construite din părți ale unor gene existente anterior.
Exoni și introni
În 1977, s-a constatat în mod neașteptat că ADN-ul unei gene eucariote este mai lung decât ARNm corespunzător. Motivul este că anumite secțiuni din transcriptul ARN primar format inițial sunt eliminate înainte de a avea loc traducerea. Micrografiile electronice arată că ADN-ul și transcriptul său corespunzător (ARN) au lungimi diferite (1). Atunci când ARNm și ADN-ul său complementar monocatenar sunt hibridizate, apar bucle de ADN monocatenar, deoarece ARNm se hibridizează numai cu anumite secțiuni ale ADN-ului monocatenar. În (2), sunt reprezentate șapte bucle (de la A la G) și opt secțiuni de hibridare (de la 1 la 7 și secțiunea principală L). Din totalul de 7700 de perechi de baze ADN ale acestei gene (3), doar 1825 se hibridizează cu ARNm. Un segment hibridizant se numește exon. O secțiune de ADN transcrisă inițial care este ulterior eliminată din transcrierea primară este un intron. Dimensiunea și dispunerea exonilor și intronilor sunt caracteristice pentru fiecare genă eucariotă (structura exon/intron). (Micrografie electronică din Watson et al., 1987).
Secvențe de ADN intercalate (introni)
La procariote, ADN-ul este coliniar cu ARNm și nu conține introni (1). La eucariote, ARNm matur este complementar doar cu anumite secțiuni de ADN, deoarece acesta din urmă conține introni (2). (Figura adaptată după Stryer, 1995).
Structura de bază a genelor eucariote
Exonii și intronii sunt numerotați în direcția 5′ spre 3′ a șirului de codificare. Atât exonii, cât și intronii sunt transcriși într-un ARN precursor (transcript primar). primul și ultimul exon conțin, de obicei, secvențe care nu sunt traduse. Acestea se numesc regiunea netranslatată 5′ (5′ UTR) a exonului 1 și 3′ UTR la capătul 3′ al ultimului exon. Segmentele necodificatoare (introni) sunt eliminate din transcrierea primară, iar exonii de o parte și de alta sunt conectați printr-un proces numit splicing. Splicingul trebuie să fie foarte precis pentru a evita o modificare nedorită a cadrului de citire corect. Intronii încep aproape întotdeauna cu nucleotidele GT în șirul 5′ la 3′ (GU în ARN) și se termină cu AG. Secvențele de la capătul 5′ al intronului care încep cu GT se numesc situs donator de îmbinare, iar cele de la capătul 3′, care se termină cu AG, se numesc situs acceptor de îmbinare. ARNm matur este modificat la capătul 5? prin adăugarea unei structuri stabilizatoare numită „cap” și prin adăugarea multor adenine la capătul 3′ (poliadenilare).
Calea de splicare în intronii GU-AG
Splicarea ARN este un proces complex mediat de o proteină mare care conține ARN numită spliceosom. Acesta este format din cinci tipuri de molecule de ARN nuclear mic (snRNA) și peste 50 de proteine (particule mici de riboproteine nucleare). Mecanismul de bază al splicingului implică, în mod schematic, scindarea autocatalitică la capătul 5′ al intronului, ceea ce duce la formarea lariatului. Aceasta este o structură circulară intermediară formată prin conectarea terminației 5′ (UG) la o bază (A) din cadrul intronului. Acest loc se numește locul de ramificare. În etapa următoare, scindarea la locul 3′ eliberează intronul în formă de lariat. În același timp, exonul drept este legat (splicat) la exonul stâng. Lariatul este destrămat pentru a produce un intron liniar, iar acesta este degradat rapid. Locul de ramificare identifică capătul 3′ pentru o clivare precisă la locul de acceptare a îmbinării. Acesta se află la 18-40 de nucleotide în amonte (în direcția 5′) de locul de racordare 3′. (Figura adaptată după Strachan și Read, 1999)