Los genes eucariotas están formados por segmentos de ADN codificantes y no codificantes, denominados exones e intrones, respectivamente.A primera vista, parece una carga innecesaria llevar ADN sin funciones obvias dentro de un gen. Sin embargo, se ha reconocido que esto tiene grandes ventajas evolutivas. Cuando partes de diferentes genes se reordenan en nuevos sitios cromosómicos durante la evolución, se pueden construir nuevos genes a partir de partes de genes previamente existentes.
Exones e intrones
En 1977, se descubrió inesperadamente que el ADN de un gen eucariota es más largo que su correspondiente ARNm. La razón es que ciertas secciones del transcrito de ARN primario inicialmente formado se eliminan antes de que se produzca la traducción. Las micrografías electrónicas muestran que el ADN y su correspondiente transcrito (ARN) tienen longitudes diferentes (1). Cuando el ARNm y su ADN monocatenario complementario se hibridan, surgen bucles de ADN monocatenario porque el ARNm sólo se hibrida con ciertas secciones del ADN monocatenario. En (2), se muestran siete bucles (A a G) y ocho secciones de hibridación (1 a 7 y la sección principal L). Del total de 7700 pares de bases de ADN de este gen (3), sólo 1825 hibridan con el ARNm. Un segmento de hibridación se denomina exón. Una sección de ADN inicialmente transcrita que posteriormente se elimina del transcrito primario es un intrón. El tamaño y la disposición de los exones e intrones son característicos de cada gen eucariota (estructura exón/intrón). (Micrografía electrónica de Watson et al., 1987).
Secuencias de ADN intrónicas (intrones)
En procariotas, el ADN es colineal con el ARNm y no contiene intrones (1). En los eucariotas, el ARNm maduro es complementario sólo a ciertas secciones del ADN porque éste contiene intrones (2). (Figura adaptada de Stryer, 1995).
Estructura básica de los genes eucariotas
Los exones e intrones se numeran en la dirección 5′ a 3′ de la cadena codificante. Tanto los exones como los intrones se transcriben en un ARN precursor (transcripción primaria).El primer y el último exón suelen contener secuencias que no se traducen. Se denominan región no traducida 5′ (5′ UTR) del exón 1 y 3′ UTR en el extremo 3′ del último exón. Los segmentos no codificantes (intrones) se eliminan del transcrito primario y los exones de ambos lados se conectan mediante un proceso llamado splicing. El empalme debe ser muy preciso para evitar un cambio indeseable del marco de lectura correcto. Los intrones casi siempre comienzan con los nucleótidos GT en la cadena 5′ a 3′ (GU en el ARN) y terminan con AG. Las secuencias en el extremo 5′ del intrón que comienzan con GT se denominan sitio donante de empalme y en el extremo 3′, que termina con AG,se denominan sitio aceptor de empalme. El ARNm maduro se modifica en el extremo 5′ añadiendo una estructura estabilizadora llamada «cap» y añadiendo muchas adeninas en el extremo 3′ (poliadenilación).
Vía de empalme en los intrones GU-AG
El empalme del ARN es un proceso complejo mediado por una gran proteína que contiene ARN llamada espliceosoma. Este consta de cinco tipos de pequeñas moléculas de ARN nuclear (snRNA) y más de 50 proteínas (pequeñas partículas de riboproteína nuclear). El mecanismo básico de empalme implica esquemáticamente la escisión autocatalítica en el extremo 5′ del intrón, lo que da lugar a la formación de un lariat. Se trata de una estructura circular intermedia formada por la conexión del extremo 5′ (UG) a una base (A) dentro del intrón. Este sitio se denomina sitio de ramificación. En la siguiente etapa, la escisión en el sitio 3′ libera el intrón en forma de lariat. Al mismo tiempo, el exón derecho se liga (empalma) al exón izquierdo. El lariat se desdobla para dar lugar a un intrón lineal que se degrada rápidamente. El sitio de bifurcación identifica el extremo 3′ para el corte preciso en el sitio aceptor de empalme. Se encuentra entre 18 y 40 nucleótidos aguas arriba (en dirección 5′) del sitio de empalme 3′. (Figura adaptada de Strachan y Read, 1999)