Eukaryotic genes consistem em segmentos codificadores e não codificadores de DNA, chamados exons e introns, respectivamente. No entanto, tem sido reconhecido que isto tem grandes vantagens evolutivas. Quando partes de diferentes genes são rearranjadas em novos locais cromossômicos durante a evolução, novos genes podem ser construídos a partir de partes de genes previamente existentes.
Exons e introns
Em 1977, descobriu-se inesperadamente que o DNA de um gene eucariótico é mais longo que o seu mRNA correspondente. A razão é que certas seções da transcrição do RNA primário inicialmente formado são removidas antes que a tradução ocorra. Micrografias eletrônicas mostram que o DNA e sua transcrição correspondente (RNA) são de comprimentos diferentes (1). Quando o mRNA e o seu ADN de cadeia única complementar são hibridizados, surgem loops de ADN de cadeia única porque o mRNA hibridiza apenas com certas secções do ADN de cadeia única. Em (2), são mostrados sete loops (A a G) e oito secções de hibridação (1 a 7 e a secção principal L). Do total de 7700 pares de base de DNA deste gene (3), apenas 1825 hibridizam com mRNA. Um segmento de hibridização é chamado de exon. Uma secção de ADN inicialmente transcrita que é subsequentemente removida da transcrição primária é um intrão. O tamanho e a disposição dos exons e introns são característicos de cada gene eucariótico (exon/intron estrutura). (Micrografia eletrônica de Watson et al., 1987).
Intervening DNA sequences (introns)
Em procariotas, o DNA é colinear com mRNA e não contém introns (1). Em eucariotas, o mRNA maduro é complementar apenas a certas secções do ADN porque este último contém intrões (2). (Figura adaptada de Stryer, 1995).
Estrutura genética básica eucariótica
Exões e introns são numerados na direção 5′ a 3′ da linha de codificação. Tanto os exons quanto os introns são transcritos em um RNA precursor (transcrição primária). O primeiro e o último exons geralmente contêm seqüências que não são traduzidas. Estes são chamados de 5′ untranslated region (5′ UTR) do exon 1 e o 3′ UTR no final do último exon. Os segmentos não codificados (introns) são removidos da transcrição primária e os exons de cada lado são ligados por um processo chamado splicing. A emenda deve ser muito precisa para evitar uma mudança indesejável do quadro de leitura correto. Os introns quase sempre começam com os nucleotídeos GT no fio 5′ a 3′ (GU em RNA) e terminam com AG. As sequências no final do intron 5′, começando com GT, são chamadas site doador de emendas e no final de 3′, terminando com AG, são chamadas site aceitador de emendas. O mRNA maduro é modificado no final de 5? adicionando uma estrutura estabilizadora chamada “cap” e adicionando muitas adeninas no final de 3′(poliadenilação).
Percurso de emenda em introns GU-AG
A emenda de RNA é um processo complexo mediado por uma grande proteína contendo RNA chamada spliceosome. Este consiste em cinco tipos de pequenas moléculas de RNA nuclear (snRNA) e mais de 50 proteínas (pequenas partículas de riboproteínas nucleares). O mecanismo básico de emenda esquematicamente envolve a clivagem autocatalítica no final de 5’end do intron resultando na formação de lariat. Esta é uma estrutura circular intermediária formada pela conexão do terminal 5′ (UG) a uma base (A) dentro do intron. Este site é chamado de site do ramo. Na etapa seguinte, a clivagem no site 3′ libera o intron em forma de lariat. Ao mesmo tempo, o exão direito é ligado (emendado) ao exão esquerdo. O lariat é ligado para produzir um intrão linear e este é rapidamente degradado. O site do ramo identifica a extremidade 3′ para uma clivagem precisa no local de aceitação da emenda. Ela se encontra 18-40 nucleotídeos a montante (na direção 5′) do site 3′ splice. (Figura adaptada de Strachan e Read, 1999)