O genoma humano tem aproximadamente 20.000 genes codificantes de proteínas, mas o proteoma humano contém estimados 80.000 a 400.000 proteínas distintas. Como isso é possível? A maior parte da resposta é o splicing alternativo — a capacidade de um único gene produzir múltiplas isoformas de mRNA por inclusão ou exclusão seletiva de diferentes éxons.
O splicing alternativo é como ter um único arquivo de código que, dependendo de flags de compilação, produz executáveis completamente diferentes. Mesma fonte, múltiplas saídas funcionais.
Revisão do Splicing
Após a transcrição, o pré-mRNA inclui tanto éxons quanto íntrons. O spliceossomo — um complexo de ~5 snRNAs (U1, U2, U4, U5, U6) e >150 proteínas — remove os íntrons e une os éxons em uma reação de dois passos de transesterificação.
O spliceossomo reconhece:
- Sítio de splicing 5': bordas éxon|íntron, conservadas como GU no RNA
- Sítio de splicing 3': bordas íntron|éxon, terminando em AG
- Ponto de ramificação: adenosina ~20–50 nt upstream do sítio 3'
- Tract de polipirimidina: entre o ponto de ramificação e o sítio 3', reconhecido por U2AF
O splicing padrão (também chamado de splicing constitutivo) sempre inclui os mesmos éxons. O splicing alternativo seleciona de forma variável entre éxons alternativos.
Os Cinco Modos de Splicing Alternativo
1. Skipping de Éxon
O modo mais comum (~40% dos eventos de splicing alternativo). Um éxon interno e seus íntrons flanqueadores são removidos juntos. O resultado é um mRNA menor com uma sequência de proteína potencialmente truncada ou alterada.
Exemplo: o éxon 7 de SMN2 é frequentemente pulado, produzindo uma proteína truncada. Drogas como nusinersen (Spinraza) corrigem isso, tratando a atrofia muscular espinhal.
2. Sítios de Splicing 5' Alternativos
Diferentes posições de início de íntron são usadas, alterando o limite 5' do éxon upstream. Isso pode adicionar ou remover alguns aminoácidos do produto proteico.
3. Sítios de Splicing 3' Alternativos
Diferentes posições de término de íntron são usadas, alterando o limite 3' do éxon downstream.
4. Retenção de Íntron
Um íntron não é removido e permanece no mRNA maduro. Muito mais comum em plantas; relativamente raro em animais, mas ocorre — muitas vezes como mecanismo de silenciamento gênico (o mRNA retido com íntron é degradado por NMD).
5. Éxons Mutuamente Exclusivos
Dois éxons que nunca são incluídos juntos no mesmo mRNA. A proteína troponina T muscular tem um par de éxons mutuamente exclusivos regulados pelo tipo de músculo (cardíaco vs. esquelético).
Reguladores do Splicing
O splicing alternativo não é aleatório — é precisamente controlado por proteínas de ligação ao RNA que reconhecem sequências curtas no pré-mRNA e recrutam ou antagonizam o spliceossomo:
Proteínas SR (ricas em serina-arginina): geralmente ativadoras de splicing quando ligadas a exonic splicing enhancers (ESEs). Promovem o reconhecimento do éxon pelo spliceossomo.
Proteínas hnRNP: geralmente repressoras quando ligadas a exonic splicing silencers (ESSs) ou intronic splicing silencers (ISSs). Bloqueiam a ligação do spliceossomo.
A concentração relativa de proteínas SR vs. hnRNP difere entre tipos de células, resultando em padrões de splicing diferentes para os mesmos pré-mRNAs. Isso é um mecanismo fundamental de identidade de tipo celular.
Consequências Funcionais do Splicing Alternativo
Isoformas diferentes de proteínas criadas pelo splicing alternativo podem ter:
Domínios diferentes: a inclusão/exclusão de um éxon pode adicionar ou remover um domínio inteiro de proteína. A receptor tirosina quinase FGFR1 tem isoformas com diferentes domínios de ligação ao ligante, conferindo especificidade de ligante ao FGF diferente.
Propriedades de localização diferentes: peptídeos de sinalização ou âncoras de membrana codificados em éxons alternativos.
Propriedades regulatórias diferentes: a isoforma curta de VEGF (VEGF-121) é secretada; a isoforma longa (VEGF-165) está ligada à heparina e permanece perto da célula. Ambas as isoformas são codificadas pelo mesmo gene, com propriedades funcionais diferentes criadas pelo splicing.
Atividade oposta: Bcl-x longa é antiapoptótica; Bcl-x curta (da inclusão alternativa do éxon) é pró-apoptótica. Drogas modificadoras de splicing que mudam o equilíbrio Bcl-xL/Bcl-xS estão em desenvolvimento clínico para câncer.
Mutações de Splicing e Doença
Mutações que afetam o splicing são uma das categorias de variante mais importantes em doenças genéticas:
Mutações no sítio de splicing canônico: mudanças nos dinucleotídeos GT ou AG quase sempre destroem o sítio de splicing. O resultado é tipicamente skipping de éxon ou retenção de íntron.
Mutações no ponto de ramificação: mais raras, mas causam skipping de éxon.
Mutações ESE/ESS: mudam ESEs ou ESSs, alterando o reconhecimento do éxon. Podem ser clinicamente silenciosas (sinônimas no nível de aminoácidos) mas funcionalmente deletérias.
Ativação de sítio críptico: uma mutação pode criar uma nova sequência que se parece com um sítio de splicing, redirecionando o spliceossomo para uma posição anormal.
O SpliceAI é uma rede neural profunda que prediz o efeito de qualquer variante no splicing, pontuando a criação ou destruição de sítios de splicing com alta precisão. Está disponível via web e linha de comando. Está agora integrado ao fluxo de trabalho de classificação de variantes de laboratórios clínicos. Para qualquer variante próxima a uma borda éxon-íntron (±50 pb), verificar o escore SpliceAI é boa prática.
Terapêutica Modificadora de Splicing
O splicing tornou-se um alvo terapêutico:
Oligonucleotídeos antisense (ASOs): pequenas moléculas de RNA sintético que ligam a sequências específicas do pré-mRNA e bloqueiam sítios de splicing ou sequências regulatórias. Nusinersen (atrofia muscular espinhal), mipomersen (hipercolesterolemia).
Pequenas moléculas: risdiplam (atrofia muscular espinhal) modifica o splicing do SMN2 para incluir o éxon 7 por ligação a uma proteína SR.
Medindo o Splicing Alternativo
O RNA-seq pode detectar isoformas alternativas:
Nível de isoforma: contagem de reads que mapeiam para transcritos específicos. Ferramentas: Salmon, RSEM, kallisto.
Evento de nível de éxon: para cada evento de splicing candidato, PSI (Percent Spliced In) mede a proporção de transcritos que incluem o éxon: PSI = reads de inclusão / (reads de inclusão + reads de exclusão).
Ferramentas de análise de splicing diferencial: rMATS, SUPPA2, DEXSeq.
Por Que o Splicing Alternativo Importa para a Bioinformática
- Mapeamento de leituras de RNA-seq: reads que abrangem junções de éxons precisam ser mapeadas corretamente em relação às isoformas conhecidas — STAR e HISAT2 fazem isso por padrão
- Quantificação de nível de transcrição: distinguir entre isoformas de um mesmo gene requer reads de éxon de comprimento total ou dados de sequenciamento de longa leitura
- Anotação de variantes: variantes em éxons constitutivos têm impacto garantido; variantes em éxons cassete afetam apenas isoformas que o incluem
- Análise de proteoma: proteômica de massa pode distinguir peptídeos exclusivos de diferentes isoformas, validando a expressão da proteína isoforma-específica
O splicing alternativo é onde a complexidade do genoma de 20.000 genes se expande para um proteoma de centenas de milhares de proteínas distintas.