Gêmeos idênticos compartilham a mesma sequência de DNA. No entanto, eles podem desenvolver doenças diferentes, responder diferentemente a medicamentos e mostrar diferenças fisiológicas mensuráveis à medida que envelhecem. Eles são mais concordantes para doenças do que gêmeos fraternos, mas menos de 100% concordantes — o que significa que algo além da sequência determina o fenótipo.
Esse algo é a epigenética: modificações químicas no DNA e nas proteínas ao redor dele que mudam a expressão gênica sem alterar a sequência subjacente. As marcas epigenéticas são hereditárias através da divisão celular, reversíveis em resposta ao ambiente e cada vez mais reconhecidas como impulsionadoras chave do desenvolvimento, envelhecimento e doença.
A Camada de Cromatina
Para entender a epigenética, você primeiro precisa entender a cromatina — o complexo de DNA, proteínas histonas e moléculas associadas que compõe os cromossomos.
Como descrito no capítulo de DNA, o DNA é enrolado em torno de histonas — pequenas proteínas carregadas positivamente que compactam o DNA carregado negativamente. A unidade básica é o nucleossomo: 147 pb de DNA enrolado ~1,75 vezes em torno de um octâmero de 4 tipos de histonas (H2A, H2B, H3, H4, duas cópias cada).
O insight crítico: se o DNA está acessível aos fatores de transcrição e à RNA polimerase depende de quão firmemente está empacotado.
Dois estados de cromatina:
- Eucromatina: regiões frouxamente empacotadas, acessíveis, ativamente transcritas. Aparece mais clara na microscopia.
- Heterocromatina: regiões densamente empacotadas, inacessíveis, transcricionalmente silenciosas. Inclui heterocromatina constitutiva (centrômeros, telômeros — silenciada permanentemente) e heterocromatina facultativa (genes silenciados em um determinado tipo celular, mas ativos em outros).
Pense no estado da cromatina como controle de acesso. O mesmo arquivo (gene) existe em cada célula, mas em algumas células é chmod 000 (heterocromatina — sem acesso), em outras chmod 644 (eucromatina — legível). O código não mudou. As permissões mudaram.
Ao contrário das permissões do sistema de arquivos, os estados de cromatina podem ser alterados dinamicamente em resposta a sinais — estímulos ambientais podem "desbloquear" ou "bloquear" genes — e, crucialmente, as células filhas herdam esses estados através da divisão celular.
Metilação do DNA: A Marca Epigenética Primária
A metilação do DNA é a adição de um grupo metil (–CH₃) à posição 5' da citosina, quase exclusivamente em dinucleotídeos CpG (citosina seguida de guanina) em mamíferos.
Distribuição
O genoma é geralmente hipometilado exceto em elementos repetitivos (transposons, DNA satélite), onde a metilação é usada para silenciar elementos móveis potencialmente prejudiciais. Cerca de 70–80% dos CpGs são metilados em células somáticas típicas.
As ilhas CpG — regiões com alta densidade de CpG, tipicamente de 200–3.000 pb — estão localizadas em ~60% dos promotores gênicos e geralmente não são metiladas quando o gene está ativo. Quando uma ilha CpG é metilada, o gene associado é silenciado.
Mecanismo de Silenciamento
CpGs metilados são reconhecidos por proteínas de ligação metil-CpG (MBDs, incluindo MeCP2), que recrutam histona desacetilases (HDACs) e outra maquinaria repressiva. Isso faz com que a cromatina se compacte, bloqueando o acesso de TFs.
Escritores, Leitores e Apagadores
O epigenoma tem maquinaria análoga ao código-fonte com controle de versão:
Escritores (DNMT): As DNA metiltransferases adicionam marcas de metilação:
- DNMT3A e DNMT3B: metilação de novo — estabelecem novos padrões de metilação
- DNMT1: metilação de manutenção — copia os padrões durante a replicação do DNA
Apagadores (TET): As enzimas TET oxidam 5-metilcitosina para 5-hidroximetilcitosina (5hmC) e além, levando à demetilação. Mutações TET2 são comuns em leucemias.
Metilação do DNA no Câncer
Dois padrões de metilação aberrante são característicos do câncer:
- Hipometilação global: ativa transposons, desestabiliza o genoma
- Hipermetilação de promotores de genes supressores de tumor: silencia genes como MLH1 (reparo de incompatibilidade), CDKN2A (p16), BRCA1
A metilação do DNA pode ser medida por:
- Sequenciamento por bisulfito: bisulfito converte C não metilado em U; C metilado permanece como C. Permite mapeamento de metilação em escala genômica (WGBS) ou em loci selecionados (pirosequenciamento, pirossequenciamento)
- Arrays de metilação (EPIC): mede ~850.000 sítios CpG — padrão em estudos clínicos
Modificações de Histonas: O Código de Histonas
As histonas não são apenas carretéis passivos de DNA. Suas caudas N-terminais, que se projetam para fora do nucleossomo, sofrem dezenas de modificações covalentes diferentes:
| Modificação | Posição | Efeito | Interpretação |
|---|---|---|---|
| H3K4me3 | H3 Lys4 trimethylation | Ativação | Promotores ativos |
| H3K27ac | H3 Lys27 acetylation | Ativação | Enhancers/promotores ativos |
| H3K4me1 | H3 Lys4 monomethylation | Poised | Enhancers |
| H3K27me3 | H3 Lys27 trimethylation | Repressão | Genes Polycomb-silenciados |
| H3K9me3 | H3 Lys9 trimethylation | Repressão | Heterocromatina constitutiva |
| H3K36me3 | H3 Lys36 trimethylation | Transcrito | Corpo do gene (expressos ativamente) |
Marcas individuais raramente determinam o resultado sozinhas. A combinação de marcas em uma região é que define o estado funcional. Por exemplo: H3K4me3 + H3K27ac em um promotor = ativo e transcrito; H3K4me3 + H3K27me3 (promotor "bivalente") = poised para ativação ou silenciamento — comum em células-tronco, onde genes de desenvolvimento precisam ser facilmente ativáveis em qualquer direção.
Escritores, Apagadores e Leitores de Histonas
Escritores adicionam modificações: HATs (histona acetiltransferases) adicionam acetilação; HMTs (histona metiltransferases) adicionam metilação.
Apagadores removem modificações: HDACs (histona desacetilases) removem acetilação — alvos de medicamentos aprovados (ácido valpróico, vorinostat); HDMs (histona desmetilases) removem metilação.
Leitores reconhecem modificações e recrutam maquinaria efetora: bromodomínios leem acetilação; cromodomínios leem metilação; PHD fingers leem vários estados de histonas.
ATAC-seq: Mapeando a Acessibilidade da Cromatina
ATAC-seq (Assay for Transposase-Accessible Chromatin using sequencing) usa uma transposase (Tn5) que preferentemente insere cassetes de sequenciamento em DNA aberto e acessível (sem nucleossomo). O sequenciamento desses fragmentos mapeia a cromatina acessível em todo o genoma.
A saída é um perfil de picos ao longo do genoma onde a cromatina está aberta — tipicamente promotores ativos e enhancers. Ao comparar amostras:
- Picos ganhos na doença → regiões regulatórias ativadas
- Picos perdidos → elementos repressores ou silenciados
O ATAC-seq de célula única (scATAC-seq) mapeia a acessibilidade por célula individual, revelando heterogeneidade no estado regulatório.
Imprinting Genômico
O imprinting é um fenômeno epigenético onde genes específicos são expressos monoalelicamente — apenas a cópia paterna ou apenas a cópia materna. O allele silenciado é marcado por metilação do DNA e modificações de histonas estabelecidas durante a gametogênese.
Genes impressos incluem IGF2 (fator de crescimento expresso apenas paternalmente) e H19 (lncRNA expresso apenas maternalmente). Distúrbios de imprinting causam síndromes como Prader-Willi e Angelman — fenótipos distintos de deleções na mesma região cromossômica 15q, dependendo de qual alelo parental é deletado.
Epigenética na Bioinformática
O epigenoma gera vários tipos distintos de dados que requerem pipelines especializados:
| Tipo de dado | Tecnologia | O que detecta |
|---|---|---|
| Metilação do DNA | WGBS, RRBS, arrays Illumina | CpGs metilados em escala genômica |
| Histona ChIP-seq | ChIP seguido de seq | Sítios de ligação de proteínas modificadoras de histonas |
| ATAC-seq | Transposase + seq | Regiões de cromatina aberta |
| Hi-C | Ligação de cromatina + seq | Contatos 3D cromossômicos |
Ferramentas bioinformáticas: bismark (alinhamento de bisulfito), MACS2/3 (chamada de pico ChIP/ATAC), methylKit (análise de metilação diferencial), diffTF (atividade diferencial de TF de ATAC-seq).