Um vírus é, no sentido mais literal, um pedaço de código procurando uma máquina para executar. Ele carrega um genoma — um programa completo para fazer cópias de si mesmo — mas não possui nenhuma das maquinarias celulares necessárias para executar esse programa. Ele deve encontrar uma célula hospedeira e cooptar os ribossomos, polimerases e suprimento de energia dessa célula para se replicar.
Essa dependência define o vírus. Ele não está vivo no sentido usual (sem metabolismo, sem homeostase, sem reprodução independente), mas é a entidade autorreplicante mais bem-sucedida da Terra pelo número de cópias. Estima-se que existam 10³¹ vírus individuais na biosfera — mais do que todas as outras entidades biológicas combinadas.
Entender os vírus é essencial para a bioinformática porque sequências virais aparecem em todo lugar: em conjuntos de dados de sequenciamento como contaminantes ou coinfecções, como retroelementos integrados em cada genoma de vertebrado e como ferramentas (vetores virais) para entrega de genes em pesquisa e terapia.
O Que um Vírus Realmente É
No mínimo, um vírus requer:
- Um genoma — ácido nucleico contendo a informação para codificar proteínas virais e direcionar a replicação
- Um capsídeo — uma cápsula de proteína que protege o genoma durante a transmissão
- Um mecanismo para entrar em células hospedeiras
Muitos vírus também têm: 4. Um envelope — uma bicamada lipídica (derivada das membranas da célula hospedeira) que envolve o capsídeo em alguns vírus 5. Proteínas acessórias — proteínas regulatórias, de evasão imune ou estruturais codificadas no genoma
Um vírus é como um binário compilado em um pendrive. O binário contém instruções válidas, mas não pode fazer nada sem um computador para executar. Quando encontra um computador (uma célula hospedeira), assume os recursos do hospedeiro — CPU (ribossomos), RAM (citoplasma), I/O (maquinaria de transporte) — para executar seu programa: replicar-se e preparar novas cópias para distribuição.
O sistema imune do hospedeiro é o software antivírus: ele escaneia arquivos recebidos, sinaliza padrões suspeitos e tenta colocar em quarentena ou deletar o binário antes que ele possa ser executado.
Tipos de Genoma: Mais Diversidade do Que a Vida Celular
Ao contrário da vida celular, que usa apenas DNA de fita dupla como genoma, os vírus usam virtualmente toda configuração possível de ácido nucleico:
| Tipo de genoma | Vírus exemplos | Notas |
|---|---|---|
| dsDNA | Herpesvírus, poxvírus, adenovírus | Mais similar aos genomas celulares; podem ser muito grandes (poxvírus ~200 kb) |
| ssDNA | Parvovírus, circovírus | Genomas pequenos e simples |
| dsRNA | Reovírus, rotavírus | Replicam no citoplasma via RNA polimerase dependente de RNA |
| +ssRNA | Coronavírus (SARS-CoV-2), flavivírus (dengue, Zika), picornavírus (polio) | O genoma funciona diretamente como mRNA; pode ser traduzido imediatamente |
| −ssRNA | Influenza, raiva, Ebola | O genoma é complementar ao mRNA; deve ser transcrito primeiro |
| ssRNA-RT | HIV, HTLV | Genoma de RNA, mas replica por meio de intermediário de DNA via transcriptase reversa |
| dsDNA-RT | Hepatite B | Genoma de DNA, replica via intermediário de RNA |
As designações "+" e "−" para vírus de RNA referem-se à polaridade da fita em relação ao mRNA: senso positivo (+ssRNA) pode ser diretamente traduzido pelos ribossomos; senso negativo (−ssRNA) deve primeiro ser copiado em mRNA.
O sistema de classificação de Baltimore (1971, Prêmio Nobel 1975) categoriza todos os vírus por tipo de genoma e estratégia de replicação em 7 classes. Permanece como a taxonomia fundamental para virologia e prediz diretamente quais enzimas do hospedeiro o vírus pode sequestrar versus quais deve trazer consigo. Por exemplo, vírus de RNA de senso negativo devem carregar sua própria RNA polimerase dependente de RNA no vírion porque as células hospedeiras não têm tal enzima.
Simetria do Capsídeo: A Geometria Importa
Os capsídeos virais se automontam a partir de cópias repetidas de uma ou poucas proteínas. Duas geometrias fundamentais evoluíram:
Simetria icosaédrica: A maioria dos vírus animais não envelopados. 20 faces triangulares equiláteras. Empacotamento eficiente — próximo a uma esfera, maximizando a relação volume/superfície. Adenovírus, poliovírus, HPV e hepatite B usam capsídeos icosaédricos.
Simetria helicoidal: As proteínas do capsídeo formam uma espiral ao redor do genoma. Usada por vírus de RNA de senso negativo (vírus do mosaico do tabaco, raiva) e influenza. Comprimento flexível — acomoda tamanhos variáveis de genoma.
Capsídeos complexos: Alguns vírus (poxvírus, bacteriófagos) têm estruturas mais complexas e assimétricas que não se encaixam em nenhuma categoria.
A automontagem a partir de unidades simétricas e repetidas é elegante: o genoma só precisa codificar um pequeno número de sequências de proteínas do capsídeo em vez de uma estrutura de capsídeo única. É o mesmo princípio de construir estruturas 3D complexas a partir de blocos de Lego idênticos.
Envelopados vs. Não Envelopados: Implicações para Transmissão
A presença ou ausência de um envelope lipídico tem grandes consequências:
Vírus envelopados (HIV, SARS-CoV-2, influenza, herpesvírus):
- Adquirem seu envelope brotando pelas membranas da célula hospedeira durante a saída
- O envelope contém proteínas da membrana do hospedeiro e proteínas virais (proteínas spike, etc.)
- Mais sensíveis a detergentes, calor e dessecação — que rompem a bicamada lipídica
- Se espalham com mais eficiência pelo contato direto ou gotículas; menos duráveis em superfícies
Vírus não envelopados (adenovírus, rotavírus, poliovírus, norovírus):
- Capsídeo nu — resistente a detergentes, ácido e dessecação
- Podem sobreviver em superfícies por horas a dias
- Tipicamente transmitidos pela rota fecal-oral ou superfícies contaminadas
- É por isso que os antissépticos à base de álcool são menos eficazes contra vírus não envelopados (o álcool rompe envelopes lipídicos, mas menos efetivamente rompe capsídeos de proteína nua)
Tamanho do Genoma Viral: O Programa Mínimo
Os genomas virais abrangem uma enorme variedade:
- Menor: Hepatite D (1,7 kb, codifica apenas 1 proteína; requer hepatite B para replicação)
- Maiores vírus animais: Mimivírus (~1,2 Mb — maior que alguns genomas bacterianos)
- Patógenos humanos típicos: Influenza ~13 kb, SARS-CoV-2 ~30 kb, HIV ~9,7 kb, HSV-1 ~152 kb
A pressão para minimizar o tamanho do genoma impulsiona densidade de codificação extrema em vírus pequenos:
- Quadros de leitura sobrepostos: a mesma sequência de nucleotídeos codifica duas proteínas diferentes em quadros diferentes
- Poliproteínas: uma grande proteína é traduzida e então clivada por proteases em múltiplas proteínas funcionais
- Proteínas multifuncionais: uma proteína serve como componente do capsídeo, replicase e antagonista imune
Essa compactação de codificação é uma das razões pelas quais a análise de genoma viral é particularmente interessante computacionalmente — uma única mutação pode afetar múltiplas proteínas simultaneamente se cair em uma região sobreposta.
Funções das Proteínas Virais
Os genes em genomas virais, mesmo pequenos, codificam um conjunto completo de funções:
Proteínas estruturais (capsídeo, envelope, matriz): empacotam e protegem o genoma durante a transmissão
Proteínas de replicação (polimerases, helicases, proteases): realizam a replicação do genoma e, em vírus de RNA de senso negativo, a transcrição inicial
Proteínas de entrada: proteínas de superfície viral que reconhecem receptores da célula hospedeira e medeiam a fusão de membrana ou endocitose
Proteínas de evasão imune: encontradas em todos os vírus bem-sucedidos; os mecanismos incluem bloqueio da sinalização de interferon, ocultação de proteínas virais da apresentação por MHC e expressão de proteínas semelhantes às do hospedeiro para evitar detecção
Proteínas acessórias/regulatórias: controlam o tempo e a taxa de expressão do gene viral; determinam se a infecção é aguda ou latente
Diversidade Viral no Genoma Humano
Cerca de 8% do genoma humano consiste em sequências reconhecíveis derivadas de retrovírus — retrovírus endógenos (ERVs) que se integraram em células germinativas ancestrais há milhões de anos. A maioria é degenerada e não funcional, mas algumas sequências derivadas de ERV foram cooptadas:
- Sincitina-1 e Sincitina-2 (derivadas de proteínas de envelope de ERV) são essenciais para o desenvolvimento placentário em primatas — as células que formam a placenta se fundem usando uma proteína de fusão viral reutilizada
- Alguns promotores de ERV impulsionam a expressão gênica em tecidos onde o gene original não tinha promotor
- Sequências de ERV contribuem para elementos regulatórios (enhancers, sítios de ligação de CTCF)
Isso torna o genoma humano literalmente um palimpsesto de integrações virais antigas — e torna a "contaminação" no sequenciamento genômico não trivial de detectar, já que sequências de ERV podem se alinhar a genomas de referência viral.
Vírus como Ferramentas de Bioinformática
Além de seu papel como patógenos, os vírus são ferramentas essenciais em biologia molecular e medicina:
Vetores virais: Vírus adeno-associado (AAV), lentivírus e adenovírus são projetados como veículos de entrega para terapia gênica. Entender a biologia natural de cada tipo de vetor é necessário para entender seu tropismo (quais células ele infecta), capacidade (quanto DNA pode carregar) e imunogenicidade.
Entrega de CRISPR: A maioria das terapias clínicas de CRISPR usa vetores virais para entregar o RNA guia e o Cas9. A escolha do vetor determina a eficiência de entrega, a resposta imune e a duração da edição.
Ferramentas de pesquisa: Bacteriófagos (vírus que infectam bactérias) são usados para exibição de fagos, triagem de bibliotecas de proteínas e como sistemas modelo. O fago lambda foi um dos primeiros genomas sequenciados e levou diretamente à tecnologia do DNA recombinante.
No próximo capítulo, examinaremos como os vírus realmente entram nas células e se replicam — o mecanismo de infecção.