UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO DE CIÊNCIAS BIOLÓGICAS DEPARTAMENTO DE BIOQUÍMICA
MÁRCIA DANIELLE DE ARAÚJO DANTAS
ESTUDO DO GENOMA DO VÍRUS CAUSADOR DA MIONECROSE INFECCIOSA EM CAMARÕES E
DESENVOLVIMENTO DE MÉTODOS PARA DETECÇÃO DE POLIMORFISMOS
NATAL 2014
MÁRCIA DANIELLE DE ARAÚJO DANTAS
ESTUDO DO GENOMA DO VÍRUS CAUSADOR DA MIONECROSE INFECCIOSA EM CAMARÕES E
DESENVOLVIMENTO DE MÉTODOS PARA DETECÇÃO DE POLIMORFISMOS
NATAL 2014
Dissertação apresentada ao Programa de Pós-Graduação em Bioquímica da Universidade Federal do Rio Grande do Norte como requisito parcial para obtenção do título de Mestre em Bioquímica. Orientador: Professor Dr. Daniel Carlos Ferreira Lanza
MÁRCIA DANIELLE DE ARAÚJO DANTAS
ESTUDO DO GENOMA DO VÍRUS CAUSADOR DA MIONECROSE INFECCIOSA EM CAMARÕES E DESENVOLVIMENTO DE MÉTODOS PARA DETECÇÃO DE
POLIMORFISMOS Dissertação apresentada ao Programa de Pós-Graduação em Bioquímica da Universidade Federal do Rio Grande do Norte como requisito parcial para obtenção do título de Mestre em Bioquímica.
Aprovado em: 01/08/2014
BANCA EXAMINADORA
___________________________________________________ Prof. Dr. Daniel Carlos Ferreira Lanza Departamento de Bioquímica - UFRN
Orientador
____________________________________________________ Prof. Dr. Leonardo Lima Pepino de Macedo
Pesquisador da EMBRAPA - Recursos Genéticos e Biotecnologia Examinador externo
____________________________________________________ Prof. Dr. João Paulo Matos Santos Lima Departamento de Bioquímica – UFRN
Examinador interno
Dedico esta obra
À minha querida avó Maria da Luz Santos, que agora está descansando ao lado do Senhor, mas que, com certeza, continua olhando por mim. Obrigado por toda
dedicação, amor e carinho. Guardarei a senhora para sempre em meu coração.
AGRADECIMENTOS
Agradeço a todos que direta ou indiretamente participaram da realização deste trabalho, em especial agradeço:
A Deus, pai de infinito amor e bondade, pela sua presença constante em minha vida, me abençoando e iluminando meus caminhos.
Aos meus pais, Maria do Socorro de Araújo Dantas e Luis de Vasconcelos Dantas, por todo amor, carinho e dedicação. Vocês são os principais responsáveis pela
pessoa que sou hoje e por todas as minhas conquistas.
Ao meu namorado, Pedro Henrique Sales da Costa, por todo amor, amizade e companheirismo e por sempre estar ao meu lado me apoiando em todos os
momentos.
Ao Programa de Pós-Graduação em Bioquímica, Departamento de Bioquímica da Universidade Federal do Rio Grande do Norte (UFRN) pelos conhecimentos
adquiridos na área.
Aos amigos do Laboratório de Biologia Molecular Aplicada – Laplic, Raffael, Allan,
Douglas, Jéssica e Natália, pela amizade e pelos momentos de descontração durante os trabalhos. Em especial agradeço a Raffael por toda ajuda com as
análises de Bioinformática.
Ao professor Dr. João Paulo Matos Santos Lima e seus alunos Diego e Ricardo pela
ajuda durante o desenvolvimento deste trabalho.
Ao pessoal do Laboratório de Imunogenética pela disponibilidade de equipamentos extremamente necessários para a realização deste trabalho.
À professora Drª Suely Ferreira Chavante pelo incentivo e apoio em ingressar na pós-graduação.
Às empresas Camanor, Concepto Azul e Genearch pela doação das amostras de camarão sem as quais não seria possível a realização deste trabalho.
Aos colegas da minha turma de pós-graduação por compartilhar comigo tantos
momentos de alegria e desespero durante esses anos de estudo.
Aos meus grandes amigos da Biologia pelos quatros anos de companheirismo e amizade. Em especial às amigas Sinara Carla, Larissa Maria e Larissa Bahia. Vocês
tornaram os meus momentos mais felizes durante a graduação.
À CAPES pelo fornecimento da bolsa de pesquisa e à FAPERN pelo auxílio financeiro ao projeto de pesquisa.
E claro, o meu muito obrigada ao meu querido orientador Professor Dr. Daniel Carlos Ferreira Lanza pela sua orientação, paciência, profissionalismo e
compromisso com seus orientandos. Obrigada pela sua atuação direta na ampliação dos meus conhecimentos. O senhor, com certeza, é um exemplo de pessoa e de
profissional.
O cientista não é o homem que fornece as verdadeiras respostas, é quem faz as verdadeiras perguntas.
Claude Lévi-Strauss
RESUMO
A carcinicultura é uma das atividades que mais contribui para o crescimento da aquicultura mundial. Entretanto, esta atividade vem sofrendo perdas econômicas significativas devido ao surgimento de doenças virais como a Mionecrose Infecciosa (IMN). A IMN já está disseminada em toda região Nordeste do Brasil e vem causando sérios danos à carcinicultura na Indonésia. O principal sintoma da doença é a mionecrose, que consiste na necrose dos músculos estriados do abdômen e do cefalotórax do camarão. A IMN é causada pelo vírus da mionecrose infecciosa (IMNV), um vírus não envelopado que apresenta protrusões ao longo de seu capsídeo. O genoma viral é formado por uma única molécula de RNA dupla fita e possui duas Open Reading Frames (ORFs). A ORF1 codifica a proteína principal do capsídeo (MCP) e uma possível proteína de ligação a RNA (RBP). A ORF2 codifica uma provável RNA polimerase dependente de RNA (RdRp) e classifica o IMNV dentro da família Totiviridae. Assim, o objetivo desse estudo foi estudar o genoma completo do IMNV e as proteínas codificadas no intuito de desenvolver um sistema que identificasse diferentes isolados do vírus com base na presença de polimorfismos. A relação filogenética entre alguns totivírus foi investigada e mostrou um novo grupo para o IMNV dentro da família Totiviridae. Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos genomas foram mais semelhantes entre si do que com aqueles já descritos. Regiões variáveis e conservadas do genoma foram identificadas através de gráficos de similaridade e alinhamentos utilizando as quatro sequências do IMNV. Esta análise possibilitou o mapeamento de sítios polimórficos e revelou que a região mais variável do genoma se encontra na primeira metade da ORF1 e coincide com as regiões que possivelmente codificam a protrusão viral, enquanto que as regiões mais estáveis se encontraram em domínios conservados de proteínas que interagem com o RNA. Além disso, estruturas secundárias foram preditas para todas as proteínas empregando diversos softwares e modelos estruturais proteicos foram calculados usando modelagens por threading e simulações ab initio. A partir dessas análises foi possível observar que as proteínas do IMNV possuem motivos e formas similares às proteínas de outros totivírus, e novas possíveis funções proteicas foram propostas. O estudo do genoma e das proteínas foi essencial para o desenvolvimento de um sistema de detecção baseado em PCR capaz de discriminar os quatro isolados do IMNV com base na presença de sítios polimórficos. Palavras-chave: IMNV Brasil. Sítios polimórficos. Região variável. Domínios conservados. Modelagem proteica. RNA.
ABSTRACT Shrimp farming is one of the activities that contribute most to the growth of global aquaculture. However, this business has undergone significant economic losses due to the onset of viral diseases such as Infectious Myonecrosis (IMN). The IMN is already widespread throughout Northeastern Brazil and has caused serious damage to shrimp farming in Indonesia. The main symptom of disease is myonecrosis, which consists of necrosis of striated muscles of the abdomen and cephalothorax of shrimp. The IMN is caused by infectious myonecrosis virus (IMNV), a non-enveloped virus which has protrusions along its capsid. The viral genome consists of a single molecule of double-stranded RNA and has two Open Reading Frames (ORFs). The ORF1 encodes the major capsid protein (MCP) and a potential RNA binding protein (RBP). ORF2 encodes a probable RNA-dependent RNA polymerase (RdRp) and classifies IMNV in Totiviridae family. Thus, the objective of this research was study the IMNV complete genome and encoded proteins in order to develop a system differentiate virus isolates based on polymorphisms presence. The phylogenetic relationship among some totivirus was investigated and showed a new group to IMNV within Totiviridae family. Two new genomes were sequenced, analyzed and compared to two other genomes already deposited in GenBank. The new genomes were more similar to each other than those already described. Conserved and variable regions of the genome were identified through similarity graphs and alignments using the four IMNV sequences. This analyze allowed mapping of polymorphic sites and revealed that the most variable region of the genome is in the first half of ORF1, which coincides with the regions that possibly encode the viral protrusion, while the most stable regions of the genome were found in conserved domains of proteins that interact with RNA. Moreover, secondary structures were predicted for all proteins using various softwares and protein structural models were calculated using threading and ab initio modeling approaches. From these analyses was possible to observe that the IMNV proteins have motifs and shapes similar to proteins of other totiviruses and new possible protein functions have been proposed. The genome and proteins study was essential for development of a PCR-based detection system able to discriminate the four IMNV isolates based on the presence of polymorphic sites. Keywords: IMNV Brazil. Polymorphic sites. Variable region. Conserved domains. Protein modeling. RNA.
LISTA DE FIGURAS
Figura 1 - Camarões Litopenaeus vannamei infectados com o vírus da mionecrose
infecciosa....................................................................................................................22
Figura 2 - Organização do genoma do IMNV mostrando 5’ e 3’UTR e as duas ORFs
não sobrepostas.........................................................................................................25
Figura 3 - Reconstrução em imagem 3D do IMNV a uma resolução de 8.0 Å...........28
Figura 4 - Modelo em 3D da subunidade A do capsídeo de Saccharomyces
cerevisae L-A (ScV-L-A).............................................................................................29
Figura 5 - Estrutura tridimensional prevista para o vírus da mionecrose
infecciosa....................................................................................................................30
Figura 6 - Estrutura da RNA polimerase dependente de RNA do poliovírus.............33
Figura 7 - Estratégia empregada para amplificar o genoma completo do IMNV.......46
Figura 8 - Análise filogenética de membros representativos da família
Totiviridae...................................................................................................................54
Figura 9 - Análise Neighbor joining do grupo IMNV-like incluindo os quatro genomas
completos do IMNV....................................................................................................57
Figura 10 - Representação esquemática do genoma do IMNV e análise de
variabilidade...............................................................................................................59
Figura 11 - Sítios polimórficos identificados no genoma do IMNV.............................60
Figura 12 - Análise de composição de aminoácidos e predição de estrutura
secundária para RBP.................................................................................................62
Figura 13 - Análise de composição de aminoácidos e predição de estrutura
secundária para SP1 e SP2.......................................................................................63
Figura 14 - Análise de composição de aminoácidos e predição de estrutura
secundária para MCP.................................................................................................65
Figura 15 - Análise de composição de aminoácidos e predição de estrutura
secundária para RdRp................................................................................................67
Figura 16 - Modelo estrutural para a proteína RBP do IMNV gerado pelo I-
TASSER.....................................................................................................................69
Figura 17 - Modelo estrutural para a MCP do IMNV gerado pelo I-TASSER.............70
Figura 18 - Modelo estrutural para a RdRp do IMNV gerado pelo I-TASSER...........71
Figura 19 - Alinhamentos de nucleotídeos dos fragmentos de 456 pb e 200 pb
referentes às regiões variável e conservada, respectivamente.................................73
Figura 20 - Sistema de detecção do IMNV.................................................................74
Figura 21 - Análises de predição de estrutura secundária e curva de melting de fita
simples e dupla para a região R2...............................................................................76
Figura 22 - Análises de predição de estrutura secundária e curva de melting de fita
simples e dupla para a região R3...............................................................................77
Figura 23 - Predição de estrutura secundária de RNA e curva de melting de fita
simples realizada in silico para o fragmento de 456 pb..............................................78
Figura 24 - Esquema proposto para a formação da protrusão do IMNV...................86
Figura Suplementar 1 - Análise filogenética de membros representativos dos grupos
TVV-like, LRV-like e GLV-like...................................................................................111
Figura Suplementar 2 - Sequência genômica completa (7.561 pb) e regiões
codificantes do IMNVgen1........................................................................................112
Figura Suplementar 3 - Sequência genômica completa (7.561 pb) e regiões
codificantes do IMNVgen2........................................................................................118
Figura Suplementar 4 - Predição de regiões estruturadas e desestruturadas para as
proteínas do IMNV....................................................................................................132
Figura Suplementar 5 - Predição de estrutura terciária para a Proteína Principal do
Capsídeo do IMNV...................................................................................................134
Figura Suplementar 6 - Predição de estrutura terciária para a RNA Polimerase
Dependente de RNA do IMNV.................................................................................135
Figura Suplementar 7 - Predição de estrutura terciária usando modelagem por
threading no programa Phyre2 para as proteínas do isolado da Indonésia.............136
LISTA DE TABELAS
Tabela 1 - Lista dos primers usados em cada análise para identificar o IMNV nas
amostras de camarões Litopenaeus vannamei..........................................................42
Tabela 2 - Lista de primers usados para amplificar o genoma completo do IMNV....46
Tabela 3 - Comparação das sequências de nucleotídeos e aminoácidos do
IMNVgen1 com outras sequências disponíveis no GenBank e IMNVgen2...............56
Tabela 4 - Comparação das sequências de nucleotídeos e aminoácidos do
IMNVgen2 com outras sequências disponíveis no GenBank e IMNVgen1...............56
Tabela 5 - Lista de primers empregados no sistema de identificação do IMNV........72
Tabela 6 - Regiões selecionadas para o teste de detecção baseado na análise da
curva de melting de fita simples.................................................................................75
Tabela Suplementar 1 - Nome e números de acesso das sequências dos totivírus
usados neste estudo agrupados de acordo com a análise
filogenética...............................................................................................................106
Tabela Suplementar 2 - Nome e números de acesso das sequências dos
Trichomonasvirus, Leishmaniavirus e Giardiavirus usados neste estudo agrupados
de acordo com a análise filogenética.......................................................................107
Tabela Suplementar 3 - Identificação do IMNV em amostras de camarão marinho
Litopenaeus vannamei.............................................................................................108
Tabela Suplementar 4 - Identificação dos sítios polimórficos (SP) no genoma do
IMNV.........................................................................................................................124
Tabela Suplementar 5 - Avaliação dos modelos tridimensionais das proteínas RBP,
MCP e RdRp............................................................................................................133
LISTA DE ABREVIATURAS / SIGLAS
Aa Aminoácidos
ABCC Associação Brasileira dos Criadores de Camarão
BLAST Basic Local Alignment Search Tool
CDD Conserved Domains Database
cDNA DNA complementar
DNA Ácido desoxirribonucleico
dNTP Deoxinucleotídeos trifosfatados
DSRM Double-strand RNA binding motif
dsRNA RNA dupla fita
EMPARN Empresa Brasileira de Pesquisa Agropecuária do RN
ExPASy Expert Protein Analysis System
ha hectare
HIV Human immunodeficiency virus
HRMA High-Resolution Melting Analysis
IBDV Vírus da doença infecciosa da Bursa
ICTV Comitê Internacional de Taxonomia de Vírus
IHHNV Infectious hypodermal and haematopoietic virus
IMN Infectious Myonecrosis
IMNV Infectious myonecrosis virus
kDa Kilodaltons
Kg Quilogramas
LOS Limphoid organ spheroids
MCP Proteína Principal do Capsídeo
ml mililitros
mM milimolar
µg microgramas
µl microlitros
µM micromolar
NCBI National Center for Biotechnology Information
nt Nucleotídeo
OIE World Organization for Animal Health
ORF Open Reading Frame
PCR Polymerase Chain Reaction
PDB Protein Data Bank
PMCV Piscine myocarditis virus
pmol Picomole
RBP Proteína de ligação a RNA
RdRp RNA polimerase dependente de RNA
RMSD Root-mean-square deviation
RNA Ácido Ribonucleico
RNAi RNA de interferência
RNAP RNA polimerase
RT Transcriptase reversa
RT-LAMP Reverse Transcription Loop Mediated Isothermal Amplification
RT-PCR Reverse Transcription Polymerase Chain Reaction
SP Sítio polimórfico
SP1 Small Protein 1
SP2 Small Protein 2
TLR3 receptor Toll-like 3
TM Temperatura de melting
TSV Taura syndrome virus
U Unidade
UniProt Universal Protein Resource
WEEV Western equine encephalitis virus
WSSV White spot syndrome virus
YHV Yellow head virus
SUMÁRIO
1 INTRODUÇÃO 19
1.1 MIONECROSE INFECCIOSA 20
1.2 VÍRUS DA MIONECROSE INFECCIOSA 23
1.2.1 Proteína de ligação a RNA (RBP) 26
1.2.2 Proteína Principal do Capsídeo (MCP) 27
1.2.3 Protrusões virais 30
1.2.4 RNA Polimerase Dependente de RNA (RdRp) 32
1.3 VARIABILIDADE GENÉTICA EM VÍRUS 34
1.4 SISTEMAS DE DETECÇÃO PARA O IMNV 36
2 OBJETIVOS 39
3 MATERIAIS E MÉTODOS 40
3.1 ANÁLISE FILOGENÉTICA 40
3.2 OBTENÇÃO DAS AMOSTRAS DE CAMARÃO 41
3.3 SCREENING INICIAL PARA DETECÇÃO DO IMNV EM DIFERENTES
AMOSTRAS DE CAMARÃO 42
3.3.1 Extração de RNA total 43
3.3.2 RT-PCR 43
3.3.2.1 Síntese de cDNA 43
3.3.2.2 Reação em Cadeia da Polimerase (PCR) 44
3.4 AMPLIFICAÇÃO E SEQUENCIAMENTO DO GENOMA VIRAL 45
3.5 ANÁLISE DAS SEQUÊNCIAS 47
3.6 ANÁLISE ESTRUTURAL DE PROTEÍNAS 48
3.7 MODELAGEM PROTEICA 49
3.8 SISTEMAS DE DETECÇÃO DE POLIMORFISMOS 50
3.8.1 Teste de detecção baseado nas regiões variáveis e conservadas 50
3.8.2 Teste de detecção baseado na análise da curva de melting de fita simples 51
4 RESULTADOS 53
4.1 ANÁLISE FILOGENÉTICA DA FAMÍLIA TOTIVIRIDAE 53
4.2 SCREENING INICIAL PARA DETECÇÃO DO IMNV EM DIFERENTES
AMOSTRAS DE CAMARÃO 54
4.3 AMPLIFICAÇÃO E MONTAGEM DOS NOVOS GENOMAS 55
4.4 CARACTERIZAÇÃO DOS NOVOS GENOMAS 55
4.5 IDENTIFICAÇÃO DE REGIÕES CONSERVADAS E VARIÁVEIS 58
4.6 ANÁLISE DE COMPOSIÇÃO DE AMINOÁCIDOS E PREDIÇÃO DE
ESTRUTURA SECUNDÁRIA 61
4.7 MODELAGEM DE PROTEÍNAS 68
4.8 SISTEMAS DE DETECÇÃO DE POLIMORFISMOS 71
4.8.1 Teste de detecção baseado nas regiões variáveis e conservadas 71
4.8.2 Teste de detecção baseado na análise da curva de melting de fita simples 74
5 DISCUSSÃO 79
6 CONCLUSÃO 91
REFERÊNCIAS 93
APÊNDICE 105
19
1 INTRODUÇÃO
Durante a década de 80, os avanços na produção de camarão
proporcionaram um rápido crescimento na carcinicultura (LOTZ, 1997). A produção
de crustáceos foi a atividade que mais cresceu na aquicultura mundial nos últimos
anos, atingindo 4,5 milhões de toneladas e US$ 17,95 bilhões de dólares em 2006.
No mesmo ano a produção de camarão cultivado correspondeu a 17% do valor total
dos produtos pesqueiros internacionalmente negociados (FAO, 2008).
No Brasil, as pesquisas com camarão começaram na década de 70 com o
Projeto Camarão da Empresa Brasileira de Pesquisa Agropecuária do Rio Grande
do Norte S/A EMPARN (BRASIL, 2001). Várias espécies de camarão nativas
(Farfantepenaeus subtilis, F. brasiliensis, F. paulensis e Litopenaeus schmitti) foram
consideradas como opções de cultivo, porém vários fatores relacionados à produção
tornaram estas espécies inviáveis comercialmente (MADRID, 1999). Apenas em
meados da década de 80, com a introdução do camarão branco do Pacífico,
Litopenaeus vannamei, a carcinicultura brasileira se consolidou (BRASIL, 2001).
Entre os anos de 1996 e 2002, a produção de camarão passou de 2.880
toneladas para mais de 60 mil toneladas e a produtividade, de 900 kg/ha/ano para
5.458 kg/ha/ano (ORMOND, 2004), tonando o Brasil o país líder do hemisfério
ocidental, com 90.190 toneladas, e líder mundial em produtividade, com 6.084
kg/ha/ano, no ano de 2003 (ROCHA, 2005a).
Segundo dados da Associação Brasileira dos Criadores de Camarão (ABCC),
a produção brasileira de camarão deve ser da ordem de 100.000 toneladas em
2014. Em 2013, a produção alcançou 85.000 toneladas e foi destinada basicamente
ao mercado interno, com algumas exportações para países como Vietnã e França.
20
Os principais produtores são os estados do Ceará e do Rio Grande do Norte.
Existem quase 2.000 produtores no Brasil, a maioria com pequenos cultivos.
Atualmente os maiores produtores mundiais de camarão são China, Vietnã,
Tailândia, Indonésia, Índia e Equador. O Equador produziu 300.000 toneladas de
camarão em 2013 e obteve US$ 1,67 bilhão com a exportação de 215.000 toneladas
do produto (Disponível em MPA - Ministério da Pesca e Aquicultura).
Apesar desse crescimento na produtividade, os carcinicultores têm sofrido
perdas econômicas significativas nas últimas décadas devido a problemas
ambientais relacionados às práticas de cultivo e às doenças virais (MOSS, 2002).
Dentre as doenças virais que acometem a carcinicultura mundial, destacam-se
aquelas causadas pelo vírus da Mancha Branca (WSSV – White spot syndrome
virus), vírus da Cabeça Amarela (YHV – Yellow head virus), vírus da Taura (TSV –
Taura syndrome virus), vírus da Necrose Hipodermal e Hematopoiética Infecciosa
(IHHNV – Infectious hypodermal and haematopoietic virus) e o vírus da Mionecrose
Infecciosa (IMNV – Infectious myonecrosis virus) (LOTZ, 1997; LIU et al., 2009).
1.1 MIONECROSE INFECCIOSA
A Mionecrose Infecciosa (Infectious Myonecrosis - IMN) é uma das doenças
de maior impacto na carcinicultura da região Nordeste do Brasil. A IMN foi
identificada pela primeira vez em 2002 em cultivos de camarão da espécie
Litopenaeus vannamei no estado do Piauí e no ano seguinte foi detectada nos
estados do Ceará e Rio Grande do Norte (LIGHTNER et al., 2004; LIGHTNER &
PANTOJA, 2004). Hoje a doença já está disseminada em toda região Nordeste do
Brasil e vem causando sérios danos à carcinicultura na Indonésia (NUNES,
21
MARTINS & GESTEIRA, 2004; ANDRADE et al., 2007; SENAPIN et al., 2007;
LIGHTNER, 2011). Devido à importância econômica cada vez maior do L. vannamei
na região Ásia-Pacífico e ao consequente aumento do transporte dessa espécie
entre fronteiras, em janeiro de 2006 a IMN foi adicionada à lista Quartely Aquatic
Animal Disease Report com o propósito de aumentar a vigilância e sua detecção
(QAAD, 2006).
De acordo com a Associação Brasileira dos Produtores de Camarão, a
produção de camarão, no período em que a doença surgiu no Brasil (2002-2005), foi
de 150.000 toneladas a menos que o total esperado. Embora essa redução também
seja atribuída a variações no cambio e à ação antidumping dos Estados Unidos,
estima-se que 60 a 70% das perdas foram causadas por ação da IMN, causando
prejuízos próximos a 400 milhões de dólares naquele período (MADRID, 2005a, b;
ROCHA, 2005a, b; ANDRADE et al., 2007).
O principal sintoma da IMN é a mionecrose, que consiste na necrose dos
músculos estriados do abdômen e do cefalotórax do camarão. Os segmentos
abdominais podem apresentar opacidade focal ou multifocal (Figura 1A) que
progride do último segmento para o restante do corpo do animal e, em estágios mais
avançados, músculos e apêndices podem exibir coloração avermelhada (Figura 1B)
(LIGHTNER et al., 2004; NUNES, MARTINS & GESTEIRA, 2004; POULOS et al.,
2006). Além desses sintomas, os camarões também podem apresentar redução no
consumo de alimentos, nado desorientado e amolecimento do exoesqueleto
(NUNES, MARTINS & GESTEIRA, 2004). Análises histológicas dos músculos
esqueléticos de camarões infectados revelam necrose muscular coagulativa,
infiltração hemocítica, fibrose e aparecimento de esferoides do órgão linfoide
(Limphoid organ spheroids - LOS). Os locais comuns para LOS incluem o
22
hemoceloma nas brânquias, coração próximo à glândula antenal e cordão nervoso
ventral (TANG et al., 2005).
Figura 1: Camarões Litopenaeus vannamei infectados com o vírus da mionecrose infecciosa. (A) O camarão acima mostra sinais de necrose, evidenciada pela opacidade do sexto segmento abdominal (fase aguda); abaixo se encontra o camarão sadio, sem sinais de infecção (adaptado de POULOS et al., 2006). (B) O camarão apresenta pigmentação avermelhada nos últimos segmentos abdominais – seta (fase crônica) (adaptado de NUNES, MARTINS & GESTEIRA, 2004).
Nos últimos anos, as características de infecção da doença parecem ter
mudado nos camarões cultivados na região nordeste do Brasil. Os camarões
cultivados nas estações de baixa precipitação podem ser positivos para a doença
em testes de detecção e não exibir os sintomas histopatológicos da infecção ou
apresentarem sintomas brandos e baixas taxas de mortalidade (FEIJÓ et al., 2013;
LANZA D. C. F, dados não publicados). Variações nas características da doença
podem ocorrer por várias razões, incluindo condições ambientais, técnicas de
cultivo, contagem viral, co-infecção ou por variações interespecíficas no genoma do
agente etiológico (BACHERE, 2000). O agente etiológico da IMN foi purificado e
caracterizado pela primeira vez no ano de 2006 por Poulos e colaboradores e é
denominado de vírus da mionecrose infecciosa (IMNV).
23
1.2 VÍRUS DA MIONECROSE INFECCIOSA
Quando comparado a outros vírus que infectam camarão o IMNV apresenta
sintomas mais brandos que os vírus da Taura (Taura syndrome virus - TSV), e que
os vírus causadores da Mancha Branca (White spot syndrome virus - WSSV) e da
Cabeça Amarela (Yellow head virus - YHV). Animais desafiados pelos vírus TSV,
WSSV e YHV, em condições de laboratório, apresentam 100% de mortalidade
acumulada 10 dias após desafio enquanto os animais desafiados com IMNV só
atingem taxas semelhantes 52 dias após o desafio (LU et al., 1994; OVERSTREET
et al., 1997; TANG & LIGHTNER, 2000; TANG et al., 2005). A maioria dos vírus
patogênicos que acometem camarões pode causar infecções persistentes, mas em
baixo nível. Em decorrência disso, geralmente, o cultivo dos camarões infectados
por IMNV não é interrompido, permitindo o estabelecimento do vírus em animais
saudáveis e gerando grandes prejuízos advindos de gastos com alimentação e
manejo.
Geralmente as doenças virais surgem como resultado de um aumento na
contagem viral em decorrência de várias formas de estresse ambiental ou fisiológico
(PENG et al., 1998; COWLEY et al., 2002; LOTZ, ANTON & SOTO, 2005;
SANCHEZ-MARTINEZ et al., 2007). Um camarão pode ser infectado
simultaneamente ou sequencialmente por múltiplos vírus e/ou por diferentes
linhagens de um mesmo vírus (FLEGEL et al., 2004; HOA et al., 2005). Um
levantamento epidemiológico para monitoramento de TSV e IMNV em fazendas do
estado de Pernambuco mostrou que a incidência de TSV é baixa, mas nove das
onze propriedades analisadas apresentaram camarões infectados com IMNV
(PINHEIRO et al., 2007). Quatro espécies de camarão já foram identificadas como
24
susceptíveis ao IMNV: L. vannamei, de maior interesse comercial no Brasil, e as
espécies L. stylirostris, Farfantepenaeus subtilis e Penaeus monodon (LIGHTNER et
al., 2004; TANG et al., 2005).
O IMNV é um vírus não envelopado, com simetria icosaédrica e 40 nm de
diâmetro. A partícula também possui protrusões em seu capsídeo que
provavelmente estão envolvidas na transmissão extracelular e patogenicidade viral
(POULOS et al., 2006; TANG et al., 2008). O genoma viral é formado por uma única
molécula de RNA dupla fita contendo 7.561 pares de bases e apresenta duas ORFs
(Open Reading Frames) em diferentes frames: A ORF1 no frame 1 (nucleotídeos
136 a 4.953) e a ORF2 no frame 3 (nucleotídeos 5.241 a 7.490). A ORF1 codifica
uma proteína de 1.605 aa (179 kDa) que provavelmente é clivada, gerando a
proteína principal do capsídeo (MCP) e uma proteína que compartilha motivos de
uma proteína de ligação a dsRNA (RBP). Além disso, duas outras proteínas
menores (Small Proteins), de 32 kDa e 38 kDa, foram visualizadas em gel
desnaturante e parecem corresponder às protrusões que estariam envolvidas na
entrada do vírus na célula, incluindo a ligação ao receptor e/ou penetração na
membrana. A ORF2 (nucleotídeos 5241 a 7490) codifica uma proteína de 749 aa (85
kDa) que contém domínios característicos de uma RNA polimerase dependente de
RNA (RdRp) e classificam o IMNV como sendo um membro da família Totiviridae.
Estas ORFs aparentemente não se sobrepõem, existindo um espaço de 287
nucleotídeos entre elas (Figura 2) (POULOS et al., 2006; TANG et al., 2008).
25
Figura 2: Organização do genoma do IMNV mostrando 5’ e 3’UTR e as duas ORFs não sobrepostas. 1 – Proteína de ligação ao dsRNA (10 kDa); 2 – Protrusão? (31 kDa); 3 – Protrusão? (36 kDa); 4 – Proteína principal do capsídeo (99 kDa); 5 – RNA polimerase dependente de RNA (85 kDa) (adaptado de POULOS et al., 2006; NIBERT, 2007).
Posteriores análises na sequência genômica revelaram a presença de dois
motivos 2A-like (GDVESNPGP e GDVEENPGP) na ORF1 do IMNV precedendo a
proteína do capsídeo. Os nonapeptídeos GDVESNPGP e GDVEENPGP abrangem
os aminoácidos 86-94 e 370-378, respectivamente. A presença desses dois motivos
reforça o pressuposto de que a ORF1 é uma poliproteína que posteriormente é
clivada gerando fragmentos consecutivos de 93, 284 e 1.228 aa. Esse último
fragmento provavelmente também é clivado gerando a MCP (901 aa) e outro
fragmento de 327 aa. O fragmento de 93 aa possivelmente corresponde à proteína
de ligação a dsRNA (RBP) e os fragmentos de 284 e 327 aa corresponderiam às
proteínas de 32kDa e 38 kDa, respectivamente, vistas em gel desnaturante
(NIBERT, 2007).
É provável que, em alguns vírus, as duas ORFs estejam sobrepostas em
199 nucleotídeos, sendo traduzidas conjuntamente e gerando uma proteína de 1.734
aminoácidos (196 kDa) que seria, posteriormente, clivada. Isso é possível se ocorrer
frameshift ribossomal -1 na região de sobreposição das ORFs (NIBERT, 2007). O
26
frameshifti ribossomal -1 é frequentemente associado a um motivo “shifty heptamer”,
XXXYYYZ, onde X é A, C, G ou U, Y é A ou U, e Z é A, C ou U (BEKAERT et al.,
2003; JACKS et al., 1988). A sequência GGGUUUU, que se qualifica como um
“shifty heptamer” foi encontrada na região de sobreposição das ORFs do IMNV
(NIBERT, 2007). Além disso, imediatamente antes dessa sequência se encontra o
dinucleotídeo UC que pode favorecer o frameshifting ribossomal -1 (BEKAERT &
ROUSSET, 2005). Esta estratégia de codificação é semelhante aos vírus que
infectam Giardia lamblia (WANG et al., 1993; LI, WANG & WANG, 2001) e
Saccharomyces cerevisae (DINMAN, ICHO & WICKNER, 1991).
1.2.1 Proteína de ligação a RNA (RBP)
O primeiro produto codificado pela ORF1 (93 aa) apresenta uma região de 60
aminoácidos na extremidade N-terminal que compartilha um domínio conservado de
ligação a dsRNA (DSRM) (POULOS et al., 2006). Esses domínios são encontrados
em uma variedade de proteínas de ligação a RNA, apresentando diferentes
estruturas e funções (BURD & DREYFUSS, 1994).
Devido à natureza de seu genoma, os vírus de RNA precisam utilizar muitas
RBPs (LI & NAGY, 2011). O vírus da influenza possui uma nucleoproteína de ligação
a RNA (NP) cuja função primária é a encapsidação do genoma viral para fins de
transcrição, replicação e empacotamento. Essa proteína pode interagir com uma
grande variedade de moléculas virais ou da célula do hospedeiro, incluindo o próprio
RNA, RNA polimerases dependentes de RNA e a proteína da matriz viral (PORTELA
& DIGARD, 2002). Também foi visto que as proteínas NS1-BP e hnRNP K do vírus
da Influenza A podem estar envolvidas no processo de splicing do RNA. No vírus da
27
Hepatite C, a RBP NS5A pode desempenhar um papel significante na regulação da
passagem do processo de tradução para replicação do genoma, recrutamento das
polimerases e helicases para o RNA viral e aumento nas processividades das
mesmas (HUANG et al., 2005). Além do seu papel nos processos de replicação e
transcrição, as RBPs virais também parecem aumentar a resposta imune inata
iniciada pelo receptor Toll-like 3 (TLR3) (LAI et al., 2011).
1.2.2 Proteína Principal do Capsídeo (MCP)
A MCP do IMNV compreende os aminoácidos 705-1.605 (901 aa), possuindo
uma massa predita de 99 kDa e sequência N terminal IVSMENQSEID (POULOS et
al., 2006). A estrutura tridimensional do capsídeo do IMNV foi elucidada em 2008 por
Tang e colaboradores (Figura 3). Análises de crio-microscopia eletrônica de
transmissão (cryo-TEM) e reconstrução de imagem 3D revelam que o IMNV tem um
capsídeo formado por 120 subunidades organizado como um arranjo T=2 e
apresenta-se como uma estrutura dobrada em forma pentamérica na qual possui um
complexo de fibras de natureza proteica (Figura 3A). Assim como observado para o
capsídeo de outros totivirus, existem 60 cópias quimicamente idênticas de cada
subunidade, denominadas A e B. As subunidades A formam clusters pentaméricos
em torno de cada um dos 12 eixos quíntuplos, e as subunidades B formam clusters
triméricos em torno dos 20 eixos triplos. Além disso, cinco subunidades B se
encontram em torno de cada pentâmero A formando um decâmero compacto
centrado em cada eixo quíntuplo. As interações entre os decâmeros podem ocorrer,
principalmente, de duas formas: (i) duas subunidades A de decâmeros adjacentes
participam de contatos assimétricos através de cada eixo icosaédrico duplo, e (ii)
28
três subunidades B de decâmeros adjacentes participam de interações assimétricas
em torno de cada eixo triplo (Figura 3B). Todos os contatos entre as subunidades A
e B são assimétricos. Essas unidades assimétricas são formadas pelo dímero MCP-
A/B, totalizando 60 unidades diméricas formando o capsídeo. Com relação ao RNA
dupla fita encontrado dentro do capsídeo, este parece se organizar de forma
helicoidal, de maneira bastante simétrica (Figura 3A) (TANG et al., 2008).
Figura 3: Reconstrução em imagem 3D do IMNV a uma resolução de 8.0 Å. (A) Secção central com valores de densidade codificados em escala de cinza (quanto mais escuro, mais denso). Os eixos de simetria estão indicados no quadrante superior direito. (B) Visão da superfície do IMNV mostrando a simetria icosaédrica do capsídeo e as subunidades A (azul e ciano) e B (vermelho, rosa e laranja) (adaptado de TANG et al., 2008).
Dados estruturais de alta resolução sobre as proteínas do capsídeo de vírus
da família Totiviridae são escassos. Somente uma estrutura em cristal disponível foi
resolvida, para a MCP do vírus que infecta Saccharomyces cerevisae L-A (ScV-L-A)
(Figura 4) (NAITOW et al., 2002). Como observado no capsídeo do IMNV e de
outros totivírus, o capsídeo do ScV-L-A é formado a partir de 60 cópias de pseudo
capsômeros, cada um composto de duas moléculas de MCP que possuem
sequências de aminoácidos idênticas mas suas estruturas terciárias são diferentes,
principalmente nos resíduos localizados na superfície da proteína. Cada molécula de
A B
29
MCP é formada por duas α-hélices localizadas próximas aos eixos icosaédricos
quíntuplos e várias folhas β próximas aos eixos duplos e triplos (NAITOW et al.,
2002).
Figura 4: Modelo em 3D da subunidade A do capsídeo de Saccharomyces cerevisae L-A (ScV-L-A). A figura mostra o “trench” acessível a partir da superfície da partícula (outside) e o resíduo de His 154. As extremidades N- e C-terminais estão voltadas para o interior do capsídeo (inside) (adaptado de NAITOW et al., 2002).
As subunidades do capsídeo de ScV-L-A geram mRNAs sem o cap5’ pela
remoção enzimática dessa estrutura na presença do resíduo de His 154 presente na
MCP (BLANC, GOYER & SONENBERG, 1992). A estrutura para a MCP de ScV-L-A
revela uma “vala” (“trench”) estreita e profunda no sítio ativo e um resíduo de His
154 necessário para a reação de remoção do cap5’ (Figura 4). O “trench” é formado
por vários loops que abrem e fecham a estrutura por se encontrarem na superfície
da partícula. O mRNA celular pode, então, ser capturado por esses loops e
posicionados no “trench” para a reação ocorrer (NAITOW et al., 2002).
30
1.2.3 Protrusões virais
Análises de reconstrução de imagem em 3D mostraram que o capsídeo do
IMNV possui fibras complexas que se estendem a aproximadamente 80 Å dos eixos
quíntuplos do capsídeo (Figuras 3 e 5). Esses elementos mostraram menos
densidade e resolução do que o capsídeo, o que pode ser explicado pela sua
flexibilidade lateral e compreendem pelo menos três domínios morfológicos: knob,
mais externo; stalk, no meio e; foot mais interno e ancorado ao capsídeo. O
comprimento total de cada protrusão, incluindo o domínio foot, é de
aproximadamente 100 Å (Figura 5) (TANG et al., 2008).
Figura 5: Estrutura tridimensional prevista para o vírus da mionecrose infecciosa. À direita, um detalhamento da estrutura da protrusão do capsídeo viral (adaptado de TANG et al., 2008).
Até o momento, a presença de protrusões ao longo do capsídeo viral é uma
característica exclusiva do IMNV quando comparado a outros membros da família
Totiviridae e, possivelmente, contribuem para os padrões de virulência e
patogenicidade específicos do IMNV uma vez que ele é considerado como único
membro da sua família a ser transmitido extracelularmente entre os organismos
31
hospedeiros. Outros membros da família Totiviridae estão associados com infecções
avirulentas, enquanto que o IMNV causa uma doença geralmente fatal em camarões
peneídos (LIGHTNER et al., 2004; POULOS et al., 2006; GHABRIAL, 2008; TANG
et al., 2008). Entretanto, é possível que o totivírus que infecta o salmão do Atlântico,
Piscine myocarditis virus (PMCV), também possua essas estruturas. O PMCV causa
uma doença fatal em seu hospedeiro e, assim como o IMNV, presume-se que sua
transmissão seja extracelular. Além disso, esse vírus possui sequências codificantes
extras em seu genoma que podem estar envolvidas nos mecanismos de entrada
celular (NIBERT & TAKAGI 2013). O IMNV foi o primeiro vírus da família Totiviridae
descoberto como sendo capaz de infectar um hospedeiro diferente de protozoários
ou fungos e, até o momento, ele é o único membro dessa família capaz de infectar
crustáceos.
Alguns estudos têm mostrado que as regiões que codificam protrusões
apresentam grande variabilidade genética em diferentes vírus, permitindo que eles
se adaptem a diferentes situações (CAVANAGH, DAVIS & MOCKETT, 1988; LEE et
al., 2010; PROMKUNTOD et al., 2014). Já se sabe que proteínas semelhantes a
protrusões estão envolvidas na entrada de certos vírus, como os coronavírus, na
célula hospedeira, além de desempenhar um papel importante na determinação da
gama de hospedeiros (ENJUANES et al., 2006; PERLMAN & NETLAND 2009;
BELOUZARD et al., 2012).
O capsídeo adornado com protrusões do IMNV sugere um mecanismo
evolucionário simples que fornece um novo conjunto de funções capazes de
expandir os padrões de infectividade do vírus. A evolução do IMNV a partir de
totivírus mais simples pode ter incluído a aquisição de sequências codificantes para
as protrusões, o que permite a transmissão extracelular (TANG et al., 2008).
32
1.2.4 RNA Polimerase Dependente de RNA (RdRp)
A ORF2 do genoma do IMNV apresenta um domínio conservado
característico de RNA polimerases dependente de RNA. As RdRps desempenham
um papel central na replicação dos vírus de dsRNA. Apesar das altas taxas de
mutações que ocorrem em vírus de RNA, as RdRps são geralmente bastante
conservadas nas famílias virais, especialmente dentro de motivos funcionais, e são
bons alvos para estudos filogenéticos (O’REILLY & KAO, 1998). Análises
comparativas utilizando a região da RdRp do IMNV o caracterizam como um
membro da família Totiviridae, similar ao vírus que infecta o protozoário Giardia
lamblia (POULOS et al., 2006; NIBERT, 2007). Estudos sobre estrutura e função de
RdRps tem sido relatados para vários vírus como Rhinovírus (LOVE et al., 2004),
Picornavírus (KOK & MCMINN, 2009) e o vírus da Hepatite C (WAHEED, BHATTI &
ASHRAF, 2013). A primeira estrutura em cristal da RdRp foi resolvida para o
poliovírus podendo ser comparada com outras polimerases (Figura 6) (HANSEN,
LONG & SCHULTZ, 1997).
As estruturas das RNA polimerases (RNAPs) geralmente apresentam uma
arquitetura comum descrita como uma “right hand”, contendo os domínios “thumb”,
“fingers” e “palm” (Figura 6). O domínio “palm” parece catalisar a reação de
transferência do grupo fosforila durante o processo de replicação enquanto que o
domínio “fingers” está envolvido nas interações envolvendo os trifosfatos de
nucleosídeos e pareamento do template. O domínio “thumb” provavelmente
desempenha um papel na processividade e translocação da RNAP (STEITZ, 1999).
Em RdRps, o domínio “palm” apresenta quatro sequências-motivo encontradas em
todas as classes de RNAPs, denominadas A, B, C e D, e uma sequência-motivo
33
adicional E que é única de RdRps e transcriptases reversas (RTs) (Figura 6) (POCH
et al., 1989). Outras três sequências-motivo (F1, F2 e F3) também encontradas em
RdRps, parecem estar envolvidas na separação da dupla fita do RNA para a
transcrição (BRUENN, 2003). Os motivos A e C estão envolvidos na coordenação do
magnésio; o motivo A também pode desempenhar um papel na discriminação entre
ribose e desoxirribose, assim como o motivo B; o motivo D completa a estrutura do
domínio “palm”; e o motivo E está envolvido em interações hidrofóbicas com o
domínio “thumb” (O’REILLY & KAO, 1998).
Figura 6: Estrutura da RNA polimerase dependente de RNA do poliovírus. Os domínios “thumb”, “fingers” e “palm” estão indicados. As sequências-motivo encontradas no domínio “palm” estão destacadas nas seguintes cores: A em vermelho, B em verde, C em amarelo, D em roxo claro e E em roxo escuro (adaptado de HANSEN, LONG & SCHULTZ, 1997).
34
1.3 VARIABILIDADE GENÉTICA EM VÍRUS
O estudo da variabilidade genética é uma abordagem interessante quando se
deseja compreender mais profundamente a biologia dos seres vivos. Os vírus de
RNA sofrem grande taxa de mutação principalmente devido a falta de atividade de
correção de erros da RNA polimerase. O conhecimento de que alterações em
regiões específicas do genoma de diferentes vírus influenciam em sua capacidade
de infecção e mecanismos de patogenicidade já é amplamente difundido. As
primeiras evidências surgiram do estudo de viróides, que tinham sua capacidade de
infecção, replicação e patogenicidade afetadas por alterações induzidas em seu
genoma de RNA (TABLER & SFINGER, 1985; SANO et al., 1992). Hoje existem
inúmeros trabalhos que associam a variabilidade genética de diferentes vírus a sua
patogenicidade. Alguns exemplos clássicos em doenças humanas são a correlação
da variabilidade observada no gene NS5A do vírus causador da hepatite C e a
resistência do vírus ao interferon, a correlação entre polimorfismos no gene que
codifica a transcriptase reversa do HIV (Human Immunodeficiency Virus) e
alterações na propagação e resistência do vírus, e a presença de polimorfismos
associados à infectividade na ORF26 do herpesvírus causador do Sarcoma de
Kaposi (ENOMOTO et al., 1996., CHAYAMA et al., 1997; KUROSAKI et al., 1997;
ZONG et al., 2007; KEARNEY et al., 2008; BITTAR et al., 2010; PINHO et al., 2010).
Polimorfismos no genoma também podem afetar as propriedades dos vírus
por alterarem a estrutura secundária do RNA. Acredita-se que a estrutura secundária
de genomas virais, particularmente em regiões não traduzidas desempenha um
papel central no ciclo de vida viral, em particular nos processos de replicação e
tradução (CLYDE, BARRERA & HARRIS, 2008; KORAKA et al., 2009). Em um
35
estudo desenvolvido por McBridge & Panganiban (1996) relatou-se que estruturas
hairpin estão envolvidas no encapsulamento do vírus HIV-1. Foi visto que
perturbações em um único hairpin, seja por deleção ou substituição de bases, pode
ter um efeito parcial sobre o encapsulamento. Porém, quando dois hairpins são
afetados, os efeitos são mais significativos.
O estudo de variabilidade genética em vírus que acometem animais de
criação é fundamental para caracterização de cepas virulentas e desenvolvimento
de vacinas. Análises de variabilidade genética de proteínas estruturais de diferentes
linhagens do vírus causador da encefalite equina (Western equine encephalitis virus
- WEEV), uma doença que é problema de saúde pública nos Estados Unidos,
possibilitaram definir os principais aminoácidos responsáveis pelos mecanismos de
virulência deste vírus (NAGATA et al., 2006). O vírus da doença infecciosa da bursa
(IBDV), causador da doença de gumboro, uma das principais doenças para a
avicultura brasileira, pode ser classificado de acordo com sua antigenicidade e
patogenicidade pela região hipervariável do gene VP2, que codifica uma proteína do
capsídeo viral (LANA, BEISEL & SILVA, 1992). A diversidade genética de sete
isolados no vírus Sacbrood na China foi estudada e regiões hipervariáveis no gene
VP1 já foram sequenciadas e caracterizadas a fim de se obter informações sobre
epidemiologia e imunologia do vírus (MINGXIAO et al., 2013).
O estudo da variabilidade genética também é de suma importância para o
desenvolvimento de sistemas diagnósticos. Em vírus que acometem a carcinicultura,
foi demonstrado que os polimorfismos identificados na ORF94 do WSSV podem
afetar o resultado de alguns testes diagnósticos baseados na amplificação via PCR
(Polymerase Chain Reaction) ou na detecção de proteínas do vírus via anticorpos
(MUSTHAQ et al., 2006). Análises de sequências da ORF1 de YHV da região do
36
Indo-Pacífico permitem a diferenciação de pelo menos seis diferentes linhagens do
vírus, sendo que, apenas duas dessas linhagens provocam a doença
(WIJEGOONAWARDANE et al., 2008).
Existe apenas um trabalho voltado para o estudo da variabilidade genética do
IMNV (NAIM, BROWN & NIBERT, 2014), publicado recentemente. Entretanto, até o
momento, não foram observados estudos que levem em consideração a
variabilidade genética do IMNV no desenvolvimento de métodos diagnósticos
capazes de identificar diferentes isolados do vírus.
1.4 SISTEMAS DE DETECÇÃO PARA O IMNV
Os crustáceos parecem não possuir imunidade adaptativa nem memória
imunológica e não existem drogas ou vacinas contra as doenças virais que
acometem camarões. O sistema de defesa dos camarões depende principalmente
da imunidade inata a qual é formada por defesas humorais e celulares (KURTZ,
2004; JIRAVANICHPAISAL, LEE & SÖDERHÄLL, 2006). O monitoramento e o
controle da disseminação de doenças na carcinicultura dependem do
desenvolvimento de ferramentas rápidas e específicas para detecção e
caracterização dos patógenos.
A Organização Mundial de Saúde Animal indica o diagnóstico do IMNV
através de técnicas moleculares. Já foram desenvolvidos sistemas de detecção do
IMNV por RT-PCR (Reverse Transcription Polymerase Chain Reaction) analisado
tanto da forma tradicional quanto em tempo real, que atingem o limite de detecção
mínimo de 10 cópias do vírus por microlitro de RNA total extraído (TANG et al.,
2005; POULOS et al., 2006; POULOS & LIGHTNER, 2006; ANDRADE et al., 2007;
37
LIU et al., 2013). Recentemente foram desenvolvidas outras ferramentas
promissoras para detecção do IMNV, como anticorpos monoclonais para detecção
de proteínas virais (KUNANOPPARAT et al., 2011; MELLO et al., 2011;
CHAIVISUTHANGKURA et al., 2013) e sistemas de detecção baseados em RT-
LAMP (Reverse Transcription Loop Mediated Isothermal Amplification) (ANDRADE &
LIGHTNER, 2009; PUTHAWIBOOL et al., 2009; ARUNRUT, SUEBSING &
KIATPATHOMCHAI, 2013). Além dessas ferramentas, métodos de imunização
baseados em RNA de interferência (RNAi) estão sendo desenvolvidos para o
monitoramento e controle do IMNV (LOY et al., 2012; LOY et al., 2013).
Apesar dos avanços recentes nos sistemas de detecção do patógeno, ainda
não existem métodos direcionados à identificação da variabilidade genética do
IMNV. O monitoramento em campo revela que em algumas amostras dadas como
positivas não se observa sintomas nos animais, e geralmente existem diferenças na
gradação dos sintomas e evolução da doença em diferentes regiões. Essas
diferenças podem estar associadas a variações ambientais e/ou a diferentes
variantes do vírus. O monitoramento e o controle de doenças virais que acometem a
carcinicultura dependem de ferramentas rápidas e precisas para detecção e
caracterização do patógeno.
O estudo do genoma de determinada espécie de vírus e a sua variabilidade
genética, implica em conhecer e comparar os genomas existentes na natureza e
suas principais proteínas, seja no nível de sequência nucleotídica ou aminoacídica,
seja no nível estrutural. Esse conhecimento permite identificar, em um primeiro
momento, quais são as regiões mais variáveis no genoma e quais são as
consequências dessas variações nas proteínas codificadas pelo vírus. A partir
38
desses dados é possível inferir como essas variações poderiam afetar a biologia do
vírus e desenvolver novos sistemas de detecção mais eficientes.
No presente trabalho, a variabilidade genética do IMNV foi estudada a partir
da sequência de quatro genomas completos. Com base nesses dados foi elaborado
um mapa com os sítios polimórficos existentes no genoma e possíveis influências
das regiões variáveis sob a estrutura das proteínas codificadas foram propostas.
Além disso, foram realizadas predições de estruturas secundárias e terciárias para
as proteínas. A partir desses resultados foi desenvolvido um sistema de detecção
baseado em PCR, capaz de diferenciar os isolados do IMNV estudados aqui a partir
da identificação de polimorfismos no genoma.
39
2 OBJETIVOS
Geral:
Estudar o genoma completo do IMNV e os possíveis produtos gênicos
codificados e desenvolver um sistema de detecção baseado em PCR que
permita diferenciar isolados do vírus com base na presença de polimorfismos.
Específicos:
Verificar as relações de parentesco entre membros da família Totiviridae
utilizando sequências já disponíveis no GenBank;
Identificar a incidência do IMNV em camarões coletados no Nordeste;
Sequenciar e montar o genoma completo de pelo menos dois isolados
diferentes do IMNV;
Comparar os genomas obtidos entre si e com genomas completos do
IMNV já depositados no GenBank;
Analisar a localização de sítios polimórficos e verificar se esses sítios
causam alterações em aminoácidos e/ou em suas características;
Identificar regiões variáveis e conservadas presentes no genoma do vírus;
Estudar in silico a composição de aminoácidos e as estruturas
secundárias das proteínas que compõem o genoma do IMNV;
Modelar in silico a estrutura terciária das proteínas RBP, MCP e RdRp;
Desenhar primers específicos com base nas regiões variáveis e
conservadas identificadas no genoma;
Desenvolver métodos de diagnósticos para diferenciar os isolados
utilizando a técnica de PCR.
40
3 MATERIAIS E MÉTODOS
3.1 ANÁLISE FILOGENÉTICA
As sequências de nucleotídeos e aminoácidos de representantes da família
Totiviridae foram obtidas a partir do GenBank (www.ncbi.nlm.nih.gov) e UniProt –
Universal Protein Resource (www.uniprot.org). As sequências foram alinhadas com o
auxílio das ferramentas TCOFFEE e MCOFFEE (NOTREDAME, HIGGINS &
HERINGA, 2000) usando parâmetros default, e manualmente editadas usando
Jalview versão 2.8 (WATERHOUSE et al., 2009). As Open Reading Frames (ORFs)
e domínios conservados de proteínas foram identificados através do ORF finder
(http://www.ncbi.nlm.nih.gov/projects/gorf/) e do Conserved Domains Database –
CDD (http://www.ncbi.nlm.nih.gov/Structure/cdd/cdd.shtml), respectivamente. As
sequências de aminoácidos da RdRp foram então alinhadas no programa MAFFT
versão 6.85 (KATOH & TOH, 2010; KATOH & FRITH, 2012) com parâmetro L-INS-I
que avalia a consistência do alinhamento, gap opening penalty 1.53 e offset value
0.1, guiado por alinhamento estrutural da família de proteínas pfam02123, presente
no CDD (MARCHLER-BAUER et al., 2011). A sequência da RdRp de Micromonas
pusilla virus (família Reoviridae; número de acesso YP654545) foi usada como
outgroup devido sua alta proximidade e similaridade com a família Totiviridae. O
melhor modelo de substituição de aminoácidos foi estimado por análise de
verossimilhança usando o programa ProtTest versão 3.2 (ABASCAL, ZARDOYA &
POSADA, 2005). O cálculo dos dendogramas foi baseado em análise Bayesiana,
usando os programas MrBayes versão 3.2.1 (RONQUIST & HUELSENBECK, 2003;
RONQUIST et al., 2012), e BEAST versão 1.8 (DRUMMOND et al., 2012). Todos os
41
indels e sítios não informativos (missing data) no alinhamento foram tratados como
deleções parciais, com um corte de 75%, para permitir potenciais regiões ambíguas
nas topologias, resultado em 530 sítios de parcimônia informativos no dataset. A
inferência Bayesiana foi conduzida em três corridas (runs) independentes, com
modelos fixos LG ou WAG, taxas de distribuição gama entre os sítios e frequências
de aminoácidos fixas. Cada Cadeia de Markov foi iniciada com uma árvore aleatória
e rodada por 106 gerações, com dados amostrados a cada 100 gerações, e a árvore
consenso foi estimada usando um “burn in” de 1.000.000 árvores. A convergência
das corridas foi avaliada usando a ferramenta Tracer versão 1.5 (DRUMMOND &
RAMBAUT, 2007), a fim de avaliar estatisticamente a robustez da análise
Bayesiana. As árvores geradas pelos programas foram editadas no programa
FigTree versão 1.4.1 (DRUMMOND & RAMBAUT, 2007).
3.2 OBTENÇÃO DAS AMOSTRAS DE CAMARÃO
Amostras de camarão da espécie Litopenaeus vannamei possivelmente
infectadas com IMNV foram gentilmente cedidas por empresas do Nordeste do
Brasil. As amostras eram oriundas de diferentes regiões do litoral do Nordeste
brasileiro e foram coletadas em anos diferentes. A maioria das amostras
correspondia ao camarão intacto, apresentando ou não sintomas da doença. Outras
duas amostras correspondiam a um lisado de células de camarão, um conservado
de forma congelada e outro em etanol 70%. Essas duas últimas amostras foram
coletadas em 2009 no estado do Pernambuco/BR e em 2013 no estado do Rio
Grande do Norte/BR, respectivamente.
42
3.3 SCREENING INICIAL PARA DETECÇÃO DO IMNV EM DIFERENTES
AMOSTRAS DE CAMARÃO
Inicialmente, para a detecção dos vírus nas amostras de camarão, foram
utilizadas duas estratégias: (i) PCR-Nested, utilizando primers desenvolvidos por
Senapin et al. (2007), especificamente os pares de primers F13/R13 e F13N/R13N
e; (ii) o método de identificação tradicional que utiliza os primers desenvolvidos pela
World Organization for Animal Health (OIE). Após as análises iniciais, a identificação
dos vírus foi realizada empregando o par de primers F14/R14. As sequências dos
primers usados em cada análise estão listadas na Tabela 1.
As amostras de camarões, possivelmente infectadas foram analisadas como
descrito a seguir.
Tabela 1: Lista dos primers usados em cada análise para identificar o IMNV nas amostras de camarões Litopenaeus vannamei.
Primer Sequência (5’ → 3’) Referência
F13 TTTATACACCGCAAGAATTGGCCAA
Senapin et al., 2007 R13 AGATTTGGGAGATTGGGTCGTATCC
F13N TGTTTATGCTTGGGATGGAA
R13N TCGAAAGTTGTTGGCTGATG
4587F CGACGCTGCTAACCATACAA
OIE 4914R ACTCGGCTGTTCGATCAAGT
4725NF GGCACATGCTCAGAGACA
4863NR AGCGCTGAGTCCAGTCTTG
F14 GAGTACCATCAGGAGTGAGAATAAC Senapin et al., 2007
R14 GATGTATGTCCTCTACGTTAACCAA
43
3.3.1 Extração de RNA total
A extração de RNA total foi realizada utilizando o KIT NUCLEOSPIN®RNA II,
seguindo as instruções do fabricante. Aproximadamente, 50 µg de tecido foram
retirados do sexto segmento abdominal do camarão. Em seguida, o tecido foi
macerado, vortexado e submetido às etapas de centrifugação descritas no manual
do kit de extração. Para as amostras de lisados de células de camarão conservadas
congeladas ou em etanol 70%, foram utilizados 30 µl e 60 µl de amostra,
respectivamente.
3.3.2 RT-PCR
3.3.2.1 Síntese de cDNA
A síntese de cDNA foi realizada seguindo o protocolo da enzima
Transcriptase Reversa ImPromII™ (Promega®) para um volume final de 20 µl, com
algumas modificações. Em tubos de 1,5 ml, foram adicionados 6,6 µl de RNA total e
4 µl de primers (5 µM cada). Essa mistura foi incubada a 85 ºC em banho Maria por
5 minutos e, imediatamente em seguida, colocada em gelo por 5 minutos.
Posteriormente foram adicionados aos tubos 4 µl de Reaction Buffer 5X, 2,4 µl de
MgCl2 25 mM, 2 µl de dNTP mix 5 mM cada e 1 µl da enzima Transcriptase Reversa.
Em seguida, os tubos foram submetidos às seguintes etapas: (1) temperatura
ambiente (± 25 ºC) por 5 minutos, para anelar os primers; e (2) 50 ºC por 60 minutos
em banho Maria, para extensão das fitas de cDNA.
44
3.3.2.2 Reação em Cadeia da Polimerase (PCR)
A reação em cadeia da polimerase foi realizada de acordo com o protocolo da
Taq Biotools, com algumas modificações. As amplificações foram conduzidas em
volume final de 20 µl contendo 10,8 µl de água Milliq, 2 µl de Reaction Buffer 10X, 1
µl de MgCl2 50 mM, 0,8 µl de dNTP mix 5 mM cada, 0,4 µl de Taq polimerase (5
U/µl), 4 µl de cDNA e 1 µl de primer. Para a amostra conservada em etanol 70%, as
quantidades de água e cDNA foram 7,8 µl e 7 µl, respectivamente.
Os ciclos térmicos empregados nas análises variaram conforme os primers
usados:
(i) Desnaturação inicial a 94 ºC por 2 minutos, seguido por 30 ciclos de
desnaturação a 94 ºC por 40 segundos, anelamento a 45 ºC por 40 segundos,
extensão a 72 ºC por 40 segundos, e extensão final a 72 ºC por cinco minutos. Na
reação nested, o ciclo correspondia a uma desnaturação inicial a 94 ºC por 5
minutos, seguido por 25 ciclos de desnaturação a 94 ºC por 45 segundos,
anelamento a 50 ºC por 45 segundos, extensão a 72 ºC por 30 segundos, e
extensão final a 72 ºC por cinco minutos (primers F13/R13 e F13N/R13N
desenvolvidos por Senapin et al., 2007).
(ii) Desnaturação inicial a 95 ºC por 2 minutos, seguido por 39 ciclos de
desnaturação a 95 ºC por 45 segundos, anelamento a 60 ºC por 45 segundos, e
extensão final a 60 ºC por sete minutos. Na reação nested, o ciclo correspondia a
uma desnaturação inicial a 95 ºC por 2 minutos, seguido por 39 ciclos de
desnaturação a 95 ºC por 30 segundos, anelamento a 65 ºC por 30 segundos,
extensão a 72 ºC por 30 segundos, e extensão final a 72 ºC por dois minutos
(primers desenvolvidos pela OIE).
45
(iii) Desnaturação inicial a 94 ºC por 2 minutos, seguido por 30 ciclos de
desnaturação a 94 ºC por 30 segundos, anelamento a 55 ºC por 45 segundos,
extensão a 72 ºC por 45 segundos, e extensão final a 72 ºC por cinco minutos
(primers F14/R14 desenvolvidos por Senapin et al., 2007).
Os produtos da amplificação foram visualizados em gel de agarose 1%, na
presença de brometo de etídio. Os tamanhos dos fragmentos foram determinados
através de um marcador de peso molecular DNA Marker Hae III (Sigma) e
visualizados em transluminador UV.
3.4 AMPLIFICAÇÃO E SEQUENCIAMENTO DO GENOMA VIRAL
Para a amplificação do genoma viral completo, as etapas de extração de RNA
total, síntese de cDNA e técnica de PCR procederam conforme descrito
anteriormente. O ciclo térmico empregado foi o mesmo daquele utilizado para os
primers F14/R14.
A estratégia de amplificação e os primers usados para amplificar o genoma
completo do vírus foram aqueles descritos no trabalho de Senapin et al. (2007). No
total, 15 regiões do genoma foram amplificadas por RT-PCR para produzir 13
fragmentos de 600 pb cada, 1 fragmento de 840 bp e 1 fragmento de 572 pb. Cada
fragmento amplificado tinha sua extremidade 3’ sobreposta com a extremidade 5’ do
fragmento adjacente. A estratégia de amplificação está mostrada na Figura 7 e a
lista das sequências de primers esta descrita na Tabela 2.
46
Figura 7: Estratégia empregada para amplificar o genoma completo do IMNV (adaptado de SENAPIN et al., 2007).
Tabela 2: Lista de primers usados para amplificar o genoma completo do IMNV (SENAPIN et al.,
2007).
Região Nome do primer foward /Sequência Nome do primer reverse/Sequência
1 F1/GGCAATTTCAACCTAATTCTAAAAC R1/TGAAAAATAAGCTGTGCCCCATGTT
2 F2/AATACTACATCATCCCCGGGTAGAC R2/GACTTTCTTCCCAAGATGGAGTCTC
3 F3/GAAGTTAAAGATGTAACACTTGCCT R3/ATACTCCTTCTCCAAAGGGTGTACG
4 F4/GATCCAGTTCTAACTAGAGAAGATA R4/TCCAGATACAATTACCATGCTGGTT
5 F5/GCAGCTTGGCTAAACAACAGACCAT R5/ATTCAATCCACGAATTTGTCTTGGT
6 F6/CTTCGTGATAATGACTCTATTAGGG R6/CTGTGGAACAGATTGTAAAGTAAGA
7 F7/ATAAATAATGGTGTTAATATATTTG R7/ACTAATTGGCAGTGTTGTTTTCATT
8 F8/GTTGGTGTGGCCCTGCCAACTGTAA R8/ACTACCTTGCATTGAACTCCACGAA
9 F9/GTTTGGTATTCAACAAGACGTATTT R9/AACATTAATACAACTCTCATCATGA
10 F10/GAGACAGGCAATGTATTCAGACCAT R10/CTCTTGCTGACTCGGCTGTTCGATC
11 F11/TCGGGTTTTATGAATGCCCGTTCCA R11/TTGATAACTGTTTTGCAATTTCAAT
12 F12/TTGTACAAAACATTTGTATCTATAT R12/CTTCGATGTTAGATGCCACAGCAAG
13 F13/TTTATACACCGCAAGAATTGGCCAA R13/AGATTTGGGAGATTGGGTCGTATCC
14 F14/GAGTACCATCAGGAGTGAGAATAAC R14/GATGTATGTCCTCTACGTTAACCAA
15 F15/AATATCTAGAATTGCCAAAACGACT R15/CATGGCTGGCCACAAAACCCAACTG
Nested F13N/TGTTTATGCTTGGGATGGAA R13N/TCGAAAGTTGTTGGCTGATG
47
Os produtos de PCR foram enviados à empresa Hellixa para serem
purificados e submetidos ao sequenciamento usando a plataforma da Applied
Biosystems® 3500 Genetic Analyzer, de acordo com as especificações do
fabricante. As concentrações dos produtos da amplificação foram mensuradas
previamente a fim de se verificar se os mesmos estavam na concentração adequada
para o sequenciamento. Os fragmentos foram sequenciados através do método de
sequenciamento Sanger, utilizando os primers descritos na Tabela 2 na
concentração de 5 µM cada primer. A reação de sequenciamento ocorreu em ambas
às direções, foward e reverse, para cada região. As regiões do genoma foram
sequenciadas no mínimo duas vezes (forward + reverse) e no máximo seis vezes
até a obtenção de uma sequência confiável. As análises dos eletroferogramas e a
montagem dos genomas foram realizadas usando parâmetros pré-definidos no
programa Geneious versão 6.1.6 (Disponível em Biomatters) e inspeção visual
cuidadosa.
3.5 ANÁLISE DAS SEQUÊNCIAS
As sequências genômicas completas obtidas foram analisadas no Basic Local
Alignment Search Tool – BLAST (ALTSCHUL et al., 1997) para confirmar suas
identidades e encontrar outras sequências similares. As sequências de aminoácidos
foram obtidas através do servidor Expert Protein Analysis System – ExPASy
(http://ca.expasy.org/). Uma análise comparativa entre os genomas obtidos neste
estudo com outros 2 genomas completos do IMNV disponíveis no GenBank
(números de acesso AY570982.2 e EF061744.1) foi realizada usando o programa
Geneious. Posteriormente, as quatro sequências foram alinhadas no ClustalW
48
(LARKIN et al., 2007), com parâmetros default, usando o software Jalview versão
2.8 (WATERHOUSE et al., 2009) para identificação dos sítios polimórficos e regiões
conservadas. Diferenças no nível de similaridade entre as regiões genômicas foram
plotadas pelo programa SimPlot versão 3.5.1 (LOLE et al., 1999), com os seguintes
parâmetros: modelo de árvore Neighbor joining, bootstrap igual a 1000 e modelo de
distância Kimura (2-parameter). Adicionalmente, a fim de investigar a similaridade
entre os genomas, uma análise de agrupamento, utilizando o método de Neighbor
joining foi feita no software MEGA versão 6.06 (TAMURA et al., 2013), usando o
modelo de substituição nucleotídica de Tamura-Nei e 1000 repetições de bootstrap,
como teste de confiança na topologia. Para esta análise, além das sequências
completas obtidas no presente estudo, foram usadas as seguintes sequências
disponíveis no GenBank: números de acesso JN391187.1, AB555544.1,
NC_013499.1, NC_014609.1, AY570982, EF061744.1.
3.6 ANÁLISE ESTRUTURAL DE PROTEÍNAS
A predição de regiões estruturadas e não estruturadas foi realizada através do
software Foldindex© que prediz se uma sequência de proteínas é intrinsecamente
desdobrada implementando o algorítimo de Uversky e colaboradores, o qual é
baseado na hidrofobicidade média dos resíduos e carga líquida das sequências
(PRILUSKY et al., 2005). Para a predição de coiled coils foi usado o programa Coils
(LUPAS, VAN DYKE & STOCK, 1991) com windows 14, 21 e 28. O programa
TMpred (HOFMANN & STOFFEL, 1993) foi empregado para avaliar a
hidrofobicidade e hidrofilicidade da proteína ao longo da sequência de aminoácidos,
e o software PredictProtein (ROST, YACHDAV & LIU, 2004) foi utilizado para
49
predizer estruturas em α-hélices e folhas β, assim como regiões da proteína
expostas ou não a solvente.
3.7 MODELAGEM PROTEICA
A predição de modelos estruturais foi realizada com auxílio dos programas I-
TASSER (servidor online) (ZHANG, 2008; ROY et al,. 2010) e Phyre2 (KELLEY &
STERNBERG, 2009). A metodologia do I-TASSER é baseada na predição por
homologia de estrutura e alinhamento por threading das sequências alvo com base
nas estruturas disponíveis na biblioteca do Protein Data Bank – PDB
(http://www.rcsb.org/pdb/home/home.do), complementando com simulações ab initio
para as cadeias laterais (ZHANG, 2007). O programa I-TASSER gera modelos
classificados pelo Z-Score, RMSD, densidade do cluster e, principalmente pelo C-
score. O C-score corresponde ao escore de confiança que estima a qualidade do
modelo gerado pelo I-TASSER cujo valor pode ser de -5 a 2 (quanto maior o valor
do C-score, maior será a confiança do modelo). Com relação ao programa Phyre2,
este realiza modelagem basicamente por homologia (KELLEY & STERNBERG,
2009).
Os modelos foram avaliados usando os softwares MOLPROBITY (CHEN et
al., 2010) e SWISS-MODEL (ARNOLD et al., 2006). Para a visualização dos
modelos, foram usados os softwares UFSC Chimera (PETTERSEN et al., 2004) e
PyMOL versão 1.5.0.4 (http://www.pymol.org/).
50
3.8 SISTEMAS DE DETECÇÃO DE POLIMORFISMOS
3.8.1 Teste de detecção baseado nas regiões variáveis e conservadas
Pares de primers foram desenhados com base em uma região conservada e
uma região variável do genoma. Todos os primers foram analisados nos programas
PrimerBlast (http://www.ncbi.nlm.nih.gov/tools/primer-blast/) para verificar o TM
(temperatura de melting) e anelamento inespecífico, e AutoDimer (VALLONE &
BUTLER, 2004) para verificar a formação de hairpins e dímeros de primers.
Um método de PCR convencional foi desenvolvido para identificar as duas
regiões escolhidas. Após a síntese de cDNA, foi realizada a PCR como descrito a
seguir: os primers (5 µM cada) foram usados em 20 µl de reação contendo 10,8 µl
de água Milliq, 2 µl de Reaction buffer 10X, 1 µl de MgCl2 50 mM, 0,8 µl de dNTP
mix 5 mM cada, 0,4 µl de Taq polimerase 5 U/µl e 4 µl de cDNA. A reação foi
submetida à desnaturação inicial a 94 ºC por 2 minutos, seguido por 30 ciclos de 94
ºC por 30 segundos, 58 ºC por 45 segundos, 72 ºC por 45 segundos, e extensão
final a 72 ºC por 5 minutos. Os amplicons gerados foram de 200 pb para a região
conservada e 456 pb para a região variável. Os produtos da PCR foram analisados
em gel de agarose 1,5% na presença de brometo de etídio, e visualizados em
transluminador.
Uma análise de agrupamento utilizando o método de Neighbor joining foi
realizada usando a sequência de nucleotídeos do fragmento de 456 pb. O
dendograma foi calculado no programa MEGA 6.06, usando o modelo Tamura-Nei e
1000 replicações de Bootstrap.
51
3.8.2 Teste de detecção baseado na análise da curva de melting de fita simples
Seis regiões no genoma (cada uma com 200 pb) foram selecionadas como
candidatas para o sistema de identificação de polimorfismos através da análise da
curva de melting de fita simples. Essas regiões foram submetidas à análise in silico
no programa RNAfold (http://rna.tbi.univie.ac.at) para predição da estruturas
secundárias de RNA e DNA, e nos softwares MELTSIM (BLAKE et al., 1999) e
RNAheat (HOFACKER et al., 1994) para a geração de curvas de melting de DNA fita
dupla e RNA fita simples, respectivamente. Os seis pares de primers (sequências
não mostradas) foram desenhados e analisados usando os programas PrimerBlast e
AutoDimer.
As análises in vitro procederam da seguinte maneira, em duas etapas:
(I) Em um volume final de 20 µl foram adicionados 10,8 µl de água Milliq, 2 µl
de Reaction Buffer 10X, 1 µl de MgCl2 50 mM, 0,8 µl de dNTP mix 5 mM
cada, 0,4 µl de Taq polimerase (5 U/µl), 4 µl de cDNA e 1 µl de primer (5
µM cada). O protocolo de termociclagem compreendia um passo inicial a
94 ºC por 2 minutos, seguido por 30 ciclos de desnaturação a 94 ºC por 30
segundos, anelamento a 55 ºC por 45 segundos, extensão a 72 ºC por 45
segundos, e extensão final a 72 ºC por cinco minutos.
(II) 4 µl do produto da primeira reação foi utilizado como template em um
volume final de 20 µl contendo 10 µl de mix SYBR green, 1 µl de primer
foward (5 µM) e 5 µl de água Milliq. Essa reação foi submetida a uma
desnaturação inicial a 94 ºC por 2 minutos, seguido por 30 ciclos de
desnaturação a 94 ºC por 30 segundos, anelamento a 55 ºC por 45
segundos, extensão a 72 ºC por 45 segundos, 30 ºC por 2 minutos, e
52
extensão final a 72 ºC por cinco minutos. Os parâmetros da curva de
dissociação foram padrões.
As curvas de melting in vitro foram visualizadas no software 7500 Fast Real-Time
PCR System versão 2.1.0 (Applied Biosystems®).
53
4 RESULTADOS
4.1 ANÁLISE FILOGENÉTICA DA FAMÍLIA TOTIVIRIDAE
Proteínas RdRp foram analisadas a fim de estimar a relação filogenética do
IMNV dentro da família Totiviridae. Trinta sequências de aminoácidos da RdRp de
membros representativos da família Totiviridae (Tabelas Suplementares 1 e 2) foram
alinhadas, e as relações entre elas está descrito no dendograma da Figura 8. Oito
clados monofiléticos distintos podem ser observados no dendograma e esses grupos
foram nomeados seguindo a classificação de Liu et al. (2012). O grupo IMNV-like, o
qual compreende vírus que infectam artrópodes, GLV-like e ScV-like coincide com
os descritos previamente (LIU et al., 2012). Quatro novos grupos foram
estabelecidos: MoV-like, compreendendo vírus que infectam plantas e fungos, TVV-
like e LRV-like, que abragem vírus que infectam protozoários parasitas humanos, e
GaRV-like, que compreende vírus de fungos. Para assegurar a eficiência da análise,
as relações entre os membros dos grupos TVV-like, LRV-like e GLV-like (Tabela
Suplementar 2) foram determinadas numa segunda análise filogenética (Figura
Suplementar 1). O vírus Zygosaccharomyces bailii (ZbV-Z) e dois outros vírus
relacionados isolados de plantas e fungos formaram o grupo ZbV-Z-like. Todos os
grupos observados estão de acordo com a classificação propostas pelo Comitê
Internacional de Taxonomia de Vírus (ICVT) (KING et al., 2012).
54
Figura 8: Análise filogenética de membros representativos da família Totiviridae. A árvore foi calculada a partir do alinhamento da sequência de aminoácidos da RdRp de 30 membros representativos da família Totiviridae, usando Inferência Bayesiana. As IDs das sequências estão indicadas nas Tabelas Suplementares 1 e 2. Os números indicam a consistência topológica e a confiança de cada ramo. As chaves indicam os grupos identificados neste estudo e nomeados de acordo com Liu et al. (2012) e as cores representam os gêneros de acordo com a ICTV.
4.2 SCREENING INICIAL PARA DETECÇÃO DO IMNV EM DIFERENTES
AMOSTRAS DE CAMARÃO
Foram analisadas 31 amostras diferentes de camarão utilizando os métodos
descritos anteriormente. Algumas apresentavam sinais da doença, como opacidade
ou coloração avermelhada nos segmentos abdominais distais. Das 31 amostras
analisadas, apenas duas foram identificadas como positivas para o IMNV: o lisado
de células congelado e o conservado em etanol 70% (Tabela Suplementar 3).
55
4.3 AMPLIFICAÇÃO E MONTAGEM DOS NOVOS GENOMAS
Dois novos genomas de isolados diferentes do IMNV foram amplificados e
sequenciados no presente estudo. Os isolados foram nomeados IMNVgen1
(coletado em 2009 no estado de Pernambuco/BR) e IMNVgen2 (coletado em 2013
no estado do Rio Grande do Norte/BR). As sequências dos genomas completos
estão mostradas nas Figuras Suplementares 2 e 3.
A estratégia empregada para obtenção da sequência nucleotídica completa
de IMNVgen1 e IMNVgen2 foi aquela desenvolvida para o genoma proveniente da
Indonésia descrita por Senapin et al. (2007). Exceto pelos últimos 43 nucleotídeos
em um dos genomas, a qualidade das bases foi alta, em torno de 50 (> 20),
equivalente ao escore Phred (EWING & GREEN, 1998), indicando que a sequência
genômica foi confiável para os dois isolados.
4.4 CARACTERIZAÇÃO DOS NOVOS GENOMAS
A análise comparativa realizada com o auxílio da ferramenta BLAST mostrou
que as novas sequências obtidas no presente estudo correspondem ao vírus da
mionecrose infecciosa (99% de identidade). Os dois isolados apresentaram um
genoma de 7561 pb, consistente com o tamanho dos genomas do IMNV publicados
anteriormente para os isolados do Brasil (GenBank Nº de acesso AY570982.2) e
Indonésia (GenBank Nº de acesso EF061744.1). IMNVgen1 apresentou uma
composição de bases de 37,0% de A, 25,2% de T, 20,0% de G e 17,8% de C. O
conteúdo G/C e A/T do genoma foi calculado para ser 1,12% e 1,47%,
respectivamente. Já IMNVgen2 apresentou uma composição de bases de 36,8% de
56
A, 25,3% de T, 20,0% de G e 17,9% de C. O conteúdo G/C e A/T do genoma foi
calculado para ser 1,12% e 1,45%, respectivamente. Como mostrado na Tabela 3,
IMNVgen1 é muito similar a IMNVgen2 (99,42% de identidade), assim como é muito
parecido com os isolados do Brasil e Indonésia. Valores de identidade semelhantes
foram observados quando IMNVgen2 foi comparado com esses mesmos isolados
(Tabela 4).
Tabela 3: Comparação das sequências de nucleotídeos e aminoácidos do IMNVgen1 com outras sequências disponíveis no GenBank e IMNVgen2.
GenBank No/ novo genoma
Local do isolado (ano)
Identidade genômica
(%)
Identidade de nucleotídeos (%)
Identidade de aminoácidos (%)
ORF1 ORF2 ORF1 ORF2
AY570982.2 Brasil (2003) 98,90 98,75 99,11 98,82 99,34
EF061744.1 Indonésia (2006) 98,66 98,48 98,99 98,45 99,34
IMNVgen2 Brasil (2013) 99,42 99,36 99,56 99,57 99,21
Tabela 4: Comparação das sequências de nucleotídeos e aminoácidos do IMNVgen2 com outras sequências disponíveis no GenBank e IMNVgen1.
GenBank No/ novo genoma
Local do isolado (ano)
Identidade genômica
(%)
Identidade de nucleotídeos (%)
Identidade de aminoácidos (%)
ORF1 ORF2 ORF1 ORF2
AY570982.2 Brasil (2003) 98,90 98,75 99,11 98,82 99,21
EF061744.1 Indonésia (2006) 98,67 98,48 98,99 98,38 99,21
IMNVgen1 Brasil (2009) 99,42 99,36 99,56 99,57 99,21
57
As sequências codificantes de IMNVgen1 e IMNVgen2 estão organizadas
em duas ORFs, como esperado para um típico totivírus e de acordo com os
genomas já publicados (POULOS et al., 2006; SENAPIN et al., 2007). Em ambos, a
ORF1 apresentou 4.818 nucleotídeos, começando no nucleotídeo 136, e a ORF2
apresentou 2.250 nucleotídeos, começando no nucleotídeo 5.241, estando as ORFs
em diferentes frames. A sequência aminoacídica da ORF1 dos novos genomas foi
pelo menos 98,38% similar as sequências dos isolados do Brasil e Indonésia
(Tabela 4). Com relação à sequência aminoacídica da ORF2, IMNVgen1 mostrou
99,34% de similaridade com os genomas já publicados, enquanto que IMNVgen2
mostrou 99,21% de similaridade.
A análise de agrupamento por Neighbor joining usando os quatro genomas
completos dentro do grupo IMNV-like gerou um dendograma com dois grupos bem
definidos para o IMNV: um grupo composto pelos vírus sequenciados neste estudo e
outro compreendendo os genomas previamente descritos (Figura 9).
Figura 9: Análise Neighbor joining do grupo IMNV-like incluindo os quatro genomas completos do IMNV. O dendograma foi calculado baseado no alinhamento da sequência de nucleotídeos, usando o modelo Tamura-Nei e 1000 replicações de Bootstrap. As análises foram realizadas no programa MEGA 6.06. IMNV - Penaeid shrimp infectious myonecrosis virus; AsV - Armigeres subalbatus virus; DmV - Drosophila melanogaster totivirus; TianV - Tianjin totivirus; ORV - Omono river virus.
58
4.5 IDENTIFICAÇÃO DE REGIÕES CONSERVADAS E VARIÁVEIS
A análise realizada no programa Simplot gerou um gráfico que proporcionou
uma visão geral da distribuição de sítios polimórficos (SPs) ao longo do genoma. Os
SPs foram verificados nas oito regiões previamente descritas para o genoma do
IMNV (POULOS et al., 2006; NIBERT, 2007): (1) 5’UTR, que compreende os
primeiros 135 nucleotídeos do genoma, (2) RBP, correspondente a região que
codifica uma provável proteína de ligação a RNA (nt 136 a 414), (3) Small Protein 1
(SP1) e (4) Small Protein 2 (SP2) (nt 415 a 1266 e nt 1267 a 2247,
respectivamente), regiões candidatas a codificarem as protrusões do IMNV, (5) MCP
(nt 2248 a 4953), que corresponde a região que codifica a proteína do capsídeo, (6)
região entre as ORFs (nt 4954 a 5240), (7) região que codifica a RdRp (nt 5241 a
7490) e (8) 3’UTR que compreende os últimos 71 nucleotídeos do genoma. Estas
regiões estão esquematizadas no topo da Figura 10. Observando as comparações
ilustradas na Figura 10 é possível identificar três regiões com baixo escore de
similaridade localizadas na primeira metade da ORF1, em todas as comparações. A
análise no Simplot também revelou que a região que codifica a ORF2 apresenta alta
similaridade quando comparada à ORF1. Os resultados também indicam que os
isolados descritos para o Brasil e Indonésia são mais similares entre si, assim como
IMNVgen1 e IMNVgen2, o que corrobora com o dendograma mostrado na Figura 9.
59
Figura 10: Representação esquemática do genoma do IMNV e análise de variabilidade. Os plots de similaridade gerados no Simplot comparam IMNVgen1 e IMNVgen2 com os genomas disponíveis no banco de dados. O eixo X representa a posição dos nucleotídeos e o eixo Y representa o escore de similaridade. A região mais variável e o domínio conservado da RdRp estão destacados.
60
Os resultados obtidos no alinhamento das sequências nucleotídicas e
aminoacídicas mostrou a presença de 126 sítios polimórficos, dos quais 5 estão na
proteína de ligação a dsRNA (RBP), 40 nas regiões das Small Proteins (SP1 e SP2),
47 na proteína do capsídeo e 28 na RdRp. Desses 126 sítios polimórficos, 37
causam alteração em aminoácidos, estando 13 nas regiões de SP1 e SP2, 15 na
proteína do capsídeo e 7 na RdRp (Figura 11 e Tabela Suplementar 4). Levando em
consideração a região codificante do genoma, verificamos que, proporcionalmente, a
maior densidade de sítios polimórficos, inclusive aqueles que alteram aminoácidos,
se encontram nas regiões da SP1 e SP2 (~1 polimorfismo a cada 46 nt), seguido
pela proteína do capsídeo (~1 polimorfismo a cada 57 nt) e pela RdRp (~1
polimorfismo a cada 80 nt). Os polimorfismos encontrados na região da proteína de
ligação da dsRNA não alteram o quadro de leitura dos aminoácidos, constituindo
mutações silenciosas.
Figura 11: Sítios polimórficos identificados no genoma do IMNV. O número total de sítios polimórficos compreende os sítios polimórficos sinônimos e não sinônimos mostrados proporcionalmente em cada região do genoma.
132 274
1806 2674
286
2229
69
3 5
27 32
1
21
2
13 15 7
96%
96%
97%
97%
98%
98%
99%
99%
100%
100%
5'UTR RBP Small Proteins
MCP Entre ORFs RdRp 3'UTR
Sítios não polimórficos
Sítios polimórficos (total menos sítios não sinônimos)
Sítios polimórficos não sinônimos
61
Com base nos resultados obtidos no Simplot e no alinhamento das quatro
sequências, foi possível mapear os sítios polimórficos ao longo do genoma e, assim
identificar quais regiões eram mais conservadas e quais eram mais variáveis. Os
dados indicam que as regiões previstas para codificarem a protrusão do vírus (SP1 e
SP2) variaram mais em relação às outras regiões, enquanto que a região da RdRp
apresentou-se mais conservada. Nesse sentido, podemos dizer que as proteínas
que são candidatas a formarem a protrusão do vírus são mais susceptíveis a
sofrerem mudanças do que as outras proteínas do IMNV e, provavelmente
apresentam uma região hipervariável.
4.6 ANÁLISE DE COMPOSIÇÃO DE AMINOÁCIDOS E PREDIÇÃO DE
ESTRUTURA SECUNDÁRIA
Os primeiros 93 aminoácidos da ORF1 codificam uma proteína que
apresenta um domínio DSRM (double-strand RNA binding motif) conservado
envolvido na ligação a RNA. Para simplificar, toda a proteína foi chamada RBP (RNA
binding protein). As predições de estrutura secundária revelam que a RBP é
totalmente estruturada e possui alto conteúdo de α-hélices, mas nenhum coiled coil
(Figura 12 e Figura Suplementar 4A). Diferente das outras proteínas do IMNV, a
RBP não apresentou nenhum sítio polimórfico que causasse alteração na sequência
de aminoácidos.
62
Figura 12: Análise de composição de aminoácidos e predição de estrutura secundária para RBP. A predição de regiões estruturadas (verde) e desestruturadas (vermelho), coiled coils e hélices transmembrana foram realizadas usando os programas Foldindex, Coils e TMPred, respectivamente. O software PredictProtein foi usado para predizer a presença de α-hélices (caixas rosas) e folhas β (caixas azuis) (primeira e segunda linha), e exposição a solvente (caixas azuis indicam exposição a solvente e caixas amarelas indicam não exposição a solvente). Abaixo, uma representação esquemática mostrando o domínio conservado DSRM (em cinza claro). O eixo X representa a posição dos aminoácidos.
Proporcionalmente, as proteínas SP1 e SP2, candidatas a codificarem a
protrusão, apresentaram o maior número de sítios polimórficos, dos quais 13 podem
provocar mudança de aminoácidos. As análises de composição de aminoácidos e
predição de estrutura secundária indicam que SP1 possui características de uma
proteína estruturada apresentando uma região N-terminal hidrofóbica não exposta a
solvente e grande quantidade de folhas-β (Figura 13 e Fig. Suplementar 4B). Já SP2
63
mostrou-se uma proteína quase totalmente desestruturada, com alta quantidade de
aminoácidos carregados, alta hidrofilicidade e uma pequena região estruturada na
porção C-terminal. Além disso, a região desestruturada que apresentou o maior pico
coincidiu com uma região não exposta a solvente. SP2 também mostrou uma região
de coiled coil com um escore significante na porção N-terminal, que foi predito em
diferentes reading windows (Figura 13 e Figura Suplementar 4C).
Figura 13: Análise de composição de aminoácidos e predição de estrutura secundária para SP1 e SP2. A predição de regiões estruturadas (verde) e desestruturadas (vermelho), coiled coils e hélices transmembrana foram realizadas usando os programas Foldindex, Coils e TMPred, respectivamente. O software PredictProtein foi usado para predizer a presença de α-hélices (caixas rosas) e folhas β (caixas azuis) (primeira e segunda linha), e exposição a solvente (caixas azuis indicam exposição a solvente e caixas amarelas indicam não exposição a solvente). Abaixo, uma representação esquemática mostrando os sítios polimórficos não sinônimos (traços pretos) identificados nas proteínas. O eixo X representa a posição dos aminoácidos.
64
A proteína principal do capsídeo (MCP) apresentou um número considerável
de sítios polimórficos, sendo superada apenas pela região das proteínas SP. De
acordo com o esperado para uma proteína globular, ela contém uma alta proporção
de aminoácidos neutros (31%) e hidrofóbicos (50,5%). Esta proteína, formada por
901 aminoácidos, apresentou alto grau de regiões estruturadas e duas regiões
desestruturadas mais evidentes na sua segunda metade. A região desestruturada
entre os aminoácidos 804 a 846 contém alto conteúdo de α-hélices predito pelos
programas Coils e PredictProtein (Figura 14 e Fig. Suplementar 4D). As análises in
silico também revelaram cinco picos hidrofóbicos preditos pelo TMPred. A
comparação entre os quatro genomas do IMNV mostrou que a região
correspondente a MCP possui 15 sítios onde ocorrem mudanças de aminoácidos.
Esses sítios estão distribuídos ao longo da proteína e alguns coincidem com os
picos hidrofóbicos.
Um mapa contendo todos os sítios polimórficos, bem como os aminoácidos
codificados, está mostrado na Tabela Suplementar 4. As mudanças de aminoácidos
nos sítios 2440, 3160, 3293, 3570, 3653, 3929, 4091 e 4504, localizados na MCP,
devem ser destacadas, pois ocorrem mudanças entre aminoácidos com diferentes
cargas, indicando que estes sítios poderiam afetar a estrutura secundária da
proteína em diferentes isolados virais.
65
Figura 14: Análise de composição de aminoácidos e predição de estrutura secundária para MCP. A predição de regiões estruturadas (verde) e desestruturadas (vermelho), coiled coils e hélices transmembrana foram realizadas usando os programas Foldindex, Coils e TMPred, respectivamente. O software PredictProtein foi usado para predizer a presença de α-hélices (caixas rosas) e folhas β (caixas azuis) (primeira e segunda linha), e exposição a solvente (caixas azuis indicam exposição a solvente e caixas amarelas indicam não exposição a solvente). Abaixo, uma representação esquemática mostrando o core conservado da MCP (em cinza claro) e os sítios não sinônimos identificados na proteína (traços pretos). O eixo X representa a posição dos aminoácidos.
66
A RNA polimerase dependente de RNA mostrou-se uma proteína muito
conservada entre os quatro isolados apresentando apenas sete sítios polimórficos
não-sinônimos. As análises in silico revelaram que a RdRp possui características de
uma proteína estruturada com pequenas regiões desestruturadas interpassadas,
lembrando uma proteína com domínios conectados por pontes móveis (Figura 15 e
Figura Suplementar 4E). Duas hélices hidrofóbicas preditas pelo TMPred estão
localizadas em domínios estruturados e provavelmente estão escondidas na
estrutura globular. A predição de estruturas secundárias revelou a existência de um
alto conteúdo de α-hélices e dois motivos coiled coil com alta probabilidade de
ocorrência compreendendo os aminoácidos 243 a 256 e 636 a 649. Em ambos os
motivos não foram detectadas mudanças de aminoácidos (Figura 15). A Figura 15
mostra que as sequências-motivo conservadas em RNA polimerases estão
localizadas em regiões estruturadas e, exceto pela sequência-motivo F1, todas
coincidem com a região do domínio conservado da RdRp.
Como mostrado na Tabela Suplementar 4, a mudança de aminoácidos nos
sítios 5299, 5520, 5784 e 6981, localizados na RdRp, devem ser destacados pois
ocorre mudança de aminoácidos com diferentes cargas, indicando que estes sítios
tem potencial para alterar a estrutura secundária da proteína.
67
Figura 15: Análise de composição de aminoácidos e predição de estrutura secundária para RdRp. A predição de regiões estruturadas (verde) e desestruturadas (vermelho), coiled coils e hélices transmembrana foram realizadas usando os programas Foldindex, Coils e TMPred, respectivamente. O software PredictProtein foi usado para predizer a presença de α-hélices (caixas rosas) e folhas β (caixas azuis) (primeira e segunda linha), e exposição a solvente (caixas azuis indicam exposição a solvente e caixas amarelas indicam não exposição a solvente). Abaixo, uma representação esquemática mostrando o domínio conservado da RdRp (em cinza claro), os sítios não sinônimos identificados na proteína (traços pretos) e as sequências-motivo conservadas em RdRps (traços azuis). O eixo X representa a posição dos aminoácidos.
68
4.7 MODELAGEM DE PROTEÍNAS
As estruturas terciárias das proteínas RBP, MCP e RdRp potencialmente
codificadas pelo isolado da Indonésia foram preditas utilizando os programas I-
TASSER e Phyre2. Os valores para o escores e parâmetros de avaliação dos
modelos são mostrados na Tabela Suplementar 5. Não foi possível obter modelos
com escores de confiabilidade significantes para as proteínas SP1 e SP2. Os
modelos da MCP e RdRp também foram preditos para os três isolados do Brasil
(Figuras Suplementares 5 e 6). Não foram gerados modelos da RBP para os
isolados do Brasil devido à sequência de aminoácidos da proteína ser idêntica para
os quatro isolados.
O melhor modelo 3D da RBP apresentou um C-Score igual a -2,26 e uma
estrutura comum presente em estruturas já resolvidas para o domínio conservado
DSRM disponíveis no Protein Data Bank (PDB), as quais possuem duas α-hélices e
três folhas β (destacado em cinza claro na Figura 16 e na Figura Suplementar 7A).
Essas estruturas também correspondem parcialmente às estruturas secundárias
preditas pelo PredictProtein (Figura 12).
69
Figura 16: Modelo estrutural para a proteína RBP do IMNV gerado pelo I-TASSER. O domínio conservado DSRM está destacado em cinza claro. (MolProbity score 4,03, Z-Score 0,627, C-score -2,26).
O modelo gerado no I-TASSER para o monômero da MCP apresentou um
C-Score igual a -2,27 e um formato semelhante ao dos monômeros de
Saccharomyces cerevisiae virus L-A (ScV-L-A) e Helminthosporium victoriae virus
190S (HvV190s), mas diferenças significativas em relação às estruturas secundárias
devido o alto conteúdo de α-hélices (Figura 17) (NAITOW et al., 2002; DUNN et al.,
2013). A Figura 17 mostra a localização do possível “trench” e um resíduo de His
107 identificado nesta estrutura. Um segundo modelo gerado no Phyre2 para a
MCP, baseado apenas em modelagem por threading, resultou em uma estrutura
composta por três α-hélices (Figura Suplementar 7B), compreendendo os
aminoácidos 518 a 590.
70
Figura 17: Modelo estrutural para a MCP do IMNV gerado pelo I-TASSER. O core conservado da MCP está destacado em cinza claro. Os sítios polimórficos não sinônimos e suas posições estão indicados em vermelho. (MolProbity score 3,47, Z-Score -6,341, C-score -2,27).
A modelagem por threading associada com simulações ab initio para a RdRp
gerou o modelo com o melhor C-Score (0,23) em relação aos modelos da RBP e
MCP. Apesar da ausência de estruturas β na estrutura, o formato da proteína foi
semelhante a uma “right hand”, como esperado para uma RNA polimerase. Os
domínios “thumb”, “fingers” e “palm” estão indicados na Figura 18, assim como as
sequências-motivo A, B, C, D, E, F1, F2 e F3 estão destacadas em cores diferentes.
O domínio conservado da RdRp também está evidenciado em cinza claro (Figura
18).
71
Figura 18: Modelo estrutural para a RdRp do IMNV gerado pelo I-TASSER. O domínio conservado da RdRp está destacado em cinza claro. Os sítios polimórficos não sinônimos e suas posições estão indicados em vermelho. Os domínios “thumb”, “fingers”, e “palm” estão mostrados, assim como as sequências-motivo conservadas em RdRps estão destacadas como segue: A – azul escuro; B – azul claro; C – rosa; D – verde; E – amarelo; F1, F2 e F3 – laranja. (MolProbity score 3,96, Z-Score -5,14, C-score 0,23).
4.8 SISTEMAS DE DETECÇÃO DE POLIMORFISMOS
4.8.1 Teste de detecção baseado nas regiões variáveis e conservadas
Primers flanqueando uma região variável e uma região conservada do
genoma do IMNV foram produzidos para detecção do vírus (Tabela 5). Os pares de
primers SP-F/SP-R e RdRp-F/RdRp-R foram desenhados para amplificar um
fragmento de 456 pb e 200 pb, respectivamente, e para possuírem temperaturas de
melting (TM) similares a fim de serem usados tanto em uma reação multiplex como
em reações separadas. Um par de primer (EF1α-F/ EF1α-R) também foi desenhado
72
para ser usado como controle positivo da reação e amplifica um fragmento de 600
pb presente no gene do fator de elongação-1α do camarão.
Tabela 5: Lista de primers empregados no sistema de identificação do IMNV.
Nome do primer Sequência (5’→3’) TM (ºC)
SP-F CATCAAGTGTACTCGGAAG 52,85
SP-R CTTCTCTAGTTAGAACTGGATC 52,90
RdRp-F ACGTAGAGGACATACATCC 53,05
RdRp-R GATTGGTATTGTCTGATTTCTAC 53,02
EF1α-F GCGCAAGAGCGACAACTATG 59,97
EF1α-R ACATAGGCTTGCTGGGAACC 60,03
Um esquema mostrando o alinhamento de nucleotídeos referente aos
fragmentos de 456 pb e 200 pb, amplificados das regiões variável e conservada,
respectivamente, está mostrado na Figura 19. A figura também indica o número de
sítios polimórficos presente em cada região.
73
Figura 19: Alinhamentos de nucleotídeos dos fragmentos de 456 pb e 200 pb referentes às regiões variável e conservada, respectivamente. Esses fragmentos foram empregados no sistema de detecção do IMNV. Os sítios polimórficos de cada região estão mostrados em caixas.
Usando os primers SP-F/SP-R e RdRp-F/RdRp-R em duas reações de PCR
separadas foi possível detectar a presença do IMNV em duas amostras diferentes
de camarão como mostrado na Figura 20A. Embora esta seja uma análise
qualitativa, considerando a mesma quantidade de template e a intensidade das
bandas, é possível notar que a amostra 1 apresentou uma maior quantidade de
partículas do IMNV do que a amostra 2. A análise de agrupamento por Neighbor
joining utilizando o fragmento de 456 pb a partir dos quatro genomas do IMNV
reconstitui os mesmos grupos mostrados na Figura 9 (Figura 20B).
74
Figura 20: Sistema de detecção do IMNV. (A) Gel de agarose mostrando os resultados do sistema de identificação do IMNV utilizando os novos marcadores para as regiões variável e conservada do genoma. O sistema foi capaz de identificar a presença do IMNV em duas amostras diferentes do camarão coletadas em diferentes locais do Brasil. 1 – marcador de peso molecular; 2 e 6 – controle positivo (EF-1α); 3 e 7 – controle negativo; 4 e 8 – detecção usando os primers da região mais variável; 5 e 9 – detecção usando primers da região conservada. Os asteriscos indicam as bandas de 456 pb e 200 pb esperadas. (B) Análise Neighbor joining baseado no fragmento de 456 pb da região mais variável. O dendograma foi calculado baseado no alinhamento da sequência de nucleotídeos, usando o modelo Tamura-Nei e 1000 replicações de Bootstrap. As análises foram realizadas no programa MEGA 6.06.
4.8.2 Teste de detecção baseado na análise da curva de melting de fita simples
Na tentativa de desenvolvermos um sistema de identificação de ácidos
nucleicos a partir da curva de desnaturação dos amplicons, seis regiões de 200 pb
foram selecionadas ao longo de todo o genoma do IMNV além do fragmento de 456
pb (Reg.Frag456) já apresentado no tópico anterior. Todas essas regiões foram
submetidas a 2 análises in silico: (1) predição de estrutura secundária de RNA e
DNA e (2) geração de curvas de melting a partir da desnaturação do DNA de fita
75
dupla e do RNA de fita simples. A abordagem de desnaturação de uma fita simples é
inédita, e possivelmente mais eficiente para determinar variações na sequência
primária que a desnaturação de uma fita dupla (OLIVEIRA et al., 2014). Após as
análises in silico algumas dessas regiões também foram utilizadas para testes
preliminares in vitro (Tabela 6).
Tabela 6: Regiões selecionadas para o teste de detecção baseado na análise da curva de melting de fita simples.
Região Localização no genoma Teste in silico Teste in vitro
R1 (nt 468-667) Small proteins Sim Não
R2 (nt 969-1168) Small proteins Sim Sim
R3 (nt 1119-1318) Small proteins Sim Sim
R4 (nt 1635-1834) Small proteins Sim Não
R5 (nt 2413-2612) MCP Sim Sim
R6 (nt 6823-7022)* RdRp Sim Sim
Reg.Frag456 Small proteins Sim Não
*A região R6 corresponde ao fragmento de 200 pb do par de primers RdRp-F/RdRp-R.
A partir da desnaturação das sequências apresentadas na Tabela 6,
esperávamos conseguir diferenciar os amplicons e discriminar os isolados
sequenciados neste estudo. As Figuras 21 e 22 mostram resultados preliminares
dos testes para as regiões R2 e R3, comparando os isolados IMNVgen1 e
IMNVgen2. Os resultados obtidos de predição de estrutura secundária de RNA e
DNA para a região R2 mostram estruturas bastante diferentes entre os isolados
(Figura 21A-D). Por outro lado, para a região R3, essas estruturas se apresentaram
mais semelhantes (Figura 22A-D). Para ambas as regiões, os resultados obtidos
para a curva de melting de fita simples in silico não corresponderam às curvas
geradas na análise in vitro, indicando que o método não foi eficiente na
diferenciação dos isolados e precisa ser melhorado (Figuras 21E-H e 22E-H).
76
Figura 21: Análises de predição de estrutura secundária e curva de melting de fita simples e dupla para a região R2. A - estrutura secundária utilizando parâmetros de RNA para IMNVgen1; B - estrutura secundária utilizando parâmetros de RNA para IMNVgen2; C - estrutura secundária utilizando parâmetros de DNA para IMNVgen1; D - estrutura secundária utilizando parâmetros de DNA para IMNVgen2; E - curva de melting de fita dupla realizada in silico; F - curva de melting de fita simples realizada in silico; G - curva de melting de fita dupla realizada in vitro; H - curva de melting de fita simples realizada in vitro. IMNVgen1 – curva em vermelho; IMNVgen2 – curva em azul.
77
Figura 22: Análises de predição de estrutura secundária e curva de melting de fita simples e dupla para a região R3. A - estrutura secundária utilizando parâmetros de RNA para IMNVgen1; B - estrutura secundária utilizando parâmetros de RNA para IMNVgen2; C - estrutura secundária utilizando parâmetros de DNA para IMNVgen1; D - estrutura secundária utilizando parâmetros de DNA para IMNVgen2; E - curva de melting de fita dupla realizada in silico; F - curva de melting de fita simples realizada in silico; G - curva de melting de fita dupla realizada in vitro; H - curva de melting de fita simples realizada in vitro. IMNVgen1 – curva em vermelho; IMNVgen2 – curva em azul.
78
Como mostrado na Figura 19, o fragmento de 456 pb foi capaz de diferenciar
os quatro isolados do IMNV após a etapa de sequenciamento. Os resultados in silico
de predição de estrutura secundária de RNA e curva de melting de fita simples
indicam que este fragmento é capaz de diferenciar os vírus sequenciados no
presente estudo daqueles já descritos (Figura 23). De fato, as estruturas
secundárias de RNA dos vírus do Brasil e Indonésia são mais semelhantes entre si
(Figura 23A e B), assim como as estruturas secundárias de RNA para IMNVgen1 e
IMNVgen2 (Figura 23C e D). A curva de melting de RNA fita simples realizada in
silico foi capaz de refletir a diferença entre as estruturas de RNA (Figura 23E).
Figura 23: Predição de estrutura secundária de RNA e curva de melting de fita simples realizada in silico para o fragmento de 456 pb. A predição de estrutura secundária de RNA foi realizada no programa RNAfold e a curva de melting simples fita foi gerada no programa RNAheat. A – IMNV-BR; B – IMNV-Ind; C – IMNVGen1; D – IMNVGen2; E – curva de melting de fita simples in silico.
79
5 DISCUSSÃO
O surgimento de doenças infecciosas que acometem animais de criação é um
dos principais problemas para a economia dos países produtores, causando
prejuízos financeiros significativos. Sendo assim, é necessário que esse problema
seja resolvido ou, pelo menos, minimizado empregando métodos de identificação e
controle eficientes para evitar e/ou combater essas doenças (LANA, BEISEL &
SILVA, 1992; NAGATA et al., 2006; MINGXIAO et al., 2013).
O desenvolvimento de métodos de identificação e controle eficazes requer
conhecimentos aprofundados em relação à biologia do patógeno. Em termos
moleculares, é necessário conhecer a sequência genômica do organismo, assim
como os produtos gênicos codificados pelo genoma (POULOS et al., 2006; SILVA et
al., 2014). Também é interessante estudar a filogenia e aspectos evolutivos do
organismo de interesse (POULOS et al., 2006; CORTEY et al., 2011; FRAGA et al.,
2012). A partir desses conhecimentos pode-se investigar a variabilidade genética
das diversas espécies, identificar regiões conservadas e variáveis nas sequências,
prever a estrutura tridimensional de proteínas importantes e, assim, inferir seus
mecanismos de infectividade, replicação, dentre outros mecanismos e
características (NIBERT, 2007; TANG et al., 2008; CORTEY et al., 2011; APTE-
SENGUPTA et al., 2012; NAIM, BROWN & NIBERT, 2014).
Um método molecular eficaz para detecção molecular é a Reação em Cadeia
da Polimerase (PCR). Esse sistema já é amplamente empregado na detecção de
agentes infecciosos e fornece um resultado confiável (POULOS & LIGHTNER, 2006;
SILVA et al., 2014). Além disso, quando realizada em tempo real, a PCR é capaz de
quantificar o DNA de maneira precisa e com maior reprodutibilidade (SILVA,
80
PINHEIRO & COIMBRA, 2011; WEIRATHER et al., 2011; BOTELHO-SOUZA et al.,
2014). Estudar o genoma, tanto no nível de nucleotídeos quanto no nível de
aminoácidos, bem como as proteínas codificadas, é importante na seleção de
regiões alvo para o desenho de primers (SEIBERT et al., 2010; LOY et al., 2013). A
produção dos primers é o principal passo no desenvolvimento de um sistema de
PCR confiável.
No presente trabalho, foi estudado o genoma, bem como os possíveis
produtos de expressão gênica codificados por ele, de quatro isolados distintos do
vírus causador da mionecrose infecciosa em camarões peneídeos, oriundos do
Brasil e Indonésia, a fim de desenvolver um método de PCR eficiente na
identificação e distinção desses isolados.
As duas amostras positivas identificadas no screening inicial para detecção de
novos isolados do IMNV em camarões Litopenaeus vannamei foram suficientes para
alcançar os objetivos do presente estudo. O fato de não termos conseguido
encontrar o IMNV em muitas amostras, em especial aquelas cujos camarões
estavam intactos, pode ser devido aos seguintes fatores: (i) os camarões realmente
não estavam infectados, já que as amostras foram obtidas de grandes fazendas que
tomam as devidas medidas profiláticas; (ii) a coleta das amostras pode ter sido
realizada em um período no qual as condições ambientais não favoreciam a
incidência do vírus ou; (iii) os métodos aplicados na identificação não foram
eficientes, pois encontramos que o primer F13 (Tabela 1) não funcionou devido
anelar em uma região onde existia um sítio polimórfico (nt 5.784).
A análise filogenética mostra que o grupo GLV-like compreende vírus do
gênero Giardiavirus e ScV-like compreende vírus do gênero Totivirus. O gênero
Victorivirus inclui dois grupos, MoV-like e GaRV-like. Os gêneros Leishmaniavirus e
81
Trichomonasvirus incluem os grupos LRV-like e TVV-like, respectivamente. O grupo
ZbV-Z-like foi anteriormente designado como um grupo primitivo, menos derivado,
parente distante dos totivírus e inclui partículas virais com organização genômica
distinta desta família. Uma nova família Amalgamaviridae foi proposta para
acomodar estes três vírus (LIU et al., 2012). O grupo IMNV-like aparece como o
grupo menos derivado próximo a GLV-like. De fato, no estudo filogenético realizado
por Poulos e colaboradores (2006), o IMNV foi agrupado com GLV, mas essa
análise não levou em consideração as sequências dos vírus do grupo IMNV-like. O
grupo IMNV-like não é classificado pela ICTV (KING et al., 2012). Assim, é
interessante notar que o IMNV provavelmente pertence a um táxon ainda não
descrito. Devido suas características peculiares, Tang e colaboradores (2008)
propuseram a criação de um novo gênero na família Totiviridae para acomodar o
IMNV. Nossos resultados indicam que o grupo IMNV-like poderia corresponder a
esse novo gênero.
As comparações entre os quatro isolados em nível de sequência genômica
completa, bem como sequências nucleotídicas e aminoacídicas das ORFs
mostradas nas Tabelas 3 e 4, indicam que IMNVgen1 e IMNVgen2 são mais
parecidos entre si do que com os genomas do Brasil e Indonésia, e que ambos são
mais semelhantes à sequência descrita para o Brasil. É esperado que a similaridade
entre os isolados coletados no Brasil seja alta, considerando que o IMNV foi
primeiramente identificado no Brasil e, posteriormente, atingiu outros locais do
mundo. Entretanto, a análise de agrupamento por Neighbor joining revelou a
formação de dois grupos distintos: IMNVgen1/IMNVgen2 e IMNV-BR/IMNV-IND
(Figura 9). É curioso e inesperado observar que o isolado do Brasil seja mais
relacionado ao isolado da Indonésia. Provavelmente, o genoma está sendo afetado
82
mais pela variação ao longo do tempo do que pela variação devido ao isolamento
geográfico, uma vez que os vírus sequenciados no presente estudo foram coletados
nos anos de 2009 e 2013, enquanto que os isolados do Brasil e da Indonésia foram
coletados em 2003 e 2006, respectivamente (POULOS et al., 2006; SENAPIN et al.,
2007). No entanto, mudanças decorrentes de isolamento geográfico são recorrentes
entre os vírus que acometem camarões, como ocorreu com o IMNV na dispersão do
Brasil para a Indonésia (SENAPIN et al., 2007). Isolados de WSSV, que é um vírus
de DNA, originários da China, Taiwan e Indonésia apresentaram até 13.000 pares
de bases divergentes (MARKS et al., 2004). Além disso, isolados diferentes de
WSSV da mesma região geográfica foram repostados na China (TAN et al., 2009).
Esta observação requer uma análise mais detalhada do genoma a fim de identificar
os sítios polimórficos e determinar as regiões que vem sofrendo mudanças e sua
correlação com motivos estruturais proteicos.
Mutações gênicas em vírus são bastante comuns, principalmente em vírus
que apresentam genoma de RNA, como o IMNV. A falta de atividade de correção de
erros da RNA polimerase contribui significativamente para o grande número de
mutações encontradas em vírus de RNA. Já é amplamente conhecido que a
capacidade de infecção e mecanismos de patogenicidade são influenciados pelas
alterações em regiões específicas do genoma de diferentes vírus. As primeiras
evidências surgiram do estudo de viróides, que tinham sua capacidade de infecção,
replicação e patogenicidade afetadas por alterações induzidas em seu genoma de
RNA (TABLER & SFINGER, 1985; SANO et al., 1992). Pudupakam et al. (2011),
viram que deleções em uma região hipervariável da ORF1 reduziam a eficiência da
replicação do vírus da hepatite E.
83
A proteína RBP apresentou uma estrutura semelhante àquelas já resolvidas e
disponíveis para o domínio conservado DSRM (Figura 16), o que reforça o
pressuposto de que os primeiros 93 aminoácidos da ORF1 codificam uma proteína
de ligação a dsRNA. Não foi identificado nesta proteína nenhum polimorfismo que
alterasse o quadro de leitura de aminoácidos. A função exata da RBP ainda não está
bem elucidada. Ela provavelmente desempenha um papel importante no
encapsulamento do vírus e modulação da imunidade inata após expressão em
células infectadas (TANG, et al., 2008). Sendo assim, podemos supor que sua
função requer que a proteína não sofra nenhuma variação na sequência
aminoacídica e/ou na sua estrutura proteica. A alta conservação intraespecífica
observada tanto na sequência de aminoácidos quanto na estrutura da proteína,
indica que as características da RBP estão sendo mantidas durante a evolução.
Devido à baixa variação na sequência de nucleotídeos, essa região se caracteriza
como uma boa região para estudos filogenéticos e desenhos de primers, assim
como pode ser considerada como um bom alvo para agentes terapêuticos. De fato,
foi observado que moléculas de RNA de interferência (RNAi) destinadas à RBP
fornecem uma proteção eficiente para os camarões desafiados com IMNV (LOY et
al., 2013).
O gráfico gerado no Simplot ilustrou a variabilidade em toda a sequência
genômica do IMNV e indicou a presença de três picos de menor escore de
similaridade na primeira metade da ORF1, região que coincide com aquela que
codifica as Small Proteins. Além disso, levando em consideração a região
codificante, a maior densidade de sítios polimórficos, inclusive aqueles que alteram a
sequência de aminoácidos, se encontra nesta região. Provavelmente a região que
codifica as Small proteins é uma região hipervariável presente no genoma do IMNV
84
que só pôde ser detectada quando as novas sequências, IMNVgen1 e IMNVgen2,
foram incluídas na comparação. Regiões hipervariáveis são definidas por
comparações intragenômicas uma vez que não existe um valor absoluto que
classifique uma região como hipervariável (GONZÁLEZ-CANDELAS & LÓPEZ-
LABRADOR, 2013). Em alguns casos, regiões hipervariáveis podem ser
identificadas usando o alinhamento de um pequeno número de sequências, como
observado na região hipervariável da proteína VP2 do vírus da Doença Infecciosa de
Gumboro (BAYLISS et al.,1990) ou na proteína VP1 do vírus Sacbrood (MINGXIAO
et al., 2013) que foram identificadas usando três e sete sequências,
respectivamente. Essas regiões geralmente são encontradas em proteínas
estruturais (TSAREV et al., 1992). Em alguns vírus, regiões hipervariáveis estão
associadas com infectividade viral e adaptação aos mecanismos do sistema imune
do hospedeiro (BAYLISS et al., 1990; CARPENTER et al., 1991; ANJUM et al.,
2013). Um ponto importante é que as Small Proteins codificadas por esta região são
candidatas a codificarem as protrusões do IMNV (TANG et al., 2008). Alguns
estudos tem mostrado que regiões hipervariáveis de diferentes vírus coincidem com
as regiões que codificam as protrusões virais e que essas sequências estão
envolvidas em vários mecanismos como a entrada do vírus na célula e neutralização
de anticorpos (CAVANAGH, DAVIS & MOCKETT, 1988; LEE et al., 2010;
PROMKUNTOD et al., 2014).
Tang e colaboradores (2008) identificaram a uma resolução a 8-0 Å, que o
capsídeo do IMNV possui protrusões com características de um complexo de fibras
e densidade e resolução menor do que a proteína do capsídeo, o que pode ser
explicado por sua flexibilidade lateral. A protrusão do IMNV compreende pelo menos
três domínios morfológicos: knob, stalk e foot. Esses mesmos autores propuseram
85
que a protrusão do IMNV pode ser formada por um trímero composto por três
moléculas de SP1 ou SP2. Nossos resultados de composição de aminoácidos e
predição de estrutura secundária indicam que SP1 é uma proteína dobrada
apresentando uma região N-terminal hidrofóbica não exposta a solvente (Figura 13).
SP1 provavelmente é uma proteína globular e seu sítio hidrofóbico deve se
encontrar no interior da estrutura. Sendo assim, ela possui características de um
domínio knob, consistente com sua forma globular e alto conteúdo de folhas-β. Por
outro lado, SP2 possui características de uma proteína fibrosa ou nativamente
desdobrada, que apresenta alta mobilidade e motivos ricos em coiled coil, que
possibilita sua interação com outras proteínas (MITRAKI et al., 1999; LANZA et al.,
2008). A forma desdobrada móvel, alto conteúdo de aminoácidos carregados e a
presença de coiled coil observados em SP2 (Figura 13) são características que se
enquadram no domínio stalk, como observado nas protrusões de adenovírus
(CHAPPELL et al., 2002). Nesse contexto, nossos dados apontam para uma nova
visão na qual a protrusão do IMNV pode ser formada por um heteromultímero
composto pelas proteínas SP1 e SP2 (Figura 24). Protrusões compostas por
diferentes proteínas já foram observadas em outros vírus como o bacteriófago PRD,
no qual a protrusão é formada pelas subunidades proteicas P5 e P2 (MERCKEL et
al., 2005), e o bunyavirus, no qual as glicoproteínas G1 e G2 formam a protrusão
viral (PERSSON & PETTEERSSON, 1991). A região estruturada localizada na
porção C-terminal da proteína SP2 pode ser o domínio foot que está ancorado ao
capsídeo (Figura 24).
86
Figura 24: Esquema proposto para a formação da protrusão do IMNV. A proteína SP1, que apresenta uma forma dobrada, corresponderia ao domínio knob da protrusão; enquanto que a proteína SP2, a qual se apresenta quase totalmente desestruturada, corresponderia ao domínio stalk. A região estruturada presente na porção C-terminal de SP2 representaria do domínio foot que está ancorado ao capsídeo.
O capsídeo é responsável por proteger o material genético e também está
envolvido no empacotamento viral e na especificidade para a adsorção, ou seja, o
capsídeo está diretamente relacionado com a interação vírus-hospedeiro. Além da
semelhança observada com outros monômeros (NAITOW et al., 2002; DUNN et al.,
2013), o modelo gerado para a MCP do IMNV também mostrou uma possível região
candidata a representar o “trench” como observado na MCP de ScV-L-A (NAITOW et
al., 2002). Neste “trench” também foi possível identificar um resíduo de His 107
(destacado em azul na Figura 17), sugerindo uma possível atividade enzimática de
remoção do cap5’ do mRNA para a MCP do IMNV. Existem poucos trabalhos
direcionados ao estudo da estrutura de proteínas de totivírus. Entretanto,
comparações de predição de estrutura secundária da MCP indicam a existência de
87
um core rico em α-hélice que é altamente conservado entre os totivírus e em
micovírus de RNA dupla fita (DUNN et al., 2013). O segundo modelo para a MCP
gerado no Phyre2 resultou em uma estrutura composta por três α-hélices (Figura
Suplementar 6B), compreendendo os aminoácidos 518 a 590, que pode
corresponder ao core rico em α-hélice conservado entre os totivírus.
A ORF2 que provavelmente codifica a RdRp, apresentou-se mais conservada
quando comparada a ORF1. O papel que a RdRp desempenha na replicação viral
exige que sua sequência nucleotídica não sofra muita variação. O modelo
tridimensional predito para a RdRp do IMNV foi semelhante a outros modelos já
resolvidos para RNA polimerases virais como a RdRp do poliovírus e a RNA
polimerase do bacteriófago T7 (Figura 18) (SOUSA et al., 1993; HANSEN, LONG &
SCHULTZ, 1997), que se caracteriza por um formato semelhante a uma “right hand”
e possui os domínios “thumb”, “fingers” e “palm”. É inesperado a ausência de
estruturas β no modelo da RdRp do IMNV, uma vez que essas estruturas são
comuns em outros modelos de RdRps já resolvidos (HANSEN, LONG & SCHULTZ,
1997; LOVE et al., 2004). No entanto, a ausência de folhas-β e alto conteúdo de α-
hélices corroboram com a predição feita pelo PredictProtein (Figura 15). Um
segundo modelo gerado no software Phyre2 mostrou a presença de algumas
estruturas β na RdRp do IMNV (Figura Suplementar 6C), mas somente 51% dos
resíduos modelados apresentaram confiança maior que 50%. Portanto, nossos
dados reforçam a hipótese de que a proteína codificada pela ORF2 trata-se
realmente de uma RNA polimerase dependente de RNA.
Em resumo, as proteínas envolvidas em interações com o RNA (RBP e RdRp)
são mais conservadas do que as proteínas estruturais, possivelmente devido à
função que cada tipo de proteína desempenha.
88
O estudo do genoma e dos possíveis produtos gênicos do IMNV possibilitou
compreender um pouco mais sobre a biologia do vírus e definir quais seriam as
principais proteínas alvo para o desenvolvimento de métodos de identificação e
controle eficazes. Tsarev et al., (1992) sugere que regiões hipervariáveis podem ser
utilizadas para caracterizar diferentes cepas virais mesmo que proximamente
relacionadas através de métodos moleculares e imunológicos, enquanto que as
sequências mais conservadas podem ser usadas no desenho de primers para
detecção do patógeno.
Levando em consideração a possível região hipervariável presente nas Small
Proteins e a região mais conservada da RdRp, foi desenvolvido um novo método
para o diagnóstico de diferentes isolados do IMNV. O sistema se mostrou eficiente
na identificação de duas amostras diferentes contaminadas pelo vírus. Uma das
principais vantagens deste novo sistema de detecção é que usando os primers SP-
F/SP-R, um fragmento de 456 pb que apresenta sítios polimórficos informativos é
amplificado, podendo ser sequenciado. Este fragmento corresponde a uma parte da
região que codifica as Small proteins e apresenta nove sítios polimórficos dos quais
três causam alteração na sequência de aminoácidos. Comparando essa região foi
possível diferenciar os quatro isolados do IMNV. A análise Neighbor joining usando o
fragmento de 456 pb foi capaz de reconstituir os mesmos dois grupos mostrados na
Figura 9. Esses resultados sugerem que esta pequena sequência possui
informações que podem representar o genoma completo do IMNV, sendo suficiente
para discriminar os quatro isolados estudados aqui. Todavia, a discriminação entre
os quatro isolados só é possível após o sequenciamento do fragmento de 456 pb. O
ideal seria um sistema que identificasse polimorfismos sem a necessidade de
sequenciar.
89
Métodos que utilizam esse princípio são aqueles baseados em HRMA (High-
Resolution Melting Analysis) (REED & WITTWER, 2004; ARVIA, CORCIOLI & AZZI,
2013). A HRMA é capaz de discriminar isolados de uma mesma espécie pela
identificação de polimorfismos de sítio único. Contudo, esses métodos requerem
equipamentos e reagentes mais sofisticados o que os torna mais onerosos. Nesse
contexto, uma tentativa de desenvolver um sistema de identificação de
polimorfismos baseado na análise da curva de melting utilizando equipamentos e
reagentes mais acessíveis foi realizada.
Geralmente, as PCRs em tempo real geram curvas de melting a partir da
desnaturação do DNA dupla fita. No presente estudo foi proposto um método de
identificação de diferentes isolados do IMNV através da análise de curva de melting
a partir da desnaturação do DNA simples fita. O objetivo do método é distinguir
cepas diferentes com base na estrutura secundária do ácido nucleico que é refletida
em curvas de melting características para cada isolado. De fato, as diferentes
estruturas secundárias de RNA preditas refletiram em curvas de melting de fita
simples distintas, como observado na Figura 23, indicando que o princípio do
método é válido. Um estudo in silico recentemente desenvolvido em nosso
laboratório aborda o uso da curva de melting de fita simples na identificação de
diferentes variantes do totivírus que infecta Trichomonas vaginalis (OLIVEIRA et al.,
2014). Nossos resultados preliminares não foram os esperados, provavelmente
devido a uma falha na metodologia. Focamos as análises in vitro na desnaturação
do DNA e o IMNV é um vírus de RNA. As estruturas secundárias preditas para os
dois ácidos nucleicos (DNA e RNA) são diferentes e as curvas de melting de fita
simples geradas in silico e in vitro representam a desnaturação do RNA e DNA,
90
respectivamente (Figuras 21 e 22). Sendo assim, é necessário direcionar os
protocolos experimentais para a desnaturação do RNA de fita simples.
91
6 CONCLUSÃO
Dois novos genomas completos do IMNV foram sequenciados, caracterizados e
apresentaram 99% de identidade com outros dois genomas já descritos.
O estudo filogenético mostrou um novo grupo taxonômico, denominado IMNV-like,
que está mais próximo ao grupo GLV-like, mas ainda não é classificado pela ICVT.
O grupo IMNV-like possivelmente poderá abranger um gênero ainda não descrito
dentro da família Totiviridae.
A partir da comparação entre os quatro genomas foi possível gerar um mapa de
sítios polimórficos que abrange todo o genoma do IMNV. Este mapa possibilitou
identificar as regiões mais conservadas e mais variáveis do genoma.
O mapa de sítios polimórficos será essencial para posteriores estudos sobre a
biologia do IMNV, assim como para a concepção de novos marcadores moleculares
e desenvolvimento de terapias como aquelas baseadas em RNAi.
A proteína que compreende os primeiros 93 aminoácidos da ORF1 não apresentou
mutações que alterassem a sequência de aminoácidos. O modelo tridimensional
obtido para esta proteína foi semelhante a estruturas já resolvidas para o domínio
DSRM, o que reforça o pressuposto de que este produto gênico corresponde a uma
proteína de ligação a dsRNA.
92
A região que possivelmente codifica as protrusões do IMNV é a mais variável do
genoma, como observado em outros vírus de RNA. Esta região possivelmente
direciona a evolução do vírus e, provavelmente, é um fator determinante de sua
virulência.
A estrutura tridimensional da MCP do IMNV mostrou uma forma semelhante a outros
modelos de MCP já descritos e possibilitou inferir uma provável função enzimática
de remoção do cap5’ do mRNA para esta proteína.
A região que possivelmente codifica a RdRp do IMNV mostrou-se bastante
conservada e o modelo estrutural gerado para esta proteína correspondeu à
arquitetura típica de outras RNA polimerases, corroborando com o pressuposto de
que a ORF2 realmente codifica uma RdRp.
As regiões mais variáveis podem ser empregadas na caracterização de diferentes
cepas virais, enquanto que as regiões mais conservadas podem ser utilizadas no
desenho de primers para detectar o patógeno. A partir dos dados obtidos foi criado o
primeiro sistema capaz de diferenciar isolados do IMNV com base a presença de
polimorfismos.
Este sistema e os resultados mostrados aqui serão o ponto de partida para elucidar
a função das proteínas virais e sua correlação com a evolução do vírus, assim como
para a identificação de marcadores de virulência no IMNV.
93
REFERÊNCIAS ABASCAL, F.; ZARDOYA, R.; POSADA, D. ProtTest: selection of best-fit models of protein evolution. Bioinformatics, [S.l.], v. 21, p. 2104-5, 2005. ALTSCHUL, S. F. et al. Gapped BLAST and PSI-BLAST: a new generation of protein database search programs. Nucleic Acids Research, [S.l.], v. 25, p. 3389-3402, 1997. ANDRADE, T. P. D. et al. Real-time reverse transcription polymerase chain reaction assay using TaqMan probe for detection and quantification of Infection Myonecrosis Virus (IMNV). Aquaculture, Arizona – USA, v.264, p.9-15, 2007. ANDRADE, T. P.; LIGHTNER, D. V. Development of a method for the mediated isothermal amplification and nucleic acid lateral flow hybrid assay. Journal of Fish Diseases, [S.l.], v. 32, p. 911-24, 2009. ANJUM, S. et al. Additional Glycosylation Within a Specific Hypervariable Region of Subtype 3a of Hepatitis C Virus Protects Against Virus Neutralization. The Journal of Infectious Diseases, [S.l.], v. 208, p.1888-97, 2013. APTE-SENGUPTA, S. et al. Base of the Measles Virus Fusion Trimer Head Receives the Signal That Triggers Membrane Fusion. The Journal of Biological Chemistry, [S.l.], v. 287, p. 33026-33035, 2012. ARNOLD K. et al. The SWISS-MODEL Workspace: A web-based environment for protein structure homology modelling. Bioinformatics, [S.l.], v. 22, p.195-201, 2006. ARUNRUT, N.; SUEBSING, R.; KIATPATHOMCHAI, W. Rapid and sensitive detection of shrimp infectious myonecrosis virus using a reverse transcription loop-mediated isothermal amplification and visual colorogenic nanogold hybridization probe assay. Journal of Virological Methods, [S.l.], v.193, p. 542-547, 2013. BACHÉRE, E. Shrimp immunity and diseases control. Aquaculture, [S.l.], v.191, p. 3-11, 2000. BAYLISS, C. D. et al. A comparison of the sequences of segment A of four infectious bursal disease virus strains and identification of a variable region in VP2. Journal of General Virology, [S.l.], v. 71, p. 1303-1312, 1990. BEKAERT, M.; ROUSSET, J. P. An extended signal involved in eukaryotic -1 frameshifting operates through modification of the E site tRNA. Molecular Cell, [S.l.], v.17, p. 61-68, 2005. BEKAERT, M. et al. Towards a computational model for21 eukaryotic frameshifting sites. Bioinformatics, [S.l.], v.19, p. 327-335, 2003. BELOUZARD, S. et al. Mechanisms of Coronavirus Cell Entry Mediated by the Viral Spike Protein. Viruses, [S.l.], v. 4, p. 1011-1033, 2012.
94
BIOMATTERS. Geneious. Copyright © 2005-2014 Biomatters Limited. Disponível em: <http://www.geneious.com/>. Acesso em: 13 mar. 2014. BITTAR, C. et al. Genetic diversity of NS5A protein from hepatitis C virus genotype 3a and its relationship to therapy response. BMC Infectious Diseases, [S.l.], v. 23, p.10-36, 2010. BLAKE, R. D. et al. Statistical mechanical simulation of polymeric DNA melting with MELTSIM. Bioinformatics, [S.l.], v. 15, p. 370-375, 1999. BLANC, A.; GOYER, C.; SONENBERG, N. The coat protein of the yeast double-stranded RNA virus L-A attaches covalently to the cap structure of eukaryotic mRNA. Molecular Cell, [S.l.], v. 12, p. 3390-3398, 1992. CORTEY, M. et al. Genetic variability and phylogeny of Torque teno sus virus 1(TTSuV1) and 2 (TTSuV2) based on complete genomes. Veterinary Microbiology, [s.l.], v.148, p.125-131, 2011. BOTELHO-SOUZA, L. F. et al. Development of a reverse transcription quantitative real-time PCR-based system for rapid detection and quantitation of hepatitis delta virus in the western Amazon region of Brazil. Journal of Virological Methods, [S.l.], v.197, p.19-24, 2014. BRASIL. Ministério da Agricultura, Agropecuária e Abastecimento. Plataforma tecnológica do camarão marinho cultivado. Brasília: MAPA, 2001. BRUENN, J. A. A structural and primary sequence comparison of the viral RNA-dependent RNA polymerases. Nucleic Acids Research, [S.l.], v. 31, p.1821-1829, 2003. BURD, C. G.; DREYFUSS, G. Conserved structures and diversity of functions of RNA-binding proteins. Science, [S.l.], v. 265, p. 615-21, 1994.
CARPENTER, S. et al. Identification of a Hypervariable Region in the Long Terminal Repeat of Equine Infectious Anemia Virus. Journal of Virology, [S.l.], p.1605-1610, 1991. CAVANAGH, D.; DAVIS, P. J.; MOCKETT, A. P. A. Amino acids within hypervariable region 1 of avian coronavirus IBV (Massachusetts serotype) spike glycoprotein are associated with neutralization epitopes. Virus Research, [S.l.], v.11, p.141-150, 1988. CHAIVISUTHANGKURA, P. et al. Simple and rapid detection of infectious myonecrosis virus using an immunochromatographic strip test. Archives of Virology, [S.l.], p. 1925-1930, 2013. CHAPPELL, J. D. et al. Crystal structure of reovirus attachment protein sigma1 reveals evolutionary relationship to adenovirus fiber. EMBO Journal, [S.l.], v. 21, p. 1-11, 2002.
95
CHAYAMA, K. et al. Pretreatment virus load and multiple amino acid substitutions in the interferon sensitivity determining region predict the outcome of interferon treatment in patients with chronic genotype 1b hepatitis C virus infection. Hepatology, [S.l.], v. 25, p. 745-749, 1997. CHEN, V. B. et al. C. MolProbity: all-atom structure validation for macromolecular crystallography. Acta Crystallographica, [S.l.], v. 66, p.12-21, 2010. CLYDE, K.; BARRERA, J.; HARRIS, E. The capsid-coding region hairpin element (cHP) is a critical determinant of dengue virus and West Nile virus RNA synthesis. Virology, [S.l.], v. 379, p.314-323, 2008. COWLEY, J. A. et al. Vertical transmission of gill-associated virus (GAV) in the black tiger prawn Penaeus monodon. Diseases of Aquatic Organisms, [S.l.], v. 50, p.95-104, 2002. DINMAN, J. D.; ICHO, T.; WICKNER, R. B. A21 ribosomal frameshift in a double-stranded RNA virus of yeast forms a gag–pol fusion protein. Proceedings of the National Academy of Sciences U S A, v. 88, p.174-178,1991. DRUMMOND, A. J.; RAMBAUT, A. BEAST: Bayesian evolutionary analysis by sampling trees. BMC evolutionary biology, [S.l.], v. 7, p. 214, 2007. DRUMMOND, A. J. et al. Bayesian phylogenetics with BEAUti and the BEAST 1.7. Molecular Biology and Evolution, [S.l.], v. 29, p. 1969-73, 2012. DUNN, S. E. et al. Three-dimensional Structure of Victorivirus HvV190S Suggests Coat Proteins in Most Totiviruses Share a Conserved Core. PLOS Pathogens, [S.l.], v. 9, e1003225, 2013. ENJUANES, L. et al. Biochemical aspects of coronavirus replication and virus-host interaction. Annual Review Microbiology, [S.l.], v. 60, p.2 11-230, 2006. ENOMOTO, N. et al. Mutations in the nonstructural protein 5A gene and response to interferon in patients with chronic hepatitis C virus 1b infection. New England Journal of Medicine, [S.l.], v. 334, p. 77-81, 1996. EWING, B.; GREEN, P. Base-calling of automated sequencer traces using phred. II. Error probabilities. Genome Research, [S.l.], v. 8, p.186-194, 1998. FAO. The State of World Fisheries and Aquaculture 2008. Roma, 2008. FEIJÓ, R. G. et al. Infectious myonecrosis vírus and White spot syndrome vírus co-infection in Pacific White shrimp (Litopenaeus vannamei) farmed in Brazil. Aquaculture, [S.l.], v. 380-383, p.1-5, 2013. FLEGEL, T. W. et al. Presence of multiple viruses in non-diseased, cultivated shrimp at harvest. Aquaculture, [S.l.], v. 240, p.55-68, 2004.
96
FRAGA, J. et al. Genetic characterization of three Cuban Trichomonas vaginalis virus. Phylogeny of Totiviridae family. Infection, Genetics and Evolution, [S.l.], v.12, p.113-120, 2012. GHABRIAL, S. Totiviruses. In: MAHY, B. W. J.; VAN REGENMORTEL M. H. V. Encyclopedia of Virology. 3. ed. San Diego: Academic Press/Elsevier, 2008. GONZÁLEZ-CANDELAS, F.; LÓPEZ-LABRADOR, F. X. Brenner's Encyclopedia of Genetics. 2. ed. [S.l.: s.n], 2013. HANSEN, J. L.; LONG, A. M.; SCHULTZ, S. C. Structure of the RNA-dependent RNA polymerase of poliovirus. Structure, [S.l.], v. 5, p.1109-1122, 1997. HOA, T. et al. Genotypic variations in tandem repeat DNA segments between ribonucleotide reductase subunit genes of white spot syndrome virus (WSSV) isolates from Vietnam, In: WALKER, P., LESTER, R., REANTASO, M. (Ed.). Diseases in Asian Aquaculture V, Manila: 2005, p.395-403. HOFACKER, I. L. et al. Fast Folding and Comparison of RNA Secondary Structures. Monatshefte für Chemie, [S.l.], v. 125, p.167-188, 1994. HOFMANN, K.; STOFFEL, W. TMbase - A database of membrane spanning proteins segments. Biological Chemistry Hoppe-Seyler, [S.l.], v. 374, p.166, 1993. HUANG, L. et al. Hepatitis C Virus Nonstructural Protein 5A (NS5A) Is an RNA-binding Protein. The Journal of Biological Chemistry, [S.l.], v. 280, p. 36417-36428, 2005. JACKS, T. et al. Characterization of ribosomal frameshifting in HIV-1 gag–pol expression. Nature, [S.l.], v. 331, p. 280-283, 1988. JIRAVANICHPAISAL, P.; LEE, B. L.; SÖDERHÄLL, K. Cell-mediated immunity in arthropods: hematopoiesis, coagulation, melanization and opsonization. Immunobiology, [S.l.], v. 211, p. 213-236, 2006. KATOH, K.; TOH, H. Parallelization of the MAFFT multiple sequence alignment program. Bioinformatics, [S.l.], v. 26, p.1899-900, 2010. KATOH, K.; FRITH, M. C. Adding unaligned sequences into an existing alignment using MAFFT and LAST. Bioinformatics, [S.l.], v. 28, p. 3144-3146, 2012. KEARNEY, M. et al. Frequent polymorphism at drug resistance sites in HIV-1 protease and reverse transcriptase. AIDS, [S.l.], v. 22, p. 497-501, 2008. KELLEY, L. A.; STERNBERG, M. J. E. Protein structure prediction on the Web: a case study using the Phyre server. Nature Protocols, [S.l.], v. 4, p. 363-371, 2009. KING, A. M. Q. et al. The most recent report of the ICTV: Virus taxonomy: classification and nomenclature of viruses: Ninth Report of the International Committee on Taxonomy of Viruses. San Diego: Elsevier Academic Press, 2012.
97
KOK, C. C.; MCMINN, P. C. Picornavirus RNA-dependent RNA polymerase. The International Journal of Biochemistry & Cell Biology, [S.l.], v. 41, p. 498–502, 2009. KORAKA, P. et al. RNA secondary structures in the proximal 3’UTR of Indonesian Dengue 1 virus strains. Virus Research, [S.l.], v.142, p. 213-216, 2009. KUNANOPPARAT, A. et al. Detection of infectious myonecrosis virus using monoclonal antibody specific to N and C fragments of the capsid protein expressed heterologously. Journal of Virological Methods, [S.l.], v.171, p.141-148, 2011. KUROSAKI, M. et al. Analysis of genotypes and amino acid residues 2209 to 2248 of the NS5A region of hepatitis C virus in relation to the response to interferon-beta therapy. Hepatology, [S.l.], v. 25, p. 750-753, 1997. KURTZ, J. Memory in the innate and adaptive immune systems. Microbes and Infection, [S.l.], v. 6, p. 1410-7, 2004. LAI, Y. et al. Viral Double-Strand RNA-Binding Proteins Can Enhance Innate Immune Signaling by Toll-Like Receptor 3. PLoS ONE, [S.l.], v. 6, p.e25837, 2011. LANA, D. P.; BEISEL, C. E.; SILVA, R. F. Genetic mechanisms of antigenic variation in infectious bursal disease virus: analysis of a naturally occurring variant virus. Virus Genes, [S.l.], v. 6, p. 247-59, 1992. LANZA, D. C. F. et al. Human FEZ1 has characteristics of a natively unfolded protein and dimerizes in solution. Proteins, [S.l.], v. 74, p. 104-121, 2008. LARKIN, M. A. et al. Clustal W and Clustal X version 2.0. Bioinformatics, [S.l.], v. 23, p. 2947-2948, 2007. LEE, D-K. et al. Heterogeneity in spike protein genes of porcine epidemic diarrhea viruses isolated in Korea. Virus Research, [S.l.], v. 149, p.175-182, 2010. LI, L.; WANG, A. L.; WANG, C. C. Structural analysis of the -1 ribosomal frameshift elements in giardiavirus mRNA. Journal of Virology, [S.l.], v. 75, p. 10612-10622, 2001. LIGHTNER, D. V. Virus diseases of farmed shrimp in the Western Hemisphere (the Americas): A review. Journal of Invertebrate Pathology, [S.l.], v.106, p.110-130, 2011. LIGHTNER, D. V.; PANTOJA, C. R. Infectious Myonecrosis (IMV): current status report on the biology of etiological agent and development of diagnostic methods. In: FEIRA NACIONAL DO CAMARÃO (FENACAM). Natal, Rio Grande do Norte, Anais p. 22, 2004. LIGHTNER, D. V. et al. Infectious myonecrosis: a new disease in Pacific White shrimp. Global Aquaculture Advocate, [S.l.], v. 7, p. 85, 2004.
98
LIU, H. et al. Evolutionary genomics of mycovirus-related dsRNA viruses reveals cross-family horizontal gene transfer and evolution of diverse viral lineages. BMC Evolutionary Biology, [S.l.], v.12, p.91, 2012. LIU, H.; SÖDERHÄLL, K.; JIRAVANICHPAISAL, P. Antiviral immunity in crustaceans. Fish and Shellfish Immunology, [S.l.], v. 27, p. 79-88, 2009. LIU, H-L. et al. A real-time PCR for the detection of infectious myonecrosis virus in penaeid shrimp. Journal of Invertebrate Pathology, [S.l.], v. 113, p. 237-239, 2013. LOLE, K. S. et al. Full-length human immunodeficiency virus type 1 genomes from subtype C-infected seroconverters in India, with evidence of intersubtype recombination. Journal of Virology, [S.l.], v. 73, p. 152-60, 1999. LOTZ, J. M. Special topic review: Viruses, biosecurity and specific pathogen-free stocks in shrimp aquaculture. Journal of Microbiology & Biotechnology, [S.l.], v.13, p. 405-413, 1997. LOTZ, J. M.; ANTON, L. S.; SOTO, M. A. Effect of chronic Taura syndrome virus infection on salinity tolerance of Litopenaeus vannamei. Diseases of Aquatic Organisms, [S.l.], v. 65, p. 75-78, 2005. LOVE, R. A. et al. The Crystal Structure of the RNA-Dependent RNA Polymerase from Human Rhinovirus: A Dual Function Target for Common Cold Antiviral Therapy. Structure, v.12, p.1533–1544, 2004. LOY, J. D. et al. Sequence-optimized and targeted double-stranded RNA as a therapeutic antiviral treatment against infectious myonecrosis virus in Litopenaeus vannamei. Diseases of Aquatic Organisms, [S.l], v.105, p. 57-64, 2013. LOY, J. D. et al. dsRNA provides sequence-dependent protection against infectious myonecrosis virus in Litopenaeus vannamei. Journal of General Virology, [S.l.], v.93, p. 880–888, 2012. LU, Y. et al. Infection of the yellow head baculo-like virus (YBV) in two species of penaeid shrimp Penaeus stylirostris (Stimpson) and Penaeus vannamei (Boone). Journal of Fish Diseases, [S.l.], v. 17, p. 649–656, 1994. LUPAS, A.; VAN DYKE, M.; STOCK, J. Predicting Coiled Coils from Protein Sequences. Science, [S.l.], v. 252, p.1162-1164, 1991. MADRID, R. M. A crise econômica da carcinicultura. Panorama da Aquicultura, [S.l.], v. 90, p. 22–29, 2005b. MADRID, R. M. A Dança dos Preços na Carcinicultura Brasileira e Desafios de Competitividade. Revista da ABCC, [S.l.], n. 7, p. 52-61, 2005a. MADRID, R. M. Programa de apoio ao desenvolvimento do cultivo de camarão marinho (Versão preliminar). Brasília: MAA, 1999.
99
MARCHLER-BAUER, A. et al. CDD: a Conserved Domain Database for the functional annotation of proteins. Nucleic acids research, [S.l.], v. 39, p. D225-9, 2011. MARKS, H. et al. Genetic variation among isolates of white spot syndrome virus. Archives of Virology, [S.l.], v. 149, p. 673–697, 2004. McBRIDGE, M. S.; PANGANIBAN, A.T. The Human Immunodeficiency Virus Type 1 Encapsidation Site Is a Multipartite RNA Element Composed of Functional Hairpin Structures. Journal of Virology, [S.l.], v. 70, p. 2963-2973, 1996. MELLO, M. V. et al. Purification of infectious myonecrosis virus (IMNV) in species of marine shrimp Litopenaeus vannamei in the State of Ceará. Journal of Virological Methods, [S.l.], v.177, p.10-14, 2011. MERCKEL, M. C. et al. The Structure of the Bacteriophage PRD1 Spike Sheds Light on the Evolution of Viral Capsid Architecture. Molecular Cell, [S.l.], v.18, p.161-170, 2005. MINGXIAOA, M. et al. Genetic characterization of VP1 gene of seven Sacbrood virus isolated from three provinces in northern China during the years 2008–2012. Virus Research, [S.l.], v.176, p. 78-82, 2013. MITRAKI, A. et al. Unfolding studies of human adenovirus type 2 fibre trimmers: Evidence for a stable domain. European Journal of Biochemistry, [S.l.], v. 264, p. 599-606, 1999. MOSS, S. M. Marine shrimp farming in the western hemisphere: past problems, present solutions, and future visions. Reviews in Fisheries Science, [S.l.], v.10, p. 601-620, 2002. MINISTÉRIO DA PESCA E AQUICULTURA. Produtores de camarão e MPA criam agenda positiva para o desenvolvimento da carcinicultura nacional. Disponível em: <http://www.mpa.gov.br/index.php/imprensa/noticias/2963-produtores-de-camarao-e-mpa-criam-agenda-positiva-para-o-desenvolvimento-da-carcinicultura-nacional>. Acesso em: 18 jun. 2014. MUSTHAQ, S. S. et al. Variability in the tandem repetitive DNA sequences of white spot syndrome virus (WSSV) genome and suitability of VP28 gene to detect different isolates of WSSV from India. Aquaculture, [S.l.], v. 256, p. 34-41, 2006. NAGATA, L. P. et al. Infectivity variation and genetic diversity among strains of Western equine encephalitis virus. Journal of General Virology, [S.l.], v. 87, p. 2353-61, 2006. NAIM, S.; BROWN, J. K.; NIBERT, M. L. Genetic diversification of penaeid shrimp infectious myonecrosis virus between Indonesia and Brazil. Virus Research, [S.l.], v.189, p. 97-105, 2014.
100
NAITOW, H. et al. L-A virus at 3.4 Å resolution reveals particle architecture and mRNA decapping mechanism. Nature Structural Biology, [S.l.], v. 9, p. 725-728, 2002. NIBERT, M. L.; TAKAGI, Y. Fibers come and go: differences in cell-entry components among related dsRNA viruses. Current Opinion in Virology, [S.l.],v.3, p. 20-26, 2013. NIBERT, M. L. ‘2A-like’ and ‘shifty heptamer’ motifs in penaeid shrimp infectious myonecrosis virus, a monosegmented double-stranded RNA virus. Journal of General Virology, [S.l.], v. 88, p.1315- 318, 2007. NOTREDAME, C.; HIGGINS, D. G.; HERINGA, J. T-Coffee: A Novel Method for Fast and Accurate Multiple Sequence Alignment. Journal of Molecular Biology, [S.l.], v. 302, p. 205-217, 2000. NUNES, A. J. P.; MARTINS, P. C. C.; GESTEIRA, T. C. V. Carcinicultura ameaçada. Revista Panorama da Aquicultura, [S.l.], v. 83, p. 37-51, 2004. O’REILLY, E. K.; KAO, C. C. Analysis of RNA-Dependent RNA Polymerase Structure and Function as Guided by Known Polymerase Structures and Computer Predictions of Secondary Structure. Virology, [S.l.], v. 252, p. 287-303, 1998. OFFICE INTERNATIONAL ESPIZOTICS. Infectious myonecrosis virus. In: Manual of Diagnostic Tests for Aquatic Animals. Paris, France: Office International des Epizooties, 2009. p. 96-104. OLIVEIRA, R. A. C. et al. In silico single strand melting curve: A new approach to identify nucleic acid polymorphisms in Totiviridae. BMC Bioinformatics, [S.I.], v.15, p. 243, 2014. ORMOND, J. G. P. A carcinicultura brasileira. Rio de Janeiro: BNDES, n.19, p.91-118, 2004. OVERSTREET, R. M. et al. Susceptibility to TSV of some penaeid shrimp native to the Gulf of Mexico and southeast Atlantic Ocean. Journal of Invertebrate Pathology, [S.l.], v. 69, p.165-176, 1997. PENG, S. E. et al. The transition from pre-patent to patent infection of white spot syndrome virus (WSSV) in Penaeus monodon triggered by pereiopod excision. Fish Pathology, [S.l.], v.33, p.395-400, 1998. PERLMAN, S.; NETLAND, J. Coronaviruses post-SARS: Update on replication and pathogenesis. Nature Reviews Microbiology, [S.l.], v. 7, p. 439-450, 2009. PERSSON, R.; PETTEERSSON, R. F. Formation and intracellular transport of a heterodimeric viral spike protein complex. The Journal of Cell Biology, [S.l.], v.112, p. 257-266, 1991.
101
PETTERSEN, E. F. et al. UCSF Chimera - a visualization system for exploratory research and analysis. Journal of Computational Chemistry, [S.l.], v. 25, p.1605-1612, 2004. PINHEIRO, A. C. A. S. et al. Epidemiological status of Taura syndrome and Infectious myonecrosis viruses in Penaeus vannamei reared in Pernambuco (Brazil). Aquaculture, [S.l], v. 262, p.17-22, 2007. PINHO, J. R. R. et al. Genetic diversity of NS5A protein from hepatitis C virus genotype 3a and its relationship to therapy response. BMC Infectious Diseases, [S.l], v.10, p. 36, 2010. POCH, O. et al. Identification of four conserved motifs among the RNA-dependent polymerase encoding elements. The EMBO Journal, [S.l.], v. 8, p. 3867-3874, 1989. PORTELA, A.; DIGARD, P. The influenza virus nucleoprotein: a multifunctional RNA-binding protein pivotal to virus replication. Journal of General Virology, [S.l.], v.83, p.723-734, 2002. POULOS, B. T.; LIGHTNER, D. V. Detection of infectious myonecrosis virus (IMNV) of penaeid shrimp by reverse-transcriptase polymerase chain reaction (RT-PCR). Diseases of Aquatic Organisms, [S.l.], v. 73, p. 69-72, 2006. POULOS, B. T. et al. Purification and characterization of infectious myonecrosis virus of penaeid shrimp. Journal of General Virology, [S.l], v. 87, p.987-996, 2006. PRILUSKY, J. et al. FoldIndex©: a simple tool to predict whether a given protein sequence is intrinsically unfolded. Bioinformatics, v. 21, p. 3435–3438, 2005. PROMKUNTOD, N. et al. Mapping of the receptor-binding domain and amino acids critical for attachment in the spike protein of avian coronavirus infectious bronchitis virus. Virology, [S.l.], v. 448, p. 26-32, 2014. PUDUPAKAM, R. S. et al. Mutational Analysis of the Hypervariable Region of Hepatitis E Virus Reveals Its Involvement in the Efficiency of Viral RNA Replication. Journal of Virology, [S.l.], v. 85, p.10031-10040, 2011. PUTHAWIBOOL, T. et al. Detection of shrimp infectious myonecrosis virus by reverse transcription loop-mediated isothermal amplification combined with a lateral flow dipstick. Journal of Virological Methods, [S.l.], v.156, p. 27-31, 2009. QAAD 2006 - Quarterly Aquatic Animal Disease Report (Asia and Pacific Region), NACA: Bangkok, Thailand. 2006/2, April-June 2006. Não entendi REED, G. H.; WITTWER, C. T. Sensitivity and Specificity of Single-Nucleotide Polymorphism Scanning by High-Resolution Melting Analysis. Clinical Chemistry, [S.l.], v.50, p.1748-1754, 2004. ROCHA, I. P. Mensagem da Diretoria da ABCC. Revista da ABCC, [S.l.], v. 7, n.3, p. 6, 2005a.
102
ROCHA, I. P. Mensagem da Diretoria da ABCC. Revista da ABCC, [S.l.], v. 7, n. 4, p. 4, 2005b. RONQUIST, F.; HUELSENBECK, J. P. MrBayes 3: Bayesian phylogenetic inference under mixed models. Bioinformatics, [S.l.], v.19, p.1572-4, 2003. RONQUIST, F. et al MrBayes 3.2: efficient Bayesian phylogenetic inference and model choice across a large model space. Systematic biology, [S.l.], v. 61, p.539-42, 2012. ROST, B.; YACHDAV, G.; LIU, J. The PredictProtein server. Nucleic Acids Research, [S.l.], v. 32, p. 321-326, 2004. ROY, A.; KUCUKURAL, A.; ZHANG, Y. I-TASSER: a unified platform for automated protein structure and function prediction. Nature Protocols, [S.l.], v.5, p.725-738, 2010. SANCHEZ-MARTINEZ, J. G. et al. White spot syndrome virus in cultured shrimp: a review. Journal of Aquaculture Research, [S.l.], v. 38, p.1339-1354, 2007. SANO, T. et al. Identification of multiple structural domains regulating viroid pathogenicity Proceedings of the National Academy of Sciences USA, [S.l.], v.89, p.10104-10108, 1992. SEIBERT, C. H. et al. Detection of major capsid protein of infectious myonecrosis virus in shrimps using monoclonal antibodies. Journal of Virological Methods, [S.l.], v. 169, p.169-175, 2010. SENAPIN, S. et al. Outbreaks of infectious myonecrosis virus (IMNV) in Indonesia confirmed by genome sequencing and use of an alternative RT-PCR detection method. Aquaculture, [S.l.], v. 266, p. 32-38, 2007. SILVA, D. C. D. et al. Infectious hypodermal and hematopoietic necrosis virus from Brazil: Sequencing, comparative analysis and PCR detection. Virus Research, [S.l.], v. 189, p.136-146, 2014. SILVA, S. M. B. C.; PINHEIRO, A. C. A. S.; COIMBRA, M. R. M. Quantitation of infectious myonecrosis virus in different tissues of naturally infected Pacific white shrimp, Litopenaeus vannamei, using real time PCR with SYBR Green chemistry. Journal of Virological Methods, [S.l.], v.177, p.197-201, 2011. SOUSA, R. et al. Crystal structure of bacteriophage T7 RNA polymerase at 3.3 Å resolution. Nature, [S.l.], v. 364, p. 593-599, 1993. STEITZ, T. A. DNA Polymerases: Structural Diversity and Common Mechanisms. The Journal of Biological Chemistry, [S.l.], v. 274, p. 17395-17398, 1999.
103
TABLER, M.; SFINGER, H. L. Infectivity studies on different potato spindle tuber viroid (PSTV) RNAs synthesized in vitro with the SP6 transcription system. The EMBO Journal, [S.l.], v. 4, p. 2191-2199, 1985. TAMURA, K. et al. MEGA6: Molecular Evolutionary Genetics Analysis Version 6.0. Molecular Biology and Evolution, [S.l.], v. 30, p. 2725-2729, 2013. TAN, Y. et al. Molecular detection of three shrimp viruses and genetic variation of white spot syndrome virus in Hainan Province, China, in 2007. Journal of Fish Diseases, [S.l.], v. 32, p. 777-784, 2009. TANG, J. et al. Infectious myonecrosis virus has a totivirus-like, 120-subunit capsid, but with fiber complexes at the fivefold axes. PNAS, [S.l.], v.105, n.4 5, p.17.526-17.531, 2008. TANG, K. F. J.; LIGHTNER, D. V. Quantification of white spot syndrome virus DNA through a competitive polymerase chain reaction. Aquaculture, [S.l.], v.189, p.11-21, 2000. TANG, K. F. J. et al. V. In situ hybridization demonstrates that Litopenaeus vannamei, L. stylirostris and Penaeus monodon are susceptible to experimental infection with infectious myonecrosis virus (IMNV). Diseases Aquatic Organisms, [S.l.], v. 63, p. 261-265, 2005. TSAREV, S. A. et al. Characterization of a prototype strain of hepatitis E virus. Proceedings of the National Academy of Sciences, [S.l.], v. 89, p. 559-563, 1992. TSAI, P-L. et al. Cellular RNA Binding Proteins NS1-BP and hnRNP K Regulate Influenza A Virus RNA Splicing. PLOS Pathogens, [S.l.], v. 9, p.1003460, 2013. VALLONE, P. M.; BUTLER, J. M. AutoDimer: a screening tool for primer-dimer and hairpin structures. BioTechniques, [S.l.], v. 37, p. 226-231, 2004. WAHEED, Y.; BHATTI, A.; ASHRAF, M. RNA dependent RNA polymerase of HCV: A potential target for the development of antiviral drugs. Infection, Genetics and Evolution, [S.l.], v.14, p. 247–257, 2013. WANG, A. L. et al. Giardiavirus double-stranded RNA genome encodes a capsid polypeptide and a gag–pol-like fusion protein by a translational frameshift. Proceedings of the National Academy of Sciences USA, [S.l.], v. 90, p. 8595–8599, 1993. WATERHOUSE, A. M. et al. Jalview Version 2 - a multiple sequence alignment editor and analysis workbench. Bioinformatics, [S.l.], v. 25, p. 1189-1191, 2009. WEIRATHER, J. L. et al. Serial Quantitative PCR Assay for Detection, Species Discrimination, and Quantification of Leishmania spp. in Human Samples. Journal of Clinical Microbiology, [S.l.], v. 49, p. 3892-3904, 2011.
104
WIJEGOONAWARDANE, P. K. et al. Genetic diversity in the yellow head nidovirus complex. Virology, [S.l.], v. 380, p. 213-25, 2008. ZHANG, Y. I-TASSER server for protein 3D structure prediction. BMC Bioinformatics, [S.l.], v. 9, p. 40, 2008. ZHANG, Y. Template-based modeling and free modeling by I-TASSER in CASP7. Proteins, [S.l.], v. 69, p.108-117, 2007. ZONG, J. C. et al. Evaluation of global clustering patterns and Strain variation over and extended ORF26 gene locus from Kaposi’ Sarcoma herpesvirus. J Clin Virol., [S.l.], v. 40, p.19-25, 2007.
105
APÊNDICE
106
Tabela Suplementar 1: Nome e números de acesso das sequências dos totivírus usados neste estudo agrupados de acordo com a análise filogenética.
Nome do vírus Nº de acesso Abreviação
MoV-like
Beauveria bassiana RNA virus 1 CCC42235.1 BeauV
Tolypocladium cylindrosporum virus 1 YP_004089630.1 TcV-1
Botryotinia fuckeliana totivirus 1 YP_001109580.1 BotryV
Helminthosporium victoriae virus 190S NP_619670.2 HvV-190S
Chalara elegans RNA virus 1 YP_024728.1 ChalElV
Helicobasidium mompa totivirus 1-17 NP_898833 HmV1-17
Thielaviopsis basicola dsRNA virus 1 AAS68036.1 ThielaV
Magnaporthe orzyae virus 1 YP_122352.1 MoV-1
IMNV-like
Penaeid shrimp infectious myonecrosis virus AAT67231.2 IMNV
Tianjin totivirus AFE02920.1 TianV
Omono river virus BAJ21511.1 ORV
Drosophila melanogaster totivirus SW-2009a YP_003289293.1 DmV-SW-2009ª
Armigeres subalbatus virus SaX06-AK20 YP_003934934.1 AsV-SaX06-AK20
GLV-like
Piscine myocarditis virus AL V-708 YP_004581250.1 PMV-AL V-708
Giardia canis virus from China (2883-5981)* DQ238861.1 GCV
Giardia lamblia virus (2880-5978)* NC_003555.1 GLV2
ZbV-like
Blueberry latent virus isolate AR (936-3332)* HM029248.1 BLV
Southern tomato virus isolate Mexico-1(1039-3327)* EF442780.1 STV
Zygosaccharomyces bailii virus Z NP_624325.1 ZbV-Z
ScV-like
Ustilago maydis virus H1 (735-6002)* NC_003823.1 UmV-H1
Saccharomyces cerevisiae virus L-BC (La) NP_042581.1 ScV L-BC
Saccharomyces cerevisiae virus L-A NP_620495.1 ScV L-A
Black raspberry virus F YP_001497151.1 BRV-F
Tuber aestivum virus 1 ADQ54106.1 TaV-1
GaRV-like
Sphaeropsis sapinea RNA virus 2 AAD11603.1 SphaeroV
Coniothyrium minitans RNA virus YP_392467.1 CmRV
Epichloe festucae virus 1 CAK02788.1 EpiFesV
Gremmeniella abietina RNA virus L2 AAT48885.1 GaRV-L2
Outras sequências
Eimeria brunetti RNA virus 1 NP_108651.1 EbRV-1
*O número de acesso corresponde à sequência de nucleotídeos do genoma completo. Números entre
parênteses correspondem ao primeiro e último nucleotídeo da sequência que codifica a RdRp.
107
Tabela Suplementar 2: Nome e números de acesso das sequências dos Trichomonasvirus, Leishmaniavirus e Giardiavirus usados neste estudo agrupados de acordo com a análise filogenética.
Nome do vírus Nº de acesso Abreviação
TVV4
Trichomonas vaginalis virus 4 strain TVV4-1 AED99796.1 TVV4-1
Trichomonas vaginalis virus 4 strain TVV4-OC3 AED99794.1 TVV4-OC3
Trichomonas vaginalis virus 4 strain TVV4-OC5 AED99798.1 TVV4-OC5 TVV3
Trichomonas vaginalis virus 3 strain TVV3-UR1 AED99800.1 TVV3-UR1
Trichomonas vaginalis virus 3 strain TVV3-OC5 AED99804.1 TVV3-OC5
Trichomonas vaginalis virus 3 strain TVV3-OC3 AED99802.1 TVV3-OC3
Trichomonas vaginalis virus 3 NP_659390.1 Trichomonasvirus_3 TVV2
Trichomonas vaginalis virus 2 strain TVV2-OC3 AED99808.1 TVV2-OC3
Trichomonas vaginalis virus 2 strain TVV2-UR1 AED99806.1 TVV2-UR1
Trichomonas vaginalis virus 2 strain TVV2-OC5 AED99810.1 TVV2-OC5
Trichomonas vaginalis virus II NP_624323.2 Trichomonasvirus_II
Trichomonas vaginalis virus 2 isolate C76 AET81014.1 TVV2-C76
Trichomonas vaginalis virus 2 isolate C351 AET81016.1 TVV2-C351 TVV1
Trichomonas vaginalis virus NP_620730.2 Trichomonasvirus_I
Trichomonas vaginalis virus 1 isolate C344 AET81012.1 TVV1-C344
Trichomonas vaginalis virus 1 strain TVV1-UH9 AED99814.1 TVV1-UH9
Trichomonas vaginalis virus 1 strain TVV1-OC4 AED99818.1 TVV1-OC4
Trichomonas vaginalis virus 1 strain TVV1-OC3 AED99816.1 TVV1-OC3
Trichomonas vaginalis virus 1 strain TVV1-UR1 AED99812.1 TVV1-UR1
Trichomonas vaginalis virus 1 strain TVV1-OC5 AED99820.1 TVV1-OC5
LRV-like
Leishmania RNA virus 2 - 1 NP_043465.1 LRV 2-1
Leishmania RNA virus 1 - 4 NP_619653.1 LRV 1-4
Leishmania RNA virus 1 - 1 NP_041191.1 LRV 1-1
GLV-like
Giardia canis virus from China ABB36743.1 GCV
Giardia lamblia virus AAM77694.1 GLV1
Giardia lamblia virus NP_620070.1 GLV2
108
Tabela Suplementar 3: Identificação do IMNV em amostras de camarão marinho Litopenaeus vannamei.
Amostra Procedência Data da coleta Data PCR
Data eletroforese Resultado
Resultado nested Observações
V13/L1246 Camanor 02/09/2011 09/11/2012 14/11/2012 Negativo Negativo Primers F13/R13 e F13N/R13N / Camarão morto
CBV15/L1247 Camanor 04/09/2011 09/11/2012 14/11/2012 Negativo Negativo Primers F13/R13 e F13N/R13N
LOTE CB 1242-1 150UP Camanor 27/08/2011 09/11/2012 14/11/2012 Negativo Negativo Primers F13/R13 e F13N/R13N
V13/L1246 Camanor 02/09/2011 19/11/2013 20/11/2012 Negativo Negativo Primers OIE
CBV15/L1247 Camanor 04/09/2011 19/11/2013 20/11/2012 Negativo Negativo Primers OIE
LOTE CB 1242-1 19 150/UP Camanor 27/08/2011 19/11/2013 20/11/2012 Negativo Negativo Primers OIE
B6A/Lote: 06 Camanor 01/09/2011 20/11/2012 21/11/2012 Negativo Negativo Primers F13/R13 e F13N/R13N
CB V1/LOTE 1256 Camanor 13/10/2011 20/11/2012 21/11/2012 Negativo Negativo Primers F13/R13 e F13N/R13N
V06/L1235 Camanor 02/09/2011 20/11/2012 21/11/2012 Negativo Negativo Primers F13/R13 e F13N/R13N
V05/L1238 CB Camanor 02/09/2011 20/11/2012 21/11/2012 Negativo Negativo Primers F13/R13 e F13N/R13N
CBV16 - PLS (CBV11 R2-7 14353) Camanor 02/09/2011 20/11/2012 21/11/2012 Negativo Negativo Primers F13/R13 e F13N/R13N / Larvas
P/S Aquatec Lote CBV18 R2-1 14.383 Camanor SEM DATA 20/11/2012 21/11/2012 Negativo Negativo
Primers F13/R13 e F13N/R13N / Larvas
B6A/Lote: 06 Camanor 01/09/2011 04/12/2012 04/12/2012 - - Primers F13/R13 e F13N / PCR não funcionou
V06/L1235 Camanor 02/09/2011 04/12/2012 04/12/2012 - - Primers F13/R13 e F13N / PCR não funcionou
CB V1/LOTE 1256 Camanor 13/10/2011 04/12/2012 04/12/2012 - - Utilização do Primer 13 / PCR não funcionou
B6A/Lote: 06 Camanor 01/09/2011 06/12/2012 06/12/2012 - - Primers F13/R13 e F13N / PCR não funcionou
V06/L1235 Camanor 02/09/2011 06/12/2012 06/12/2012 - - Primers F13/R13 e F13N / PCR não funcionou
CB V1/LOTE 1256 Camanor 13/10/2011 06/12/2012 06/12/2012 - - Primers F13/R13 e F13N / PCR não funcionou
CB V09/Lote: 1239 Camanor 12/09/2011 06/12/2012 06/12/2012 - - Primers F13/R13 e F13N / PCR
109
não funcionou
V7-L1257 CB Camanor 07/11/2011 06/12/2012 06/12/2012 - - Primers F13/R13 e F13N / PCR não funcionou
CB BV1/1250 Camanor 20/10/2011 06/12/2012 06/12/2012 - - Primers F13/R13 e F13N / PCR não funcionou
B6A/Lote: 06 Camanor 01/09/2011 10/12/2012 10/12/2012 - - Primers F13/R13 e F13N / PCR não funcionou
V06/L1235 Camanor 02/09/2011 10/12/2012 10/12/2012 - - Primers F13/R13 e F13N / PCR não funcionou
CB V1/LOTE 1256 Camanor 13/10/2011 10/12/2012 10/12/2012 - - Primers F13/R13 e F13N / PCR não funcionou
CB V09/Lote: 1239 Camanor 12/09/2011 10/12/2012 10/12/2012 - - Primers F13/R13 e F13N/ PCR não funcionou
V7-L1257 CB Camanor 07/11/2011 10/12/2012 10/12/2012 - - Primers F13/R13 e F13N / PCR não funcionou
CB BV1/1250 Camanor 20/10/2011 10/12/2012 10/12/2012 - - Primers F13/R13 e F13N / PCR não funcionou
B6A/Lote: 06 Camanor 01/09/2011 12/12/2012 12/12/2012 - - Primers F13/R13 e F13N / PCR não funcionou
V06/L1235 Camanor 02/09/2011 12/12/2012 12/12/2012 - - Primers F13/R13 e F13N / PCR não funcionou
CB V1/LOTE 1256 Camanor 13/10/2011 12/12/2012 12/12/2012 - - Primers F13/R13 e F13N / PCR não funcionou
B6A/Lote:06 Camanor 01/09/2011 05/03/2013 05/03/2013 Negativo - Primer F14/R14
V06/L1235 Camanor 02/09/2011 05/03/2013 05/03/2013 Negativo - Primer F14/R14
CBV1/Lote: 1256 Camanor 13/10/2011 07/03/2013 08/03/2013 Negativo - Primer F14/R14
Lote CB 1242-1 150/UP Camanor 27/08/2011 07/03/2013 08/03/2013 - - Primer F14/R14 / Controle + não funcionou
V05/L1238-CB Camanor 02/09/2011 07/03/2013 08/03/2013 Negativo - Primer F14/R14
CB V15/L1247 Camanor 04/09/2011 12/03/2013 12/03/2013 Negativo - Primer F14/R14
BV01/Lote 1250 Camanor 06/09/2011 12/03/2013 12/03/2013 Negativo - Primer F14/R14
B8 L1261 Camanor 07/11/2011 14/03/2013 15/03/2013 Negativo - Primer F14/R14
BV1 3 dias após ingerir camarão do Camanor 23/10/2011 14/03/2013 15/03/2013 Negativo - Primer F14/R14
110
V1
V12 L1258 CB Camanor 16/11/2011 14/03/2013 15/03/2013 Negativo - Primer F14/R14
Camarões do Darlio - - 21/03/2013 21/03/2013 Negativo - Primer F14/R14
CB 1244-1 Camanor 26/08/2011 21/03/2013 21/03/2013 - - Primer F14/R14/ Controle + não funcionou
V5 Lote: 1265 CB Camanor 19/11/2011 21/03/2013 21/03/2013 Negativo - Primer F14/R14
B6A/Lote:06 Camanor 01/09/2011 26/03/2013 27/03/2013 Negativo Negativo Primers OIE
V06/L1235 Camanor 02/09/2011 26/03/2013 27/03/2013 Negativo Negativo Primers OIE
CBV1/Lote: 1256 Camanor 13/10/2011 26/03/2013 27/03/2013 Negativo Negativo Primers OIE
Camarões do Darlio - - 26/03/2013 27/03/2013 Negativo Negativo Primers OIE
V13/L1246 Camanor 02/09/2011 26/03/2013 27/03/2013 Negativo Negativo Primers OIE / Camarão morto
Siri Camanor - 26/03/2013 27/03/2013 Negativo Negativo Primers OIE / C+ não funcionou
Camarões V03 Camanor 09/11/2011 26/03/2013 03/04/2013 Negativo Negativo Primers OIE
CB V20/L1252 Camanor 12/09/2011 26/03/2013 03/04/2013 Negativo Negativo Primers OIE
BV1 após ingerir camarão do V1, 1º dia Camanor 21/10/2011 26/03/2013 03/04/2013 Negativo Negativo Primers OIE
Intensivo B6A Lote 06 Camanor 05/09/2011 26/03/2013 04/04/2013 Negativo Negativo Primers OIE
BV1 4 dias após ingerir camarão do V1 Camanor 24/10/2011 26/03/2013 04/04/2013 Negativo Negativo Primers OIE
Camarão de Allan Camanor - 26/03/2013 04/04/2013 Negativo Negativo Primers OIE
Aquário 2/ morreu 3º Prof. Fabiana - 10/04/2013 11/04/2013 Negativo Negativo Primers OIE e primer F14/R14
Aquário 1/ morreu 2º Prof. Fabiana - 10/04/2013 11/04/2013 Negativo Negativo Primers OIE e primer F14/R14
Amostra lisado de células congelado Genearch 2005 15/01/2013 15/01/2013 Positivo - Primer F14/R14
Amostra lisado de células etanol 70%
Concepto Azul 2011 13/06/2013 13/06/2013 Positivo - Primer F14/R14
111
:
Figura Suplementar 1: Análise filogenética de membros representativos dos grupos TVV-like, LRV-like e GLV-like. A árvore foi calculada a partir do alinhamento da sequência de aminoácidos da RdRp de usando Inferência Bayesiana. As IDs das sequências estão indicadas na tabela suplementare 2. Os números indicam a consistência topológica e a confiança de cada ramo. As chaves indicam os grupos identificados neste estudo e nomeados de acordo com Liu et al. (2012) e as cores representam os gêneros de acordo com a ICTV.
112
Genoma completo IMNVgen1
ggcaatttcaacctaattctaaaactgttaccaacaatttctgaactacagaagaggcat
attcttcatctacttcgagaagaagtagaaggaaagaaagtttgcttcgtagagcgagaa
aaacagaatccacttatggctataaacgaactagccgttaaagttggaaagaagcctaaa
M A I N E L A V K V G K K P K
tacacatcgacgaaaaccggagctgaccacattccaagttggactgtattggttgagttc
Y T S T K T G A D H I P S W T V L V E F
gcaggttttagcgaagcagcaacatgtgacacagttaaaaacgcaaaaatgattgctgct
A G F S E A A T C D T V K N A K M I A A
tacaaattggttaaaagattttgtaaatgggacccaacctacattgaaatttctgattgt
Y K L V K R F C K W D P T Y I E I S D C
atgctgccacctccagaccttacatcgtgcggggatgttgagagtaatcctggacctatc
M L P P P D L T S C G D V E S N P G P I
atacatagtgttgcatttgcaagaactggttcagtatggacacctgccacctttactttc
I H S V A F A R T G S V W T P A T F T F
aatactacatcatccccgggtagactgcaagtacaaatgtcatccagcgacaatagatat
N T T S S P G R L Q V Q M S S S D N R Y
gggttcaactctgttttacttgcagcaggcggtacaacatggggcacagcttatttttca
G F N S V L L A A G G T T W G T A Y F S
gaacgctggaacagtgattttggattacagccagatctaactataactgtaacaccacaa
E R W N S D F G L Q P D L T I T V T P Q
ctaactggagaagaacttggttcaatttattttgatgctgtcgaaactacaaatgcagag
L T G E E L G S I Y F D A V E T T N A E
gaagctatagaagcaacaattataaatactactccaattgatgtaatggtagacacaaca
E A I E A T I I N T T P I D V M V D T T
gcaggccctgtaccaattgaaggtgatttcaaacccacaaatgaaactcccacgtgggta
A G P V P I E G D F K P T N E T P T W V
agtaacacaaagcccattgatgtagcaacacctaagactcgtgactacgcaaatcggtca
S N T K P I D V A T P K T R D Y A N R S
gtactgactccacaattgatcacaaaaatgaaagaccatgtctatgccttacaaaaggat
V L T P Q L I T K M K D H V Y A L Q K D
gaagttgaagatgtaacacttgcctcactcgattttggtttaaatccatcaagtgtactc
E V E D V T L A S L D F G L N P S S V L
ggaagatggttgaaatggctaactggcatagatatgagactccatcttgggaagaaagtt
G R W L K W L T G I D M R L H L G K K V
acaaaccataaagttagaatgtttgtgcaaaaaacaaggtttccactaaagacagcaatt
T N H K V R M F V Q K T R F P L K T A I
gaggaactaaacaatggtactgttccacttagattaaggagggatgttcgttacattgaa
E E L N N G T V P L R L R R D V R Y I E
aagccattcgataaagaggaacataccaacatactgttatctggtgatgttgaggaaaac
113
K P F D K E E H T N I L L S G D V E E N
cctgggcctgaagggatggaacaggtatcaataacgccagaacaacttcaaatgattctg
P G P E G M E Q V S I T P E Q L Q M I L
gcaatgcaaaaatcaccaccaaagccaaagatcaaagaactaagtgaaagggaaattcag
A M Q K S P P K P K I K E L S E R E I Q
ttaaggctccaaggaaatgaagcaacccgcagacatcaaagatttaaaggtgagcccatt
L R L Q G N E A T R R H Q R F K G E P I
gatccagttctaactagagaagatataattagaaagcacaatcagcagaatggaatattg
D P V L T R E D I I R K H N Q Q N G I L
ccctatgaaaaagaacagccggtggtggtaaataacgtacaccctttggagaaggagtat
P Y E K E Q P V V V N N V H P L E K E Y
tccattgaaaaggaaggaatggtgtgggacgaggaacaatttctaacgtatatacatgac
S I E K E G M V W D E E Q F L T Y I H D
aaatcatcaagcaacgatcactatgcctgcatctataacgttgttacacataacagattc
K S S S N D H Y A C I Y N V V T H N R F
ggcgtaattgaaatgccagaagatccacttgaaatgattgatcattatgaaccagaggaa
G V I E M P E D P L E M I D H Y E P E E
gaaccaaaaacaaaacctaaaactaaaagtggtaacaaaagagaactaaatgatgaaacc
E P K T K P K T K S G N K R E L N D E T
ttttacagaaagaagaagacaaaaacaacaaaagagccaaaaacacaagagcaaaagaaa
F Y R K K K T K T T K E P K T Q E Q K K
attgaccacgataacatgttttcacgattgctgagaaggcttgacaaaccacaaattgta
I D H D N M F S R L L R R L D K P Q I V
gcagcttggctaaacaacagaccatcacgtaaattggtcgaaaaattagctgacagtaaa
A A W L N N R P S R K L V E K L A D S K
ttcggaattggatggcaagcaaaagaagagtacacaaccagcatggtaattgtatctgga
F G I G W Q A K E E Y T T S M V I V S G
tatatcaattgtgaaccgttacccctaatcgtagataagcttctctccgtcgataacaac
Y I N C E P L P L I V D K L L S V D N N
tatgacatgtggcaacagactgacaagtattttgacaatttgatcacactgtgtaaccgc
Y D M W Q Q T D K Y F D N L I T L C N R
gtcagtgacgttacctacactagcgctcagctgtgtagagatgcatctatcttgaataac
V S D V T Y T S A Q L C R D A S I L N N
aagaagatgcatgttgaaaatggaaacattgtttcaatggaaaatcagtctgaaattgat
K K M H V E N G N I V S M E N Q S E I D
agtcaaactaaattcttttcactgttagaagatgataacaaacttccaattgtagatgag
S Q T K F F S L L E D D N K L P I V D E
ctaagagtattagctgatatgacggcacaaagaagcaacgtaaacactgctggtaatcat
L R V L A D M T A Q R S N V N T A G N H
cttcgtgataatgactctattagggccgacgctgttctagctaacaatacagtacgtaac
L R D N D S I R A D A V L A N N T V R N
aattgtcaaattccaattcctgtaacaacactaataccaagacaaattcgtggattgaat
N C Q I P I P V T T L I P R Q I R G L N
ggtgcacttgtaaatcagcaattacggttacagggaattgaaacacacattacagacagt
114
G A L V N Q Q L R L Q G I E T H I T D S
tatatttcaaaagctgagccatctgactattcgaaacaactgtctgaaatggttaatgct
Y I S K A E P S D Y S K Q L S E M V N A
caaaagacatcaacttggcgagcaaacaatatcgcatcacaggggtgggacatgtttgat
Q K T S T W R A N N I A S Q G W D M F D
actgtacagttaaatacaaacatatcacaaaaggatctttcaatggacactgctttgaca
T V Q L N T N I S Q K D L S M D T A L T
aagcttatgttgttgtaccagctaacaacacaaaatctgccagcaacacaattaccatca
K L M L L Y Q L T T Q N L P A T Q L P S
agcatttattctgcatttgattcaagaacacagcctactttacaggatggaatttggggt
S I Y S A F D S R T Q P T L Q D G I W G
ataaataatggtgttaatatatttggtgaacaatgcggtggattagctgcgccagtcttt
I N N G V N I F G E Q C G G L A A P V F
ccattcagtgggggcaccggagaaattactttccatcttactttacaatctgttccacag
P F S G G T G E I T F H L T L Q S V P Q
gaatttcaagaatcggcaattttcgtaccagcaactgcactacaagctgcaaaagagggt
E F Q E S A I F V P A T A L Q A A K E G
gctcgaacattggcaatgtatgttttaatgtttgcagaatggccatttggtatgtataca
A R T L A M Y V L M F A E W P F G M Y T
aaaactaaacaaacaacagacaatgctggtaataatcaagcagatcaaattttcattcac
K T K Q T T D N A G N N Q A D Q I F I H
tccgaatctactgtacatattccaggacaaaaacaaatgcatattgtgctgccaagaaaa
S E S T V H I P G Q K Q M H I V L P R K
gtgaacatggtgaaccccactacaattgcagaagcaaatgcacgtgtagtgactcaacca
V N M V N P T T I A E A N A R V V T Q P
acatacggtacagtggcagctggggcaggtgtcgcaaatggtaatattaacgtagctgct
T Y G T V A A G A G V A N G N I N V A A
attggtgtggccctgccaactgtaaatttgactgactatcttgtatcgtgggcaaccgat
I G V A L P T V N L T D Y L V S W A T D
ttcacacttggcgacataaaacaattggttgaaagaatgaaaacaacactgccaattagt
F T L G D I K Q L V E R M K T T L P I S
cgagacctgatggcagcacgtcaaaatgctatgttattgagtactctatttcctccacta
R D L M A A R Q N A M L L S T L F P P L
attcagagcaatgtggcttcagacacaaatgaagtcgcaggaacagctggagcatacact
I Q S N V A S D T N E V A G T A G A Y T
gcatgtcttgcaaacttaggtattcctgaaacactaacagttaactggggagcagatata
A C L A N L G I P E T L T V N W G A D I
aatgttcagccattatatcagctacttgaaacggacatcacagcccataatcggtacgta
N V Q P L Y Q L L E T D I T A H N R Y V
ttaaacctgttcaaaagagaagaagtggtagcaggtgcatatgaatttgggtggttggga
L N L F K R E E V V A G A Y E F G W L G
cacatggccagttatatgatgggactccttctaacaatgaatatatcatcagtgtttaac
H M A S Y M M G L L L T M N I S S V F N
gtttggtattcaacaagacgtatttcaacaaaggcgtgggacacagcatatgatagtaac
115
V W Y S T R R I S T K A W D T A Y D S N
atccaagcatatcaggacatgcattatcaaatgttttcgtggagttcaatgcaaggtagt
I Q A Y Q D M H Y Q M F S W S S M Q G S
attgcgccagcaatggtggacgaaattcttcataacctttgtggccaaatgtttggcttc
I A P A M V D E I L H N L C G Q M F G F
agcttaccattgagacaagtcttatttaacgcattgccaatcactttttcatcgtttgga
S L P L R Q V L F N A L P I T F S S F G
agttggatgttgcctagagtttctgatggtttccaaactgtaaggtattatgatgcaggt
S W M L P R V S D G F Q T V R Y Y D A G
ccaccagccattaatgcaaaacgtgatggggaagtaccagtaagtatgattgacgcatgg
P P A I N A K R D G E V P V S M I D A W
acctataaatttacagaaaaattgccaaaaagttttttgccatggccaatgccagaagga
T Y K F T E K L P K S F L P W P M P E G
aaggacagtacaatgggatatgatccggaaaaagaaccagcactaattgataattcaaat
K D S T M G Y D P E K E P A L I D N S N
gagacaggcaatgtattcagaccattcatggcaagaaatggcaacaattccaattattta
E T G N V F R P F M A R N G N N S N Y L
ccaaccaactacacaattgacgtatcacagaatggtcatgatgagagttgtattaatgtt
P T N Y T I D V S Q N G H D E S C I N V
gacctttttaacaatgttgcaggagtaacactaacaaattatgatggaaccgcaacaaac
D L F N N V A G V T L T N Y D G T A T N
gcaaacgtcgtaccaacaggatcatacattaagcagagagcaatgcctattaatgcaaat
A N V V P T G S Y I K Q R A M P I N A N
gcggtacgaccaactgaaacactcgacgctgctaaccatacaaaaccttttgctattgaa
A V R P T E T L D A A N H T K P F A I E
ggaggaagactcgtatatttgggtggaacaattgcaaatacaaccaatgtggtaaacgcg
G G R L V Y L G G T I A N T T N V V N A
atgcagaggaaacaaaggctttcaaaaccggcattcaagtgggcacatgctcagagacaa
M Q R K Q R L S K P A F K W A H A Q R Q
cgtgtatatgacagcagtcgtccagggatggacgcaatcacaaagttgtgtgcacgaaag
R V Y D S S R P G M D A I T K L C A R K
tcgggttttatgaatgcccgttccacagcaatgatggcacccaagactggactcagcgct
S G F M N A R S T A M M A P K T G L S A
gttatagatcaagcaccaaatacatctcaagacttgatcgaacagccgagtcagcaagag
V I D Q A P N T S Q D L I E Q P S Q Q E
gttatggatatgcaagcgacagcaacagtataaatcagatatatcaaattgcattgcata
V M D M Q A T A T V -
gaaaggcaaaacttataacagcaaagaaatggcaagaattaacaaaaggtatttataatg
catctaccctgacaccgaagatagttgaccaaattataaaggatgaaggaagtgggaccg
ataagacaaaatatgtaaatgttcctaaaataattactgacaaagaattacaaacattct
atgtaccaagaagcaacgcagacctagttataagaagaatacgtttaatcgacctttggc
116
gtaacctaaaaccagatcaaatggacgagattcgtaattacactcatctagattatatcttt
M D E I R N Y T H L D Y I F
gtacaaaacatttgtatctatatgttagtatttggaatagacacagttaaacactttaga
V Q N I C I Y M L V F G I D T V K H F R
caaataggtctattcaatgaaaggaatgaatttattgaaattgcaaaacaattatcaacc
Q I G L F N E R N E F I E I A K Q L S T
aaagggaaaagatttgttgatgatgttgataatatgaaacaaaaggtatgtgaaatagct
K G K R F V D D V D N M K Q K V C E I A
actattgttggttatatggacccaaacgttgataaaatagacgtaatggaagaagtggac
T I V G Y M D P N V D K I D V M E E V D
tcacttgcagctgaaggtaatgaacatggtatagatagagataattggaatgatttgttt
S L A A E G N E H G I D R D N W N D L F
acaaaaacatgcaaagaagtaatgacatggtacaaaggacatgaatttattagttttgat
T K T C K E V M T W Y K G H E F I S F D
gattacataaaggaaggaatgtggttaacaagtggaagttcaagtattgggaaagtgcat
D Y I K E G M W L T S G S S S I G K V H
tggacaaaagatggagaaaatgggaaatttaaagcaaggaaaaatatgctgttacaaatt
W T K D G E N G K F K A R K N M L L Q I
tatacaccgcaagaattggccgacattgtttatgcttgggatggaaagttacattcacgt
Y T P Q E L A D I V Y A W D G K L H S R
gtctttattaaaaacgaaatgagtaaattaagacttgctgtggcatctaacatcgaagca
V F I K N E M S K L R L A V A S N I E A
tatattcatgaatcttatatgcttttcctatatggtcatggttttaaagaatactttgga
Y I H E S Y M L F L Y G H G F K E Y F G
gtgacgcttgacgaaaaaccagatcaacagcatcagagagaaattgaaatgattgagaaa
V T L D E K P D Q Q H Q R E I E M I E K
ctacaagctggatactttggattaccatttgactatgcatcatttgatcatcagccaaca
L Q A G Y F G L P F D Y A S F D H Q P T
actttcgaagttaagacaatggtgagaagagttggagaaattgtagttagtcaagtacct
T F E V K T M V R R V G E I V V S Q V P
aagaattattactatcagacacaattgctagtcaataagattgttaatgcatatgataaa
K N Y Y Y Q T Q L L V N K I V N A Y D K
agttatttgtctggaaatattaaaaatactaaatttgaaaatataaaagtcaaaggtgga
S Y L S G N I K N T K F E N I K V K G G
gtaccatcaggagtgagaataacaagtttgttgggaaatatgtggaacgctataattaca
V P S G V R I T S L L G N M W N A I I T
aagatcgcaataaataatgttattggaattattggatacgacccaatctcccaaatctcg
K I A I N N V I G I I G Y D P I S Q I S
ttacgcggagacgacgttgctatattaagtaaagatccagcagctctttatttacttaga
L R G D D V A I L S K D P A A L Y L L R
ctatcatatgctgcaattaatgcaattggcaaagatagtaagttaggtatatctccaaaa
L S Y A A I N A I G K D S K L G I S P K
gtatgtgaatttttacggaatgagatatcagtgacaggagtacgcggttggacatgtaga
117
V C E F L R N E I S V T G V R G W T C R
ggaataggtggtataagtcaacgaaaaccatggaatccacaaccttggagtccaaatgat
G I G G I S Q R K P W N P Q P W S P N D
gaagtcgaaacaaatgcaagcaacatttcattattagaaagacgagcaggaattgaactt
E V E T N A S N I S L L E R R A G I E L
caacaattacaccacataaacaaagttaaatggtcaagacacgtcagacaaagttataaa
Q Q L H H I N K V K W S R H V R Q S Y K
tatctagaattgccaaaacgacttggtggttttggaatctatcgattccaggggtggtta
Y L E L P K R L G G F G I Y R F Q G W L
cctaacggcaaattaccacttgccaaaaaacctttggttaacgtagaggacatacatcca
P N G K L P L A K K P L V N V E D I H P
agccaagagctgtttttgcctttaagtgaacaacagaaaaagatcttagcacaggttgaa
S Q E L F L P L S E Q Q K K I L A Q V E
atgacaaacaaaatgcaaacagatgatatacctgggacacaaaaattattttcaaaggaa
M T N K M Q T D D I P G T Q K L F S K E
tggatacagaaagtgcgtacaaaaaagatcatatggagtagaaatcagacaataccaatc
W I Q K V R T K K I I W S R N Q T I P I
catacggatcacacagtacgcataccaagatgggacgagaaaatcaaattcccaaggtat
H T D H T V R I P R W D E K I K F P R Y
aaatcagaatatatattaaataataaaatcaacttaacaatggagcaagtgctaagacag
K S E Y I L N N K I N L T M E Q V L R Q
tataacctcttaaaagaagtggaacggtacgataaagatctaaaagtgccaaagttatta
Y N L L K E V E R Y D K D L K V P K L L
gacattttggacaaatggttcccggtccaaagtagtaaaattaaaacatatgaaagtcaa
D I L D K W F P V Q S S K I K T Y E S Q
ggttttcatagaacagacgcaattaaccttgctgttggtgaaattccaactgaaccagca
G F H R T D A I N L A V G E I P T E P A
gttaaaataaatcctatactaataaactttgttaagctacatcttgaaagacaaggtatt
V K I N P I L I N F V K L H L E R Q G I
agacatcagagaggtagaaataggatcgccaaatttatttaccaaaaaacaaaacaagca
R H Q R G R N R I A K F I Y Q K T K Q A
gagaacatgatactgcaaagtagtttacaacaaatgtataggtactaaattaagggacca
E N M I L Q S S L Q Q M Y R Y -
ataaagaaacttcgagtttcctataacacattcccagttgggtttgggggccagccatg
Figura Suplementar 2: Sequência genômica completa (7.561 pb) e regiões codificantes do IMNVgen1. Os aminoácidos codificados estão mostrados abaixo da sequêcia de nucleotídeos.
118
IMNVgen2 complete genome
ggcaatttcaacctaattctaaaactgttaccaacaatttcagaactacagaagaggcat
attcttcatctacttcgagaagaagtagaaggaaagaaagtttgcttcgtagagcgagaa
aaacagaatccacttatggctataaacgaactagccgttaaagttggaaagaaacctaaa
M A I N E L A V K V G K K P K
tacacatcgacgaaaaccggagctgaccacattccaagttggactgtattggttgagttc
Y T S T K T G A D H I P S W T V L V E F
gcaggttttagcgaagcagcaacatgtgacacagttaaaaacgcaaaaatgattgctgct
A G F S E A A T C D T V K N A K M I A A
tacaaattggttaaaagattttgtaaatgggacccaacctacattgaaatttctgattgt
Y K L V K R F C K W D P T Y I E I S D C
atgctgccacctccagatcttacatcgtgcggggatgttgagagtaatcctggacctatc
M L P P P D L T S C G D V E S N P G P I
atacatagtgttgcatttgcaagaactggttcagtatggacacctgccacctttactttc
I H S V A F A R T G S V W T P A T F T F
aatactacatcatccccaggtagactgcaagtacaaatgtcatccagcgacaatagatat
N T T S S P G R L Q V Q M S S S D N R Y
gggttcaactctgttttacttgcagcaggcggtacaacatggggcacagcttatttttca
G F N S V L L A A G G T T W G T A Y F S
gaacgctggaacagtgactttggattacagccagatctaactataactgtaacaccacaa
E R W N S D F G L Q P D L T I T V T P Q
ctaactggagaagaacttggttcaatttattttgatgctgtcgaaactacaaatgcagag
L T G E E L G S I Y F D A V E T T N A E
gaagctatagaggcaacaattataaatactactccaattgatgtaatggtagacacaaca
E A I E A T I I N T T P I D V M V D T T
gcaggccctgtaccaattgaaggtgatttcaaacccacaaatgaaactcccacgtgggta
A G P V P I E G D F K P T N E T P T W V
agtaacacaaagcccattgatgtagcaacacctaagactcgtgactacgcaaatcggtca
S N T K P I D V A T P K T R D Y A N R S
gtactgactccacaattgatcacaaaaatgaaagaccatgtctatgccttacaaaaggat
V L T P Q L I T K M K D H V Y A L Q K D
gaagttgaagatgtaacacttgcctcactcgattttggcttaaatccatcaagtgtactc
E V E D V T L A S L D F G L N P S S V L
ggaagatggttgaaatggttaactggcatagacatgagactccatcttgggaagaaagtt
G R W L K W L T G I D M R L H L G K K V
acaaaccataaagttagaatgtttgtgcaaaaaacaaggtttccactaaagacagcaatt
T N H K V R M F V Q K T R F P L K T A I
gaggaactaaacaatggtactgttccacttagattaaggagggatgttcgttacattgaa
E E L N N G T V P L R L R R D V R Y I E
aagccattcgataaagaggaacataccgacatactgttatctggtgacgttgaggaaaac
119
K P F D K E E H T D I L L S G D V E E N
cctgggcctgaagggatggaacaggtatcaataacgccagaacaacttcaaatgattctg
P G P E G M E Q V S I T P E Q L Q M I L
gcaatgcaaaaatcaccaccaaagccaaagatcaaagaactaagtgaaagggaaattcag
A M Q K S P P K P K I K E L S E R E I Q
ttaaggctccaaggaaatgaagcaacccgcagacatcaaagatttaaaggtgagcccatt
L R L Q G N E A T R R H Q R F K G E P I
gatccagttctaactagagaagatataattagaaagcacaatcagcagaatggaatattg
D P V L T R E D I I R K H N Q Q N G I L
ccttatgaaaaagaacagccggtagtggtaaataacgtacaccctttggagaaggagtat
P Y E K E Q P V V V N N V H P L E K E Y
tccattgaaaaggaaggaatggtgtgggacgaggaacaatttctgacgtatatacatgac
S I E K E G M V W D E E Q F L T Y I H D
aaatcatcaagcaacgatcactatgcctgcatctataacgttgttacacataacagattc
K S S S N D H Y A C I Y N V V T H N R F
ggcgtaattgaaatgccagaagatccacttgaaatgattgatcattatgaaacaggggaa
G V I E M P E D P L E M I D H Y E T G E
gaatcaaaaacaaaacccaaaactaaaagtggtaacaaaagagaactaaatgatgaaacc
E S K T K P K T K S G N K R E L N D E T
ttttacagaaagaagaagacaaaaacaacaaaagagccaaaaacacaagagcaaaagaaa
F Y R K K K T K T T K E P K T Q E Q K K
attgaccacgataacatgttttcacgattgctgagaaggcttgacaaaccacaaattgta
I D H D N M F S R L L R R L D K P Q I V
gcagcttggctaaacaacagaccatcacgtaaattggtcgaaaaattagctgacagtaaa
A A W L N N R P S R K L V E K L A D S K
ttcggaattggatggcaagcaaaagaagagtacacaaccagcatggtaattgtatctgga
F G I G W Q A K E E Y T T S M V I V S G
tatatcaattgtgaaccgttacccctaatcgtagataagcttctctccgtcgataacaac
Y I N C E P L P L I V D K L L S V D N N
tatgacatgtggcaacagaccgacaagtattttgacaatttgatcacactgtgtaaccgc
Y D M W Q Q T D K Y F D N L I T L C N R
gtcagtgacgttacctacactagcgctcagctgtgtagagatgcatctatcttgaataac
V S D V T Y T S A Q L C R D A S I L N N
aagaagatgcatgttgaaaatggaaacattgtttcaatggaaaatcagtctgaaattgat
K K M H V E N G N I V S M E N Q S E I D
agtcaaactaaattcttttcactattagaagatgataacaaacttccaattgtagatgag
S Q T K F F S L L E D D N K L P I V D E
ctaagagtattagctgatatgacggcacaaagaagcaacgtaaacactgctggtaatcat
L R V L A D M T A Q R S N V N T A G N H
cttcgtgataatgactctattagggccgacgctgttctatctaacaatacagtacgtaat
L R D N D S I R A D A V L S N N T V R N
aattgtcaaattccaattcctgtaacaacactaataccaagacaaattcgtggattgaat
N C Q I P I P V T T L I P R Q I R G L N
ggtgcacttgtaaatcagcaattacggttacagggaattgaaacacacattacagacagt
120
G A L V N Q Q L R L Q G I E T H I T D S
tatatttcaaaagctgagccatctgactattcgaaacaactgtctgaaatggttaatgct
Y I S K A E P S D Y S K Q L S E M V N A
caaaagacatcaacttggcgagcaaacaatatcgcatcacaggggtgggacatgtttgat
Q K T S T W R A N N I A S Q G W D M F D
actgtacagttaaatacaaacatatcacaaaaggatctttcaatggacactgctttgaca
T V Q L N T N I S Q K D L S M D T A L T
aagcttatgttgttgtaccagctaacaacacaaaatctgccagcaacacaattaccatca
K L M L L Y Q L T T Q N L P A T Q L P S
agcatttattctgcatttgattcaagaacacagcctactttacaggatggaatttggggt
S I Y S A F D S R T Q P T L Q D G I W G
ataaataatggtgttaatatatttggtgaacaatgcggtggattagctgcgccagtcttt
I N N G V N I F G E Q C G G L A A P V F
ccattcagtgggggcaccggagaaattactttccatcttactttacaatctgttccacag
P F S G G T G E I T F H L T L Q S V P Q
gaatttcaagaatcagcaattttcgtaccagcaactgcactacaagctgcaaaagagggc
E F Q E S A I F V P A T A L Q A A K E G
gctcgaacattggcaatgtatgttttaatgtttgcagaatggccatttggtatgtataca
A R T L A M Y V L M F A E W P F G M Y T
aaaactaaacaaacaacagacaatgctggtaataatcaagcagatcaaattttcattcac
K T K Q T T D N A G N N Q A D Q I F I H
tccgaatctactgtacatattccaggacaaaaacaaatgcatattgtgctgccaagaaaa
S E S T V H I P G Q K Q M H I V L P R K
gtgaacatggtgaaccccactacaattgcagaagcaaatgcacgtgtagtaactcaacca
V N M V N P T T I A E A N A R V V T Q P
acatacggtacagtggcagctggggcaggtgtcgcaaatggtaatattaacgtagctgct
T Y G T V A A G A G V A N G N I N V A A
attggtgtggccctgccaactgtaaatttgactgactaccttgtatcgtgggcaaccgat
I G V A L P T V N L T D Y L V S W A T D
ttcacacttggcgacataaaacaattggttgaaagaatgaaaacaacactgccaattagt
F T L G D I K Q L V E R M K T T L P I S
cgagacctgatggcagcacgtcaaaatgctatgttattgagtactctatttcctccacta
R D L M A A R Q N A M L L S T L F P P L
attcagagcaatgtggcttcagacacaaatgaagtcgcaggaacagctggagcatacact
I Q S N V A S D T N E V A G T A G A Y T
gcatgtcttgcaaacttaggtattcctgaaacactaacagttaactggggagtagatata
A C L A N L G I P E T L T V N W G V D I
aatgttcagccattgtatcagctacttgaaacggatatcacagcccataatcggtacgta
N V Q P L Y Q L L E T D I T A H N R Y V
ttaaacctgttcaaaagagaagaagtggtagcaggtgcatatgaatttgggtggttggga
L N L F K R E E V V A G A Y E F G W L G
cacatggccagttatatgatgggacttcttctaacaatgaatatatcatcagtgtttaac
H M A S Y M M G L L L T M N I S S V F N
gtttggtattcaacaagacgtatttcaacaaaggcgtgggacacagcatatgatagtaac
121
V W Y S T R R I S T K A W D T A Y D S N
atccaagcatatcaggacatgcattatcaaatgttttcgtggagttcaatgcaaggtagt
I Q A Y Q D M H Y Q M F S W S S M Q G S
attgcgccagcaatggtggacgaaattcttcataacctttgtggccaaatgtttggcttc
I A P A M V D E I L H N L C G Q M F G F
agcttaccattgagacaagtcttatttaacgcattgccaatcactttttcatcgtttgga
S L P L R Q V L F N A L P I T F S S F G
agttggatgttgcctagagtttctgatggtttccaaactgtaaggtattatgatgcaggt
S W M L P R V S D G F Q T V R Y Y D A G
ccaccagccattaatgcaaaacgtgatggggaagtaccagtaagtatgattgacgcatgg
P P A I N A K R D G E V P V S M I D A W
acctataaatttacagaaaaattgccaaaaagttttttgccatggccaatgccagaagga
T Y K F T E K L P K S F L P W P M P E G
aaggacagtacaatgggatatgatccggaaaaagaaccagcactaattgataattcaaat
K D S T M G Y D P E K E P A L I D N S N
gagacaggcaatgtattcagaccattcatggcaagaaatggcaacaattccaattattta
E T G N V F R P F M A R N G N N S N Y L
ccaaccaactacacaattgacgtatcacagaatggtcatgatgagagttgtattaatgtt
P T N Y T I D V S Q N G H D E S C I N V
gacctttttaacaatgttgcaggagtaacactaacaaattatgatggaaccgcaacaaac
D L F N N V A G V T L T N Y D G T A T N
gcaaacgtcgtaccaacaggatcatacattaagcagagagcaatgcctatcaatgcaaat
A N V V P T G S Y I K Q R A M P I N A N
gcggtacgaccaactgaaacactcgacgctgcaaaccatacaaaaccttttgctattgaa
A V R P T E T L D A A N H T K P F A I E
ggaggaagactcgtatatttgggtggaacaattgcaaatacaaccaatgtggtaaacgcg
G G R L V Y L G G T I A N T T N V V N A
atgcagaggaaacaaaggctttcaaaaccggcattcaagtgggcacatgctcagagacaa
M Q R K Q R L S K P A F K W A H A Q R Q
cgtgtatatgacagcagtcgtccagggatggacgcaatcacaaagttgtgtgcacgaaag
R V Y D S S R P G M D A I T K L C A R K
tcgggttttatgaatgcccgttccacagcaatgatggcacccaagactggactcagcgct
S G F M N A R S T A M M A P K T G L S A
gttatagatcaagcaccaaatacatctcaagacttgatcgaacagccgagtcagcaagag
V I D Q A P N T S Q D L I E Q P S Q Q E
gttatggatatgcaagcgacagcaacagtataaatcagatatatcaaattgcattgcata
V M D M Q A T A T V -
gaaaggcaaaacttataacagcaaagaaatggcaagaattaacaaaaggtatttataatg
catctaccctgacaccgaagatagttgaccaaattataaaggatgaaggaagtgggaccg
ataagacaaaatatgtaaatgttcctaaaataattactgacaaagaattacaaacattct
atgtaccaagaagcaacgcagacctagttataagaagaatacgtttaatcgacctttggc
122
gtaacctaaaaccagatcaaatggacgagattcgtaattacactcatctagattatatcttt
M D E I R N Y T H L D Y I F
gtacaaaacatttgtacctatatgttagtatttggaatagacacagttaaacactttaga
V Q N I C T Y M L V F G I D T V K H F R
caaataggtctattcaatgaaaggaatgaatttattgaaattgcaaaacaattatcaacc
Q I G L F N E R N E F I E I A K Q L S T
aaagggaaaagatttgttgatgatgttgataatatgaaacaaaaggtatgtgaaatagct
K G K R F V D D V D N M K Q K V C E I A
actattgttggttatatggacccaaacgttgataaaatagacgtaatggaagaagtcaac
T I V G Y M D P N V D K I D V M E E V N
tcacttgcagctgaaggtaatgaacatggtatagatagagataattggaatgatttgttt
S L A A E G N E H G I D R D N W N D L F
acaaaaacatgcaaagaagtaatgacatggtacaaaggacatgaatttattagttttgat
T K T C K E V M T W Y K G H E F I S F D
gattacataaaggaaggaatgtggttaacaagtggaagttcaagtattgggaaagtgcat
D Y I K E G M W L T S G S S S I G K V H
tggacaaaagatggagaaaatgggaaatttaaagcaaggaaaaatatgctgttacaaatt
W T K D G E N G K F K A R K N M L L Q I
tatacaccgcaagaattggccgacattgtttatgcttgggatggaaagttacattcacgt
Y T P Q E L A D I V Y A W D G K L H S R
gtctttattaaaaacgaaatgagtaaattaagacttgctgtggcatctaacatcgaagca
V F I K N E M S K L R L A V A S N I E A
tatattcatgaatcttatatgcttttcctatatggtcatggttttaaagaatactttgga
Y I H E S Y M L F L Y G H G F K E Y F G
gtgacgcttgacgaaaaaccagatcaacagcatcagagagaaattgaaatgattgagaaa
V T L D E K P D Q Q H Q R E I E M I E K
ctacaagctggatactttggattaccatttgactatgcatcatttgatcatcagccaaca
L Q A G Y F G L P F D Y A S F D H Q P T
actttcgaagttaagacaatggtgagaagagttggagaaattgtagttagtcaagtacct
T F E V K T M V R R V G E I V V S Q V P
aagaattattactatcagacacaattgctagtcaataagattgttaatgcatatgataaa
K N Y Y Y Q T Q L L V N K I V N A Y D K
agttatttgtctggaaatattaaaaatactaaatttgaaaatataaaagtcaaaggtgga
S Y L S G N I K N T K F E N I K V K G G
gtaccatcaggagtgagaataacaagtttgttgggaaatatgtggaacgctataattaca
V P S G V R I T S L L G N M W N A I I T
aagatcgcaataaataatgttattggaattattggatacgacccaatctcccaaatctcg
K I A I N N V I G I I G Y D P I S Q I S
ttacgcggagacgacgttgctatattaagtaaagatccagcagctctttatttacttaga
L R G D D V A I L S K D P A A L Y L L R
ctatcatatgctgcaattaatgcaattggcaaagatagtaagttaggtatatctccaaaa
L S Y A A I N A I G K D S K L G I S P K
gtatgtgaatttttacggaatgagatatcagtgacaggagtacgcggttggacatgtaga
123
V C E F L R N E I S V T G V R G W T C R
ggaataggtggcataagtcaacgaaaaccatggaatccacaaccttggagtccaaatgat
G I G G I S Q R K P W N P Q P W S P N D
gaagtcgaaacaaatgcaagcaacatttcattattagaaagacgagcaggaattgaactt
E V E T N A S N I S L L E R R A G I E L
caacaattacaccacataaacaaagttaaatggtcaagacacgtcagacaaagttataaa
Q Q L H H I N K V K W S R H V R Q S Y K
tacctagaattgccaaaacgacttggtggttttggaatctatcgattccaggggtggtta
Y L E L P K R L G G F G I Y R F Q G W L
cctaacggcaaattaccacttgccaaaaaacctttggttaacgtagaggacatacatcca
P N G K L P L A K K P L V N V E D I H P
agccaagagctgtttttgcctttaagtgaacaacagagaaagatcttagcacaggtcgaa
S Q E L F L P L S E Q Q R K I L A Q V E
atgacaaacaaaatgcaaacagatgatatacctgggacacaaaaattattttcaaaggaa
M T N K M Q T D D I P G T Q K L F S K E
tggatacagaaagtgcgtgcaaaaaagatcatatggagtagaaatcagacaataccaatc
W I Q K V R A K K I I W S R N Q T I P I
catactgatcacacagcacgcataccaagatgggacgagaaaatcaaattcccaaggtat
H T D H T A R I P R W D E K I K F P R Y
aaatcagaatatatattaaataataaaatcaacttaacaatggagcaagtgctaagacag
K S E Y I L N N K I N L T M E Q V L R Q
tataacctcttaaaagaagtggaacggtacgataaagatctaaaagtgccaaagttatta
Y N L L K E V E R Y D K D L K V P K L L
gacattttggacaaatggttcccggtccaaagtagtaaaattaaaacatatgaaagtcaa
D I L D K W F P V Q S S K I K T Y E S Q
ggttttcatagaacagacgcaattaaccttgctgttggtgaaattccaactgaaccagca
G F H R T D A I N L A V G E I P T E P A
gttaaaataaatcctatactaataaactttgttaagctacatcttgaaagacaaggtatt
V K I N P I L I N F V K L H L E R Q G I
agacatcagagaggtagaaataggatcgccaaatttatttaccaaaaaacaaaacaagca
R H Q R G R N R I A K F I Y Q K T K Q A
gagaacatgatactgcaaagtagtttacaacaaatgtataggtactaaattaagggacca
E N M I L Q S S L Q Q M Y R Y -
Ataaagaaacttcgagtttcctataacacattcccagttgggttttggggccagccatg
Figura Suplementar 3: Sequência genômica completa (7.561 pb) e regiões codificantes do IMNVgen2. Os aminoácidos codificados estão mostrados abaixo da sequência de nucleotídeos.
124
Tabela suplementar 4: Identificação dos sítios polimórficos (SP) no genoma do IMNV. A tabela indica a posição do SP e se esse SP causa alteração na sequência de aminoácidos. Em destaque (cinza) os SP que causam alteração na sequência de aminoácidos.
Posição NT
Brasil Indonésia IMNVgen1 IMNVgen2 Mudança de AA
Característica do AA
5’UTR
1 42 T T T A - -
2 105 C T C C - -
3 112 A G G G - -
RBP
4 174 G AAG Lys
G AAG Lys
G AAG Lys
A AAA Lys
Não Lys – polar básico
5 219 C AGC Ser
C AGC Ser
T AGT Ser
T AGT Ser
Não Ser – polar neutro
6 309 A TTA Leu
A TTA Leu
G TTG Leu
G TTG Leu
Não Leu – apolar
7 378 C GAC Asp
C GAC Asp
C GAC Asp
T GAT Asp
Não Asp – polar ácido
8 396 C GAC Asp
C GAC Asp
T GAT Asp
T GAT Asp
Não Asp – polar ácido
Small Protein 1 (SP1)
9 429 C AGC Ser
C AGC Ser
T AGT Ser
T AGT Ser
Não Ser – polar neutro
10 498 G CCG Pro
G CCG Pro
G CCG Pro
A CCA Pro
Não Pro – apolar
11 544 T TTC Phe
C CTC Leu
T TTC Phe
T TTC Phe
Sim Phe – apolar Leu – apolar
12 549 T AAT Asn
T AAT Asn
C AAC Asn
C AAC Asn
Não Asn – polar neutro
13 570 T GGT Gly
T GGT Gly
C GGC Gly
C GGC Gly
Não Gly – apolar
14 601 C CAA Gln
C CAA Gln
G GAA Glu
G GAA Glu
Sim Gln – polar neutro Glu – polar ácido
15 606 T CGT Arg
T CGT Arg
C CGC Arg
C CGC Arg
Não Arg – polar básico
16 618 C CAC
C CAC
T CAT
C CAC
Não His – polar básico
125
His His His His
17 702 T GTT Val
T GTT Val
C GTC Val
C GTC Val
Não Val – apolar
18 732 G GAG Glu
G GAG Glu
A GAA Glu
G GAG Glu
Não Glu – polar ácido
19 890 T GTA Val
C GCA Ala
C GCA Ala
C GCA Ala
Sim Val – apolar Ala – apolar
20 916 C CTG Leu
T TTG Leu
T TTG Leu
T TTG Leu
Não Leu – apolar
21 967 A AAA Lys
A AAA Lys
G GAA Glu
G GAA Glu
Sim Lys – polar básico
Glu – polar ácido
22 996 C TTC Phe
C TTC Phe
T TTT Phe
T TTT Phe
Não Phe – apolar
23 999 C GGC Gly
C GGC Gly
T GGT Gly
C GGC Gly
Não Gly – apolar
24 1039 T TTA Leu
T TTA Leu
C CTA Leu
T TTA Leu
Não Leu – apolar
25 1053 C GAC Asp
C GAC Asp
T GAT Asp
C GAC Asp
Não Asp – polar ácido
26 1080 C GTC Val
C GTC Val
T GTT Val
T GTT Val
Não Val – apolar
27 1169 G CGT Arg
A CAT His
T CTT Leu
T CTT Leu
Sim Arg – polar básico
His – polar básico
Leu – apolar
28 1206 G CCG Pro
G CCG Pro
A CCA Pro
A CCA Pro
Não Pro – apolar
29 1228 G GAT Asp
G GAT Asp
A AAC Asn
G GAC Asp
Sim Asp – polar ácido
Asn – polar neutro
30 1230 T GAT Asp
T GAT Asp
C AAC Asn
C GAC Asp
Sim
31 1248 T GAT Asp
C GAC Asp
T GAT Asp
C GAC Asp
Não Asp – polar ácido
32 1263 C CCC
T CCT
T CCT
T CCT
Não Pro – apolar
126
Pro Pro Pro Pro
Small Protein 2 (SP2)
33 1503 T CCT Pro
T CCT Pro
C CCC Pro
T CCT Pro
Não Pro – apolar
34 1504 G GAT Asp
G GAT Asp
T TAT Tyr
T TAT Tyr
Sim Asp – polar ácido Tyr – polar neutro
35 1524 A GTA Val
A GTA Val
G GTG Val
A GTA Val
Não Val – apolar
36 1603 T TTG Leu
T TTG Leu
C CTA Leu
C CTA Leu
Não
Leu – apolar
37 1605 G TTG Leu
G TTG Leu
A CTA Leu
G TTG Leu
38 1683 T GGT Gly
T GGT Gly
C GGC Gly
C GGC Gly
Não Gly – apolar
39 1687 C CTT Leu
C CTT Leu
A ATT Ile
A ATT Ile
Sim Leu – apolar Ile – apolar
40 1715 T ATG Met
C ACG Thr
T ATG Met
T ATG Met
Sim Met – apolar Thr – polar neutro
41 1732 C CCA Pro
C CCA Pro
C CCA Pro
A ACA Thr
Sim Pro – apolar Thr – polar neutro
42 1736 G GGG Gly
G GGG Gly
A GAG Glu
G GGG Gly
Sim Gly – apolar Glu – polar ácido
43 1744 C CCA Pro
C CCA Pro
C CCA Pro
T TCA Ser
Sim Pro – apolar Ser – polar neutro
44 1758 T CCT Pro
T CCT Pro
T CCT Pro
C CCC Pro
Não Pro – apolar
45 1779 A AAA Lys
G AAG Lys
A AAA Lys
A AAA Lys
Não Lys – polar básico
46 2058 A CCA Pro
A CCA Pro
G CCG Pro
G CCG Pro
Não Pro – apolar
47 2121 T ACT Thr
T ACT Thr
T ACT Thr
C ACC Thr
Não Thr – polar neutro
48 2134 G GAC Asp
A AAC Asn
G GAC Asp
G GAC Asp
Sim Asp – polar ácido Asn – polar neutro
Proteína Principal do Capsídeo (MCP)
127
49 2304 G CTG Leu
G CTG Leu
G CTG Leu
A CTA Leu
Não Leu - apolar
50 2440 G GCT Ala
G GCT Ala
G GCT Ala
T TCT Ser
Sim Ala – apolar Ser – polar polar
51 2460 C AAC Asn
C AAC Asn
C AAC Asn
T AAT Asn
Não Asn – polar neutro
52 2525 T GTA Val
T GTA Val
C GCA Ala
C GCA Ala
Sim Val – apolar Ala – apolar
53 2727 A TCA Ser
G TCG Ser
A TCA Ser
A TCA Ser
Não Ser – polar neutro
54 2733 A AAA Lys
A AAA Lys
G AAG Lys
G AAG Lys
Não Lys – polar básico
55 2856 T CCT Pro
C CCC Pro
T CCT Pro
T CCT Pro
Não Pro – apolar
56 2894 T GTT Val
C GCT Ala
T GTT Val
T GTT Val
Sim Val – apolar Ala – apolar
57 2928 C GCC Ala
C GCC Ala
T GCT Ala
T GCT Ala
Não Ala – apolar
58 3015 A TCA Ser
A TCA Ser
G TCG Ser
A TCA Ser
Não Ser – polar neutro
59 3060 T GGT Gly
T GGT Gly
T GGT Gly
C GGC Gly
Não
Gly – apolar
60 3160 T TCA Ser
T TCA Ser
G GCA Ala
G GCA Ala
Sim Ser – polar neutro Ala – apolar
61 3291 A GTA Val
A GTA Val
G GTG Val
A GTA Val
Não Val – apolar
62 3293 T ATT Ile
T ATT Ile
C ACT Thr
C ACT Thr
Sim Ile – apolar Thr – polar neutro
63 3361 G GTT Val
G GTT Val
A ATT Ile
A ATT Ile
Sim Val – apolar Ile - apolar
64 3373 C CTG Leu
T TTG Leu
C CTG Leu
C CTG Leu
Não Leu – apolar
65 3399 T TAT Tyr
T TAT Tyr
T TAT Tyr
C TAC Tyr
Não Tyr – polar neutro
128
66 3408 C TCC Ser
C TCC Ser
G TCG Ser
G TCG Ser
Não Ser – polar neutro
67 3487 T TTG Leu
T TTG Leu
C CTG Leu
C CTG Leu
Não Leu – apolar
68 3570 G AAG Lys
G AAG Lys
T AAT Asn
T AAT Asn
Sim Lys – polar básico Asn – polar neutro
69 3577 C CCA Pro
C CCA Pro
G GCA Ala
G GCA Ala
Sim Pro – apolar Ala – apolar
70 3653 T GTA Val
A GAA Glu
C GCA Ala
T GTA Val
Sim Val – apolar Glu – polar ácido
Ala – apolar
71 3675 G TTG Leu
G TTG Leu
A TTA Leu
G TTG Leu
Não Leu – apolar
72 3696 C GAC Asp
C GAC Asp
C GAC Asp
T GAT Asp
Não Asp – polar ácido
73 3708 C CAC His
C CAC His
T CAT His
T CAT His
Não His – polar básico
74 3732 C TTC Phe
T TTT Phe
C TTC Phe
C TTC Phe
Não Phe – apolar
75 3748 G GTA Val
A ATA Ile
G GTA Val
G GTA Val
Sim Val – apolar Ile – apolar
76 3807 C CTC Leu
C CTC Leu
C CTC Leu
T CTT Leu
Não Leu – apolar
77 3929 A CAA Gln
G CGA Arg
A CAA Gln
A CAA Gln
Sim Gln – polar neutro Arg – polar básico
78 3966 A GCA Ala
A GCA Ala
G GCG Ala
G GCG Ala
Não Ala – apolar
79 4017 G GGG Gly
G GGG Gly
C GGC Gly
C GGC Gly
Não Gly – apolar
80 4091 T TTG Leu
C TCG Ser
T TTG Leu
T TTG Leu
Sim Leu – apolar Ser – polar neutro
71 4135 G GTA Val
A ATA Ile
G GCA Ala
G GCA Ala
Sim
Val – apolar Ile – apolar Ala – apolar
82 4136 T GTA Val
T ATA Ile
C GCA Ala
C GCA Ala
129
83 4148 T GTC Val
T GTC Val
C GCC Ala
C GCC Ala
Sim Val – apolar Ala – apolar
84 4347 T TTT Phe
T TTT Phe
C TTC Phe
C TTC Phe
Não Phe – apolar
85 4371 T TCT Ser
T TCT Ser
C TCC Ser
C TCC Ser
Não Ser – polar neutro
86 4380 G TTG Leu
G TTG Leu
A TTA Leu
A TTA Leu
Não Leu – apolar
87 4422 T GAT Asp
C GAC Asp
T GAT Asp
T GAT Asp
Não Asp – polar ácido
88 4504 G GAC Asp
G GAC Asp
A AAC Asn
A AAC Asn
Sim Asp – polar ácido Asn – polar neutro
89 4527 T TAT Tyr
C TAC Tyr
C TAC Tyr
C TAC Tyr
Não Tyr – polar neutro
90 4551 C ATC Ile
C ATC Ile
T ATT Ile
C ATC Ile
Não Ile – apolar
91 4593 T GCT Ala
T GCT Ala
T GCT Ala
A GCA Ala
Não Ala – apolar
92 4680 A GCA Ala
A GCA Ala
G GCG Ala
G GCG Ala
Não Ala – apolar
93 4686 G CAG Gln
A CAA Gln
G CAG Gln
G CAG Gln
Não Gln – polar neutro
94 4710 G CCG Pro
A CCA Pro
G CCG Pro
G CCG Pro
Não Pro – apolar
95 4905 G CAG Gln
A CAA Gln
G CAG Gln
G CAG Gln
Não Gln – polar neutro
Região entre as ORFs
96 5093 T C T T - -
RNA Polimerase Dependente de RNA (RdRp)
97 5299 T ATC Ile
T ATC Ile
T ATC Ile
C ACT Thr
Sim Ile – apolar Thr – polar neutro
98 5393 G CAG Gln
G CAG Gln
A CAA Gln
A CAA Gln
Não Gln – polar neutro
99 5489 T AAT Asn
T AAT Asn
C AAC Asn
C AAC Asn
Não Asn – polar neutro
130
100 5519 C GTC Val
C GTC Val
G GTG Val
C GTC Val
Não Val – apolar
101 5520 A AAC Asn
A AAC Asn
G GAC Asp
A AAC Asn
Sim Asn – polar neutro Asp – polar ácido
102 5528 C CTC Leu
C CTC Leu
T CTT Leu
T CTT Leu
Não Leu – apolar
103 5784 A AAC Asn
A AAC Asn
G GAC Asp
G GAC Asp
Sim Asn – polar neutro Asp – polar ácido
104 5825 C GTC Val
A GTA Val
C GTC Val
C GTC Val
Não Val – apolar
105 6212 A ACA Thr
A ACA Thr
T ACT Thr
T ACT Thr
Não Thr – polar neutro
106 6266 G ACG Thr
G ACG Thr
A ACA Thr
A ACA Thr
Não Thr – polar neutro
107 6278 T GGT Gly
T GGT Gly
A GGA Gly
A GGA Gly
Não Gly – apolar
108 6554 C GGC Gly
C GGC Gly
T GGT Gly
C GGC Gly
Não Gly – apolar
109 6698 G TCG Ser
G TCG Ser
A TCA Ser
A TCA Ser
Não Ser – polar neutro
110 6725 T TAT Tyr
T TAT Tyr
T TAT Tyr
C TAC Tyr
Não Tyr – polar neutro
111 6770 C TTC Phe
T TTT Phe
C TTC Phe
C TTC Phe
Não Phe – apolar
112 6812 G AAG Lys
G AAG Lys
A AAA Lys
A AAA Lys
Não Lys – polar básico
113 6815 C CCC Pro
C CCC Pro
T CCT Pro
T CCT Pro
Não Pro – apolar
114 6880 A AAA Lys
A AAA Lys
A AAA Lys
G AGA Arg
Sim Lys – polar básico Arg – polar básico
115 6899 T GTT Val
T GTT Val
T GTT Val
C GTG Val
Não Val – apolar
116 6981 G GCA Ala
G GCA Ala
A ACA Thr
G GCA Ala
Sim Ala – apolar Thr – polar neutro
131
117 7028 T ACT Thr
T ACT Thr
G ACG Thr
T ACT Thr
Não Thr – polar neutro
118 7039 T GTA Val
T GTA Val
T GTA Val
C GCA Ala
Sim Val – apolar Ala – apolar
119 7043 T CGT Arg
T CGT Arg
C CGC Arg
C CGC Arg
Não Arg – polar básico
120 7152 C CTA Leu
C CTA Leu
T TTA Leu
T TTA Leu
Não Leu – apolar
121 7289 C AAC Asn
T AAT Asn
C AAC Asn
C AAC Asn
Não Asn – polar neutro
122 7355 C GTC Val
C GTC Val
T GTT Val
T GTT Val
Não Val – apolar
123 7359 T TTA Leu
T TTA Leu
C CTA Leu
C CTA Leu
Não Leu – apolar
124 7405 A AAG Lys
A AAG Lys
G AGG Arg
G AGG Arg
Sim Lys – polar básico Arg – polar básico
3’UTR
125 7548 T
T G T - -
126 7550 T
T G G - -
132
Figura Suplementar 4: Predição de regiões estruturadas e desestruturadas para as proteínas do IMNV. A
análise realizada no Foldindex mostra a sequência de aminoácidos estruturada (verde) e desestruturada
(vermelho) das proteínas do IMNV. A – RBP; B – SP1; C – SP2; D – MCP; E – RdRp.
B
D
C
E
A
133
Tabela Suplementar 5: Avaliação dos modelos tridimensionais das proteínas RBP, MCP e RdRp.
Parâmetros Scores
RBP MCP RdRp
MOLPROBITY
Clashscore 180,73 83,5 178,98
Rotâmeros de cadeias laterais desfavoráveis 7,59% 2,09% 6,98%
Ramachandram desfavorável 4,40% 15,31% 4,15%
Ramachandram favorável 84,71% 70,17% 87,42%
Desvio do carbono β 9,09% 8,26% 11,51%
Ligações de comprimentos ruins 0% 1,40% 0,03%
Ligações de ângulos ruins 2,94% 6,33% 3,54%
MolProbity Score 4,03 3,47 3,96
SWISS-MODEL
Z-Score 0,627 -6,341 -5,14
QMEANscore6 -1,01 0,189 0,298
I-TASSER
C-score -2,26 -2,27 0,23
TM-score esperado 0,45 ± 0,14 0,45 ± 0,14 0,74 ± 0,11
RMSD esperado 8,6 ± 4,5 14,4 ± 3,7 7,7 ± 4,3
Números de decoys 5380 498 465
Densidade de cluster 0,0949 0,1220 0,3755
134
Figura Suplementar 5: Predição de estrutura terciária para a Proteína Principal do Capsídeo do IMNV. Os modelos foram gerados para os quatro isolados do IMNV no programa I-TASSER. A – IMNV-BR (-1,25); B – IMNVgen1 (-1,22); C – IMNVgen2 (-1,13). Os C-scores estão indicados entre parênteses.
A
B
C
135
Figura Suplementar 6: Predição de estrutura terciária para a RNA Polimerase Dependente de RNA do IMNV. Os modelos foram gerados para os quatro isolados do IMNV no programa I-TASSER. A – IMNV-BR (0,23); B – IMNVgen1 (-0,16); C – IMNVgen2 (-0,69). Os C-scores estão indicados entre parênteses.
B
C
A
136
Figura Suplementar 7: Predição de estrutura terciária usando modelagem por threading no programa Phyre2 para a proteínas do isolado da Indonésia. A – RBP; B – MCP; C – RdRp.
A B
C
Top Related