Marcadores Genéticos - LGE - Laboratório de Genômica e...
Transcript of Marcadores Genéticos - LGE - Laboratório de Genômica e...
Marcadores Genéticos
Qualquer característica morfológica ou molecular quediferencia indivíduos, e que seja facilmente detectável
Marcadores Morfológicos
É um fenótipo de fácil identificação, normalmente determinado por um único alelo.
Características fenotípicas são utilizadas como marcadores morfológicos desde os tempos de Mendel, como fenótipos de fácil identificação visual
Marcadores Bioquímicos (moleculares)
Baseado na propriedade de migração dasproteínas, as quais podem ser separadas poreletroforese;
Marcadores de DNA (moleculares)
Polimorfismo detectado na seqüência de DNA
� Vantagens:
- Não é objeto de influências ambientais;
- Potencialmente ilimitado em número;
Maior desvantagem é a necessidade de técnicas e equipamentos
mais complexos.
Características Desejáveis
• alto polimorfismo;
• reprodutibilidade;
• amplamente distribuído através do genoma;
• discriminação;• discriminação;
• ausência de influências ambientais;
• barato;
• fácil de mensurar
Tipos de marcadores
• Hibridação– RFLP – (Restriction Fragment Length Polymorphism)
– Minissatélites – VNTR –(Variable Number of Tandem Repeats)
• Amplificação de DNA• Amplificação de DNA– RAPD – (Random Amplified Polymorphic DNA)
– SCAR (Sequence Characterized Amplified Regions) ouASA (Amplified Specific Amplicon)
– Microssatélites –SSR (Simple Sequence Repeats)
– AFLP (Amplified Fragment Length Polymorphism)
RAPD
• Polimorfismo de DNA entre indivíduos pode ser devido a:
– Ausência do sítio do primer.
– Surgimento de um novo sítio.– Surgimento de um novo sítio.
– Ao comprimento da região amplificada entre sítios de primer
• SNPs**
Microssatélites – SSR (SimpleSequence Repeats)
• Significa Seqüências Simples Repetidas, a qual consiste de pequenas seqüências de nucleotídeos (1 a 4) repetidas em tandem.
• Essas seqüências são distribuídas ao acaso no • Essas seqüências são distribuídas ao acaso no genoma e constituem a classe de marcador mais polimórfica hoje disponível
• Primers específicos (20 a 30 pb).
• Diferentes números de elementos simples repetidos.
• Cada segmento amplificado de tamanho diferente representa um alelo diferente do mesmo locomesmo loco
•Requer biblioteca de
fragmentos genômico para
o organismo de interesse
Genótipos na eletroforese
http://tandem.bu.edu/trf/trf.intermediate.submit.html
SNPs
• A Single Nucleotide
Polymorphism, ou SNP ("snip"):
– pequena mudança, ou– pequena mudança, ouvariação, que pode ocorrernuma sequência de DNA emuma porção significativa (maisde 1% ) de uma população.
Single Nucleotide Polymorphism
• SNPs são as mais frequentes formas de variações genéticas
– 90% das variações genéticas humanas vêm dos SNPsSNPs
– SNPs ocorrem a cada 300~600 nucleotídeos
• SNPs tem se tornado marcadores de preferênciapela sua grande abundância e pelodesenvolvimento de tecnologias de genotipagemem larga escala
Single Nucleotide Polymorphism
• SNPs são alterações no DNA que se mantém nas gerações futuras
– SNP: variação >1%
– Mutação: variação <1%– Mutação: variação <1%
C T T A G C T T
C T T A G T T T
SNP
C T T A G C T T
C T T A G T T T
Mutação
94%
6%
99.9%
0.1%
De onde vem essas variações?
• variações nas sequências são resultados de mutações TAAAAAT
TAACAAT
TAAAAAT
• SNPs foram mutações que se propagaram ao longo de gerações
TAAAAAT TAAAAAT TAACAAT TAACAAT TAACAAT
TAAAAAT TAACAAT
Mutações and SNPs
Variações genéticas
observadasMutaçõesSNPs
Ancestral comum
tempo presente
Não-codificantes
Codificantes
SinônimasNão-
sinônimas
Classificação de SNP
sinônimas
conservativasNão-
conservativas
podem modificar a
estrutura e a estabilidade do
RNA mensageiro
Aplicações dos SNPs
• Genotipagem - padrões de SNP
• Pesquisas em desenvolvimentos de drogas
• São marcadores para identificar genes e diferenças genéticas que podem determinar a diferenças genéticas que podem determinar a resposta de pacientes a uma doença ou tratamento.
• Descoberta e mapeamento de genes
• Diagnóstico ou perfil de risco
• Encontrar o par perfeito
Encontrando SNPs:
Mineração de SNPs baseados no sequenciamento
mRNA
cDNALibrary
Genomic
BACLibrary
RRSLibrary
Sequenciamento
De DNA
Library
ESTOverlap
Library Library
BACOverlap
ShotgunOverlap
Fragment DNA
DNA from multiple individuals
Encontrando SNPs:
Mineração de SNPs baseados no sequenciamento
Sequence and Reassemble (known sequence) Assembly with other overlapping
GTTACGCCAATACAGGATCCAGGAGATTACCGTTACGCCAATACAGCATCCAGGAGATTACC
From overlap identify mismatches = SNPs
Base-calling Contig assembly
Polymorphism detection
PolyPhred
Consed
Sequenciamento Phred PhrapAmplificação do DNA5’ 3’
Vários indivíduos
Sequence viewing
Polymorphism tagging
Relatório de polimorfismosGenotipagem individual
Consed
Analysis
Análise filogenética
Homozigoto
C/C
Heterozigoto
C/TC/T
Homozigoto
T/T
Alinhamento multiplo ancorando os fragmentos na sequência de referência
Etapas do PolyBayes
Filtro de parálogos: excesso de mismatchs levando em conta os valores de qualidade
fragmentos na sequência de referência
Detecção de SNPs -> diferença entre verdadeiros polimorfismos e erros de sequenciamento utilizando valores de qualidade
Identificação de SNPs com o QualitySNP
• Análise das informações do agrupamento
• Detecção dos SNPs (todos os SNPs potenciais bi, tri e tetra alélico)
• Filtro dos dados
• Detecção dos haplótipos• Detecção dos haplótipos
• Detecção dos SNPs sinônimos e não sinônimos com o fasty (blastx)
• Identificação do KaKs
• Geração dos dados e transferência para um banco de dados
• Interface para recuperação dos dados
Reconstrução dos Haplótipos com o qualitySNP
• Grupo de sequências num cluster que representa o mesmo alelo de um gene
• Tem o mesmo nucleotídeo no sítio polimórfico
• Utiliza métodos matemáticos para minimizar falsas contruções de haplótipos causados por erro de sequenciamento
Identificação dos SNPs sinônimos e não-sinônimos
• Fasty para alinhamento com o UNIPROT
– Permite frameshifts entre os códons
– Produz melhores alinhamento com sequências de qualidade ruim
• Seleciona primeiro hit• Seleciona primeiro hit
• Detecta a ORF
• Corrige possíveis frameshifts
• Detecta sSNP/nsSNP e SNPs ou INDELs em região UTR
haplótipos
-A C T T T G C T C- C T CHaplotype 1
SNP1 SNP2 SNP3
-A C T T A G C T T-
-A A T T T G C T C-
-A C T T T G C T C-
Haplotype 2
Haplotype 3
C A T
A T C
C T CHaplotype 1
SNP1 SNP2 SNP3
Blocos de haplótipos
• Dentro de um bloco haplótipo, acontece pouca ou nenhuma recombinação
• Os SNPs dentro de um bloco haplótipo tendem a ser passados juntos nas gerações posterioresa ser passados juntos nas gerações posteriores
• Dentro de um bloco haplótipo, um pequeno subconjunto de SNPs (Tag SNPs) é suficiente para distinguir cada haplótipo
– Então será preciso utilizar apenas os Tag SNPs para genotipar ao invéz de usar todos os SNPs no bloco haplótipo
Zonas de recombinação e Blocos de haplótipos
Recombinationhotspots
P1 P2 P3 P4
S1
S2
S3
S
Haplotype patterns
Chromosome
Haplotypeblocks
S4
S5
S6
S7
S8
S9
S10
S11
S12
SNP loci
: Major allele
: Minor allele
Exemplos de Tag SNPs
P1 P2 P3 P4
S1
S2
S3
Haplotype patterns
� Desejamos distinguir um haplótipo desconhecido
� Podemos genotipar todos os SNPs para
Amostra desconhecida
S4
S5
S6
S7
S8
S9
S10
S11
S12
SNP loci
� Podemos genotipar todos os SNPs para identificar a amostra desconhecida
: Major allele
: Minor allele
Examples of Tag SNPs
P1 P2 P3 P4
S1
S2
S3
Haplotype pattern
� Não é necessário genotipar todos os SNPs
� SNPs S3, S4, e S5 podem formar um grupo de tag SNPs.
S4
S5
S6
S7
S8
S9
S10
S11
S12
SNP loci
grupo de tag SNPs.
P1 P2 P3 P4
S3
S4
S5
Exemplos de Tag SNPs errados
P1 P2 P3 P4
S1
S2
S3
Haplotype pattern
S4
S5
S6
S7
S8
S9
S10
S11
S12
SNP loci P1 P2 P3 P4
S1
S2
S3
Exemplos de Tag SNPs
P1 P2 P3 P4
S1
S2
S3
Haplotype pattern
� SNPs S1 e S12 podem formar um conjunto de tag SNPs
� Este é o menor conjunto de SNP nesse exemplo
S4
S5
S6
S7
S8
S9
S10
S11
S12
SNP loci
P1 P2 P3 P4
S1
S12
Taxa de Evolução
Para inferir uma taxa de evolução a um gene são estimados o KA e o KS
KA - é a relação entre substituições não sinônimas e KA - é a relação entre substituições não sinônimas e todos os possíveis sitios não sinônimos
KS – é a relação entre substituições sinônimas e todos os possíveis sítios sinônimos
• Exemplo:
• Prolina:
– CCT
– CCA
– CCG– CCG
– CCC
• Um sítio sinônimo e dois não sinônimos
KA/KS (dn/ds)
A taxa KA/KS é uma medida clássica da evolução de maneira global num gene
KA/KS << 1 indica que uma substancial proporção de mudanças de aminoácidos devem ter sido eliminadas por seleção de purificação. seleção de purificação.
KA/KS > 1 indica seleção adaptativa ou positiva
• A taxa de KAKS em humanos e chimpanzes é de 0,23.
• Assumindo que mutações sinônimas são neutras, esseresultado implica que 77% das alterações de aminoácidos emgenes hominideos são suficientemente deletérias e sãogenes hominideos são suficientemente deletérias e sãoeliminadas por seleção natural. Como mutações sinônimasnão são totalmente neutras, a proporção de alterações deaminoácido neutras com consequências deletérias deve sermaior
KaKs_calculator - Métodos
• NG: Nei, M. and Gojobori, T. (1986) - Faster• LWL: Li, W.H., et al. (1985) • LPB: Li, W.H. (1993) and Pamilo, P. and Bianchi, N.O. (1993) • MLWL (Modified LWL), MLPB (Modified LPB): Tzeng, Y.H., et
al. (2004) • YN: Yang, Z. and Nielsen, R. (2000) • YN: Yang, Z. and Nielsen, R. (2000) • MYN (Modified YN): Zhang, Z., et al. (2006)• GY: Goldman, N. and Yang, Z. (1994) • MS (Model Selection), MA (Model Averaging): based on a
set of candidate models defined by Posada, D. (2003) as follows.
Aula Prática
• Montar Ests com sequência
• Encontrar prováveis SNPs
• Visualizar cromatograma para validar e identificar homozigotos de heterozigotos
• Definir haplótipos• Definir haplótipos
• Definir tag SNPs
• Caracterizar – snSNP ou sSNP; CDS; Transição ou transversão;
• Desenhar sondas para separar haplotipos e genotipar