Apresentação do PowerPointlabs.icb.ufmg.br/lbem/aulas/grad/evol/aula21-evolmol1.pdf · Seleção...
Transcript of Apresentação do PowerPointlabs.icb.ufmg.br/lbem/aulas/grad/evol/aula21-evolmol1.pdf · Seleção...
23/05/2011
1
Evolução Molecular
Reconstruções Filogenéticas e Sistemática
Professor Fabrício R Santos [email protected]
Departamento de Biologia Geral, UFMG 2011
Sistemática e Taxonomia
• Sistemática é o estudo dos relacionamentos entre
grupos de organismos e a classificação hierárquica
em diferentes táxons – é um antigo ramo da
biologia clássica.
A Taxonomia é parte da Sistemática e se
refere à nomenclatura e identificação de espécies. Seus princípios foram inicialmente estabelecidos por Carolus Linnaeus (1707-1778).
Taxonomia e Classificação Hierárquica O sistema taxonômico desenvolvido inicialmente por Linnaeus tem duas características principais: i) a designação de um nome duplo (binômio) a cada espécie, e ii) um sistema de agrupamento destas espécies.
Um binômio (nome latino de 2 partes) é designado unicamente para cada espécie, no qual o primeiro é o nome genérico, e os dois nomes são ditos específicos.
Trichechus inunguis Homo sapiens Arabidopsis thaliana Escherichia coli Chromobacterium violaceum
O sistema de classificação das espécies segue uma hierarquia de categorias crescentes que formalizam o agrupamento de organismos, o qual deve ser feito a partir do reconhecimento da história de ancestralidade comum das espécies.
A nomenclatura binomial da espécie é a primeira
etapa no agrupamento: espécies derivadas do
mesmo ancestral comum imediato são geralmente
agrupadas no mesmo gênero.
As demais categorias são mais amplas, isto é,
agrupam táxons de acordo com ancestrais comuns
mais e mais antigos:
• Gêneros são agrupados em uma Família, pois
compartilham um ancestral comum recente.
• Famílias são agrupadas em Ordens, que se
agrupam em Classes, que são agrupadas em Filos,
que se agrupam em Reinos e um dos 3 Domínios.
A Sistemática Filogenética conecta a
diversidade biológica à história evolutiva
Filogenia = A história evolutiva de uma espécie ou grupo de espécies
relacionadas.
Filogenia é geralmente representada como árvores filogenéticas
que traçam relacionamentos evolutivos inferidos, revelando a
história de ancestralidade comum entre espécies.
Sistemática = O estudo e classificação da diversidade biológica em um
contexto evolutivo.
A diversidade biológica reflete episódios passados de especiação
e macroevolução.
Taxonomia = Identificação , nomeação e classificação de espécies; é um
componente da sistemática.
23/05/2011
2
Organismos podem ser representados em um diagrama (árvore) que ilustra seus relacionamentos evolutivos. Usando dados morfológicos e moleculares, podemos estimar os ancestrais comuns inferidos pelos pontos de divergência nas árvores filogenéticas.
Que são árvores?
Charles Darwin (1837) Anotações sobre padrões de especiação nos Tentilhões de Galápagos
OTU 1
OTU 2
OTU 3
OTU 4
OTU 5
OTU 6
Árvore Filogenética
1 5 4 3 2 6 7 8
No de diferenças
n1
n2
n3
n4
n5
n
OTU unidade taxonômica operacional - populações, espécies ou grupos
nó interno - ~ ancestral comum do passado
tempo antiga recente
raiz
Topologias equivalentes
Por quê árvores?
Por quê representamos evolução como árvore e não outro tipo de gráfico?
C A D B A B C D
Ciclo, reticulação
A
B C
D
• Evolução é divergência/cladogênese – espécies se
modificam com o tempo - Transformacionismo
Darwin: “Descendência com modificação”
• Por várias razões, reticulação torna-se um
fenômeno raro com o tempo – provavelmente no
Pré-Cambriano as reticulações devido a
transferências gênicas horizontais, fusões de
células, etc, eram muito comuns.
• Reticulações são difíceis de se representar.
23/05/2011
3
Sang et al., 1997
Árvores reticuladas Ex: espécies híbridas de Paeonia sp.
Grou
japonensis
americana
grus
nigrocollis
monachus
canadensis
bugeranus
virgo
paradisea
leucogeranus
antigone
rubicanda
vipio
Filogenia do grou
japonensis
americana
grus
nigrocollis
monachus
canadensis
bugeranus
virgo
paradisea
leucogeranus
antigone
rubicanda
vipio
Cladograma Árvore UPGMA
Citocromo b (Mooers et al., 1999)
Grus sp
leucogeranus antigone
rubicanda
vipio
japonensis
americana
grus
nigricollis
monachus
canadensis
Bugeranus
virgo
paradisea
japonensis
americana
grus
nigrocollis
monachus
canadensis
bugeranus
virgo
paradisea
leucogeranus
antigone
rubicanda
vipio
Filogenia do grou
Árvore UPGMA
Citocromo b (Mooers et al., 1999)
Árvore sem raiz
Árvore filogenética para os tentilhões de Galápagos Estas 13 espécies habitam as Ilhas Galápagos. Esta árvore é baseada em estudos comparativos de estruturas do corpo, especialmente forma e tamanho dos bicos, e nos estudos de campo sobre isolamento reprodutivo e comportamento alimentar.
Conexão entre classificação e filogenia A natureza da ramificação de uma árvore evolutiva reflete o arranjo hierárquico de táxons (taxa). Esta árvore sugere as afinidades genealógicas entre táxons subordinados à ordem Carnivora, ou seja, o padrão de especiação para este grupo.
23/05/2011
4
Árvores filogenéticas baseadas em sistemática Dois métodos, comparação de proteínas do sangue e hibridização DNA-DNA, foram usados para construir esta árvore de espécies de ursos e procionídeos.
Antiga controvérsia sobre afinidades entre focas, leões marinhos e morsas
A relação filogenética entre Phoecidae, Odobaenidae e Otaridae já foi extremamente discutida. Hoje a família Pinnipedia é considerada um grupo monofilético, mas focas foram previamente consideradas grupo irmão de Lontras (Mustelidae)
Qual relação entre procariotos e eucariotos? Qual a origem das mitocôndrias e dos cloroplastos?
Árvores filogenéticas podem nos dar informações sobre o passado remoto
Classificação: Reinos e Domínios
Atualmente a sistemática filogenética reconhece 3 domínios
Origem dos 3 domínios da vida no Pré-Cambriano
23/05/2011
5
outras bactérias
Archaea Eucariotos
Nature, 1998
Riq
ué
tsia
s M
ito
côn
dri
as
Rickettsia Parasita intracelular
obrigatório de eucariotos
Mitocôndria Organela intracelular
eucariótica
As mitocôndrias são relacionadas filogeneticamente às a-proteobactérias e grupo irmão das Rickettsias
Grupos irmãos de ciclídeos do Lago Tanganika na África oriental
Árvores nos informam sobre processos recentes de diversificação de populações e espécies
Árvore MP C0I (E. Michel, 1999)
Árvores filogenéticas e epidemiologia
Dentista com HIV deu origem a um surto regional nos EUA
Freeman e Herron, 1998
pac
ien
te B
-x
pac
ien
te B
-y
pac
ien
te A
-x
pac
ien
te E
-y
pac
ien
te E
-x
pac
ien
te C
-x
pac
ien
te C
-y
Den
tist
a-y
pac
ien
te A
-y
pac
ien
te G
-x
pac
ien
te G
-y
De
nti
sta
X
LC0
2-x
LC0
3-x
LC0
2-y
LC0
9
LC3
5
pac
ien
te D
-x
pac
ien
te D
-y
LC0
3-y
pac
ien
te F
-x
pac
ien
te F
-y
HIV
LI
Filogenias de agentes infecciosos permitem traçar surtos e pandemias, assim como auxiliam nas estratégias de controle de epidemias como da gripe H1N1 ou para o desenvolvimento de vacinas da gripe comum.
Reconstruções filogenéticas e Conservação da Biodiversidade
• Filogenética pode ser extremamente útil para estudos de biodiversidade (inventariamento e classificação) e estabelecimento de prioridades conservacionistas.
• Medidas de diversidade que utilizam filogenias de sequências de DNA estão agora sendo usadas para implementar planos de conservação de espécies, priorizar unidades de conservação, definir unidades de manejo etc.
• Ex: filogenias (e filogeografia) são usadas para identificar ESUs (unidades evolutivamente significantes), as quais representam populações importantes para manter a dinâmica evolutiva de uma espécie.
10-20 milhões de anos
marinho
africano
amazônico
Filogenias dos peixes-bois (Trichechus sp)
Vianna et al 2006 Mol Ecol
23/05/2011
6
Filogenia Filogeografia
Em estudos da biodiversidade, ambas as abordagens tentam reconstruir o passado evolutivo das
espécies e de suas populações.
marinho
africano
amazônico
Populações do clado III do peixe-boi marinho (Trichechus manatus) possuem uma distribuição restrita às Guianas e ao Brasil, portanto conformam uma unidade evolutiva independente (ESU) das demais nesta espécie.
Árvore sem raiz (rede Median Joining) da região controle do DNAmt
Vianna et al 2006 Mol Ecol
Filo
geo
graf
ia c
om
par
ada
B0665
B0663
B0655
B0653
B0654
B0656
B0369 B0367
B0368
B0609
B0647
B0317
B0329
B0326
B0658
B0644
B0657
B0677
B0678
B0646
B0291
B0292
B0290
B0680
B0643
B0660
B0281
B0285
B1189
B1301
B1188
B1296
B1186
B1303
B0525
B0524
B0515
B0511
B0513
B0528
B0535
B0562
B1148
B1147
B1150
99
99
99
99
90
99
99
99
99
99
99
99
99
99
99
91
99
99
99
82
90
D. ochropyga
D. ferruginea
R. ardesiaca
D. squamata
B0335
P. leucoptera
M. loricata
T. major
D. plumbeus
F. serrana
D. mentalis
H. atricapillus
S. cristatus
T. doliatus
T. caerulescens
T. ambiguus
T. pelzelni
Árvore NJ COI em Thamnophilidae
Vilaça et al. 2006
Análises filogenéticas permitem o uso do DNA como identificador de espécies
Termos filogenéticos
• Homologia
• Analogia
• Convergência, Reversão
• Plesiomorfia – estado ancestral – “0” (Simplesiomorfia)
• Apomorfia – estado derivado – “1” (Autapomorfia - Sinapomorfia)
Homologia: um caráter (ancestral ou derivado) compartilhado entre duas ou mais espécies, o qual estava presente no ancestral comum destas.
Analogia: caráter “compartilhado”, geralmente não-presente no ancestral comum (i.e., o caráter evolui duas vezes, independentemente): evolução convergente (ou paralela) e reversão ao estado ancestral. A este caráter recorrente damos o nome de Homoplasia.
Analogia
1 3 2 4 Espécies:
Estado do caráter:
estado ancestral
Nas spp. 1 e 3 há uma analogia (caráter análogo) ou homoplasia;
Origem independente – evolução paralela ou convergente .
23/05/2011
7
Homologia Ancestral (0)
1 3 2 4 Espécies:
Estado do caráter:
estado ancestral
Nas spp. 1, 3 e 4 há uma homologia ancestral (simplesiomorfia); é ancestral porque está presente na base da árvore, no ancestral comum de todas 4 spp atuais.
Homologia Derivada (1)
1 3 2 4 Espécies:
Estado do caráter:
estado ancestral
Nas spp. 1 e 2 aparece um caráter homólogo derivado (sinapomorfia). Aconteceu uma transição do estado “basal” ou primitivo no ancestral imediato destas duas spp ou OTUs.
Convergência: origem independente do caráter (i.e., duas linhagens fixam paralelamente um “fenótipo” similar). Reversão: origem e subseqüente perda, ou mutação “de volta” ao caráter ancestral (i.e., reversão ao estado plesiomórfico).
Origem das Homoplasias Evolução Convergente = Aquisição de características
similares em espécies de diferentes linhas evolutivas,
devido ao compartilhamento de nichos ecológicos
similares, sendo a seleção natural responsável por
moldar adaptações análogas.
Exemplos: asas de pássaros e morcegos
bicos de aves e monotremados
Evolução convergente também se dá no nível molecular: sequências de DNA e proteínas podem sofrer mudanças paralelas, reversões, etc
Evolução Convergente e Seleção Natural Similaridades aparentes entre marsupiais australianos e mamíferos placentários em outros continentes. Estas espécies ocupam nichos parecidos nos diferentes continentes.
Um grupo monofilético:
é um grupo de táxons que inclui o ancestral comum e todos seus
descendentes
também podemos chamá-lo de clado
23/05/2011
8
Exemplo de grupo não monofilético: Répteis
O ancestral comum mais recente dos répteis viventes também deu origem às aves.
Considerando a paleontologia que considera que mamíferos descendem também de répteis, este ancestral comum é ainda mais antigo. Filogenia dos grandes símios sem cauda
Famílias monofiléticas Hominidae Pongidae Hyllobatidae
Filogenia dos grandes símios sem cauda
Famílias parafiléticas Hominidae Pongidae Hyllobatidae
Esta classificação equivocada não representa a história evolutiva das espécies
Abordagens filogenéticas
Fenética (Taxonomia numérica)
Cladística (Sistemática Filogenética)
Fenética
• Abordagem Clássica (desde Linnaeus).
• Agrupa espécies baseada na similaridade fenotípica (ou genotípica).
• Usa todas características distinguíveis.
• Ex: métodos baseados em distâncias (UPGMA)
Análise de vários caracteres
(fenótipos, sítios polimórficos de DNA, freq. alélicas, etc.)
Matriz de dissimilaridade em base ao número de diferenças
Construção
de árvore
filogenética
Fenograma A B C
A
B
C
3
7 6
0
0
0
A B C A B
A
B
C
Relações de similaridade
MÉTODOS FENÉTICOS
23/05/2011
9
Cladística • A Teoria Evolutiva postula que grupos de
organismos relacionados descendem de um ancestral comum.
• Sistemática Filogenética (Cladística) é um método de classificação taxonômica baseado na história evolutiva.
Foi desenvolvido em 1950 por Willi Hennig, um entomologista alemão.
Cladística • Baseia-se no padrão de ancestralidade comum e
modificação das espécies e não em mera similaridade.
• Deve usar apenas caracteres derivados (apomórficos) compartilhados (sinapomórficos ou homólogos derivados).
• Portanto, objetiva traçar a história evolutiva real, o padrão de descendência com modificação.
• Ex: métodos baseados em caracteres (parcimônia).
Análise de vários caracteres com estados ancestrais (0) e derivados (1)
Construção de árvore filogenética
Cladograma
A B C
A
B
C
Relações de ancestralidade comum
MÉTODOS CLADÍSTICOS
D E
1
2
3
4
5
6
7
8
E
D
1
2 3
4
5 6
7 8
Caracteres utilizados
Sim Não Não Cladística
Sim Sim Sim Fenética
Homologias Derivadas
Homologias Ancestrais
Analogias
Besouro Borboleta Cavalo
“Eventos Reais”
Besouro Borboleta Cavalo
Fenética Cladística
Besouro Borboleta Cavalo
23/05/2011
10
Jacaré Ave Lagarto
“Eventos reais”
Jacaré Ave Lagarto
Fenética Cladística
Jacaré Ave Lagarto
Análise Filogenética
Dado um conjunto de dados (caracteres morfológicos, alinhamento de múltiplas sequências de DNA e proteína, etc), pode-se inferir o relacionamento ancestral dentre as espécies.
Esp.1 Esp.2 Esp.3 Esp.4
Temp
o
Não-resolvida ou filogenia tipo “estrela”
Filogenia parcialmente resolvida
Completamente resolvida, filogenia bifurcada
A A A
B
B B
C
C
C
E
E
E
D
D D
Politomia ou multifurcação uma bifurcação
O objetivo da inferência filogenética é resolver a ordem de ramificação das linhagens nas árvores evolutivas:
Há 3 possíveis árvores sem raiz para 4 táxons (A, B, C, D)
A C
B D
árvore 1
A B
C D
árvore 2
A B
D C
árvore 3
Métodos de reconstrução (ou inferência) filogenética objetivam descobrir qual das árvores é a
“mais provável".
Espera-se que esta seja a “verdadeira” árvore biológica — aquela que seguramente represente
a história evolutiva dos táxons analisados – mas esta é formalmente chamada de árvore
inferida a partir dos dados, cuja confiança pode ser testada por diferentes métodos.
O número de árvores sem raiz aumenta exponencialmente com o número de táxons
# táxons
3
4
5 6
7
8 9
10
. .
.
. 30
# árvores sem raiz
1
3
15 105
945
10.935 135.135
2.027.025
. .
.
. 3,58 x 10 36
C A
B D
A B
C
A D
B E
C
A D
B E
C
F
23/05/2011
11
Inferir relacionamentos evolutivos entre os táxons requer enraizar a árvore
Note que nesta árvore
enraizada, o táxon A não
está mais estreitamente
relacionado ao táxon B
em relação a C ou D
como sugerido acima.
A
B C
Raiz D
A B C D
Raiz
árvore enraizada
árvore sem raiz
O enraizamento em outra posição:
A
B C
raiz
D
árvore sem raiz
Note que nesta árvore enraizada, táxon A é mais estreitamente relacionado ao táxon B, enquanto o C é mais relacionado ao D.
C D
raiz
árvore enraizada
A
B
Uma árvore sem raiz de 4 táxons pode ser enraizada em cinco lugares distintos para produzir cinco árvores enraizadas diferentes
árvore sem raiz:
A C
B D
árvore c/raiz 4 C
D
A
B
4
árvore c/raiz 3 A
B
C
D
3
árvore c/raiz 5 D
C
A
B
5
árvore c/raiz 2 A
B
C
D
2
árvore c/raiz 1 B
A
C
D
1
Estas árvores representam cinco histórias evolutivas diferentes entre os táxons, dependendo de onde se coloca a raiz !
# táxons
3 4 5 6 7 8 9 . . . .
30
# árvores sem raiz 1 3 15 105 945 1 0 .395
13 5 .135 . . . . ~3 , 58 x 10
3 6
# raízes
3 5 7 9 11 13 15 . . . .
57
# árvores com raiz
3 15 1 0 5 9 4 5 10.3 9 5 1 35.1 3 5 2. 0 27.0 2 5
.
.
.
. ~2 , 04 x 10
3 8
x =
C A
B D
A D
B E
C
A D
B E
C
F
Cada árvore sem raiz pode teoricamente ser enraizada em qualquer lugar ao longo de qualquer de seus ramos
Há dois modos principais de enraizar árvores
Pelo grupo externo (outgroup ):
Usa táxons de referência (o “outgroup”) que sabidamente se situam fora do grupo de interesse (o “ingroup”). Requer conhecimento a priori sobre relacionamentos entre os táxons. O outgroup pode ser uma espécie (ex: aves para enraizar uma árvore de mamíferos) ou cópias de genes duplicados (ex: a-globina para enraizar b-globinas).
outgroup
A
B
C
D
10
2
3
5
2
Pelo ponto-médio ou distância:
enraiza a árvore no ponto médio entre os dois táxons mais distantes na árvore, tal como determinado pelo tamanho dos ramos. Pressupõe que os táxons evoluem coordenadamente (evolução constante entre linhagens). Esta suposição está embutida em alguns métodos fenéticos de construção de árvores tal como o UPGMA.
d (A,D) = 10 + 3 + 5 = 18 Ponto-médio = 18 / 2 = 9
Todos estes rearranjos mostram o mesmo relacionamento evolutivo entre táxons
B
A
C
D
A
B
D
C
B
C
A
D
B
D
A
C
B
A
C
D
árvore enraizada 1 B
A
C
D
A
B
C
D
Todas estas árvores são idênticas
23/05/2011
12
H C G G C H C G H
Árvores alternativas sobre relações evolutivas entre os três “grandes símios”
A árvore do meio é considerada a “árvore verdadeira”, ou fato científico, para a história evolutiva destas três espécies.
Conclusões obtidas com dados morfológicos e moleculares nos anos 1990, corroborada atualmente por dados genômicos.
Reconstruções
filogenéticas com dados
moleculares
Variabilidade genética Fenotípica
Morfológica
Funcional
Protéica
DNA
Macromutações
SNP’s – mutações de ponto
Inserções de retroposons
Microssatélites
POP1
A - 0,4
B - 0,2
C - 0,9
D - 0,1
E - 0,2
POP2
A - 0,6
B - 0,5
C - 0,8
D - 0,3
E - 0,1
POP3
A - 0,3
B - 0,2
C - 0,9
D - 0,2
E - 0,4
Freqüências alélicas
Freqüência de um dos alelos em cinco locos bialélicos (A-E) em 3 populações (pop1, 2, 3)
Frequências alélicas servem apenas para comparações fenéticas intra-específicas.
Microssatélites AT
AT AT
AT
AT
CCG CCG
CCG CCG
CA CA CA CA
CA CA
CA
CA CA CA CA CA
CA CA CA CA CA CA
CA Alelo 3
Alelo 5
Alelo 7
são multi-alélicos
µ = 10-4 a 10-3 / loco / geração
Microssatélites servem geralmente apenas para comparações fenéticas intra-específicas, testes de paternidade, identificação individual etc.
SNPs ou mutações de ponto
Single Nucleotide Polymorphisms são geralmente bialélicos alelo 0 ...AAGCGTTATAGC... alelo 1 ...AAGTGTTATAGC...
µ = 10-7 a 10-8 / locus / geração
SNPs podem ser utilizados para comparações cladísticas interespecíficas.
23/05/2011
13
* * * ** * * * * * *
A aat tcg ctt cta gga atc tgc cta atc ctg
B ... ..a ..g ... .a. ... ... t.. ... ..a
C ... ..a ..c ..g ... ..t ... ... ... t.a
D ... ..a ..a ..g ..g ..t ... t.g ..t t..
Cada diferença de nucleotídio é um SNP e considerado
como um caráter na reconstrução filogenética
Obs: Pontos (.) se referem a posições de caracteres inalterados em relação
à primeira sequência (A)
* Posições com caracteres variáveis entre estas sequências
SNPs em sequências de DNA Analogia
T C T C
C
1 3 2 4 Espécies:
Estado do caráter:
estado ancestral
T Nas spp. 1 e 3 há uma analogia (caráter análogo ou homoplasia);
Origem independente – evolução paralela ou convergente
Homologia Ancestral (0)
T C C
C
1 3 2 4 Espécies:
Estado do caráter:
estado ancestral
C Nas spp. 1, 3 e 4 há uma homologia ancestral (simplesiomorfia); é ancestral porque está presente na raiz da árvore (ancestral comum) como uma plesiomorfia.
C
Homologia Derivada (1)
T T C C
C
1 3 2 4 Espécies:
Estado do caráter:
estado ancestral
T Nas spp. 1 e 2 possuem homólogos derivados (sinapomorfia) (i.e., aconteceu uma transição do estado “basal” ou primitivo, no ancestral comum imediato destas duas spp ou OTUs).
Tipos de abordagens filogenéticas utilizando moléculas
Fenética
Similaridade geral
Cladística
Sistemática filogenética
Reconstruções filogenéticas alternativas
Dados morfológicos e análises fenéticas
Dados morfológicos e DNA com cladística
23/05/2011
14
Similaridade vs. relacionamento evolutivo
Similaridade e relacionamento evolutivo não são a mesma coisa, mesmo que relacionamento evolutivo seja inferido de certos tipos de similaridade.
Similar: ser semelhante (uma observação, uma aparência)
Relacionado: genealogicamente conectado (um fato histórico)
Dois táxons podem ser mais similares sem ser mais relacionados:
Táxon A
Táxon B
Táxon C
Táxon D
1
1
1
6
3
5
O táxon C é mais similar ao A (d = 3)
do que ao B (d = 7), mas C e B são
mais estreitamente relacionados: C e
B compartilham um ancestral comum
mais recente do que os dois com A. Métodos baseados em caracteres podem teoricamente discriminar os tipos de similaridade e encontrar a “verdadeira” árvore evolutiva .
Tipos de Similaridade Similaridade observada entre duas OTUs pode ser por: relacionamento evolutivo : caracteres ancestrais compartilhados (‘simplesiomorfias’) caracteres derivados compartilhados (‘’sinapomorfias’) Homoplasia (evolução independente do mesmo caráter):
Eventos Convergentes (em OTUs relacionadas ou não), Eventos Paralelos (em OTUs relacionadas), Reversões (em OTUs relacionadas ou não)
C
C
G
G
C
C
G
G
C
C
G
G
C
G
G
T
Convergentes Paralelos Reversões
Desenha a árvore que melhor representa as distâncias observadas entre os pares.
Seleciona a árvore que tem a maior probabilidade de reproduzir os dados observados.
Seleciona a árvore que explica os dados com o menor número de substituições (eventos mutacionais fixados).
Distância
Verossimilhança
Parcimônia
Métodos gerais de reconstrução filogenética
C A R Á T E R
Tipos de dados usados em inferência filogenética
Métodos baseados em caracteres : Usam diretamente os caracteres alinhados, tais como sequências de DNA ou proteína
táxons caracteres
espécie A ATGGCTATTCTTATAGTACG
espécie B ATCGCTAGTCTTATATTACA
espécie C TTCACTAGACCTGTGGTCCA
espécie D TTGACCAGACCTGTGGTCCG
espécie E TTGACCAGTTCTCTAGTTCG
Métodos baseados em distâncias: Transformam os dados em distâncias (dissimilaridades) par-a-par, e usam a matriz durante inferência da árvore.
A B C D E
espécie A ---- 0,20 0,50 0,45 0,40
espécie B 0,23 ---- 0,40 0,55 0,50
espécie C 0,87 0,59 ---- 0,15 0,40
espécie D 0,73 1,12 0,17 ---- 0,25
espécie E 0,59 0,89 0,61 0,31 ----
Exemplo 1: Distância “p” (= percentagem observada de sequências diferentes)
Exemplo 2: distância Kimura 2-parâmetros (estimativa do número real de substituições entre táxons)
M A T R I Z
Estima-se primeiro qual árvore sem raiz seria a mais “correta” A
B
C
D
Alguns métodos fenéticos produzem a árvore já com a raiz (UPGMA). Os métodos cladísticos podem fornecer árvores com raiz se os dados possuem informação suficiente (Parcimônia, Verossimilhança), mas geralmente utilizam ou necessitam obrigatoriamente de um grupo externo para produzir uma árvore com raiz (Parcimônia, Verossimilhança, Bayesiano, Neighbor Joining)
Algoritmos baseados em distâncias (agrupamento)
Usam distâncias para calcular árvores filogenéticas. Estas são baseadas somente no número relativo de similaridades e diferenças entre um grupo de seqüências.
– Começa com uma matriz de distâncias par-a-par
– Estes métodos constróem uma árvore ligando os pares de
táxons menos distantes, sucessivamente ligando táxons
mais distantes.
– Ex: UPGMA (típico método fenético) e
Neighbor joining (NJ) que considera diferentes taxas
evolutivas entre linhagens.
23/05/2011
15
Distâncias entre DNA • distâncias entre pares de seqüências de DNA são relativamente
simples de computar como a soma de diferenças de bases entre as
duas seqüências.
– Este tipo de algoritmo somente funciona para pares de
sequências similares o bastante para serem alinhadas
• Geralmente todas alterações de bases são consideradas iguais
• Inserções/deleções geralmente possuem um peso maior do que
substituições nucleotídicas (gap penalties).
• É também possível corrigir múltiplas substituições em um único sítio,
que é comum em relacionamentos filogenéticos distantes e para
sítios de rápida evolução.
UPGMA • O mais simples dos métodos de distância é o UPGMA (Unweighted
Pair Group Method using Arithmetic averages) e apenas reconstrói fenogramas que representam meras relações de similaridade geral.
• Assume taxas evolutivas idênticas para todas as OTUs.
• Agrupa as distâncias menores e recalcula novas distâncias através de médias aritméticas para novo agrupamento.
• Os programas do pacote PHYLIP DNADIST and PROTDIST calculam distâncias genéticas entre grupos de seqüências criando uma matriz de dissimilaridades (distâncias).
• Então o programa NEIGHBOR (que também constrói árvores NJ) do PHYLIP constrói a árvore UPGMA a partir da matriz.
• Esta árvore é visualizada em um programa apropriado (Ex: TREEVIEW ou PTP).
Métodos de Distância
a ACGA
b ATGC
c GTGC
d GCAA
a b c d
a 0
b 0,5 0
c 0,75 0,25 0
d 0,5 1,0 0,75 0
d ij
a b c d a b c d
a 0
b 0,5 0
c 0,75 0,25 0
d 0,5 1,0 0,75 0
d ij
Métodos de Distância
Matriz Árvore UPGMA (mera similaridade)
a b c d
a 0
b 0,5 0
c 0,75 0,25 0
d 0,5 1,0 0,75 0
d ij
Métodos de Distância
Matriz Árvore Neighbor-Joining (similaridade e taxas evolutivas diferenciais)
b d
a
c
Máxima parcimônia
• Parcimônia é o método mais popular de reconstrução cladística dos relacionamentos por ancestralidade comum.
• Parcimônia permite o uso de toda informação evolutiva conhecida para a construção da árvore.
– em contraste, métodos de distância resumem todas diferenças entre pares de seqüências em um único número, a percentagem de diferença ou distância genética.
23/05/2011
16
Exemplo de Parcimônia
• Considere 4 táxons com as seqüências: a (ACGA),
b (ATGC), c (GTGC), d (GCAA).
• A parcimônia deve decidir qual das 3 possíveis árvores
sem raiz (4 táxons), é a mais “correta” (parcimoniosa).
• Posteriormente, se houver informações suficientes, deve-
se colocar a raiz, a qual polariza o padrão de ramificações
sequenciais na árvore filogenética.
Exemplo de Parcimônia
a
b
c
d
a
c
b
d
a
d
b
c
a A C G A
b A T G C
c G T G C
d G C A A
árvore 1
árvore 2
árvore 3
1 2 3 4
total árvore 1 1
árvore 2
árvore 3
Exemplo de Parcimônia
a
b
c
d
a A C G A
b A T G C
c G T G C
d G C A A
árvore 1
A
A
G
G
*
* = 1 etapa de mutação
1 2 3 4
Exemplo de Parcimônia
a
b
c
d
a A C G A
b A T G C
c G T G C
d G C A A
árvore 1
1 2 3 4 C
T C
T *
* = 2 etapas de mutação
*
total árvore 1 1 2
árvore 2
árvore 3
Exemplo de Parcimônia
a
b
c
d
a A C G A
b A T G C
c G T G C
d G C A A
árvore 1 A
G G 1 2 3 4
* = 1 etapa de mutação
*
G
total árvore 1 1 2 1
árvore 2
árvore 3
Exemplo de Parcimônia
a
b
c
d
a A C G A
b A T G C
c G T G C
d G C A A
árvore 1
A
A
1 2 3 4
C
C *
* = 2 etapas de mutação
*
total árvore 1 1 2 1 2 6
árvore 2
árvore 3
23/05/2011
17
Exemplo de Parcimônia
a
b
c
d
a
c
b
d
a
d
b
c
a A C G A
b A T G C
c G T G C
d G C A A
árvore 1
árvore 2
árvore 3
1 2 3 4
total árvore 1 1 2 1 2 6
árvore 2 2 2 1 2 7
árvore 3 2 1 1 1 5
Exemplo de Parcimônia
a
d
b
c árvore 3
Árvore sem raiz escolhida pela análise de parcimônia
Neste caso temos informações adicionais de que táxon com a sequência d possa funcionar como um grupo externo (outgroup), portanto a raiz estará entre d e os outros ( ).
a b c d Árvore com raiz escolhida usando d como outgroup
Exemplo de Parcimônia
a b c d a A C G A
b A T G C
c G T G C
d G C A A
1
1 (A) 1 (A)
A evolução dos caracteres apomórficos pode ser inferida a partir do Cladograma. Assim, eventos paralelos (recorrentes) de mutação podem ser identificados, os quais correspondem às homoplasias.
3 (G)
3
2 (T)
2
4 (C)
4
A análise de parcimônia pode discriminar alguns tipos de eventos paralelos. Na figura ao lado, 4 sequências homólogas alinhadas (a) de distintos organismos foram utilizadas para construir uma árvore de parcimônia (b). Na árvore b estão dispostos os eventos de mutações (apomorfias), numerados de 1 a 8. No evento 2, o estado alélico derivado (nucleotídio A) demonstrou ser um evento paralelo, aparecendo independentemente na seqüência do homem e do milho.
Verossimilhança (L) é a probabilidade dos dados, dado o modelo de substituições nucleotídicas e uma hipótese de topologia filogenética
Modelo evolutivo de substituições
Diferentes padrões de substituição nucleotídica específicos de cada conjunto homólogo de sequências de DNA.
A
C T
G Transição
Transversão
L = P (dados/árvore)
Máxima verossimilhança Jukes-Cantor
(1 parâmetro)
A frequência dos nucleotídios não é considerada Todas substituições têm a mesma taxa
23/05/2011
18
Kimura 2P (2 parâmetros)
A frequência dos nucleotídios não é considerada Transições e transversões têm diferentes taxas
GTR (General Time Reversible) (6 parâmetros)
a
b
c d e
f
A frequência dos nucleotídios é considerada Transições e transversões têm diferentes taxas, assim como os tipos de mudanças nucleotídicas
O modelo inapropriado de substituições nucleotídicas pode levar a uma reconstrução filogenética incorreta.
Modeltest
Posada e Krandal
O software permite selecionar o modelo de substituição mais plausível para determinado conjunto de sequências, assim como outros parâmetros necessários para a reconstrução filogenética.
Dados reais: mudanças observadas e esperadas
• Comparação de sequências de chimpanzé e homem no DNAmt (307/1333 sítios são diferentes)
• Modelos com mais parâmetros se aproximam mais do padrão observado LT = L (1) x L (2) x L (3) x L (4) x..x L (N) = L (i)
d
c
b
a
C
C
T
T
7 6 5 4 3 2 1
T G G A G A
T A T A G A
T C C C G A
T C A G A A
Táxon
Táxon
Táxon
Táxon
a
c
b
d
a
b
c
d
a
d
c
b
Método baseado na avaliação probabilística de modelos evolutivos que melhor explicam um conjunto de dados de forma que este reflita a história evolutiva mais próxima da realidade
C A
L(5) = Prob x C G
A A
Prob x C
C
A
G
A C
C
C
A
G
C T Prob x
Prob ... x
Prob C
C
A
G
N N
Máxima verossimilhança
23/05/2011
19
Problemas e cuidados na reconstrução filogenética
• As taxas evolutivas são diferentes para cada gene ou segmento anônimo de DNA, e também em diferentes escalas de tempo.
• As homoplasias levam à saturação dos dados, isto é, aumentam os erros de reconstrução filogenética.
• As estimativas temporais estão sujeitas a calibrações do relógio molecular e podem ter erros associados.
• Árvores filogenéticas contam a história do caráter, do gene, mas não necessariamente da espécie, pois é uma associação (inferência) histórica.
Taxas de mutação/evolução
Saturação em sequências de DNA
111
Existem pontos-quentes de mutação. Algumas regiões estão mais sujeitas ao acúmulo de substituições, portanto também apresentam mais homoplasias (alelos recorrentes) que atrapalham a reconstrução filogenética.
Um problema decorrente da saturação é o que chamamos de “atração de ramos longos”, nos quais grupos divergentes ficam parecendo mais próximos do que realmente são.
Relação entre a taxa de mutação espontânea e a taxa de evolutiva (de substituição)
A taxa estimada de acúmulo de novos variantes é maior em tempos recentes, pois em longo prazo há o aumento da homoplasia (saturação) e outros processos que mascaram o reconhecimento dos eventos de mutação.
Calibração do relógio molecular Estimando taxas evolutivas
114
Registro fóssil Biogeografia Reamostragens Genealogias
A B A B
Separação recente taxas rápidas Separações antigas
taxas lentas
A B
As calibrações destas taxas podem ser feitas por análises diversas utilizando:
23/05/2011
20
Taxas evolutivas moleculares
Exemplo taxa = 0,06 diferenças / 6 M.A. em um determinado gene taxa = 0,01 / M.A. ou 1% por milhão de anos neste gene.
6 M.A.
Erros de calibração com fósseis
Muitas vezes o fóssil usado para calibrar o “relógio” é mais recente que a divergência genética, portanto as datas estimadas com estas taxas podem ser subestimativas.
6 M.A.
O processo do coalescente
117
Erro de calibração do Coalescente
Divergência genética precede o isolamento reprodutivo
Isolamento reprodutivo
Divergência genética
Presente
Passado
Brady et al. 2006. PRSB
A evolução da eussocialidade em abelhas halictídeas está associada a um período geológico de temperaturas amenas.
Exemplo de escalas temporais em
filogenias
Exemplo de escalas temporais
em filogenias
Ohlson et al. 2008 Zool.Sc.
Correlação entre divergência, especiação, mudanças climáticas e especialização de hábitats em Tiranídeos.
Floresta húmida
F. húmida dossel
Semi-aberto
Hábitat aberto
23/05/2011
21
Árvores de genes e de espécies
• A história evolutiva dos genes reflete aquela das espécies que os carregam, exceto quando: – Transferência horizontal = transferência gênica entre
espécies (ex. entre bactérias, mitocôndrias em híbridos)
– Duplicação gênica : ortologia/ paralogia
Incongruência entre árvores de genes e de espécies
Mamíferos
Primatas
Esta é uma árvore que representa só a história dos genes e não dos táxons.
Associações históricas
Page e Charleston, 1998
Eventos entre gene (associado) e a espécie (organismo)
Page e Charleston, 1998
Associado
Espécie
Transferência Horizontal
Evento de triagem
Codivergência
Duplicação
Reconstrução da filogenia de espécies: artefatos devido à paralogia
Perda de genes pode acontecer durante a Evolução: mesmo sequências com genomas completos pode ser difícil detectar paralogia (duplicação). Algumas linhagens gênicas podem ter sido perdidas (eventos de triagem).
Rat Mouse Rat Mouse
GNS1 GNS1
GNS1 GNS2
GNS2 GNS2 GNS1 GNS2
Hamster Hamster
especiação
duplicação
Mouse Rat
GNS GNS GNS
Hamster
Árvore verdadeira Árvore obtida com amostragem
parcial de genes parálogos