MáximaParcimônia
Parcimônia em Filogenética
Idéia básicaBuscar, dentre todas as árvores
possíveis, aquela ou aquelas que minimizam a quantidade de modificações evolutivas requeridas para explicar os dados
Quando duas hipóteses fornecerem explicações igualmente válidas para explicar um fenômeno, a mais simples sempre deve ser escolhida
ADCBE
Caracteres Espécies 1 2 3 4 5 6
A 1 0 0 1 1 0 B 0 0 1 0 0 0 C 1 1 0 0 0 0 D 1 1 0 1 1 1 E 0 0 1 1 1 0
Caracteres Espécies 1 2 3 4 5 6
A 1 0 0 1 1 0 B 0 0 1 0 0 0 C 1 1 0 0 0 0 D 1 1 0 1 1 1 E 0 0 1 1 1 0
ADCBE
ADCBE
ADCBE
1
Caracteres Espécies 1 2 3 4 5 6
A 1 0 0 1 1 0 B 0 0 1 0 0 0 C 1 1 0 0 0 0 D 1 1 0 1 1 1 E 0 0 1 1 1 0
ADCBE
ADCBE
ADCBE
ADCBE
2
2
1
Caracteres Espécies 1 2 3 4 5 6
A 1 0 0 1 1 0 B 0 0 1 0 0 0 C 1 1 0 0 0 0 D 1 1 0 1 1 1 E 0 0 1 1 1 0
ADCBE
ADCBE
ADCBE
2
2
31
Caracteres Espécies 1 2 3 4 5 6
A 1 0 0 1 1 0 B 0 0 1 0 0 0 C 1 1 0 0 0 0 D 1 1 0 1 1 1 E 0 0 1 1 1 0
ADCBE
ADCBE
ADCBE
2
2
4
314
5
5
Caracteres Espécies 1 2 3 4 5 6
A 1 0 0 1 1 0 B 0 0 1 0 0 0 C 1 1 0 0 0 0 D 1 1 0 1 1 1 E 0 0 1 1 1 0
ADCBE
ADCBE
2
2
4
314
5
5
6
ADCBE
2
2
4
314
5
5
6CDABE
2
314
4
5
5
6EBACD
2
31
4
4
5
5
6
9 passos
8 passos
8 passos
“a presença de caracteres apomórficos em espécies diferentes é sempre uma razão para se suspeitar de parentesco entre elas, e sua origem por convergência nunca deve ser assumida a priori” (Hennig, 1953).
Parcimônia em Filogenética
Parcimônia em Filogenética
A maioria dos biólogos está familiarizada com a noção de parcimônia – Hipóteses mais simples devem ser preferidas às mais complexas e hipóteses ad hoc devem ser evitadas sempre que possível.
A “simplicidade” reside em inferir que caracteres compartilhados o sejam por ancestralidade comum e não por homoplasias, que seriam as hipóteses ad hoc.
Em estudos morfológicos, a polaridade dos caracteres é feita através da comparação com os out-groups, e os caracteres polarizados resultantes formam a base da análise. Portanto, o resultado é sempre uma árvore com raiz.
Como a polarização fornece base suficiente para a obtenção de árvores enraizadas, ela não é um pré-requisito para o uso da parcimônia. Felizmente é assim, pois a polarização de caracteres moleculares é difícil e pouco significativa.
Polarização de Caracteres
Passos Lógicos da Parcimônia
fazer uma reconstituição dos eventos, de modo a envolver o menor número de eventos possível em cada filogenia (ou árvore filogenética) proposta, ou seja, minimizar o número de transformações de um caráter necessárias para explicar um determinado conjunto de dados
procurar, dentre todas as árvores possíveis, aquela que minimiza o número de eventos.
Pressupostos da Parcimônia
Os caracteres analisados são independentes entre si
Os sítios analisados são homólogos
G
AAA
AA
AAA
AA
CC
C AT
T TTTT T
TT
CCCC
AAA
AA
GGGGG
TTT
C
CC
CCC
AAA
AA
TTTT
TT
TN
GGGG
GGGG
T
TT
AGGGG
TTTT
CCCC
CCCC
TTTT
TTTT
T
T
CC
GGGG
TTTT
AAA
AA
GGGG
GT
TT T
TT
A
AAA
AA
A
Sítios InformativosSítios invariáveis não são
considerados informativosSítios variáveis contendo apenas
auto-apomorfias não são considerados informativos
Um sítio informativo, além de variável, deve ter pelo menos duas formas presentes em pelo menos dois indivíduos
Sítios Informativos
G
AAA
AA
AAA
AA
CC
C AT
T TTTT T
TT
CCCC
AAA
AA
GGGGG
TTT
C
CC
CCC
AAA
AA
TTTT
TT
TN
GGGG
GGGG
T
TT
AGGGG
TTTT
CCCC
CCCC
TTTT
TTTT
T
T
CC
GGGG
TTTT
AAA
AA
GGGG
GT
TT T
TT
A
AAA
AA
A
Invariável
InformativoVariável com autoapomorfia
HomoplasiasSubstituições reversas ou
paralelas (dois resíduos de aminoácido ou nucleotídeo são idênticos em duas OTUS, mas isso não se deve à ancestralidade comum).
Índice de Consistência
número mínimo de substituições no sítio em todas as topologias avaliadas
número mínimo de substituições na topologia em estudo
im
is
i
ii
s
mc
Índice de Retenção
número máximo de substituições que pode ser encontrado em todas as topologias (dado pela topologia em estrela com o nucleotídeo mais freqüente no centro)
ig
)(
)(
ii
iii
mg
sgr
Métodos baseados em Parcimônia
Grupo de métodos relacionados que têm como objetivo comum minimizar o número de passos evolutivos. O entendimento de pelo menos dois destes métodos é fundamental para a compreensão dos demais.
Parcimônia de Wagner ou de Fitch (1971)
Apropriada para caracteres binários, ordenados, de múltiplos estados e contínuos
Assume que a transformação de qualquer estado para qualquer outro pode se dar em qualquer direção, de forma reversível
Parcimônia de Wagner ou de Fitch (1971)
{ }C
{ }AC
{ }AC
{ }AG
{ }ACG
{ }A { }C { }A { }G
Parcimônia de SankoffTodos os métodos baseados em
parcimônia são variantes da PSO método designa um custo para
a transformação de um estado de caráter para o outro
Os “pesos” são representados em uma matriz de custos, que recebe quaisquer valores
{C}
8 8 8 8 8 8 8 8 8 8 8 8 8 8 8
{AC}
0
2 .5
6 .0 6 .0 7 .0 8 .0
G A + G C = 1 .0 + 2 .5
C A + C G
AC + AA + 1= 2.5+0.0+1.0A C + A C + 5= 2 .5+ 2 .5 +5 .0
A C + A G + 1 = 2 .5 +1 .0 + 1 .0A C + AT + 5 = 2 .5 +2 .5 +5
G A + G A + 2 .5 + 3 .5 = 8G A + G C + 2 .5 + 3 .5= 9
GA + GG + 2.5 + 3.5= 7G A + G T + 2 .5 + 4 .5 = 10 .5
2 .5 3 .5 3 .5
3 .5 3 .5 3 .5 4 .5
1 .0 1 .05 .0 5 .0
0 0 0 0
{AC}
{AG}
{ACG }
{A} {C} {A} {G}
Para
D e .
0 2.5 1 2.5 2.5 0 2 .5 1 1 2.5 0 2.5 2.5 1 2 .5 0
A C G T
ACGT
Exemplo: a PW é uma matriz de Sankoff com custo 0 para a manutenção de um caráter e 1 para qualquer modificação
Parcimônia de Sankoff
Parcimônia de Camin-Sokal (1965)
Assume que o estado ancestral é conhecido
As modificações são irreversíveis 0 1Uma aplicação potencial desta
parcimônia em dados moleculares é no estudo da evolução de pequenas deleções no DNA
Parcimônia de Camin-Sokal (1965)
1
1
10 0
00
1 1
0 1
4 modificações
Parcimônia de Dollo (Le Quesne, 1974)
Baseada na Lei da Irreversibilidade Filogenética (ou de Dollo) – Os estados complexos de um caráter não podem surgir mais de uma vez ao longo da evoluçãoUma vez perdido, o estado complexo
não surgirá de novo.Apesar de poder surgir uma só vez, o
caráter complexo pode ser convertido para o mais simples repetidas vezes.
Exemplo simples:0 é o estado ancestral1 é o estado derivado
0 1Aplicação em dados moleculares:
análise de sítios de restrição, onde a perda de um estado é muito mais provável que o ganho do mesmo
Parcimônia de Dollo (Le Quesne, 1974)
Parcimônia de Dollo (Le Quesne, 1974)
1
1
10 0
00
1 1
0 1
1 ganho3 perdas
Parcimônia em escala ordinal (Farris, 1970)
Conta modificações e infere ancestrais de caracteres arranjados em ordem linear, com modificações permitidas entre estados adjascentes.
Todas as modificações têm o mesmo peso
Estados de caráter contínuos
Parcimônia de Polimorfismo (Farris 1978, Felsenstein 1979)
Assume que modificações aparentemente paralelas de estado não são independentes
Ocorrem pela segregação de alelos na população (manutenção do polimorfismo)
Não minimiza o número de perdas, mas a manutenção do polimorfismo ao longo da árvore
Aplicação: modificações cariotípicas por inversões cromossômicas (uma inversão dificilmente ocorrerá novamente, mas diferentes inversões podem coexistir)
0 01 1
Parcimônia de Polimorfismo (Farris 1978, Felsenstein 1979)
1
1
10 0
00
1 1
5 retenções de polimorfismo
Parcimônia em Seqüências Protéicas
Método de Eck & Dayhoff (1966)
Ignora o código genético por não considerar o mínimo número de substituições nucleotídicas requeridas para a substituição de um aminoácido por outro (i.e. algumas substituições requerem uma única substituição, outras requerem duas, ou mesmo 3 substituições).
Procura por árvores que requerem o menor número de substituições no mRNA
Apesar da elegância, o algoritmo dá muita atenção a substituições silenciosas (em geral na terceira base do códon). Se as seqüências forem muito distantes, o algoritmo assim construído contribui mais para aumentar o nível de ruído da análise.
Método de Goodman et al (1979)
ProtPars (Phylip)1. Uma abordagem intermediária entre
estas duas está implementada no programa ProtPars do pacote Phylip. Ela considera o código genético, mas ignora as substituições silenciosas. Por exemplo, o algoritmo designa um passo na mudança da lisina para a arginina (AAA AGA) e dois passos na mudança da lisina para a prolina (AAA CAA (glutamina) CCA).
ProtPars (Phylip) Considera o código genético Ignora as substituições
silenciosas Por exemplo, o algoritmo designa
um passo na mudança da lisina para a arginina (AAA AGA) e dois passos na mudança da lisina para a prolina (AAA CAA (glutamina) CCA).
Busca da Melhor
Árvore...
Busca ExaustivaBusca, dentre todas as árvores
possíveis, aquela com a máxima parcimônia
O problema é que o número de árvores possíveis aumenta superexponencialmente...superexponencialmente...
n = 2
A
B
n = 3
A A
A
B
B
B
C
CC
A
B
C
n = 4A
A A A
A A A A
A
A
AA
A
A
A
B
B
B B
B
B
B B
B
BBBB
B
B
C
C
C
C
C
C C
C
C
CC
C
C
C C
D
D D
D
D
D
D
D
D
D
D
DD
D D
n = 4
A A A
B
B BC
C CD D D
Número de Árvores Possíveis
n Sem raiz Com raiz5 15 1056 105 9457 945 10.395
10 2.027.025 34.459.42520 2,21 x 10 8,2 x 10 50 2,83 x 10 2.75 x 10 76
2120
74
Nearest-Neighbor Interchange (NNI)
S
S
S
S
UU
UU
T
TT
T
VV
VV
Subtree Pruning and Regrafting (SPR)G
G
G
G
C
C
C
C
A
A
A
A
E
E
E
E
D
D
D
D
F
F
F
F
B
B
B
B
I
I
I
I
H
H
H
H
J
J
J
J
K
K
K
K
Tree Bissection Reconection (TBR)
A
B
C
F
ED
C
AB F D
E
A
B
FCD
E
A
B
C
F
E
D
A
B
C
F
E
D
Star Decomposition
A
A
F
F
E
ED
D
C
C
A
FE
D
CB
B
B
A
FE
D
CB
A
FE
D
CB
A
FE
D
C
B
Branch and
Bound
Top Related