TESE DE DOUTORADO - ICB
Transcript of TESE DE DOUTORADO - ICB
�
UNIVERSIDADE FEDERAL DE MINAS GERAIS
INSTITUTO DE CIÊNCIAS BIOLÓGICAS
DEPARTAMENTO DE BIOLOGIA GERAL
PROGRAMA DE PÓS-GRADUAÇÃO EM GENÉTICA
TESE DE DOUTORADO
Estudos filogeográficos com uso de marcadores
moleculares localizados em uma região de baixa taxa
de recombinação do cromossomo X humano
ALUNO (A): Simone Silva dos Santos Lopes
ORIENTADOR: Prof. Dr. Sérgio Danilo Junho Pena
BELO HORIZONTE
Dezembro - 2007
II
SIMONE SILVA DOS SANTOS LOPES
Estudos filogeográficos com o uso de marcadores
moleculares localizados em uma região de baixa
taxa de recombinação do cromossomo X humano
Tese apresentada à Pós-Graduação em
Genética do Departamento de Biologia Geral
do Instituto de Ciências Biológicas da
Universidade Federal de Minas Gerais, como
requisito parcial para a obtenção do título de
Doutor em Genética.
Orientador: Prof. Dr. Sérgio Danilo J. Pena
Universidade Federal de Minas Gerais
Instituto de Ciências Biológicas
Departamento de Biologia Geral
Belo Horizonte – MG – Brasil
2007
III
DEDICATÓRIA
Dedico este trabalho a toda a minha família como forma de recompensa pelos
seis anos de ausência, de modo especial a minha mãe, Marquina, patrocinadora dos
meus sonhos, que mesmo a distância, tem participado e compartilhado dos meus
melhores e piores momentos, meu referencial de trabalho, determinação e alegria,
ensinando-me a ter esperanças e acreditar que a vida sempre pode ser melhor...
IV
AGRADECIMENTOS
Agradeço a todas as pessoas que, de maneira direta ou indireta, me auxiliaram no
desenvolvimento deste projeto.
Aos meus orientadores
Primeiramente, quero agradecer a quem me orientou durante o desenvolvimento desta
tese, Prof. Dr. Sérgio Danilo Junho Pena, por quem tenho uma imensa admiração
profissional e profundo respeito. Com carinho, agradeço-lhe a oportunidade de, ao
realizar este trabalho, conviver com uma pessoa extremamente brilhante.
Agradeço ao Prof. Fabrício Santos, “meu eterno chefito”, que abriu as portas das
“minas gerais” quando aceitou me orientar durante o Mestrado. E também a sua
esposa Adriana, por quem tenho um carinho especial.
Aos colaboradores deste projeto
Aos colaboradores que forneceram as amostras de DNA utilizadas nesta tese, Dr.
Sérgio Bydlowski e Prof. Eduardo Tarazona-Santos.
Ao Prof. Ian J. Wilson, da Universidade de Newcastle no Reino Unido, pelas análises
com o programa BATWING.
Ao Dr. Rinaldo W. Pereira, pelas informações sobre os marcadores analisados.
E, em especial, às pessoas que doaram as amostras e permitiram a sua utilização em
trabalhos científicos.
V
Aos Amigos da Pós-Graduação em Genética
Agradeço a todos os professores e funcionários da Pós-Graduação em Genética, em
especial à Profa. Mônica Bucciarelli, a Momo, pela amizade e carinho dedicados a
mim. Agradeço, também às Professoras, Cleusa, Mariza e Bernadete.
Agradeço aos meus colegas de curso pelos momentos agradáveis compartilhados
durante a obtenção dos créditos, tanto no Mestrado quanto no Doutorado. Em
especial, a Luciana Lara, Fred, Juliana, Dulce, Dani Pontes, Sávio Torres, Rodrigo
Redondo e Renata Acácio.
Aos amigos do Laboratório de Biodiversidade e Evolução Molecular (LBEM)
A todos os alunos do LBEM, e em especial, Rodrigo Redondo e Daniela Lacerda, que
mantêm a ordem do laboratório, agradeço a amizade e atenção.
Aos amigos do Laboratório de Genética Bioquímica (LGB)
A todos os alunos do LGB (atuais e antigos): Alessandra Campos, Alessandra Clarizia,
Alice, Bruno, Carlos Eduardo, Carlos Gustavo, Claudiney, Carol Furtado, Daiane,
Danielle, Débora Aline, Debrinha, Érika, Flávia Parra, Chico Lobo, Guilherme, Helder,
Heron, Jane, Jorge Freitas, João Pedro, Luiz Augusto, Magui, Marina, Marcela,
Michael, Matheus, Michelle, Pedro, Priscila, Simone Pires e Thaís, pelos momentos de
descontração e alegria.
E, especialmente, aos alunos que me auxiliaram no começo do meu Doutorado:
Claudinha, Charles e Luciana Werneck que me ensinaram muito, principalmente,
pelas conversas sadias e descontraídas.
Aos alunos do Grupo de Humanos, Claudinha, Raquel, Luciana Bastos, Alessandra
Clarizia, Rodrigo Richard, Vanessa, Ferdi, Clarice e Higgor, com quem compartilhei
VI
momentos importantes para o desenvolvimento desta tese. Em especial, a Claudinha,
pelos conselhos e orientações, durante o inicio de elaboração desta tese.
Aos professores Carlos Renato, Andréa Macedo e Gloria Franco, pelas importantes
sugestões e comentários nas reuniões de segunda-feira.
Às técnicas do LGB, Neuzinha e Katita, pelo carinho, amizade e ajuda incondicional
durante todo o meu Doutorado.
Aos Amigos
Aos amigos que conheci assim que cheguei a Belo Horizonte: Ricardo Camelo, Beth,
Luciana Werneck, Renata, Gisele, Ferdi, Miguel, que me auxiliaram durante meu
processo de adaptação e que são a minha família mineira.
Aos meus amigos festeiros: Carol, Sávio (Pablito), Ferdi, Chico Tosco, Adriano, Anna
Luiza e o “super” Miguelito, com quem, durante alguns anos, me diverti bastante. Em
especial ao Miguelito, pela ajuda sempre incondicional e ao Sávio, por ser um amigão.
Aos meus amigos da UDV, pela amizade sincera e verdadeira, em especial Carol, Gui,
Paola e Everton, pelo companheirismo. E ao Guilherme e Charles, pelo auxílio durante
as correções desta tese.
Aos meus amigos de Maceió, Juli, Jeane, Rala e Natan, pela capacidade de me
alegrar em todos os momentos que passamos juntos.
VII
À Família
Em especial a minha família, pessoas fortes, batalhadoras e simples, mas dignas de
respeito, por quem tenho uma grande admiração e carinho.
Agradeço aos meus pais, Marquina, Paulino (Pai) e Domingos (Padrasto), pelo imenso
amor, respeito e confiança dedicados a mim.
Aos meus irmãos, em especial ao Sérgio e Kaline, pelo carinho e amizade. Aos meus
cunhados Marnise, Marcos e Paulinha.
Ao meu tio Paulino e a Geovanna, por representarem toda a minha família em Belo
Horizonte e por acreditarem em mim incondicionalmente.
Aos também familiares Sérgio Kehdy, Regina, Rafael, Ferdi e Léo, pessoas tão
especiais, que me faltam palavras para agradecer tanto carinho e amizade.
Agradeço finalmente, ao meu marido, William, pelo amor, confiança e respeito que
temos um pelo outro e pela relação harmoniosa que estamos construindo juntos.
Principalmente, agradeço pela compreensão e paciência nos momentos de
elaboração e conclusão desta tese, e por ser tão especial e verdadeiro.
VIII
ÍNDICE
DEDICATÓRIA ............................................................................................................... III
AGRADECIMENTOS........................................................................................................ IV
LISTA DE FIGURAS ..........................................................................................................X
LISTA DE TABELAS......................................................................................................... XI
LISTA DE ABREVIATURAS............................................................................................... XII
PREFÁCIO .................................................................................................................. XIII
RESUMO ................................................................................................................... 14
ABSTRACT ............................................................................................................... 15
1 INTRODUÇÃO........................................................................................................ 16
1.1 ESTUDOS EM EVOLUÇÃO HUMANA .......................................................................... 17
1.2 O POVOAMENTO DAS AMÉRICAS ............................................................................ 18
1.3 A FORMAÇÃO DO POVO BRASILEIRO ....................................................................... 19
1.4 MARCADORES MOLECULARES ................................................................................ 20
1.5 POLIMORFISMOS DE SEQÜÊNCIA............................................................................. 21
1.6 POLIMORFISMOS DE TAMANHO ............................................................................... 23
1.7 MARCADORES DE LINHAGEM .................................................................................. 24
1.8 BLOCOS HAPLOTÍPICOS ......................................................................................... 25
1.9 ANÁLISE DE DESEQUILÍBRIO DE LIGAÇÃO ................................................................. 26
1.10 O CROMOSSOMO X HUMANO ................................................................................ 26
2 OBJETIVOS ........................................................................................................... 30
2.1 OBJETIVO GERAL................................................................................................... 31
2.2 OBJETIVOS ESPECÍFICOS ....................................................................................... 31
3 MATERIAL E MÉTODOS ....................................................................................... 32
3.1 POPULAÇÕES E AMOSTRAGENS.............................................................................. 33
3.2 EXTRAÇÃO DE DNA............................................................................................... 35
3.3 NOMENCLATURA DA INSERÇÃO ALU ........................................................................ 35
3.4 TIPAGEM DA INSERÇÃO ALU (DXS225) ................................................................... 35
IX
3.5 SELEÇÃO DE NOVOS MARCADORES ........................................................................ 36
3.6 LOCALIZAÇÃO FÍSICA DOS MARCADORES................................................................. 37
3.7 TIPAGEM DOS MICROSSATÉLITES............................................................................ 37
3.8 ANÁLISE ESTATÍSTICA ............................................................................................ 40
4 RESULTADOS ....................................................................................................... 43
4.1 CAPÍTULO 1 - PADRONIZAÇÃO DOS MARCADORES MOLECULARES FORMADORES DO
BLOCO HAPLOTÍPICO .................................................................................................... 44
4.1.1 INTRODUÇÃO...................................................................................................... 44
4.1.2 RESULTADOS ..................................................................................................... 45
4.1.3 DISCUSSÃO........................................................................................................ 67
4.2 CAPÍTULO 2 - FILOGEOGRAFIA DE POPULAÇÕES MUNDIAIS POR MEIO DA ANÁLISE DE UM
BLOCO HAPLOTÍPICO DO CROMOSSOMO X ..................................................................... 71
4.2.1 INTRODUÇÃO...................................................................................................... 71
4.2.2 RESULTADOS ..................................................................................................... 72
4.2.3 DISCUSSÃO........................................................................................................ 92
4.3 CAPÍTULO 3 - ANÁLISE DA DIVERSIDADE E ANCESTRALIDADE GENÉTICAS DA POPULAÇÃO
BRASILEIRA (BRANCOS E PRETOS) DA CIDADE DE SÃO PAULO ........................................ 98
4.3.1 INTRODUÇÃO...................................................................................................... 98
4.3.2 RESULTADOS ................................................................................................... 100
4.3.3 DISCUSSÃO...................................................................................................... 114
5 CONCLUSÃO GERAL.......................................................................................... 118
6 CONSIDERAÇÕES FINAIS.................................................................................. 122
7 REFERÊNCIAS BIBLIOGRÁFICAS ..................................................................... 126
8 ANEXOS............................................................................................................... 137
X
LISTA DE FIGURAS
Figura 1. Rotas de migrações do Homo sapiens moderno por meio do DNA mitocondrial....... 18
Figura 2. Mapa das populações analisadas do Painel do HGDP-CEPH. .................................. 34
Figure 3. Ideograma com a localização física dos marcadores analisados. .............................. 48
Figure 4. Resultado do programa Ensembl. ............................................................................... 50
Figura 5. Alinhamento das seqüências do DXS1012 . ............................................................... 52
Figura 6. Gráfico da tipagem dos sete microssatélites............................................................... 52
Figura 7. Resultado da amplificação do DXS225....................................................................... 55
Figura 8. Freqüências da presença da inserção DXS225 nas populações mundiais................ 55
Figura 9. Histograma com valores de D’ encontrados. .............................................................. 62
Figura 10. Curvas das taxas de recombinação. ......................................................................... 63
Figura 11. Mapa de desequilíbrio de ligação para a África. ....................................................... 64
Figura 12. Mapa de desequilíbrio de ligação para a Europa...................................................... 64
Figura 13. Mapa de desequilíbrio de ligação para a China. ....................................................... 65
Figura 14. Mapa de desequilíbrio de ligação para o Japão. ...................................................... 65
Figura 15. Compartilhamento de haplótipos entre as regiões do Painel do HGDP-CEPH........ 74
Figura 16. Rede haplotípica com as cinco regiões do Painel do HGDP-CEPH......................... 77
Figura 17. Rede haplotípica com DXS2250 nas regiões do Painel do HGDP-CEPH. ............... 79
Figura 18. Rede haplotípica com DXS2251 nas regiões do Painel do HGDP-CEPH. ............... 81
Figura 19. Redes haplotípicas com DXS2251 em cada região mundial..................................... 82
Figura 20. Gráfico de PCA com as sete regiões do Painel do HGDP-CEPH.. .......................... 84
Figura 21. Gráfico de PCA com as cinco regiões do Painel do HGDP-CEPH. ......................... 85
Figura 22. Histogramas com as taxas de mutação dos microssatélites. ................................... 88
Figura 23. Distribuição a priori e a posteriori dos parâmetros populacionais............................. 91
Figura 24. Gráfico de PCA dos brasileiros, populações da África e Eurásia do Painel do HGDP-
CEPH.. ...................................................................................................................................... 107
Figura 25. Gráfico de PCA com Pretos brasileiros e as populações da África. ....................... 107
Figura 26. Dendograma da partição do BAPS para os brasileiros........................................... 110
Figura 27. Dendograma do BAPS com os Pretos brasileiros e populações da África ............ 111
Figura 28. Rede haplotípica com os brasileiros ....................................................................... 113
XI
LISTA DE TABELAS
Tabela 1. Seqüência dos iniciadores dos microssatélites analisados........................................ 39
Tabela 2. Microssatélites encontrados na região Xq21.1-Xq21.3.............................................. 46
Tabela 3. Posição dos marcadores em pares de bases (pb). .................................................... 48
Tabela 4. Freqüências da inserção DXS225 nas populações do Painel HGDP-CEPH............. 56
Tabela 5. AMOVA do marcador DXS225 das populações do Painel HGDP-CEPH.................. 57
Tabela 6. Valores de significância e D’de desequilíbrio de ligação ........................................... 61
Tabela 7. Índices de diversidade de Nei dos marcadores analisados ....................................... 66
Tabela 8. Diversidade haplotípica das cinco principais regiões do CEPH................................. 73
Tabela 9. AMOVA do bloco haplotípico nas populações do Painel HGDP-CEPH. ................... 75
Tabela 10. Distribuição a priori dos parâmetros populacionais.................................................. 90
Tabela 11. Distribuição a posteriori dos parâmetros populacionais........................................... 90
Tabela 12. Diversidade haplotípica dos brasileiros. ................................................................. 101
Tabela 13. AMOVA bloco haplotípico completo para brasileiros, populações da África e
Eurásia...................................................................................................................................... 103
Tabela 14. AMOVA para o bloco haplotípico reduzido para os brasileiros, populações da África
e Eurásia. .................................................................................................................................. 103
Tabela 15. Porcentagem da contribuição genética dos africanos e euroasiáticos para os
Brancos e Pretos de São Paulo com diferentes marcadores genéticos. ................................. 105
XII
LISTA DE ABREVIATURAS
AIM- Ancestry Informative Marker - Marcador Informativo de Ancestralidade
AMOVA- Analysis of Molecular Variance - Análise de Variância Molecular
CEPH- Centre d’Etude du Polymorphisme Humain - Centro do Polimorfismo Humano
mtDNA- Mitochondrial DNA - DNA mitocondrial
GDB- The human Genome DataBase - Banco de Dados do Genoma Humano
HapMap- Haplotype Map of the Human Genome - Mapa de Haplótipos do Genoma
Humano
HGDP- The Human Genome Diversity Project - Projeto de Diversidade do Genoma
Humano
IBGE- Instituto Brasileiro de Geografia e Estatística
INDELs- Polymorphisms of Insertions/Deletions - Polimórfismos de Inserções e
Deleções
LINEs- Long Interspersed Nuclear Elements - Elementos Intercalares Nucleares
Longos
MCMC- Markov Chain Monte Carlo - Monte Carlo Cadeia de Markov
NCBI- The National Center for Biotechnology Information - Centro Nacional de
Informação Biotecnológica
SNP- Single Nucleotide Polymorphism - Polimorfismo de Nucleotídeo Único
SINEs- Short Interspersed Nuclear Elements - Elementos Intercalares Nucleares
Curtos
UCSC- University of California Santa Cruz - Universidade Santa Cruz da Califórnia
UEP- Unique Event Polymorphism - Polimorfismo de Evento Único
YAP- Y Chromosome Alu Polymorphic Element - Elemento Alu Polimórfico do
Cromossomo Y
XAP- X Chromosome Alu Polymorphic Element - Elemento Alu Polimórfico do
Cromossomo X.
XIII
PREFÁCIO
O formato desta tese compreende uma Introdução geral, seguida dos
Objetivos, Metodologia utilizada, Resultados, Conclusão, Referências Bibliográficas e
Anexos. Os resultados apresentados vêm em forma de capítulos, com uma breve
introdução do capítulo, resultados obtidos e discussão.
O primeiro capítulo refere-se à padronização do bloco haplotípico estudado; o
segundo capítulo descreve a análise filogeográfica das populações mundiais do Painel
HGDP-CEPH com o bloco haplotípico do cromossomo X, e o terceiro capítulo, a
análise da diversidade e ancestralidade genéticas dos brasileiros a partir de
evidências do cromossomo X.
Em seguida aos resultados, são apresentadas as conclusões gerais obtidas
durante a elaboração desta tese e as considerações finais.
Nos anexos, estão os artigos publicados com os dados dos Capítulos 1 e 2
(Anexos 1 e 2) e em preparação (Anexo 3) com os dados obtidos no Capítulo 3.
�
RESUMO
A variabilidade genética das populações humanas tem sido analisada por diferentes
tipos de marcadores moleculares. Nesta tese, o principal objetivo foi utilizar
marcadores moleculares em uma região com baixa taxa de recombinação do
cromossomo X (Xq21.1-Xq21.3) como ferramenta para estudos evolutivos e
populacionais. Utilizamos um bloco haplotípico formado por quatro microssatélites
(DXS1012, DXS1002, DXS1019 e DXS8114) e uma inserção Alu (DXS225), em
completo desequilíbrio de ligação, para investigar a diversidade genética das
populações humanas. No primeiro grupo estudado (HGDP-CEPH), formado por 667
homens distribuídos em 51 populações mundiais, encontramos um total de 187
haplótipos distribuídos nas cinco principais regiões mundiais (África, Leste Asiático,
Eurásia, Oceania e América); desses, 129 são haplótipos região-especifico.
Observamos uma grande redução da diversidade haplotípica logo após a saída da
África (0,992±0,003) para o Leste Asiático (0,967±0,005) e Eurásia (0,953±0,006), e
que alcança os menores valores na Oceania (0,885±0,047) e na América
(0,839±0,038). Análises de coalescência permitiram estimar o tempo do ancestral
comum mais recente (TMRCA) para o bloco haplotípico de 182.000 anos (56.700-
479.000) e o tempo da inserção Alu DXS225 em 94.400 anos (24.300-310.000), fato
que corrobora com a origem africana e recente para o homem moderno (Ex Africa). Na
análise do segundo grupo, 204 indivíduos classificados como Brancos e Pretos, da
cidade de São Paulo, avaliamos a contribuição ancestral da África e da Eurásia para o
povo brasileiro. Encontramos 29% de contribuição africana nos Brancos e 55% nos
Pretos, enquanto que a contribuição euroasiática foi de 71% nos Brancos e 45% nos
Pretos brasileiros. Com os resultados alcançados, concluímos que o bloco haplotípico
utilizado demonstrou ser uma ferramenta eficaz, capaz de fornecer informações
coerentes capaz de corroborar com dados históricos e moleculares, ampliando o
conhecimento sobre os aspectos evolutivos das populações humanas.
� �
ABSTRACT
The genetic variability of the human populations has been investigated using different
genetic markers. In this thesis our main aim was to utilize molecular markers in a
region with low recombination rates of the X chromosome (Xq21.1-Xq21.3) as a tool for
evolution and population studies. Used an haplotypic block formed by four
microsatellites (DXS1012, DXS1002, DXS1019 and DXS8114) and an Alu insertion
(DXS225) in complete linkage disequilibrium, to investigate the genetic diversity of the
human populations. The first group studied was composed by 667 men distributed in
51 populations from the HGDP-CEPH panel, where we found a total of 187 haplotypes
distributed in the five main regions: Africa, Asian East, Eurasia, Oceania and America;
129 of these were region-specific haplotypes. Visualized a great reduction in the
haplotypic diversity after the out of Africa (0.992±0.003) for the Asian East
(0.967±0.005) and Eurasia (0.953±0.006) that reaches the smaller values in the
Oceania (0.885±0.047) and America (0.839±0.038). Coalescent analysis permitted the
estimation of the time of the most recent common ancestor (TMRCA) for the haplotypic
block of 182,000 years (56,700-479,000) and the time of the Alu insertion DXS225 of
94,400 years (24,300-310,000) that corroborate with the African and recent origin of
the modern man (Ex Africa). In the second group analyzed: 204 males classified as
White and Black of the Sao Paulo city, evaluated the ancestry contribution from Africa
and Eurasia to the Black and White Brazilians. We found 29% in the White and 55% in
the Black Brazilians of African contribution, whereas the Eurasian contribution was
71% for the White and 45% for the Black Brazilians. With the obtained results we
concluded that the haplotypic block used in this work, demonstrated to be an efficient
tool that provide coherent information that corroborate with historical and molecular
data increase the knowledge about the evolution aspects of human populations.
16
1 INTRODUÇÃO
17
1.1 ESTUDOS EM EVOLUÇÃO HUMANA
A origem da espécie humana, Homo sapiens, remonta, aproximadamente,
entre 100 a 200 mil anos e tem estimulado uma série de pesquisas científicas em
distintas áreas que visam compreender os processos que ocorreram antes e após a
origem do homem moderno (Cavalli-Sforza e Feldman, 2003). Atualmente a genética
tem contribuído bastante para o estudo da origem do homem moderno, principalmente
pelo fato de que qualquer indivíduo pode ser um objeto de estudo em potencial,
diferentemente das áreas de arqueologia e antropologia, que dependem de dados
mais escassos, como registros fósseis (Kaessmann e Pääbo, 2002). Além da
genética, outros enfoques são utilizados para estudar eventos evolutivos, tais como: o
estudo de línguas nativas, mitos e lendas, nomes de localidades geográficas e outros
relatos da nossa evolução cultural (Santos e Tarazona-Santos, 2002a).
Atualmente, a teoria mais aceita para origem do homem anatomicamente
moderno (Homo sapiens) é a “Ex Africa” , mais conhecida como “Out of Africa”, que
sugere ter o homem moderno uma origem africana recente, por volta de 100 a 200 mil
anos, e que, durante a expansão geográfica pelos diversos continentes, teria
substituído por completo as populações de humanos arcaicos (derivados dos Homo
erectus que migraram da África há 1,5 milhões de anos), que povoavam anteriormente
a Europa e a Ásia (Carvalli-Sforza e Feldman, 2003).
Estudos moleculares, principalmente com os marcadores de linhagens, que
representam segmentos de DNA passados ao longo das gerações sem a influência da
recombinação, como o DNA mitocondrial (Cann et al., 1987, Templeton, 1997) e o
cromossomo Y (Hammer, 1995), corroboram com a origem africana recente (Ex
Africa) para a origem do homem moderno e são utilizados para traçar as prováveis
rotas de migrações do Homo sapiens moderno (Figura 1).
18
Figura 1. Rotas de migrações do Homo sapiens moderno pela análise do DNA mitocondrial. As
letras representam os haplogrupos mitocondriais encontrados nas populações mundiais. Figura
retirada do sítio: http://upload.wikimedia.org/wikipedia/en/b/b9/human_mtDNA_migration.png.
Na história da nossa espécie, os últimos 12 mil anos foram cruciais para a
formação das populações nativas, isto é, aquelas que se encontravam nos seus
continentes antes das migrações que ocorreram após o século XV. Essas migrações
iniciaram um processo de miscigenação altamente intensificado (Santos e Bonatto,
2004). Atualmente, muitos trabalhos com diferentes marcadores moleculares têm
como objetivo estudar a origem das distintas populações nativas da África, Ásia,
Europa e América (Cavalli-Sforza e Feldman, 2003). Exemplos de trabalhos que
buscavam analisar a origem de populações nativas e miscigenadas, utilizando
marcadores de linhagens como: “O povoamento das Américas” e a “Formação do
Povo Brasileiro”, são detalhados a seguir.
1.2 O povoamento das Américas
O processo de colonização pré-histórica do continente americano vem sendo
estudado através de achados arqueológicos, pela antropologia física, lingüística, e
genética, que evidenciam que os primeiros habitantes do continente americano vieram
da Ásia passando pela Beríngia, uma ponte de terra formada entre 40.000 e 13.000
19
anos atrás, quando o nível do mar estava mais baixo, durante épocas glaciais, a qual
ligava o Alasca à Sibéria (Santos e Bonatto, 2004). No entanto, existem incertezas
sobre a origem, dentro da Ásia, das populações que migraram para o continente
americano e também quanto à data da primeira migração e o número de ondas
migratórias (Hey, 2005; Santos e Tarazona-Santos, 2002b).
Estudos mais recentes com nativos americanos buscam responder a questões
em um nível geográfico mais específico, como as populações dos Andes (Tarazona-
Santos et al., 2001; Rodriguez-Delfin et al., 2001) e outras populações da América do
Sul e do Norte (Wang et al., 2007; Corella et al., 2007).
1.3 A formação do povo brasileiro
O Brasil é conhecido como uma nação altamente diversa em etnias, com um
nível acentuado de miscigenação, sendo os brasileiros uma das populações mais
heterogêneas do mundo (Pena et al., 2000). A natureza triíbrida do brasileiro é
resultado de cinco séculos de intensa miscigenação entre europeus (os
colonizadores), africanos (os escravos) e ameríndios (os habitantes nativos do Brasil)
(Ribeiro, 1995). O processo de miscigenação iniciou-se com os primeiros
colonizadores e se intensificou devido à necessidade de povoar a colônia e assim
garantir o domínio português frente às constantes ameaças de invasão do território por
outras nações. Os africanos foram introduzidos no século XVI para servirem de mão-
de-obra escrava no cultivo da cana de açúcar, e mais tarde, na mineração e nas
plantações de café. Durante 1808, houve a abertura dos portos brasileiros para as
nações amigas, por meio de uma carta régia promulgada pelo príncipe regente Dom
João (Salzano e Freire-Maia, 1967), e durante os anos de 1820-1975,
aproximadamente 5.686.133 imigrantes chegaram ao Brasil, entre portugueses
(1.204.394), italianos, seguidos por espanhóis, alemães, sírios, libaneses e japoneses
(IBGE, 2000). No entanto, a entrada desses imigrantes se deu de forma heterogênea,
entre as diferentes regiões do Brasil (Pena, 2002).
20
Diversas pesquisas têm como objetivo reconstituir e compreender, do ponto de
vista genético, o processo que gerou o povo brasileiro, e qual seria a contribuição real
dos três grupos étnicos em sua composição genética. O trabalho inicial foi chamado
de retrato molecular do Brasil (Pena, 2000), que analisou homens auto-classificados
como Brancos, de quatro regiões do Brasil (Norte, Nordeste, Sudeste e Sul), os
resultados desse trabalho revelaram que a linhagem paterna desses indivíduos
brasileiros é quase exclusivamente européia (Carvalho-Silva et al.,2001), enquanto
que a herança materna estava distribuída entre européia (39%), africana (28%) e
nativa americana (33%) (Alves-Silva et al, 2000). Esses dados genéticos corroboraram
com os dados históricos sobre a colonização do Brasil, em que a linhagem paterna
européia, juntamente com a linhagem materna formada por mulheres ameríndias e
africanas, deu origem aos primeiros brasileiros.
Trabalhos mais recentes realizados com indivíduos de diferentes regiões
brasileiras tiveram como objetivo verificar a existência de correlação entre a cor da
pele e a ancestralidade genômica, utilizando marcadores informativos de
ancestralidade (AIMs) (Parra et al., 2003) e microssatélites autossômicos (Pimenta et
al., 2006). Esses trabalhos concluíram que em nível individual, existe pouca correlação
entre cor e ancestralidade genômica em brasileiros.
Outros estudos com brasileiros buscam inferir a origem africana dos escravos
que vieram para as diferentes regiões do Brasil (Bortolini et al., 2004; Abes-Sandes et
al., 2004; Silva et al., 2006; Hünemeier et al., 2007; Gonçalves et al., 2008).
1.4 Marcadores moleculares
Para estudar todas essas questões sobre a origem e evolução do homem
moderno, a genética molecular utiliza a variabilidade genômica para compreender sua
origem e manutenção, usando-a como ferramenta para inferir cenários evolutivos
passados. Essa variabilidade constitui a heterogeneidade do genoma humano, a qual,
utilizada em estudos genéticos, é denominada, coletivamente, como marcadores
21
genéticos moleculares (Cavalli-Sforza, 1998). Esses marcadores podem ser
classificados em: polimorfismos de seqüência, tais como, os SNPs (Single Nucleotide
Polymorphisms), ou polimorfismos de ponto (Taillon-Miller et al.,1998, Brookes, 1999),
os polimorfismos de inserções e deleções (INDELs) (Weber et al., 2002), os
polimorfismos de inserção Alu (Roy-Engel et al., 2001) e os polimorfismos de tamanho
ou microssatélites (Dib et al., 1996).
Podemos tratar como marcadores moleculares as variações distribuídas nos
cromossomos autossômicos e as variações presentes no DNA mitocondrial e a parte
não-recombinante do cromossomo Y, que chamamos de marcadores de linhagens,
devido à ausência de recombinação tanto para o DNA mitocondrial, como para a
região do cromossomo Y não-homóloga ao cromossomo X. Nesses sistemas os
marcadores são herdados em bloco, e a relação entre os alelos para os locos
estudados constitui um haplótipo (Santos et al., 1995).
1.5 Polimorfismos de seqüência
1.5.1 SNPs
Uma classe de marcadores moleculares é constituída pelos SNPs (Single
Nucleotide Polimorphisms) ou polimorfismos de ponto que se encontram no genoma
humano, em uma densidade muito alta, 1 a cada 1000 bases (Taillon-Miller et al.
1998). Desde 2001, com a publicação do primeiro rascunho do genoma humano, fez-
se o primeiro grande catálogo de SNPs para o genoma humano, o que propiciou a
criação de diversos bancos de dados para armazenamento de novos SNPs, como o
dbSNP (www.ncbi.nlm.nih.gov/SNP). O grande interesse na variabilidade acumulada
no genoma humano deve-se à importância dos SNPs em estudos sobre a evolução
humana e, principalmente, à sua utilidade como marcadores moleculares em estudos
de associação para identificação de variantes associadas à susceptibilidade a
doenças e drogas (Cavalli-Sforza, 2005; Pena, 2007).
22
1.5.2 INDELs
Outro tipo de marcadores moleculares que vem ganhando destaque são os
INDELs, ou polimorfismo de inserções e deleções no genoma, no qual representam a
segunda variação mais comum (Bennett et al., 2004). Sua utilização aumentou após a
publicação do trabalho de Weber et at., (2002), que descreveu 2.000 Indels
distribuídos pelo genoma humano, que ocorrem como variantes polimórficas
encontradas na população geral. Atualmente, diversos trabalhos estão sendo
publicados em que se utilizam esses marcadores em estudos evolutivos e
populacionais (Bastos-Rodrigues et al., 2006).
1.5.3 Inserções Alu
As inserções Alu são classes de elementos transponíveis bastante abundantes
no genoma humano (International Human Genome Sequencing Consortium, 2001). A
denominação Alu advém da presença de um sítio de restrição para a enzima AluI
dentro da seqüência consenso (Houck et al., 1979). Estruturalmente a seqüência Alu
apresenta homologia com o 7SLRNA, uma molécula citoplasmática extremamente
conservada entre os eucariotos (Labuda e Zietkiewicz, 1994). A primeira seqüência
Alu apareceu nos genomas de primatas há aproximadamente 65 milhões de anos
(Deininger et al., 1992). As inserções Alu são uma classe de SINEs (Short
Interspersed Nuclear Elements) que constituem uma família de mais de 500.000
seqüências, de aproximadamente 300 pares de bases, as quais têm se inserido no
genoma de primatas por meio da transposição mediada por um intermediário de RNA
transcrito pela RNA polimerase III (Schmid, 1996). No entanto, as inserções Alu não
são capazes de se retrotranspor sozinhas e utilizam a maquinaria de retrotransposição
dos LINEs (Long Interspersed Nuclear Elements) (Callinan et al., 2003). As inserções
Alu possuem algumas características, como a estabilidade da inserção, a ausência de
mecanismos que removam completamente um elemento Alu de seu sítio de inserção,
23
a existência de seqüências Alu específicas que ainda não se fixaram no genoma, o
conhecimento do seu estado ancestral e a possibilidade de analisá-las facilmente
utilizando a PCR (Batzer e Deininger, 1991). Essas características fazem dessas
seqüências excelentes marcadores genéticos que estão sendo bastante utilizados em
diferentes estudos populacionais (Battilana et al., 2006, Athanasiadis et al., 2007).
Atualmente existem diversos banco de dados específicos para seqüências Alu, um
exemplo AluGene (http://Alugene.tau.ac.it) (Dagan et al., 2003)
1.6 Polimorfismos de tamanho
1.6.1 Microssatélites
Um dos marcadores moleculares amplamente utilizados para o mapeamento
de genes e estudos evolutivos são os microssatélites (Dib et al. 1996). Estes são locos
com repetições em tandem, cuja unidade repetitiva possui de 1 a 6 pares de bases. A
variabilidade inter-alélica dos microssatélites é, geralmente, determinada pela
diferença no número de repetições, e a alta variabilidade dos locos de microssatélites
é produto da alta taxa de mutação desse tipo de loco (10-2 - 10-5 mutações por loco por
geração, Brinkmann, et al.,1998, Leopoldino et al., 2003), em comparação a outras
regiões do genoma (10-7-10-9 mutações por nucleotídeo, por geração, Nei et al., 1987;
Brookes, 1999). O tipo mais comum de mutações, em microssatélites, geralmente leva
a um aumento ou diminuição do número de repetições de uma unidade ou mais, e
acredita-se que esse tipo de mutação ocorre à nível molecular, por meio de uma
“derrapagem” da fita de DNA, causando um erro na leitura da DNA polimerase durante
a replicação (Schlotterer e Tautz 1992, Donnell et al., 1994). Devido ao alto nível de
variabilidade que apresentam, os microssatélites são usados para estudos evolutivos
em diversas espécies, inclusive na humana (Jorde et al., 1997).
24
1.7 Marcadores de linhagem
1.7.1 DNA mitocondrial
O DNA mitocondrial (mtDNA) é o material genético encontrado no interior das
mitocôndrias, organelas produtoras de energia presentes no citoplasma das células. O
mtDNA humano é uma molécula dupla-fita circular, apresenta 16.569 pares de base
(pb), pode ser dividido em duas regiões principais: a região codificadora, que constitui
cerca de 94% da molécula que contém os genes para os diferentes tipos de RNA e
proteínas necessários para a síntese de componentes catalíticos do sistema de
fosforilação oxidativa; e as regiões hipervariáveis I e II. Uma simples célula pode
conter centenas de moléculas que possuem normalmente seqüências idênticas e
comportam-se como um genoma haplóide (Wallace,1995). O mtDNA possui algumas
características especiais que o tornam uma ferramenta útil para o estudo de genética
de populações, como o modo de herança uniparental (quase exclusivamente
materno), a taxa de evolução rápida (até 25 vezes mais rápido que o DNA nuclear) e a
ausência de recombinação (genoma haplóide) (Anderson et al., 1981).
Essas características fazem do DNA mitocondrial uma fonte rica em informações para
estudos filogenéticos, campo de estudo dos princípios e processos que governam a
distribuição geográfica de linhagens genealógicas dentro das espécies, com ênfase
em fatores históricos (Pena, 2000).
1.7.2 Cromossomo Y
O cromossomo Y humano possui aproximadamente 60 megabases (Mb)
representando 2-3% do genoma haplóide, contém aproximadamente 30 genes, a
maioria deles relacionados com a determinação do sexo e características secundárias
masculinas (Lahn et al., 2001). Esse cromossomo possui regiões de homologia com o
cromossomo X denominadas pseudo-autossômicas (PARs), que ficam nas
extremidades do braço curto (Yp) e longo (Yq), PAR1 e PAR2, que possuem 2,6 e
0,34 Mb, respectivamente (Vogt et al., 1997). A natureza não-recombinante, de grande
25
parte da estrutura do cromossomo Y, presente em única cópia nos homens, e
transmitida clonalmente de pai para filho, oferece importantes possibilidades de
aplicações em estudos de evolução humana. Como os locos estão em completa
ligação, as mutações se acumulam, seqüencialmente, nas linhagens paternas através
das gerações, dando informações a respeito da história biológica das linhagens
paternas humanas (Santos e Tyler-Smith,1996).
1.8 Blocos haplotípicos
Podemos chamar de bloco haplotípico, o conjunto de marcadores em
determinada região que estão em desequilíbrio de ligação, e que, como o
cromossomo Y e o DNA mitocondrial, são transmitidos juntos, ou seja, em bloco, para
seus descendentes (Gabriel et al., 2002). Podemos considerar que o genoma humano
é constituído por um mosaico de blocos haplotípicos (Pääbo, 2003), que podem ser
utilizados em estudos de associação com doenças (The International HapMap
Consortium, 2005, Shriver et al., 2003) e em estudos populacionais (Seldin et al.,
2004; Pereira e Pena, 2006). Outra alternativa de estudo com blocos haplotípicos é a
combinação de marcadores com diferentes taxas de mutação (Tishkoff, et al., 2000).
Por exemplo, a utilização de microssatélites, que possuem uma evolução rápida, faz
com que tenhamos haplótipos idênticos em estado, mas que não possuem a mesma
descendência, diminuindo a capacidade dos haplótipos em resolver as relações entre
diferentes populações. Essa desvantagem dos microssatélites pode ser resolvida
associando-os a marcadores de evolução lenta, como os polimorfismos de
inserção\deleção, polimorfismos de inserção Alu e SNPs. O uso combinado desses
marcadores, em regiões não-recombinantes do genoma, oferece oportunidades
singulares para elucidar a história evolutiva das populações naturais, pois fornece uma
informação evolucionária complementar (Mountain et al., 2002).
26
1.9 Análise de desequilíbrio de ligação
Os determinantes do desequilíbrio de ligação, ou associação gamética, entre
dois locos vão desde fatores associados estritamente ao genoma (mutação,
recombinação, conversão gênica) a aspectos relacionados à dinâmica das populações
(expansões, diminuições e migrações). Os microssatélites foram os primeiros
marcadores a serem efetivamente utilizados no sentido de estabelecerem padrões de
desequilíbrio de ligação para todo o genoma humano e apontaram para a grande
heterogeneidade desse fenômeno ao longo do genoma (Huttley et al., 1999).
1.10 O cromossomo X humano
1.10.1 Características do cromossomo X
O cromossomo X humano teve seu seqüenciamento finalizado em março de
2005 (Ross et al., 2005), fornecendo informações mais precisas sobre suas
características principais. A sua seqüência completa corresponde a aproximadamente
165 megabases, compreendendo, aproximadamente 5% do genoma humano e possui
uma densidade gênica baixa em comparação com outros cromossomos, contendo
apenas 1.100 genes; no entanto, contém muitos elementos repetitivos, principalmente
LINEs (Long Interspersed Nuclear Elements) da família L1, presentes em 29% da
seqüência do cromossomo X, comparáveis com a média do genoma de 17% (Ross et
al.,2005). O cromossomo X possui um mecanismo de compensação da dosagem
gênica, para compensar o desequilíbrio gênico decorrente da cópia extra presente nas
mulheres (Lyon, 1961). A inativação de um dos cromossomos X ocorre no começo do
desenvolvimento e se inicia a partir do centro de inativação do X (XIC) (Ross et al.,
2005). Porém, após a publicação da seqüência completa do cromossomo X, publicou-
se um trabalho mostrando que, mesmo no cromossomo que é inativado, ocorre a
expressão de alguns genes, tendo as mulheres pelo menos 16% a mais de genes
expressos que os homens (Carrel e Willard, 2005).
27
Processos evolucionários, provavelmente, modularam a estrutura e o
comportamento do cromossomo X de várias maneiras, influenciando nas
características de conteúdo de repetições, taxa de mutação, conteúdo gênico e
estrutura de haplótipos (Ross et al., 2005).
1.10.2 Uso do cromossomo X em estudos evolutivos
O cromossomo X possui características populacionais e moleculares que são
peculiares e podem ser importantes em estudos populacionais (Schaffner, 2004), tais
como:
1. Alternância entre os sexos
Existem, na população, três cromossomos X para cada quatro cromossomos
autossômicos, já que, no homem, os cromossomos sexuais são representados por um
cromossomo X e um cromossomo Y, e na mulher, por dois cromossomos X. Em um
determinado momento, tem-se 1/3 dos cromossomos X no sexo masculino e 2/3 no
sexo feminino. Na geração seguinte, os cromossomos X da geração masculina
anterior irão constituir metade dos 2/3 de cromossomos X presentes na geração
feminina. No caso do sexo masculino, 1/3 de cromossomos X presentes na próxima
geração serão de origem feminina. Assim, 2/3 dos cromossomos X alternam de sexo a
cada geração. Essa é uma característica bastante importante, pois existem diferenças
no comportamento evolucionário de homens e mulheres, sendo as mulheres, em
algumas populações, mais móveis geograficamente (Hamilton et al., 2005), o que faz
com que os marcadores do cromossomo X tracem uma história evolutiva intermediária
entre os sexos (Schaffner, 2004).
2. Menor número efetivo
Em uma população com tamanho N, temos 2N de autossomos, mas apenas 1,5N de
cromossomos X. Comparando com os autossomos, temos na população 3/4 de
cromossomos X e 1/4 de cromossomo Y e DNA mitocondrial. Assim, o cromossomo X
tem um tamanho efetivo intermediário entre os autossomos e, os marcadores de
28
linhagem (Y e mtDNA). Essa redução no tamanho efetivo torna os marcadores de
linhagens mais suscetíveis às forças evolutivas, como a deriva genética.
3. Menor taxa de recombinação
A recombinação no cromossomo X ocorre, na maior parte do cromossomo, apenas
nas mulheres, com exceção das regiões pseudo-recombinantes das extremidades do
cromossomo que fazem recombinação com o cromossomo Y. Dessa forma, a sua taxa
de recombinação é aproximadamente 2/3 da autossômica. Além disso, o cromossomo
X apresenta regiões com diminuição da taxa de recombinação, como a região Xq13.3-
Xq21.1, onde a taxa de recombinação é de 0,116 cM/Mb, enquanto que a média do
cromossomo é de 1,3 cM/Mb (Nagaraja et al., 1997).
4. Menor taxa de mutações
Como a taxa de mutações é bem maior nos homens (devido ao alto número de
divisões das células germinativas) do que nas mulheres, e em cada geração, 2/3 dos
cromossomos X estão em mulheres, a taxa de mutação será menor para as
seqüências do cromossomo X (Schaffner, 2004).
5. Estudo de haplótipos
O fato de o cromossomo X estar presente, em cópia única, em homens permite que se
estabeleça a fase de haplótipo, possibilitando a identificação direta da relação entre os
alelos para os vários locos estudados (Schaffner, 2004).
Todas essas características fazem do cromossomo X uma ferramenta robusta
para estudos populacionais e evolutivos. Com os primeiros trabalhos sendo publicados
a partir de 1997, (Hey, 1997), seguido por Harris e Hey (1999), estimaram o tempo de
divergência entre as populações africanas e não-africanas em 200 mil anos, utilizando
a seqüência do gene PDHA1. No mesmo ano, Kaessman et al. publicaram um
trabalho utilizando 10Kb da região Xq13.3, para inferir o tempo do mais recente
ancestral comum (TMRCA) do cromossomo X em 535,000±119,000 anos. Mais
recentemente, foram realizados estudos com diferentes populações, Painel do HGDP-
CEPH usando 20 microssatélites do X (Ramachandran et al.; 2004), populações da
29
Eurásia (Katoh et al., 2002; Kaessmann et al., 2002; Xiao et al., 2004; Latini et al.,
2004, Laan et al., 2005), populações asiáticas (Garrigan et al., 2005), populações
africanas (Lovell et al., 2005) populações da Mongólia (Katoh et al., 2005) e
populações de brasileiros (Pereira e Pena, 2006).
A publicação desses trabalhos revelaram mais uma importante característica
do cromossomo X; cada região e marcador analisado permite contar diferentes
histórias evolutivas sobre as populações humanas (Schaffner, 2004).
30
2 OBJETIVOS
31
2.1 OBJETIVO GERAL
Realizar estudos filogeográficos utilizando marcadores moleculares localizados
em uma região com baixa taxa de recombinação no cromossomo X humano.
2.2 OBJETIVOS ESPECÍFICOS
1. Padronizar um bloco haplotípico do cromossomo X localizado em uma
região de baixa taxa de recombinação do cromossomo X.
2. Analisar a filogeografia das populações mundiais do Painel do HDGP-
CEPH.
3. Estimar o tempo de origem da inserção DXS225.
4. Estimar o tempo do mais recente ancestral comum (TMRCA) para o
bloco haplotípico estudado.
5. Analisar a variabilidade genética e estrutura populacional dos
brasileiros.
32
3 MATERIAL E MÉTODOS
33
3.1 POPULAÇÕES E AMOSTRAGENS
3.1.1 Amostras do Painel do HGDP-CEPH
Foram analisados 677 homens não-aparentados, pertencentes a 52 populações
mundiais do Painel do HGDP-CEPH distribuídas em sete regiões mundiais (África
Sub-Sahariana, Oriente Médio, Ásia Central, Leste Asiático, Oceania, Europa e
América) (Rosenberg, 2006) (Figura 2). As amostras foram coletadas pelos
laboratórios que fazem parte do Projeto de Diversidade Genoma Humano (HGDP) e
depositadas na Fundação Jean Dausset (CEPH- Centre d’Etude du Polymorphisme
Humain), em Paris, a qual fornece amostras de DNA para pesquisadores que estudam
a história das populações modernas, com diferentes marcadores moleculares, e que,
posteriormente, depositam seus resultados no banco de dados da fundação (Cann et
al., 2002).
3.1.2 Amostras de indivíduos Brasileiros (Pretos e Brancos de São
Paulo)
Foram analisados 204 indivíduos, sendo 97 deles classificados como Pretos e
107 classificados como Brancos, na cidade de São Paulo (Figura 2). As amostras de
doadores de sangue do hemocentro foram cedidas pelo Dr. Sérgio Bydlowski (USP-
São Paulo). Os indivíduos, seus pais e avós (maternos e paternos) foram auto-
classificados de acordo com a cor da pele e hetero-classificados por um entrevistador,
que os classificou, fenotipicamente, como indivíduos Brancos ou Pretos. Todos os
indivíduos assinaram o termo de consentimento para uso de sua amostra de DNA em
trabalhos científicos. E a utilização das amostras foi aprovada pelo comitê de ética da
USP (Universidade de São Paulo).
34
Figura 2. Mapa com a localização geográfica das populações analisadas do Painel do HGDP-
CEPH e população da cidade de São Paulo (Pretos e Brancos).
�
3.2 Extração de DNA
As amostras de brasileiros estudadas foram cedidas como alíquotas de DNA
extraídas segundo protocolo de extração descrito em Bydlowski, et al., 2003. As
amostras de DNA dos indivíduos Andinos foram extraídas pelo protocolo padrão de
“salt out” descrito em Sambrook et al., 1981. As amostras do Painel do HGDP-CEPH
vieram liofilizadas e foram diluídas no laboratório de Genética Bioquímica da UFMG,
para uma concentração final de 20 ng/µl de DNA estoque que foi diluído 1:1 para uso.
3.3 Nomenclatura da inserção Alu
A inserção Alu estudada recebeu o nome de XAP (X-chromosome Alu
Polymorphic Element) (Pereira et al., 2006), em alusão à inserção Alu do cromossomo
Y, nomeada de YAP (Y-Chromosome Alu Polymorphic Element) (Hammer, 1994). Ao
ser depositada no banco de dados do GDB (The Human Genome database,
www.gdb.org), recebeu a denominação de DXS225, com número de acesso no
GDB:11524531 (www.gdb.org/gdb-bin/genera/accno?accessionNum=GDB:11524531).
3.4 Tipagem da inserção Alu (DXS225)
A tipagem do DXS225 foi feita pela técnica de PCR, utilizando-se os protocolos
de “hot start” e "step down" (Pereira et al., 2006), sendo a seqüência do iniciador direto
DXS225-F: 5’ TCC AGA ATC TGC AAA GAA CT 3’, e do iniciador reverso DXS225-R:
5’ ATG ACC AGT GAT GAA GAG CT 3’. O programa utilizado foi padronizado com
desnaturação a 94oC, durante 5 minutos, adição da Taq polimerase, 24 ciclos de
94oC/30 seg, 64oC/30 seg e 72oC/1 min. Em seguida, cinco baterias de cinco ciclos,
diminuindo-se um grau na temperatura de anelamento a cada bateria. Desta forma, na
última bateria estaríamos trabalhando com a temperatura de anelamento do par de
iniciadores que é de 59oC. À última extensão foram acrescidos 5 min. A reação de
PCR foi feita em um volume final de 12,5�l, contendo 50ng de DNA genômico, 0,6�M
de cada iniciador, 200�M de dNTPs, 0,5 unidades de Taq DNA Polimerase em tampão
36
contendo Tris-HCl 10 mM, pH 8.5; 1,5mM de MgCl2 (Phoneutria, Belo Horizonte,
Brasil). Os produtos da PCR foram visualizados em gel de agarose 2%, com brometo
de etídeo na concentração final de 0,5�g/ml. As corridas foram realizadas no aparato
Scooter 100 (Biokey American Instruments, USA), que permite correrem até 100
amostras por gel, a 80 volts, e os resultados foram visualizados utilizando-se um
transiluminador com luz ultravioleta, e, em seguida fotografados.
3.5 Seleção de novos marcadores
A procura por novos marcadores foi feita na região dentro do intervalo Xq21.1-
Xq21.3, que possui 130Kb, onde o marcador DXS225 foi encontrado (Pereira et al.,
2006). Essa região foi descrita por Nagaraja et al.,(1997), como possuidora das mais
baixas taxas de recombinação do cromossomo X, na qual são encontrados cinco
microssatélites (DXS995, DXS8076, DXS1002, DXS8114 e DXS1050) (Pereira e
Pena, 2006), que foram utilizados na construção do mapa genético do GÉNÉTHON
(Dib. et al, 1996). Esses microssatélites foram analisados e demonstraram estar em
uma região com depressão de recombinação e distância genética zero, o que significa
ausência de recombinação nas 291 meioses analisadas para a construção do mapa
genético do GÉNÉTHON. A utilização desses microssatélites oferecia a vantagem de
poder associar-se diretamente a posição dos marcadores no mapa físico, já que o
mapa genético, utilizado no trabalho de integração, foi o mapa do GÉNÉTHON
(http://www.cephb.fr/cephdb/dumps.html).
Para procurar por novos marcadores, utilizou-se o programa Tandem Repeats
Finder (http://tandem.bu.edu/trf/trf.html) (Benson, 1999), que identifica regiões
repetitivas em seqüências de DNA. Por meio desse programa, identificamos dois
novos microssatélites que flanqueiam a inserção Alu (DXS225): um pentanucleotídeo
com repetição (ATTTT)5 e um dinucleotídeo (CA)11TA*(CA)7, sendo este um
microssatélite imperfeito.
37
Esses novos marcadores foram depositados no banco de dados do GDB (The
Human Genome Database, www.gdb.org), recebendo o pentanucleotídeo a
denominação DXS1012, com número de acesso GDB: 11524532 (www.gdb.org/gdb-
bin/genera/accno?accessionNum=GDB:11524532) e o dinucleotideo, a denominação
DXS1019, com número de acesso GDB:11524534 (www.gdb.org/gdb-
bin/genera/accno?accessionNum=GDB:11524534).
3.6 Localização física dos marcadores
Os marcadores analisados pertencem ao “contig” genômico com acesso no
NCBI NT_011651.16, o qual possui 36Mb, construído a partir da versão 35 do genoma
humano do NCBI. Esse “contig” fica localizado na região Xq21.1-Xq21.31. As posições
dos marcadores foram obtidas no banco de dados da Universidade de Santa Cruz da
Califórnia, por meio da página UCSC Genome Browser (http://genome.ucsc.edu/), da
versão de março de 2006.
3.7 Tipagem dos microssatélites
Os microssatélites foram padronizados em reações de PCR multiplex, com um
volume final de 10µl, contendo 50ng de DNA genômico, 0,06-0,08 µM de cada
iniciador direto, 0,6-0,8µl de cada iniciador reverso, 0,6-0,8 µM do iniciador M13 (-40)
marcado com fluoresceína (ver Tabela 1), 200�M de dNTPs, 0,5 unidades de Taq
Platinum (Invitrogen) em tampão contendo Tris-HCl 10mM, pH 8,5; 1,5mM de MgCl2
(Phoneutria, Belo Horizonte, Brasil). Todos os iniciadores foram desenhados com
cauda de M13 (-40). Os iniciadores diretos foram utilizados com 1/10 da concentração
dos iniciadores reverso e os M13. As tipagens dos microssatélites foram feitas com a
utilização do seqüenciador automático capilar de alto desempenho: MegaBace 1000
(GE/ Amershan Pharmacia Biotech). Cerca de 2µl dos produtos da PCR eram
adicionados a 8µl do marcador interno do MegaBace ET550-R (Amershan
Biosciences). No MegaBace, os produtos eram injetados a 3kV, com uma voltagem de
corrida de 10kV, e o tempo de injeção era de 80 segundos e 75 minutos de corrida. Os
38
resultados foram analisados utilizando-se o programa Fragment Profile versão 1.2
(GE/ Amershan Biosciences).
39
Tabela 1. Seqüência dos iniciadores dos microssatélites analisados.
DXS995 5’ GTT TTC CCA GTC ACG ACA GGA AAG AGT ACA GAA GGG 3’
5’ AAT GCG TTC CCC AAA TGT 3’
DXS8076 5’ GTT TTC CCA GTC ACG ACA ACT TAG GAT ACC CCA TTA TGT G 3’
5’ AGT GCT ACC TCC ACA AAC AG 3’
DXS1012 5’ GTT TTC CCA GTC ACG ACG TGCCAG GAA CTC TTC TAA CTG CT 3’
5’ TCG GGA GAG TGA GGC ACG AGA 3’
DXS1002 5’ GTT TTC CCA GTC ACG ACC TGC TAC CCT TTA GTT CTC TC 3’
5’TCC ATG TTG CTG CGA A 3’
DXS1019 5’ GTT TTC CCA GTC ACG ACG TTC TGC ACA TGT ATC CCA GAA 3’
5’ TCA ATG CAC AAA AGT CAG CAG GA 3’
DXS8114 5’ GTT TTC CCA GTC ACG ACA CCT GTA AGA AAT TAA AGG CAC 3’
5’ TGT ATA GCC AGT GGA ATG TG 3’
DXS1050 5’ GTT TTC CCA GTC ACG ACC CTA GGG GAT CCT TAT TAA AAA T 3’
5’ CCT AGT TTT AGA AGT TTC AAT AGC A 3’
M13 (-40) 5’ GTT TTC CCA GTC ACG AC 3’
Destaca-se em negrito, o iniciador M13 (-40).
40
3.8 Análise estatística
3.8.1 Diversidade Haplotípica
A diversidade haplotípica foi calculada para os marcadores analisados
utilizando-se a mesma fórmula para o cálculo da diversidade de Nei: H=1-�pi2.n/(n-1)
(Nei, 1978). Neste caso, pi representa a freqüência do haplótipo ith. A diversidade
haplotípica diz respeito à probabilidade de dois genomas amostrados ao acaso em
uma população possuírem haplótipos diferentes.
A estrutura genética das populações e os parâmetros básicos de diversidade
molecular, como, o número de haplótipos diferentes para cada um dos grupos, bem
como o número de haplótipos compartilhados entre os grupos, a diversidade
haplotípica, a análise de variância molecular e a análise de desequilíbrio de ligação
foram calculados usando-se o pacote de programas de genética de populações
Arlequin 2.0 (Schneider et al., 2000).
3.8.2 Análise de desequilíbrio de ligação
Realizamos a análise de desequilíbrio de ligação com o programa Arlequin 2.0,
que representa uma extensão do teste exato de Fisher, com tabelas de contingências,
e os resultados são apresentados em valores de significância (p) com seu erro padrão
(Schneider et al., 2000).
Com a colaboração do Prof. Ian J. Wilson, da Universidade de Newcastle, do
Reino Unido, foram realizadas análises adicionais para se verificar a ausência de
recombinação na região onde está localizado nosso bloco haplotípico, pela análise da
taxa de recombinação para toda a região e para os marcadores analisados por meio
do modelo de Produto de Aproximação Condicional (PAC - Product of Approximate
conditionals) (Li e Stephens, 2003). Fizeram-se cálculos para os valores de
desequilíbrio D’ (coeficiente normalizado de desequilíbrio de ligação) utilizando uma
extensão multialélica da medida padronizada de desequilíbrio (Hedrick, 1987).
41
3.8.3 Estrutura populacional
Para averiguar se a informação haplotípica obtida com os locos de
microssatélites é capaz de identificar algum nível de estruturação entre as populações
estudadas, utilizamos dois métodos: o primeiro foi a análise de variância molecular
AMOVA (Excoffier et al.,1992), que permite uma avaliação hierárquica (diferentes
graus de estruturação populacional) e a identificação da distribuição dos componentes
de variância entre: a) indivíduos da mesma população, b) entre populações dentro de
grupos definidos e c) entre grupos (geográficos, lingüísticos etc.).
O segundo método utilizado foi uma análise Bayesiana da diferenciação
genética entre populações, por meio do programa BAPS 2.2 (Bayesian Analysis of
Population Structure), desenvolvido por Corander et al., (2003; 2004). A maior
vantagem desse programa é que o número de populações é tratado como um
parâmetro desconhecido. O que permite que o programa perceba se duas populações
são consideradas geneticamente diferentes, devido a recente fundação ou alto nível
de fluxo gênico, essas populações são consideradas como uma única população
panmítica (Corander et al., 2003). Todos os grupos de combinações são considerados
igualmente prováveis a priori. Então o programa determina a partição mais provável
entre os grupos de população, dentro de um número de agrupamentos empiricamente
plausível (Corander et al., 2004).
3.8.4 Proporção de mistura
Utilizamos um método de maximum likelihood, desenvolvido por Wang (2003),
implementado no programa LEADMIX 1.0 (Likelihood Estimation of ADMIXture) para
estimar a proporção de mistura, com dados de marcadores genéticos das populações
parentais e das populações miscigenadas, considerando-se a deriva genética.
3.8.5 Análises de Componente Principal (PCA)
As análises de componente principal (PCA) foram realizadas com os dados de
freqüências haplotípicas para inferir os componentes da variação genética. Esses
componentes da variação reduzem os dados para um pequeno número de dimensões,
42
descrevendo-os com o máximo de variação possível. As análises de componente
principal são procedimentos que simplificam dados multivariados sem que se perca a
informação (revisado por Cavalli-Sforza et al., 1994). Nos conjuntos de dados com
diferenças de ancestralidade entre as amostras, os componentes da variação,
freqüentemente, têm uma interpretação geográfica (Price et al., 2006).
3.8.6 Redes haplotípicas
Redes haplotípicas foram construídas pelo cálculo de Median joining utilizando
as freqüências haplotípicas dos marcadores nas populações analisadas por meio do
programa Network 4.1.0.6 (Bandelt et al., 1999).
3.8.7 Análises de Coalescência
As análises de coalescência para os nossos dados do cromossomo X foram
feitas com a utilização do programa BATWING (Bayesian analysis of trees with internal
node generation) (Wilson et al., 1998; 2003), com a colaboração do Prof. Ian J. Wilson,
da Universidade de Newcastle, do Reino Unido, autor do referido programa. O
BATWING utiliza o método de Monte Carlo Cadeia de Markov (MCMC - Markov chain
Monte Carlo) para amostrar genealogias reconstruídas proporcionalmente às
probabilidades do modelo de coalescente em uma análise Bayesiana (Wilson et al.,
2003). As histórias populacionais reconstruídas dependem do modelo de mutação, da
estrutura genealógica e da distribuição a priori dos parâmetros de interesse, o que
permite visualizar os tipos de história populacional e a variação dos parâmetros mais
consistentes com os dados no presente (Wilson et al., 2003). Devido ao numero
restrito de indivíduos foram excluídas das análises de coalescência as populações
Karitiana, da América, e as duas populações da Oceania, Papuan e Nan Melanesian.
43
4 RESULTADOS
44
4.1 CAPÍTULO 1. PADRONIZAÇÃO DOS MARCADORES MOLECULARES
FORMADORES DO BLOCO HAPLOTÍPICO
4.1.1 INTRODUÇÃO
O interesse em desenvolver marcadores moleculares mais informativos ou
complementares aos utilizados atualmente, como o DNA mitocondrial e o cromossomo
Y, fez com que pesquisadores voltassem a sua atenção ao cromossomo X humano,
que possui características interessantes para estudos evolutivos e que durante um
bom tempo, foi pouco explorado, já que os primeiros trabalhos utilizando esse
cromossomo foram descritos a partir de 1999, por Harris e Hey, e Kaessman e
colaboradores (1999).
As principais vantagens do cromossomo X, para estudos evolutivos, são:
1. cópia única em homens, o que faz deles hemizigotos para esse
cromossomo;
2. baixa taxa de mutação média, já que 2/3 dos cromossomos estão
presentes em mulheres em que a taxa de mutação é muito menor do
que a encontrada nos homens;
3. tamanho efetivo populacional intermediário entre os cromossomos
autossomos e os marcadores de linhagem (Y e mtDNA);
4. alternância de gerações;
5. presença de regiões com baixas taxas de recombinação, que
possibilitam a utilização de haplótipos como ferramenta em estudos
populacionais, já que a ausência ou os baixos níveis de recombinação
mantêm ou minimizam a interferência na história evolutiva desses
haplótipos.
Devido a essas características, determinamos o objetivo geral desta tese de
doutorado: realizar estudos filogeográficos utilizando marcadores moleculares em uma
região de baixa taxa de recombinação do cromossomo X humano. A região escolhida
45
tem, aproximadamente, 130 Kb, mapeada na região Xq21.1-Xq21.3, que apresenta as
mais baixas taxas de recombinação para o cromossomo X: 0,16 cM/Mb (Nagaraja et
al., 1997).
O estudo dessa região, no laboratório de Genética Bioquímica da UFMG, foi
iniciado por Rinaldo W. Pereira, durante a elaboração de sua tese de doutorado,
quando caracterizou a inserção Alu, flanqueada por microssatélites, DXS225 (Pereira
et al., 2006).
A partir desses dados, selecionamos dois novos microssatélites dentro dessa
região, para formar um bloco haplotípico com marcadores com diferentes taxas de
mutação (inserção Alu e microssatélites) na região Xq21.1-Xq21.3.
Parte dos resultados obtidos neste capítulo foi publicada por Pereira et al., (2006)
(Anexo 1).
4.1.2 RESULTADOS
4.1.2.1 Identificação e desenvolvimento de novos marcadores
Na busca por novos marcadores na região Xq21.1-Xq21.3, utilizando o
programa Tandem Repeats Finder (Benson, 1999), encontramos dois novos
microssatélites (Tabela 2): um pentanucleotídeo com repetição (ATTTT)5, denominado
DXS1012, com número de acesso GDB:11524532; e um dinucleotídeo com repetição
CA11TA*CA7, denominado de DXS1019, com número de acesso GDB:11524534.
46
Tabela 2. Microssatélites encontrados na região Xq21.1-Xq21.3, com o programa
Tandem Repeats Finder (Benson, 1999).
Localização Período Repetições Marcador
33617-33678 (ATTTT)5 12 DXS1012
37326-37353 (GT) 2 14 DXS1002
39578-47921 - 21 DXS225
48998-49036 (CA) 11AT*(CA) 7 19 DXS1019
124211-124249 (GT) 2 19 DXS8114
*Microssatélite imperfeito; destacados em negrito os novos microssatélites analisados.
47
Adicionamos os dois novos microssatélites (DXS1012 e DXS1019) aos cinco
microssatélites (DXS995, DXS8076, DXS1002, DXS8114 e DXS1050) descritos por
Dib et al.,(1996) e Pereira e Pena, (2006).
A localização física desses sete marcadores está representada na Figura 3,
enquanto as posições obtidas no banco de dados da UCSC (Universidade de Santa
Cruz da Califórnia) são apresentadas na Tabela 3.
48
Figure 3. Ideograma com a localização física dos marcadores analisados.
Tabela 3. Posição dos marcadores em pares de bases (pb).
Início Término
DXS995 82.643.697 82.644.081
DXS8076 82.665.965 82.666.202
DXS1012 85.409.962 85.410.320
DXS1002 85.413.714 85.414.062
DXS225 85.424.344 85.424.694
DXS1019 85.425.383 85.425.527
DXS8114 85.500.625 85.501.030
DXS1050 87.160.603 87.160.886
49
O intervalo entre os marcadores DXS1002 e DXS8114 está localizado no intron
1 do gene DACH2 (Homo sapiens dachund homolog 2 [Drosophila]), na posição
85.290,281-85.974,243 pares de bases.
O programa Ensembl, da página da Universidade de Santa Cruz da Califórnia
(http://www.ensembl.org/homo_sapiens/contigview?chr=&start=82643697&end=87160
886), foi utilizado para fazer uma busca por genes no contig NT_011651.16. Os
resultados dessa busca pode ser visualizado na Figura 4.
50
Figura 4. Visualização da região Xq21.1-Xq21.31 por meio do programa Ensembl da página do
UCSC Genome Browser. Destacados na cor rosa os marcadores, e na cor ocre, os genes
encontrados nessa região.
51
Fizemos o seqüenciamento do produto de PCR dos microssatélites DXS1012 e
DXS1019 para confirmar as suas seqüências e os números de repetições. O
alinhamento das seqüências do marcador DXS1012 (Figura 5) foi feito usando-se o
programa Multialign (http://bioinfo.genopole-toulouse.prd.fr/multalin/multalin.html)
(Corpet, 1988), e a amostra seqüenciada foi utilizada como controle interno para as
tipagens desse marcador. No entanto, não conseguimos obter seqüências confiáveis
para o marcador DXS1019; provavelmente devido ao pequeno tamanho (cerca de 130
pb) e o extenso número de repetições do marcador, com isso, utilizamos o número de
repetições obtidos na seqüência do marcador depositado no banco de dados do NCBI
(GenBank).
Após desenvolvimento dos novos marcadores, padronizamos uma reação de
multiplex para os sete microssatélites: DXS995, DXS8076, DXS1012, DXS1002,
DXS1019, DXS8114 e DXS1050. Na Figura 6, pode ser visto um exemplo do gráfico
produzido pelo programa Fragment Profile versão 1.2 (GE/ Amershan Biosciences),
utilizado para as tipagens dos microssatélites. Os tamanhos dos alelos estão em pares
de bases e são convertidos em número de repetições.
52
Figura 5. Alinhamento das seqüências do DXS1012 utilizando-se o programa Multalign. Em destaque, estão as repetições [ATTTT]n.
Figura 6. Resultado da tipagem dos sete microssatélites em reação de multiplex no MegaBace
1000 visualizado por meio do programa Fragment Profile 1.2 (GE/ Amershan Biosciences). Os
nomes dos marcadores podem ser vistos no topo da figura, e o tamanho de cada alelo, em
pares de bases, abaixo do gráfico.
53
4.1.2.2 Tipagem da inserção DXS225
A inserção Alu (DXS225) é um elemento da família AluYa5, a qual está inserida
em seqüências de elementos repetitivos do tipo LINE-1. Para melhor desempenho da
reação de PCR alteramos algumas condições com a finalidade de se aumentar a
especificidade para a seqüência do cromossomo X (Pereira, 2002). Mesmo alterando
as condições, no produto de amplificação do DXS225, é possível visualizar um
fragmento com tamanho compatível à presença da inserção (454 pb) e um fragmento
compatível à ausência de inserção (142 pb) (Figura 7). Esse padrão encontrado pode
ser devido aos iniciadores do DXS225 que, provavelmente, estão amplificando outros
L1 homólogos distribuídos pelo genoma.
4.1.2.3 Análise da inserção DXS225 nas populações do HGDP-CEPH
A inserção DXS225 foi genotipada em 677 indivíduos do Painel do HGDP-
CEPH, que representa 52 populações. Todas as regiões demonstraram a presença da
inserção com freqüências de 21% na África, 43% no Oriente Médio, 35% na Ásia
Central, 25% no Leste Asiático, 19% na Oceania, 36% na Europa e 9,3% na América.
As freqüências da inserção DXS225 nas populações do HGDP-CEPH são
apresentadas na Figura 8 e em detalhes na Tabela 4. A presença da inserção DXS225
em todas regiões mundiais sugere que o alelo com a inserção deve ter-se originado
antes de o homem moderno sair da África.
A presença da inserção em Ameríndios foi observada apenas na população
Karitiana, que é formada por um pequeno grupo com número reduzido de indivíduos, e
possui dados históricos que relatam que tal população teve contato com populações
européias e africanas durante todo o século 20 (Storto e Velden, 2005), fato que
sugere que a presença da inserção se deve à mistura com outras populações.
54
Para verificar a presença da inserção em outras populações ameríndias,
adicionamos dados de 34 indivíduos das populações de Ticuna (Brasil) e Muskoke
(Estados Unidos), analisadas por Pereira e Pena (2006), nos quais não foi encontrada
a presença da inserção DXS225. A partir desses resultados, concluímos que era
necessário excluir a população Karitiana das próximas análises, para evitar
interferência advinda por mistura.
55
Figura 7. Gel de agarose 1%, com resultado da amplificação do DXS225. Na canaleta 1, o
marcador de peso molecular 1Kb plus DNA ladder (Invitrogen); nas canaletas 2, 3, 5, 6, 7, 10,
11, 13, 15, 18,19, a banda de 142 pb, que representa a ausência da inserção; na canaleta 4, o
branco da reação; nas canaletas 8, 9, 12, 14, 16 e 17, a presença da inserção 454 pb.
Figura 8. Mapa com a distribuição das 52 populações do Painel do HGDP-CEPH e as
freqüências da presença da inserção DXS225, em cada população.
56
Tabela 4. Freqüências da inserção DXS225 nas populações do Painel HGDP-CEPH,
com suas respectivas localizações e coordenadas geográficas; entre parênteses, há o
número de indivíduos.
População Localização Coordenadas Geográficas
DXS225+ DXS225-
1- Biaka Pigmeu (30) Republica da África Central 4N,17E 30% (9) 70% (21) 2- Mbuti Pigmeu (13) Democrática Republica do Congo 1N,29E 62% (8) 38% (5) 3-Mandenka (16) Senegal 12N,12W 13% (2) 87% (14) 4-Yoruba (13) Nigéria 8N, 5E NE 100%(13) 5-Bantu NE (11) Quênia 3S,37E 18% (2) 82% (9) 6-San (7) Namíbia 21S,20E NE 100% (7) 7-Bantu SE Pedi (8) África do Sul 24S;24,30E NE 100% (7) 8-Mozabite (20) Algéria (Mzab) 32N;3E 50% (10) 50% (10) 9-Bedouin (28) Israel (Negev) 31N;35E 39% (11) 61% (17) 10-Druze (14) Israel (Carmel) 32N;35E 29% (4) 71% (10) 11-Palestinos (17) Israel (Central) 32N;35E 53% (9) 47% (8) 12-Brahui (25) Paquistão 30,30N;66,30E 20% (5) 80% (20) 13-Balochi (25) Paquistão 30,30N;60,30E 40% (10) 60% (15) 14-Hazara (24) Paquistão 33,30N;70E 42% (10) 58% (14) 15-Makrani (20) Paquistão 26N;64E 50% (10) 50% (10) 16-Sindhi (21) Paquistão 25,30N;69E 19% (4) 81% (17) 17-Pathan (20) Paquistão 33,30N;71,30E 15% (3) 85% (17) 18-Kalash (20) Paquistão 36N;71,30E 60%(12) 40% (8) 19-Burusho (20) Paquistão 36,30N;74E 35% (7) 65% (13) 20-Han (24) China 32,30N;114E 25% (6) 75% (18) 21-Tujia (9) China 29N;109E 33% (3) 67% (6) 22-Yizu (9) China 28N;103E 33% (3) 67% (6) 23-Miaozu (7) China 28N;109E 14% (1) 86% (6) 24-Orogen (7) China 50,30N;126,30N 14% (1) 86% (6) 25-Daur (7) China 48,30N;124E 28% (2) 72% (5) 26-Mongolianos (7) China 48,30N;119E 28% (2) 72% (5) 27-Hezhen (5) China 47,30N;133,30E 20% (1) 80% (4) 28-Xibo (8) China 43,30N;81,30E 12,5% (1) 87,5% (7) 29-Uygur (8) China 44N;81E 37,5% (3) 62,5% (5) 30-Daí (7) China 21N;100E NE 100% (7) 31-Lahu (7) China 22N;100E 42,8% (3) 57,2% (4) 32-She (7) China 27N;119E 28% (2) 72% (5) 33-Naxi (8) China 26N;100E 12,5% (1) 87,5% (7) 34-Tu (7) China 36N;101E 28,5% (2) 71,5% (5) 35-Yakut (18) Sibéria 63N;129,30E 27% (5) 73% (13) 36-Japoneses (22) Japão 38N;138E 32% (7) 68% (15) 37-Cambodianos (6) Cambodia 12N,105E 16% (1) 84% (5) 38-Papuan (13) Nova Guiné 4S;143E NE 100%(13) 39-NAN Melanesianos (8) Bougainville 6S;155E 50% (4) 50% (4) 40-Franceses (12) França 46N;2E 42% (5) 58% (7) 41-Franceses Bascos (16) França 43N;0 31% (5) 69% (11) 42-Sardinianos (16) Itália 40N;9E 50% (8) 50% (8) 43-Italianos do Norte (8) Itália (Bergamo) 46N;10E NE 100% (8) 44-Toscanos (6) Itália 43N;11E 67% (4) 33% (2) 45-Orcadianos (7) Ilhas Orkney 59N;3W 29% (2) 71% (5) 46-Adygei (7) Rússia caucasiana 44N;39E 57% (4) 43% (3) 47-Russos (16) Rússia 61N;40E 25% (4) 75% (12) 48-Pima (14) México 29N;108W NE 100%(14) 49-Maya (3) México 19N;91W NE 100% (3) 50-Colombianos (5) Colômbia 3N;68W NE 100% (5) 51-Karitiana (10) Brasil 10S;63W 40% (4) 60% (6) 52-Surui (11) Brasil 11S;62W NE 100%(11)
Fonte: HGDP-CEPH. Nota: NE- não-encontrado.
57
4.1.2.4 Análise de Variância Molecular (AMOVA)
A análise de variância molecular, com as freqüências do marcador DXS225 para
as 51 populações do Painel do HGDP-CEPH (excluindo a Karitiana), foi feita por meio
do programa Arlequin 2.0 (Scheneider et al., 2000). Encontramos uma variabilidade de
91,8% entre os indivíduos, dentro das populações; 4,2% de variabilidade encontrada
entre as populações, dentro das regiões e 3,9% entre as sete regiões mundiais
(Tabela 5).
Tabela 5. Análise de variância molecular do marcador DXS225 para as populações do
Painel do HGDP-CEPH.
Amostra Número de regiões
Número de populações
Dentro das populações
Entre populações dentro de regiões
Entre regiões
Mundo 1 51 92,50 7,50 - Mundo 5 51 90,85 3,89 5,26 Mundo 7 51 91,87 4,20 3,9 África 1 7 79,56 20,44 -
Eurásia 1 1 20 96,06 3,94 - Eurásia 3 3 20 96,37 4,58 -0,95a Europa 1 8 94,53 5,47 -
Oriente Médio 1 4 101,08 -1,08a - Ásia Central 1 8 93,58 6,42 -
Leste Asiático 1 18 106,26 -6,26b - Oceania 1 2 47,93 52,07 - Américab 1 4 0,00 0,00 -
a valor não-significativo p<0,05; demais valores significativos para p<0,05; b Amostra da América sem a população Karitiana.
58
4.1.2.5 Análise de desequilíbrio de ligação
As análises de desequilíbrio de ligação, para os sete microssatélites
encontrados na região Xq21.1-Xq21.3 (DXS995, DXS8076, DXS1012, DXS1002,
DXS1019, DXS8114 e DXS1050) e para a inserção Alu (DXS225), com os dados dos
667 indivíduos do Painel do HGDP-CEPH, foram feitas por meio do programa Arlequin
2.0 (Schneider et al., 2000). O teste de desequilíbrio de ligação desse programa é uma
extensão do teste exato de Fisher, e os resultados são apresentados como valor de
(p) com erro padrão. Com isso, quanto menor o valor de (p) mais alto será o
desequilíbrio de ligação entre os marcadores testados (na diagonal inferior da Tabela
6). Observamos que os marcadores DXS1012, DXS1002, DXS225, DXS1019 e
DXS8114 estão em visível desequilíbrio de ligação, enquanto que os marcadores mais
externos, DXS995, DXS8076 e DXS1050, não apresentaram desequilíbrio de ligação
significante.
Os demais testes adicionais de desequilíbrio de ligação foram realizados com a
colaboração do Prof. Ian Wilson. Os valores de coeficiente de desequilíbrio de ligação
D’ (Hedrick, 1987), calculados para os nossos marcadores, estão apresentados na
parte diagonal superior da Tabela 6. Os maiores valores foram encontrados também
para os marcadores: DXS1012, DXS1002, DXS225, DXS1019 e DXS8114, que
variaram entre 0,94 a 0,39 (diagonal superior da Tabela 6). No entanto, existe a
dificuldade de predizer exatamente qual variação é a esperada para marcadores
altamente variáveis, como os microssatélites em completo desequilíbrio de ligação.
Para avaliar se os valores de D’ encontrados para os nossos marcadores são
consistentes com a ausência de recombinação, foi feito um estudo de simulação em
pequena escala com os quatro microssatélites completamente ligados com as
mesmas taxas de mutação e um UEP (Unique Event Polymorphism). Foram
realizadas simulações de coalescente padrão (Standard Coalescent) com as 667
amostras, utilizando-se o modelo de mutação stepwise mutations para os
microssatélites. Na Figura 9, os histogramas com os valores mínimo, médio e máximo
59
de D’ vistos em 1000 réplicas, que demonstram que nossos dados são compatíveis
com absoluto desequilíbrio de ligação.
Um teste adicional de desequilíbrio de ligação foi feito para estimar taxa de
recombinação da região contendo os marcadores DXS1012, DXS1002, DXS225,
DXS1019 e DXS8114, utilizando-se o método de PAC (Li e Stephens, 2003). A análise
de PAC (Product of Approximate Condicionals) não mostrou nenhuma evidência de
taxa de recombinação populacional (ρ), com valor diferente de zero para o nosso
bloco haplotípico, enquanto que, para toda a região (Xq21.1-Xq21.3), o valor máximo
de ρ foi de, aproximadamente, 1,5 cM/Mb, quando a taxa de mutação para a
população foi de θ= 40 (Figura 10). Os gráficos gerados nessas análises foram
fornecidos pelo Prof. Ian J. Wilson.
Adicionalmente, fizemos uma análise de busca “in silico” dos SNPs encontrados
na região entre os marcadores DXS1012 e DXS8114 (intervalo 85.409,962-85.501,030
pares de base), utilizando dados do HapMap para verificar se ocorre recombinação
nessa região. Com o programa Haploview (Barrett et al., 2005), visualizamos os
mapas de desequilíbrio dos SNPs encontrados na região Xq21.1-Xq21.3, nos dados
populacionais do HapMap (Figuras 11, 12, 13 e 14). Os mapas de desequilíbrio são
apresentados em valores de D’ (Hedrick, 1987), com os quadrados mais escuros
representando D’ =1, e as linhas indicando os grupos de marcadores que podem
formar blocos de acordo com o coeficiente de LD. De acordo com os mapas
produzidos, na região onde está localizado nosso bloco haplotípico, com os dados de
Africanos (Yoruba) (Figura 11), Europeus (Utah) (Figura 12), Chineses (Han) (Figura
13) e Japoneses (Tóquio) (Figura 14) do HapMap, observamos que a maioria dos
SNPs estão em completo desequilíbrio de ligação em toda a região (aproximadamente
90% de D’=1), com exceção de alguns SNPs que não estão em completo
desequilíbrio, mas que constituem um pequeno grupo de SNPs que podem ter sofrido
conversão gênica. Com os resultados das análises de desequilíbrio de ligação,
podemos concluir que os marcadores DXS1012, DXS1002, DXS225, DXS1019 e
60
DXS8114 constituem um bloco haplotípico não-recombinante. Com base nesses
resultados, as próximas análises foram feitas apenas com os marcadores ligados
(DXS1012, DXS1002, DXS225, DXS1019 e DXS8114).
�
Tabela 6. Valores de significância calculados para o desequilíbrio de ligação entre os pares de marcadores e o erro padrão estão apresentados
na parte inferior da diagonal. Os valores de D’ estão apresentados na parte superior da diagonal. Os marcadores do bloco haplotípico e valores
de desequilíbrio de ligação estão destacados por sombreamento e em negrito os marcadores e os valores em desequilíbrio de ligação.
DXS995 DXS8076 DXS1012 DXS1002 DXS225 DXS1019 DXS8114 DXS1050
DXS995 - 0,11 0,17 0,13 0,03 0,06 0,19 0,07
DXS8076 0,920±0,001 - 0,14 0,13 0,10 0,12 0,14 0,13
DXS1012 0,108±0,001 0,160±0,001 - 0,48 0,56 0,52 0,39 0,10
DXS1002 0,622±0,001 0,000±0,000 0,000±0,000 - 0,68 0,61 0,44 0,14
DXS225 0,912±0,001 0,168±0,001 0,000±0,000 0,000±0,000 - 0,94 0,72 0,13
DXS1019 0,958±0,000 0,006±0,000 0,000±0,000 0,000±0,000 0,000±0,000 - 0,64 0,16
DXS8114 0,001±0,000 0,000±0,000 0,000±0,000 0,000±0,000 0,000±0,000 0,000±0,000 - 0,19
DXS1050 0,009±0,000 0,052±0,000 0,069±0,001 0,107±0,000 0,015±0,000 0,010±0,000 0,000±0,000 -
�
Figura 9. Valores de D’ (Hedrick, 1987) mínimo, médio e máximo calculados a partir de 10.000
simulações coalescentes com os 667 indivíduos, para os quatro microssatélites completamente ligados
(com theta= 4, 10, e 30, respectivamente) e um polimorfismo de evento único (UEP). As simulações
são para uma única população panmítica com tamanho constante. Os valores observados estão
destacados pelas setas: valor mínimo 0,39; médio 0,6 e máximo 0,94. Gráficos produzidos pelo Prof.
Ian J. Wilson, do Departamento de Genética Humana da Universidade de Newcastle, no Reino Unido.
63
Figura 10. Curvas com log-likelihood calculado pelo modelo PAC (Product of Approximate
conditionals) (Li e Stephens, 2003) para toda a região (linhas pretas) e para o bloco haplotípico não-
recombinante (linhas azuis). Observa-se taxas de mutação populacional de θ = 10 (linhas pontilhadas)
e de θ=40 (linhas sólidas). Todas as linhas foram normalizadas para o valor máximo de zero, o que
permite as comparações entre as linhas. Gráfico produzido pelo Prof. Ian J. Wilson, do Departamento
de Genética Humana da Universidade de Newcastle, no Reino Unido.
64
Figura 11. Mapa de desequilíbrio de ligação formado com os valores de D’ para a população YRI
(África) do HapMap, produzido pelo programa Haploview (Barrett et al., 2005). Os blocos mais escuros
representam D’=1.
Figura 12. Mapa de desequilíbrio de ligação formado com os valores de D’ para a população CEU
(Europa) do HapMap, produzido pelo programa Haploview (Barrett et al., 2005). Os blocos mais
escuros representam D’=1.
65
Figura 13. Mapa de desequilíbrio de ligação formado com os valores de D’ para a população CHB
(China) do HapMap, produzido pelo programa Haploview (Barrett et al., 2005). Os blocos mais escuros
representam D’=1.
Figura 14. Mapa de desequilíbrio de ligação formado com os valores de D’ para a população JPT
(Japão) do HapMap, produzido pelo programa Haploview (Barrett et al., 2005). Os blocos mais escuros
representam D’=1.
66
Índice de diversidade de Nei
A diversidade média de cada loco de microssatélite, inserção Alu e bloco haplotípico foi
calculada pelo índice de diversidade de Nei (Nei, 1987), com os dados das freqüências
alélicas dos marcadores das populações do Painel do HGDP-CEPH (Tabela 7). Utilizamos a
fórmula h=n(1-Σpi 2)/(n-1) para dados haplóides, em que n é tamanho efetivo, e pi, a
freqüência alélica para cada loco; no caso do bloco haplotípico, pi representa a freqüência
dos haplótipos. O menor índice de diversidade foi encontrado para o DXS225, o que era
esperado por se tratar de uma inserção Alu com apenas dois alelos. Nos microssatélites, os
menores índices foram observados para o DXS1019 e o DXS1002, respectivamente, que são
os dois microssatélites que flanqueiam a inserção DXS225. Os maiores índices foram vistos
nos marcadores DXS1012 e DXS8114, que estão localizados na extremidade do nosso bloco
haplotípico.
A comparação dos índices de diversidade dos marcadores na África e nas populações
não africanas do Painel do HGDP-CEPH demonstraram que os valores de diversidade
encontrados na África sub-sahariana são maiores que os encontrados nas populações não-
africanas, com exceção dos marcadores DXS1012 e DXS225. No entanto, as diferenças
entre a África sub-sahariana e as demais populações do Painel HGDP-CEPH não foram
significativas para o teste t (teste t =1,325; p<0,05).
Tabela 7. Índices de diversidade de Nei para os marcadores nas populações do Painel do
HGDP-CEPH.
CEPH (n=667) ÁFRICA (n=98)
NÃO-AFRICANAS
(n=569) LOCOS
DXS1012 0,829 0,778 0,828 DXS1002 0,721 0,770 0,694 DXS225 0,415 0,336 0,425 DXS1019 0,560 0,811 0,487 DXS8114 0,798 0,820 0,785 Bloco Haplotípico 0,979 0,996 0,974
67
4.1.3 DISCUSSÃO
O cromossomo X humano apresenta características que o tornam uma ferramenta
poderosa em estudos populacionais (Schaffner, 2004). Devido a essas características,
propusemos como objetivo desta tese realizar estudos filogeográficos utilizando marcadores
moleculares nesse cromossomo.
Os marcadores foram selecionados na região onde está localizada a inserção Alu
(DXS225), caracterizada por Rinaldo W. Pereira, durante a elaboração de sua tese de
doutorado, em 2002, região essa conhecida por ter uma das menores taxas de recombinação
do cromossomo X (0,16 cM/Mb) comparada com a média do cromossomo (1,3 cM/Mb)
(Nagaraja et al., 1997). Descrevemos dois novos microssatélites flanqueando a inserção Alu
(DXS225): um dinucleotídeo (DXS1019) e pentanucleotídeo (DXS1012), sendo o
microssatélite DXS1019 o marcador mais próximo à inserção, com apenas 7 kb de distância
(Tabela 3). Nessa região, são encontrados cinco microssatélites (DXS995, DXS8076,
DXS1002, DXS8114 e DXS1050), que não apresentaram recombinação em 291 meioses,
testada durante a construção do mapa genético do cromossomo X (Dib et al.,1996), em que
também foram utilizados em estudos filogeográficos com populações brasileiras (Pereira e
Pena, 2006).
Para utilizar um marcador molecular informativo, formado por marcadores com
diferentes taxas de mutação, adicionamos aos cinco microssatélites (Dib et al., 1996) os dois
microssatélites caracterizados neste trabalho (DXS1019 e DXS1012) e a inserção Alu
(DXS225) (Pereira et al., 2006).
Os sete microssatélites foram padronizados em uma reação de multiplex (Figura 6),
enquanto a inserção Alu DXS225 foi genotipada individualmente.
A inserção Alu DXS225 está localizada dentro de um elemento LINE-1, que é
bastante abundante no genoma humano, principalmente no cromossomo X, onde
encontramos 29% desses elementos repetitivos (Ross et al., 2005), o que faz com que a
68
nossa reação amplifique outros elementos L1 do genoma e que o alelo sem a inserção
apareça em todas as reações (Figura 7).
A presença da inserção DXS225 foi observada em todas as regiões mundiais do
Painel do HGDP-CEPH (Figura 8), com freqüências que variam de 9,3%, na América, a 43%,
no Oriente Médio. Esse padrão de distribuição permite inferir que a inserção DXS225 deve
ter-se originado antes que o homem moderno saísse da África, há, aproximadamente,
100.000-200.000 anos. Na África, encontramos uma freqüência de 21% da presença da
inserção; no entanto, três populações africanas não possuem a inserção (Yoruba, San e
Bantu_SE).
Enquanto que a presença da inserção em Ameríndios foi observada apenas na
população Karitiana, a qual é formada por um pequeno grupo (64 indivíduos em 1970 e,
aproximadamente, 320 indivíduos em 2005) que representa uma simples extensão de uma
família (Storto e Velden, 2005). Além disso, relata-se que os Karitiana tiveram contato com
Europeus e Africanos no início do século 20, o que sugere que o alelo com a presença da
inserção DXS225, nessa população, foi introduzido por miscigenação com populações
Européias e Africanas. Para verificar se a presença da inserção foi encontrada em outras
populações Ameríndias, adicionamos os dados de indivíduos pertencentes às populações de
Ticuna, do Brasil, e de Muskoke, dos Estados Unidos (Pereira e Pena, 2006), que não
apresentaram alelo com a presença da inserção. O fato de encontrarmos apenas o alelo sem
a inserção DXS225 em populações Ameríndias pré-colombianas pode ser explicado por
efeito fundador, seguido de deriva genética que fixou o alelo sem a inserção na população.
De acordo com esses dados, decidimos retirar a população Karitiana das nossas análises
para evitar a interferência da mistura em nossos resultados. Mesmo não observando essa
provável mistura na população Karitiana com os marcadores de linhagem cromossomo Y e
DNA mitocondrial (Wang et al.,2007).
Inicialmente o marcador utilizado foi um bloco haplotípico formado por sete
microssatélites e uma inserção Alu, localizado na região Xq21.1-Xq21.3. No entanto, após as
análises de desequilíbrio de ligação, excluímos três microssatélites (DXS995, DXS8076 e
69
DXS1050), localizados nas extremidades do nosso bloco haplotípico, que não estavam em
desequilíbrio de ligação, o que pode ser observado tanto para as probabilidades de p
calculadas pelo programa Arlequin 2.0 (Schneider et al., 2000), quanto para os valores de
coeficiente de D’ (Hedrick 1987) (Tabela 6).
Foram utilizadas outras três abordagens para se verificar a existência de
recombinação na região onde o nosso bloco haplotípico está localizado, sendo a primeira e a
segunda realizadas pelo Prof. Ian Wilson em colaboração com nosso trabalho. A primeira,
uma simulação em pequena escala, com 10.000 simulações coalescentes para os valores de
D’ e os histogramas com os valores mínimos (0,39), médios (0,6) e máximo (0,94)
observados, que evidenciam que nossos dados são compatíveis com absoluto desequilíbrio
de ligação (Figura 9). A segunda foi um teste adicional de desequilíbrio de ligação, pelo
método de PAC, para estimar a taxa de recombinação (Li e Stephens, 2003), com a análise
da taxa de recombinação de toda a região Xq21.1-Xq21.3 e da região onde estão localizados
apenas os marcadores (DXS1012, DXS1002, DXS225, DXS1019 e DX8114). Na Figura 10, o
gráfico com as curvas de log-likelihood, comparando as curvas de toda a região e a região do
bloco haplotípico, observamos que não há evidências de taxa de recombinação populacional
(ρ) para o bloco haplotípico com valores não-diferentes de zero, enquanto que, para toda a
região, teve um ρ máximo de 1,5 cM/Mb para θ=40. A terceira, uma análise in silico, utilizou
os dados de SNPs do HapMap para verificar a ausência de recombinação na região entre os
marcadores DXS1012 e DXS8114, e os dados para as quatro populações do HapMap
mostraram aproximadamente, 90% de D’=1 para essa região (Figuras 11, 12, 13 e 14). Todas
as nossas análises de desequilíbrio de ligação demonstraram que os marcadores DXS1012,
DXS1002, DXS225, DXS1019 e DX8114 estão em visível desequilíbrio de ligação, formando,
dessa forma, um bloco haplotípico, que foi utilizado nas análises dos próximos capítulos.
Os índices de diversidade de Nei (Nei, 1987) foram calculados para cada marcador e
para o bloco haplotípico com as freqüências alélicas e haplotípicas das populações do Painel
do HGDP-CEPH (Tabela 7). Os microssatélites DXS1002 e DXS1019, que flanqueiam a
inserção DXS225, apresentaram os menores valores de diversidade (0,721 e 0,560,
70
respectivamente), enquanto os microssatélites mais externos do bloco haplotípico tiveram os
maiores índices de diversidade:DXS1012 (0,829) e DXS8114 (0,798). O bloco haplotípico
possui um alto índice de diversidade (0,979). Quando analisamos as diversidades dos
marcadores dentro e fora da África, observamos que a maioria deles revelaram maiores
índices de diversidade dentro da África, com exceção do DXS225 e do DXS1012 (Tabela 7).
No entanto, a diferença encontrada entre os marcadores dentro e fora da África, não foi
significativa estatisticamente (teste t=1,325), p>0,05).
A análise de variância molecular (AMOVA) para a inserção DXS225 revelou pouca
estruturação genética, com 92% da variação concentrada entre os indivíduos dentro das
populações, enquanto que a variação encontrada entre as populações dentro das regiões foi
de 4,2% e de 3,9%, entre as sete principais regiões mundiais (Tabela 4), valores compatíveis
aos encontrados em polimorfismos de DNA (Cavalli-Sforza e Feldman, 2003). No entanto, as
populações da Oceania apresentaram alta índice de variação entre as populações, o que
pode ser explicado pelo número restrito de populações, apenas duas e a diferenciação
genética encontrada entre elas.
Nossos resultados permitem concluir que o bloco haplotípico utilizado, que combina
marcadores polimórficos de evolução lenta, como a inserção (DXS225), com marcadores
polimórficos de evolução rápida, como os microssatélites (DXS1012, DXS1002, DXS1019 e
DXS8114), oferece oportunidades singulares para elucidar a história evolutiva de populações
humanas, fornecendo informações evolucionárias complementares aos marcadores
tradicionais de linhagens (cromossomo Y e DNA mitocondrial) utilizados para esse tipo de
abordagem.
Os resultados da caracterização e distribuição da inserção DXS225 nas populações
mundiais do Painel do CEPH foram publicados no manuscrito (Pereira, et al.,2006; Anexo 1).
71
4.2 CAPÍTULO 2 - FILOGEOGRAFIA DE POPULAÇÕES MUNDIAIS POR MEIO DA
ANÁLISE DE UM BLOCO HAPLOTÍPICO DO CROMOSSOMO X
4.2.1 INTRODUÇÃO
No capítulo anterior, descrevemos e padronizamos um bloco haplotípico constituído
por quatro microssatélites (DXS1012, DXS1002, DXS1019 e DXS8114) e uma inserção Alu
(DXS225), que estão em completo desequilíbrio de ligação. Neste capítulo, utilizaremos esse
bloco haplotípico para fazer uma análise filogeográfica das populações mundiais do Painel do
HGDP-CEPH.
A filogeografia é uma área de estudo dos princípios e processos que estabelecem a
distribuição geográfica de linhagens genealógicas dentro das espécies, com ênfase em
fatores históricos que integram conhecimentos de genética molecular, genética de população,
filogenética, demografia e geografia histórica (Pena, 2002). Nosso bloco haplotípico possui
diversas características interessantes para estudos evolutivos, descritas no primeiro capítulo
desta tese, e a vantagem de fornecer informação sobre os componentes populacionais de
homens e mulheres.
Com base nessas características, propusemos como um dos objetivos desta tese
utilizar nosso bloco haplotípico do cromossomo X para analisar a diversidade genética de
populações mundiais que compõem o Painel do HGDP-CEPH e fornecer conhecimentos
novos e complementares sobre a história populacional humana. Para realizar essa análise,
investigamos 667 homens não-aparentados, representantes de 51 populações distribuídas
entre as cinco principais regiões mundiais (África, Leste Asiático, Oceania, Eurásia e
América) do Painel do HGDP-CEPH (Rosenberg, 2006). Nessa análise, agrupamos as
regiões, Oriente Médio, Ásia Central e Europa, que possuem uma estrutura genética bastante
similar, em uma única região denominada Eurásia (Rosenberg et al., 2002). E com as
evidências encontradas no estudo da inserção DXS225, retiramos a população ameríndia
Karitiana, que demonstrou forte indício de fluxo gênico com populações européias e
72
africanas, como discutido no Capítulo 1 desta tese. Os resultados obtidos neste capítulo
foram publicados no manuscrito Santos-Lopes et al.,(2007) (Anexo 2).
4.2.2 RESULTADOS
4.2.2.1 Análise haplotípica
Os parâmetros básicos de diversidade molecular, incluindo a análise de variância
molecular (AMOVA) (Excoffier et al., 1992), freqüência haplotípica, diversidade haplotípica e
haplótipos compartilhados, foram calculados por meio do programa Arlequin 2.0 (Schneider et
al., 2000). Entre os 667 indivíduos estudados, encontramos um total de 187 diferentes
haplótipos formados pelos marcadores (DXS1012, DXS1002, DXS225, DXS1019 e
DXS8114) do bloco haplotípico. Do total de haplótipos (187) encontrados, 129 (69%) são
haplótipos região-específico, vistos em apenas uma única região. A grande maioria desses
haplótipos região-específico são encontrados na região da África, que possui apenas 14,6%
do total de indivíduos, mas contém 44% dos haplótipos região-específico encontrados
(Tabela 8). A diversidade haplotípica encontrada para as cinco principais regiões mostrou que
a maior diversidade está na África (0,992±0,002), enquanto que a menor está na Oceania
(0,885±0,047) e na América (0,839±0,038) (Tabela 8).
Observamos a diversidade haplotípica para os haplótipos com a presença da inserção
DXS225 (196 indivíduos) e sem a inserção (471 indivíduos) separadamente. Como esperado,
a diversidade é bem maior para os haplótipos com a ausência da inserção DXS225 que
possui a maioria dos indivíduos (471/667), dos haplótipos (141/187), e que possui um valor
de diversidade de 0,972±0,003, comparado com 0,880±0,017 para os haplótipos com a
presença da inserção. Quando comparamos a diversidade dentro (0,992±0,002) e fora
(0,968±0,002) da África, observamos que a diversidade africana é bem maior que a dos
outros continentes, e que esse perfil se repete mesmo quando comparamos os haplótipos
com a presença da inserção DXS225 na África (0,952±0,027) e nos outros continentes
(0,854±0,020). Com a ausência da inserção, a diversidade africana é de 0,991±0,003,
enquanto que nos outros continentes é de 0,962±0,004.
73
Tabela 8. Número de indivíduos, haplótipos, haplótipos únicos e diversidade haplotípica das
cinco principais regiões do CEPH.
Região Número de indivíduos
Número de haplótipos
Haplótipos únicos
Diversidade Haplotípica
África 98 71 57 0,992±0,003 Leste Asiático 173 67 31 0,967±0,005 Eurásia 342 87 36 0,953±0,006 Oceania 21 10 4 0,885±0,047 América 33 10 1 0,839±0,037 Mundo CEPH 667 187 129 0,976±0,002
A proporção de haplótipos compartilhados entre as cinco principais regiões do HGDP-
CEPH está representada na Figura 15, onde as regiões estão representadas em quadrados
de cores diferentes com o tamanho proporcional ao número de indivíduos de cada região, e
dentro de cada região, a proporção de haplótipos, a largura das setas são proporcionais ao
número de haplótipos compartilhados. A África possui as menores proporções de haplótipos
compartilhados, enquanto a América apresenta as maiores proporções, principalmente com o
Leste Asiático.
74
Figura 15. Fluxo de compartilhamento de haplótipos entre as cinco principais regiões mundiais do
Painel do HGDP-CEPH. Os quadrados representam as regiões mundiais com o tamanho proporcional
ao número de indivíduos de cada região, e a largura das setas é proporcional ao número de haplótipos
compartilhados. Entre parênteses, dentro dos quadrados, está a freqüência média de haplótipos de
cada região. Próximas às setas, estão as freqüências de haplótipos compartilhados. Essa figura foi
inspirada em diagrama similar presente em Conrad et al., (2006).
75
A análise de variância molecular (AMOVA) com os dados do bloco haplotípico revelou
pouca estruturação genética, com a maior variabilidade genética encontrada dentro das
populações (95,2%), em relação às encontradas entre as populações mundiais (1,7%) e entre
as cinco principais regiões (3,1%) (Tabela 9). O mesmo padrão foi encontrado para as
regiões, separadamente, com mais de 95% da variabilidade genética encontrada entre as
populações, com exceção apenas da Oceania e América, que apresentaram valores de
variabilidade genética maiores entre as populações dentro das regiões (14,9% e 15,3%,
respectivamente) (Tabela 9).
Tabela 9. Análise de variância molecular para o bloco haplotípico (DXS1012, DXS1002,
DXS225, DXS1019 e DXS8114) nas populações do Painel HGDP-CEPH.
Amostra Número de regiões
Número de populações
Componente de variação (%)
Dentro das populações
Entre populações dentro de regiões
Entre regiões
Mundo 1 51 96,23 3,77 - Mundo 5 51 95,22 1,69 3,08 África 1 7 98,01 1,99 -
Eurásiab 3 20 98,18 1,06 0,76 Leste Asiático 1 18 100,59 -0,59a -
Oceania 1 2 85,05 14,95 - América 1 4 84,71 15,29 -
a Valor não-significativo para p<0,05, demais valores, significativos para p<0,05. b Eurásia inclui Oriente Médio, Ásia Central e Europa.
76
4.2.2.2 Redes haplotípicas
Foram construídas redes haplotípicas pelo cálculo de Median Joining por meio do
programa Network 4.2.0.1 (Bandelt et al,1999). Para essa análise, as regiões do Oriente
Médio, Ásia Central e Europa foram agrupadas em uma única região, a Eurásia. A Figura 16
representa a rede haplotípica com as cinco principais regiões mundiais, na qual podemos
observar uma ampla distribuição e o compartilhamento de haplótipos, entre as regiões. A
África apresentou um padrão de distribuição de haplótipos diferente do encontrado nas
demais regiões, com a maioria dos seus haplótipos (coloridos de vermelho) presentes na
região mais periférica da rede haplotípica, apresentando as menores freqüências, o que é
explicado devido à grande concentração de haplótipos únicos nessa região. Percebemos,
também, a presença do efeito fundador, com alguns poucos haplótipos muito freqüentes e
apenas um único haplótipo distribuído entre todas as regiões mundiais.
77
Figura 16. Rede haplotípica construída com os haplótipos das cinco principais regiões do Painel do
HGDP-CEPH. As diferentes cores representam cada região, o tamanho dos círculos é proporcional ao
número de indivíduos, em cada haplótipo.
78
Na Figura 17, visualizamos a mesma rede haplotípica da Figura 16, destacando em
cores, os haplótipos que possuem o alelo com a ausência da inserção DXS225 nas cinco
regiões do Painel do HGDP-CEPH, e nas setas, os haplótipos formados pelos marcadores:
DXS1012, DXS1002, DXS225, DXS1019 e DXS8114, respectivamente. Nas setas, podemos
observar o haplótipo formado pelos alelos 9, 15, 0, 27, 21, o qual é o mais freqüente e o único
compartilhado entre todas as regiões. Próximo a ele, encontramos o haplótipo 10, 15, 0, 27,
21, presente em todas as regiões, exceto na Oceania; e o haplótipo 9, 15, 0, 27, 20, presente
no Leste Asiático, na Oceania e América. A ampla distribuição desses três haplótipos sugere
que eles pertencem ao grupo de haplótipos fundadores que saíram da África e se expandiu
para os demais continentes (Figura 17). O haplótipo 13, 16, 0, 27, 20 é o segundo mais
freqüente, visto na Eurásia e no Leste Asiático. Agrupado próximo a ele com diferença de um
e dois passos mutacionais, respectivamente, estão os haplótipos 13,16,0,27,21 e
14,16,0,27,21, ambos encontrados na Eurásia, Leste Asiático e Oceania, que formam um
segundo grupo de haplótipos que devem ter saído da África e se fixado nessas regiões,
devido ao efeito fundador.
79
Figura 17. Rede haplotípica construída com os haplótipos das regiões do Painel do HGDP-CEPH.
Destacados em cores os haplótipos que possuem o alelo com a ausência da inserção (DXS225). Nas
setas, os prováveis haplótipos fundadores dentro e fora da África, formados pelos marcadores
DXS1012, DXS1002, DXS225, DXS1019 e DXS8114.
80
Na Figura 18, a mesma rede haplotípica é representada dando destaque, em cores,
aos haplótipos com a presença da inserção DXS225, e as setas, destacam os haplótipos
mais freqüentes. Os haplótipos mais freqüentes com a presença da inserção são o
11,14,1,25,18, encontrado na África, Leste Asiático e Eurásia, e o 10,14,1,25,17, visto no
Leste Asiático e na Eurásia, formados pelos marcadores DXS1012, DXS1002, DXS225,
DXS1019 e DXS8114, respectivamente. O número restrito de haplótipos demonstra a
ocorrência de gargalos populacionais que reduziram o número de haplótipos durante o
período em que o homem saiu da África, seguido por efeitos fundadores que fixaram esses
haplótipos nas demais regiões. O haplótipo 11,14,1,25,18 é o mais freqüente e,
provavelmente, saiu da África levando a inserção DXS225 para as demais regiões mundiais.
Para destacar a distribuição da inserção DXS225 nas principais regiões mundiais do Painel
HGDP-CEPH, a Figura 19 representa, separadamente, a presença da inserção em cada
região.
81
Figura 18. Rede haplotípica em que se destaca, em cores, a presença da inserção DXS225 nas
principais regiões mundiais (África, Eurásia, Leste asiático e Oceania). As setas destacam os
haplótipos formados pelos marcadores DXS1012, DXS1002, DXS225, DXS1019 e DXS8114.
82
Figura 19. Redes haplotípicas em que se destaca, em preto, a presença da inserção DXS225 nas
principais regiões mundiais (África, Eurásia, Leste asiático e Oceania).
83
4.2.2.3 Análise de Componente Principal
A análise de componente principal (revisada por Cavalli-Sforza et al.,1994) foi feita por
meio do programa POPSTR (Harpending, 1994), com os dados das freqüências dos
haplótipos do bloco haplotípico. Na Figura 20, está a representação gráfica do PCA para as
sete regiões do HGDP-CEPH (África, Oriente Médio, Ásia Central, Leste Asiático, Oceania,
Europa e América), onde confirmamos o agrupamento das regiões Oriente Médio, Ásia
Central e Europa que compõem a Eurásia. Na Figura 21, há representação gráfica do
primeiro e segundo componentes, o qual apresentou 63,6% da informação, para as cinco
principais regiões (África, Leste Asiático, Eurásia, Oceania e América), com o primeiro
componente separando a África da Oceania e América, enquanto que o segundo separa a
Eurásia e o Leste Asiático da Oceania e América.
84
Figura 20. Representação gráfica da análise de componente principal com as freqüências haplotípicas
das sete regiões mundiais do Painel do HGDP-CEPH. O primeiro componente apresentou 28% da
informação e o segundo, 22%.
85
Figura 21. Representação gráfica da análise de componente principal com as freqüências haplotípicas
das cinco principais regiões mundiais do Painel do HGDP-CEPH. O primeiro componente apresentou
35% da informação e o segundo, 28,6%.
86
4.2.2.4 Análise de Coalescência
As análises de coalescência foram realizadas por meio do programa BATWING (Wilson
et al., 2003), pelo autor do programa, Prof. Ian Wilson, em colaboração com o nosso trabalho
para que realizássemos uma análise genealógica dos dados do nosso bloco haplotípico.
Esse programa utiliza o método de MCMC (Markov Chain Monte Carlo), baseado na teoria de
coalescência para gerar uma aproximação aleatória das amostras a partir de uma distribuição
posteriori dos parâmetros analisados, como: taxa de mutação, tamanho efetivo populacional,
taxas de crescimento populacional e o tempo de divergência entre populações. As análises
realizadas com o programa BATWING foram feitas com os dados das amostras do Painel do
HGDP-CEPH, em que excluem as populações da Oceania, por ser uma amostra reduzida, e
a população Karitiana (conforme explicação abordada no início do capítulo). Na análise
genealógica utilizou-se o modelo coalescente, com crescimento constante a partir de uma
população com tamanho efetivo constante (Wilson et al., 2003). Esse modelo assume uma
população ancestral pequena (com tamanho populacional N), que cresce com uma taxa de
α% por geração até o seu tamanho Nexp (κ), no presente, o que determina a época em que o
crescimento populacional começou. Para essas análises, é necessária a distribuição a priori
para os parâmetros utilizados: taxa de mutação (µ), taxa de crescimento por geração (α),
tamanho populacional das populações atuais e ancestrais (κ), tamanho populacional
ancestral (N) e, também, os parâmetros que determinam o perfil da história populacional.
Para essa análise, foi utilizado o modelo de mutação stepwise mutation (SMM), que
considera que o número de repetição de um determinado microssatélite pode aumentar ou
diminuir uma repetição a cada evento mutacional, e que tanto o aumento ou a diminuição de
uma repetição são igualmente prováveis para os quatro microssatélites (DXS1012, DXS1002,
DXS1019 e DXS8114). A inserção DXS225 foi considerada, como um polimorfismo de evento
único (UEP), que assume ser um único evento mutacional responsável pelo polimorfismo
observado. Foram utilizadas diferentes taxas de mutação para cada microssatélite, com a
distribuição gamma com parâmetros de 1,35 e 740,4, fornecendo uma taxa de mutação
87
média de 0,0018±0,0016. Esse parâmetro foi estimado a partir da análise relativa das taxas
de mutação descritas por Xu et al.,(2005). O parâmetro utilizado foi escolhido para fornecer
uma taxa de mutação média de, aproximadamente, 2x10-3 (Mountain et al., 2002). Todos os
conjuntos de dados analisados apresentaram valores similares para as taxas de mutação
relativas para os quatro locos de microssatélites. O microssatélite DXS1019 foi o que
apresentou a menor taxa de mutação, comparada com os demais microssatélites, enquanto
que o DXS1002 apresentou um valor intermediário (Figura 24 e Tabela 10).
88
Figura 22. Apresentam-se os resultados da análise do BATWING com as amostras das populações da
África, Oriente Médio, Ásia Central, Leste Asiático, Europa e América do Painel do HGDP-CEPH. As
taxas de mutação, por geração, para os quatro microssatélites do bloco haplotípico. As linhas
representam as densidades a priori e, os histogramas a posteriori. Gráficos foram produzidos pelo
Prof. Ian J. Wilson, do Departamento de Genética Humana da Universidade de Newcastle, do Reino
Unido.
89
Na Tabela 10, temos as médias e os quantiles a priori calculados pelo BATWING com
as populações da África, Oriente Médio, Ásia Central, Leste Asiático, Europa e América, para
os parâmetros populacionais. Os valores encontrados foram utilizados para o cálculo a
posteriori dos mesmos parâmetros (Tabela 11).
Na Tabela 11, estão apresentadas as estimativas calculadas para o tempo do mais
recente ancestral comum (TMRCA), de 182.000 anos (95% - intervalo de confiança- 56.700-
479.000), para os dados do nosso bloco haplotípico com as populações do Painel do HGDP-
CEPH, e a estimativa para o surgimento da inserção Alu (DXS225) de 94.000 anos (95%-
intervalo de confiança- 24.300-310.000).
Todas as análises foram feitas com a utilização de cinco corridas independentes, com
42.000 amostragens, sendo as primeiras 2.000 removidas de cada corrida e com 100 árvores
reorganizadas entre cada alteração do parâmetro populacional, apenas a cada 200.000
amostragens. Isto nos forneceu um tamanho amostral de 200.000 para a construção empírica
da distribuição posterior. Na Figura 25, estão representados a comparação dos valores a
priori e a posteriori de alguns parâmetros populacionais, como tamanho populacional
ancestral (N), taxa de crescimento por geração (α), tempo desde o início do crescimento, e
razão entre tamanho populacional atual e passado (κ), para os dados relativos às populações
do Painel do HGDP-CEPH (excluindo-se a Oceania e a população Karitiana). Todos os
parâmetros apresentaram pouca variação entre a distribuição a priori e a posteriori.
90
Tabela 10. Médias e quantiles a priori da análise do BATWING para os parâmetros
populacionais.
Parâmetros Populacionais Média 2,5% 50% 97,5% Tamanho Populacional, N (x103) 15 4,88 14 30,7 Taxa de mutação (µ) (x10-3) 1,83 0,11 1,40 5,93 Taxa de crescimento,α (%por geração) 0,5 0,061 0,419 1,395 Tempo desde o crescimento inicial (x103) 51,8 5,58 27,9 220 Tempo de divergência da África (x103) 87,4 2,85 68,9 274 TMRCA (x103) 680 164 558 1910
Tabela 11. Médias e quantiles a posteriori das análises do BATWING para os parâmetros
populacionais.
Parâmetros Populacionais Média 2,5% 50% 97,5% Tamanho populacional, N (x103) 13,9 4,3 12,8 29,7 Taxa de mutação (µ) para DXS1012 (x10-3) 2,71 1,23 2,57 5,00 Taxa de mutação (µ) para DXS1002 (x10-3) 1,04 0,45 0,98 1,95 Taxa de mutação (µ) para DXS1019 (x10-3) 0,34 0,14 0,32 0,67 Taxa de mutação (µ) para DXS8114 (x10-3) 2,93 1,34 2,78 5,38 Taxa de crescimento,α (%por geração) 0,45 0,034 0,247 1,724 Tempo desde o crescimento inicial (x103) 26,2 1,79 12 121 Tempo de divergência da África (x103) 9,95 2,77 9,08 22,5 TMRCA (x103) 182 56,7 153 479 Tempo da inserção DXS225 (x103) 94,4 24,3 70,5 310
91
Figura 23. Apresentam-se os resultados da análise do BATWING com as amostras das populações da
África, Oriente Médio, Ásia Central, Leste Asiático, Europa e América do Painel do HGDP-CEPH.
Distribuição priori e posteriori dos parâmetros populacionais. As linhas representam as densidades a
priori e histogramas a posteriori. Os gráficos foram produzidos pelo Prof. Ian J. Wilson, do
Departamento de Genética Humana da Universidade de Newcastle, do Reino Unido.
92
4.2.3 DISCUSSÃO
Neste capítulo, utilizamos um bloco haplotípico do cromossomo X formado por quatro
microssatélites (DXS1012, DXS1002, DXS1019 e DXS8114) e uma inserção Alu (DXS225),
que estão em completo desequilíbrio de ligação, para estudarmos a filogeografia das
populações mundiais do Painel do HGDP-CEPH (Rosenberg, 2006). Foram analisados 667
homens não-aparentados, representando 51 populações distribuídas entre as cinco principais
regiões mundiais (África, Leste Asiático, Eurásia, Oceania e América). Dessas análises, foi
excluída a população Karitiana, devido à sua provável mistura com populações africanas ou
européias, e as regiões Oriente Médio, Ásia Central e Europa foram agrupadas em uma única
região, a Eurásia, por revelarem alta similaridade genética.
Na análise haplotípica dos dados do bloco haplotípico composto de 667 indivíduos,
encontramos um total de 187 haplótipos, dos quais 129 eram haplótipos região-específico, ou
seja, aqueles encontrados apenas em uma única região (Tabela 8), e os 58 haplótipos
restantes foram compartilhados entre as demais regiões. Dos haplótipos compartilhados
entre as regiões, apenas um foi compartilhado entre todas as regiões do Painel HGDP-
CEPH. A diversidade haplotípica encontrada entre os 667 indivíduos foi bastante alta
(0,976±0,002), perfil que se repetiu em cada região, com exceção apenas da Oceania e da
América, que possuem os menores índices de diversidade (0,885±0,047 e 0,839±0,038,
respectivamente) (Tabela 8). A maior diversidade haplotípica foi encontrada na África
(0,992±0,003), que representa apenas 14,6% dos indivíduos, enquanto que contém 38% do
total de haplótipos e 44% dos haplótipos região-específico encontrados. Este padrão de alta
diversidade africana permanecem quando analisamos os haplótipos com a presença da
inserção (0,952±0,027) e na ausência da inserção (0,991±0,003) DXS225, separadamente.
Esse perfil de alta diversidade na África, sugere para o homem moderno uma origem
africana e recente. As demais regiões não-africanas representam apenas um subconjunto da
variabilidade encontrada na África. Então se espera que nas regiões de povoamento mais
93
recente, ocorra uma diminuição na diversidade, principalmente na região das Américas, onde
efeitos fundadores tiveram grande importância durante o povoamento do continente (Santos
et al., 1999). Visualizamos esse padrão em nosso bloco haplotípico, com uma grande
diminuição da diversidade genética, depois que o homem saiu da África (0,992±0,003) para o
Leste Asiático (0,967±0,005), e em seguida, uma menor redução do Leste Asiático para a
Eurásia (0,953±0,006) e uma brusca redução do Leste Asiático para a Oceania
(0,885±0,047). No entanto, a maior redução da variabilidade ocorre do Leste Asiático para a
América (0,839±0,037), durante o povoamento das Américas, que foi acompanhado de um
significante gargalo populacional, o qual reduziu a diversidade. Acreditamos também que
tenha fixado os alelos mais freqüentes, principalmente os que não possuíam a inserção
DXS225, que não é encontrada nas populações Ameríndias pré-colombianas. Esse padrão
corrobora com a teoria de que a expansão do homem moderno começou na África, seguida
de uma série de efeitos fundadores (Ramachandran et al., 2005). A alta diversidade africana
também é observada em outros marcadores moleculares, como, por exemplo, o DNA
mitocondrial (Cann et al, 1987) e o cromossomo Y (Jorde et al., 2000), sendo esse padrão
utilizado como evidência para a Teoria “Out of Africa” referente à origem do homem moderno.
Nossas análises de compartilhamento de haplótipos estão representadas na Figura
15, onde podem ser observadas as proporções de compartilhamento entre as cinco principais
regiões do Painel do HGDP-CEPH. As menores proporções de compartilhamento foram
encontradas na África, enquanto que as maiores foram vistas na América. Com os resultados
do compartilhamento, podemos inferir uma possível relação genealógica entre as
populações, principalmente quando observamos o Leste Asiático, que contém 50% dos
haplótipos vistos na Oceania e 70% dos encontrados na América, enquanto que a Oceania
possui apenas 7% e a América 10,4% dos encontrados no Leste Asiático, indicando uma
relação genealógica parental do Leste Asiático para a Oceania e América. No caso da
América essa relação é descrita por Santos et al.,(1999), que sugere que tal relação não
deve ter ocorrido há muito tempo, o que também é observado com nossos dados, pois não
houve tempo suficiente para uma diversificação haplotípica por mutação nos Ameríndios. Ao
94
contrário do que podemos observar na relação parental da África com o Leste Asiático, com
apenas 7% e 7,5% dos haplótipos compartilhados entre essas duas regiões. Por ser uma
relação parental mais antiga, houve tempo para ocorrer uma diversificação, devido a
mutações e outros fatores evolutivos, como o fluxo gênico com outras regiões, que podem ter
contribuído para a diferenciação haplotípica entre as regiões.
A partição da variabilidade genética, medida com a AMOVA para o bloco haplotípico,
revela pouca estruturação genética com os maiores níveis de variabilidade genética
encontrados dentro das populações (95,2%), enquanto se nota apenas 1,7% da variabilidade
presente entre as populações dentro das regiões e 3,1% entre as cinco principais regiões
(Tabela 9). Nossos índices de variabilidade são semelhantes aos encontrados por Rosenberg
et al., (2002), para as mesmas populações, no estudo de 377 microssatélites autossômicos,
com 93,2% da variação dentro das populações; 2,5% entre as populações dentro das
regiões; e 4,3% entre as cinco regiões mundiais. Quando fazemos a AMOVA para cada
região, observamos também um maior componente de variação dentro das populações com
valores maiores que 95%, com exceção das regiões Oceania e América que apresentam
valores de componentes de variação maiores entre as populações (14,95% e 15,29%,
respectivamente). Essa maior variabilidade inter-populacional nas populações da América e
Oceania pode ser explicada pelos altos níveis de deriva genética encontrada, principalmente
nas Américas (Cavalli-Sforza et al., 1994). Além disso, outro fator que pode ter contribuído
para a variabilidade entre as populações da Oceania do Painel do HGDP-CEPH, fato de ser
composta por apenas duas populações (Papuan, da Nova Guiné, e Nan Melanesian, de
Bougainville) que são geneticamente distintas, como vimos na AMOVA apenas com o
marcador DXS225 (Tabela 5). Apesar da pouca estruturação genética vista na AMOVA,
podemos considerar nosso bloco haplotípico como um marcador informativo para estudar a
partição da variabilidade genética das populações humanas.
Nas redes haplotípicas construídas, podemos observar uma ampla distribuição e
compartilhamento dos haplótipos. A África foi a única região que apresentou um padrão de
distribuição de haplótipos distinto das demais regiões, com a presença da maioria dos seus
95
haplótipos distribuídos na região mais periférica da rede, com freqüências menores
representando os haplótipos únicos encontrados nessa região (Figura 16). No entanto, as
regiões do Leste Asiático, Eurásia, Oceania e América formaram dois grupos compostos
pelos haplótipos com ausência da inserção DXS225, destacado na Figura 17, e apenas um
grupo com os poucos haplótipos que possuem a presença da inserção destacados na Figura
18. Esses agrupamentos formados pelos haplótipos encontrados fora da África, na sua
maioria são pequenos e com poucos haplótipos bastante freqüentes, o que indica a presença
de efeito fundador, fato que pode ser considerado como mais uma evidência para a ausência
de recombinação, pois, com a recombinação esse efeito teria desaparecido ao longo do
tempo.
Utilizamos as redes haplotípicas para fazer inferências sobre os haplótipos ancestrais
encontrados dentro e fora da África. Na Figura 17, destacado por setas, observamos o
haplótipo 9, 15, 0, 27, 21, o mais freqüente e o único compartilhado entre todas as regiões
mundiais. Próximos a ele, estão outros dois haplótipos: o 10, 15, 0, 27, 21, presente em todas
as regiões, exceto na Oceania, e o 9, 15, 0, 27, 20, presente no Leste Asiático, Oceania e
América. A ampla distribuição desses três haplótipos sugere que eles pertencem ao grupo
inicial de haplótipos fundadores que saíram da África e expandiram-se pelos demais
continentes (Figura 17). Outro grupo de haplótipos formado pelo 13, 16, 0, 27, 20, o segundo
mais freqüente, é visto na Eurásia e no Leste Asiático, e próximos a ele, com diferença de um
e dois passos mutacionais, estão os haplótipos 13,16,0,27,21 e 14,16,0,27,21, ambos
encontrados na Eurásia, Leste Asiático e Oceania. Esses haplótipos, provavelmente, formam
o segundo grupo de haplótipos que emergiu da África.
Quando observamos a Figura 18, os haplótipos com a presença da inserção DXS225,
vemos apenas dois haplótipos mais freqüentes: o 11,14,1,25,18, encontrado na África, Leste
Asiático e Eurásia, e o 10,14,1,25,17, visto no Leste Asiático e na Eurásia, os quais formam
um único agrupamento. Esse pequeno número de haplótipos com a presença da inserção
sugere a ocorrência de gargalos populacionais durante o período de saída do homem, da
região da África, reduzindo o número de haplótipos e a diversidade genética fora da África.
96
Essa forte redução da diversidade genética é revelada pelos índices de diversidade
encontrada dentro da África, com a presença da inserção DXS225 (0,952±0,027), se
compararmos com os índices de diversidade encontrado fora da África, de apenas
0,854±0,020. Assim, a redução é menos acentuada para os haplótipos sem a inserção
DXS225, com índices de 0,991±0,003 na África e de 0,962±0,004 fora da África.
A representação gráfica da análise de componente principal (Figura 20), para as sete
regiões do Painel HGDP-CEPH, confirmam o agrupamento entre as regiões que compõem a
Eurásia (Oriente Médio, Ásia Central e Europa). O gráfico da PCA, para as cinco regiões,
apresentou 63,6% da informação, mostrando que há separação entre a África e demais
regiões (Figura 21).
Com a análise de coalescência, foi possível estimar o tempo do mais recente
ancestral comum (TMRCA) para o nosso bloco haplotípico de 182.000 anos (95% de limites
de confiança 56.700-479.000), verificamos amplos intervalos de confiança com nossos
dados, tal como outros trabalhos que utilizam dados do cromossomo X para estimativa do
TMRCA (Shimaka et al., 2007). No entanto, o TMRCA estimado por meio de nossos dados é
compatível com evidências genéticas (Macaulay et al., 2005) e paleontológicas para a origem
do homem moderno na África há 195.000 anos (McDougall et al., 2005) e confirma o padrão
intermediário do nosso bloco haplotípico, em comparação com os marcadores de linhagem
que possuem um TMRCA de 100.000-200.000 anos (Weiss et al., 1996; Igman et al.,2000) e
os autossomos com 750.000 anos para o gene da � globina no cromossomo 11 (Harding et
al., 1997).
Na Tabela 11, estão os resultados posteriori das análises feitas com o programa
BATWING, que permitiu estimar que o evento de inserção da DXS225 ocorreu há 94.400
anos (95% de limites de confiança 24.300-310.000), corroborando com a origem da inserção
antes de o homem sair da África, já que se pressupõe que a saída da África para a Ásia deve
ter ocorrido há 55.000-65.000 anos (Liu et al.,2006; Mellars, 2006).
97
A estimativa das taxas de mutação, para cada microssatélite do bloco haplotípico,
demonstrou que o DXS1019 possui a menor taxa de mutação do bloco haplotípico (Tabela
10, Figura 22).
A estimativa do tempo de divergência da África foi de apenas 9.950 anos (95% de
limites de confiança 2.770-22.500), que é uma estimativa bastante baixa em comparação
com outros marcadores, como o DNA mitocondrial (45.000-75.000 anos) (Macaulay et al.,
2005) e com dados paleontológicos (90.000-130.000 anos) (Trinkaus, 2005), o que pode ter
ocorrido devido a migrações adicionais, após a separação das populações, que pode ter
mascarado os sinais de divergência, diminuindo o tempo observado.
Com os resultados observados neste capítulo, podemos concluir que o bloco
haplotípico do cromossomo X analisado é uma ferramenta bastante informativa para estudos
filogeográficos. E que os nossos dados corrobora com a teoria “Out of África” para a saída
do homem moderno da África.
Os referidos resultados foram publicados no artigo de Santos-Lopes et al., 2007
(Anexo 2).
98
4.3 CAPÍTULO 3 - ANÁLISE DA DIVERSIDADE E ANCESTRALIDADE
GENÉTICAS DA POPULAÇÃO BRASILEIRA (BRANCOS E PRETOS) DA CIDADE
DE SÃO PAULO
4.3.1 INTRODUÇÃO
A matriz triíbrida brasileira envolveu os Ameríndios nativos, Europeus colonizadores e
escravos Africanos (Ribeiro, 1995). Cinco séculos de cruzamentos interétnicos originaram a
ampla heterogeneidade genética brasileira, que pode ser estudada em nível molecular, por
meio de diferentes marcadores genéticos. Atualmente, os marcadores de linhagens, o
cromossomo Y e o DNA mitocondrial, que fornecem informações sobre as linhagens paterna
e materna, respectivamente, são os mais estudados.
Trabalhos iniciais com populações brasileiras foram publicados por nosso grupo
(Laboratório de Genética Bioquímica da UFMG), aos quais foi possível demonstrar que a
maioria das patrilinhagens dos indivíduos auto-classificados como brancos brasileiros é de
origem européia (Carvalho-Silva et al., 2001), enquanto que 60% das matrilinhagens são de
origem ameríndia ou africana (Alves-Silva et al., 2000). Esses resultados corrobora com
dados históricos que descrevem o processo de miscigenação entre os homens imigrantes
(principalmente portugueses), e as mulheres indígenas e africanas (Ribeiro, 1995).
Outra questão investigada pelo nosso grupo foi a existência de uma correlação entre a
cor da pele e a ancestralidade genômica, inicialmente por meio de marcadores informativos
de ancestralidades (AIMs) (Parra et al., 2003), e mais recentemente, com microssatélites
autossômicos (Pimenta et al., 2006), demonstrando que, em nível individual, existe pouca
correlação entre cor e ancestralidade genômica.
Atualmente, os estudos com populações brasileiras têm procurado investigar a origem
dos escravos africanos que vieram para o Brasil (Silva et al., 2006; Hünemeier et al., 2007;
Gonçalves et al., 2008), pois, diferentemente das migrações para as colônias européias nas
Américas, a migração para o Brasil envolveu africanos vindos de todas as principais regiões,
99
principalmente das regiões do Ocidente, Oriente, Sudoeste e Sudeste (Moçambique)
africanas (Klein, 2002).
Neste capítulo, vamos utilizar o bloco haplotípicos para analisar a diversidade genética
e a ancestralidade de brasileiros. Para isso, foram analisados 97 indivíduos classificados
como Pretos e 107 indivíduos classificados como Brancos, da cidade de São Paulo. Os
indivíduos foram classificados por critérios fenotípicos e genealógicos, conjuntamente.
Primeiramente, perguntava-se aos indivíduos a qual grupo de cor pertenciam, segundo a
definição do IBGE (Brancos, Pardos e Pretos), e após a sua inclusão em um grupo de cor, os
indivíduos classificavam os seus pais e todos seus avós. A análise fenotípica foi realizada por
um entrevistador, que observou as características faciais e a pigmentação da axila, região do
corpo não-exposta ao sol, de cada indivíduo. Assim, os indivíduos foram classificados como
Brancos, Pardos ou Pretos, mas analisamos, apenas os grupos de Pretos e Brancos. Os
indivíduos eram classificados como Pretos quando as características fenotípicas estavam
presentes, e seus pais e todos os seus avós eram definidos como Pretos. Todos os estudos
foram anônimos, com o consentimento dos participantes, e aprovados pelo comitê de ética da
USP. As amostras utilizadas nesses estudos foram cedidas pelo Professor Sérgio Bydlowski,
da Faculdade de Medicina da Universidade de São Paulo.
Os dados das populações parentais da África sub-sahariana e Eurásia foram obtidos
por meio de amostras do Painel do HGDP-CEPH, estudadas no Capítulo 2 desta tese.
Para as análises realizadas neste capítulo, reduzimos o bloco haplotípico para os dois
microssatélites (DXS1002 e DXS1019) e a inserção Alu (DXS225). Selecionamos os
microssatélites que possuem as taxas de mutação mais baixas do bloco haplotípico: a taxa
de mutação do DXS1002 é de 1,04x10-3, e a do DXS1019 é de 0,34 x 10-3 (Tabela 11 e
Figura 23). Fizemos a redução do bloco haplotípico para três marcadores, visando ampliar o
compartilhamento de haplótipos entre os grupos de brasileiros (Brancos e Pretos) e as
populações ancestrais (África sub-sahariana e Eurásia), pois, com a análise do bloco
completo, o compartilhamento encontrado foi baixo.
100
Os resultados obtidos neste capítulo foram reunidos em manuscrito em fase de
preparação (Anexo 3).
4.3.2 RESULTADOS
4.3.2.1 Diversidade haplotípica
Na análise inicial dos dois grupos de brasileiros, classificados como Pretos e Brancos
de São Paulo, com o bloco haplotípico completo (DXS1012, DXS1002, DXS225, DXS1019 e
DXS8114), observamos 119 haplótipos nos 204 indivíduos, sendo 58 nos Brancos e 79 nos
Pretos. A diversidade haplotípica, para os brasileiros, foi de 0,987±0,002, e a encontrada nos
Brancos de 0,972±0,006, e nos Pretos de 0,994±0,002.
Já com bloco haplotípico reduzido, formado pelos marcadores DXS1002, DXS225 e
DXS1019, encontramos um total de 42 haplótipos entre os 204 indivíduos brasileiros
classificados como Pretos e Brancos de São Paulo. Desses haplótipos, um total de 32 foi
encontrado nos Pretos brasileiros e apenas 18 entre os Brancos brasileiros. Nas populações
parentais, encontramos 23 haplótipos nas populações da África e 24 nas populações da
Eurásia. A diversidade haplotípica, para os brasileiros (Brancos e Pretos), foi de 0,869±0,014,
e esse índice difere bastante quando observamos os grupos de brasileiros separadamente.
Nos indivíduos Pretos brasileiros, encontramos uma diversidade haplotípica (0,905±0,018)
bem maior que a dos Brancos brasileiros (0,826±0,022). No entanto, esses valores foram
intermediários aos encontrados na África (0,947±0,006) e na Eurásia (0,754±0,015) (Tabela
12).
101
Tabela 12. Número de indivíduos, haplótipos e diversidade haplotípica para a população
brasileira e as populações parentais do HGDP-CEPH.
Bloco haplotípico completo Amostras Número de
indivíduos Número de haplótipos
Diversidade Haplotípica
Brancos Brasileiros 107 58 0,972±0,006 Pretos Brasileiros 97 79 0,994±0,002 Eurásia 342 87 0,953±0,006 África 98 71 0,992±0,003 Brasil* 204 119 0,987±0,002
Bloco haplotípico reduzido Brancos Brasileiros 107 18 0,826±0,022 Pretos Brasileiros 97 32 0,905±0,018 Eurásia 342 24 0,754±0,015 África 98 23 0,947±0,006 Brasil* 204 42 0,869±0,014 *Brasil compreende indivíduos Brancos e Pretos.
102
4.3.2.2 Compartilhamento de haplótipos
No compartilhamento de haplótipos com os dados do bloco haplotípico completo,
verificamos a proporção de haplótipos compartilhados entre os brasileiros e as populações
parentais (África e Eurásia). A partir dessa análise, observamos uma alta proporção de
compartilhamento entre os Brancos brasileiros com 50% (29/58) dos seus haplótipos
compartilhados com a Eurásia, 24% (14/58) com os africanos e 31% (18/58) com os Pretos
brasileiros, enquanto que a proporção de compartilhamento entre os Pretos brasileiros tem
valores intermediários entre as populações parentais e Brancos brasileiros, com 24% (19/79)
de haplótipos compartilhados com a Eurásia, 20% (16/79) com os africanos e 23% (18/79)
com os Brancos brasileiros.
Na análise com o bloco haplotípico reduzido, os indivíduos Brancos brasileiros
também apresentaram uma maior proporção de haplótipos compartilhados, com 77,7%
(14/18) dos seus haplótipos compartilhados com os Pretos, 77,7% (14/18) com a África e
72,2% (13/18) com a Eurásia. E os indivíduos Pretos brasileiros apresentaram o mesmo perfil
intermediário de compartilhamento, com 43,7% (14/32) com os Brancos, 59,3% (19/32) com a
África e 56,2% (18/32) com a Eurásia. No entanto, a proporção de haplótipos compartilhados
com as populações parentais aumentou.
4.3.2.3 Análise de Variância Molecular (AMOVA)
A análise de variância molecular (AMOVA) foi realizada usando-se as freqüências
haplotípicas dos Pretos e Brancos brasileiros, e as populações da África e Eurásia. Quando
fazemos a AMOVA com indivíduos Pretos e Brancos brasileiros, observamos uma
similaridade genética, com a maior parte da variação encontrada dentro das populações, com
99,1% para o bloco haplotípico completo, 98,6% para o bloco reduzido, apenas 0,99% para
bloco completo e 1,3% para o bloco reduzido entre os Brancos e Pretos brasileiros (Tabelas
13 e 14). Na AMOVA com as 28 populações, incluindo Brasileiros (Pretos e Brancos), África e
Eurásia, encontramos os componentes de variação dentro das populações de 97,6% e
103
93,2%; entre as populações com 1,4% e 2,9%; e entre os grupos, de 0,97% e 3,8%, para o
bloco haplotípico completo e o reduzido, respectivamente (Tabelas 13 e 14).
Tabela 13. Análise de variância molecular para o bloco haplotípico completo (DXS1012,
DXS1002, DXS225, DXS1019 e DXS8114 ) para os Brasileiros, África e Eurásia.
Amostra Número de regiões
Número de populações
Componentes de variação (%)
Dentro das populações
Entre populações dentro de regiões
Entre regiões
Brasileiros* 1 2 99,10 0,99 - Brasileiros,
África e Eurásia 3 28 97,60 1,4 0,97
Todos os valores foram significativos para p<0,005. *Brasileiros- indivíduos Brancos e Pretos. Tabela 14. Análise de variância molecular para o bloco haplotípico (DXS1002, DXS225 e
DXS1019 ) para os Brasileiros, África e Eurásia.
Amostra Número de regiões
Número de populações
Componentes de variação (%)
Dentro das populações
Entre populações dentro de regiões
Entre regiões
Brasileiros* 1 2 98,62 1,3 - Brasileiros,
África e Eurásia 3 28 93,24 2,94 3,83
Todos os valores foram significativos para p<0,005. *Brasileiros- indivíduos Brancos e Pretos.
104
Após a análise do compartilhamento de haplótipos e AMOVA, verificamos uma maior
proporção de haplótipos compartilhados entre os brasileiros com as populações parentais, e
uma maior diferenciação genética nos dados do bloco haplotípico reduzido. Devido a isso,
realizamos as demais análises apenas com o bloco haplotípico formado pelos três
marcadores (DXS1002, DXS225 e DXS1019 ).
4.3.2.4 Ancestralidade dos haplótipos do cromossomo X
Para estimar a contribuição ancestral relativa das populações parentais (África e
Eurásia) para indivíduos Pretos e Brancos brasileiros, utilizamos o programa LEADMIX 1.0,
que utiliza um método de maximum likelihood, desenvolvido por Wang (2003), com os dados
apenas do bloco haplotípico reduzido (DXS1002, DXS225 e DXS1019 ). As análises foram
realizadas usando-se 500 integrações no cálculo de Likelihood.
O LEADMIX calculou, para os Pretos brasileiros, uma ancestralidade africana de 0,54
(com 95% de intervalo de confiança 0,254-1,314) e uma ancestralidade Euroasiática de 0,45
(95% CI- 0,314-0,745). Os valores de ancestralidade, africana para os indivíduos Brancos
brasileiros, foram de apenas 0,29 (95% CI-0,007-0,683), e 0,71 (95% CI-0,361- 0,992) de
ancestralidade Euroasiática. A alta proporção de ancestralidade Euroasiática nos Brancos
(71%) e Pretos (45%) brasileiros se deve à reprodução preferencial, ocorrida durante o inicio
do processo de povoamento das Américas, com a reprodução sendo feita entre o colonizador
Europeu (na maioria, Portugueses) e as mulheres nativas e africanas. Na Tabela 15,
podemos comparar as porcentagens da contribuição genética de africanos e euroasiáticos e
os Brancos e Pretos de São Paulo com diferentes marcadores genéticos.
Nessas análises não utilizamos dados da população parental Ameríndia, pela mesma
apresentar um alto compartilhamento com populações da Eurásia, o que não permitiu a
separação em três grupos populacionais parentais (África, Eurásia e América).
105
Tabela 15. Porcentagem da contribuição genética dos africanos e euroasiáticos para os
Brancos e Pretos de São Paulo com diferentes marcadores genéticos.
Brancos de São Paulo Marcador Contribuição
africana Contribuição euroasiática
Referência
mtDNA 27% 73% Gonçalves-Dornelas et al. (artigo em preparação)
Cromossomo Y 0-4% >95% Carvalho-Silva et al. 2001 Indels autossômicos 11% 89% Bastos-Rodrigues et al.
(artigo em preparação) Cromossomo X 29% 71% Santos-Lopes et al. (artigo
em preparação) Pretos de São Paulo
mtDNA 85% 2,5% Gonçalves et al. 2008 Cromossomo Y 48% 50% Gonçalves et al. 2008
Indels autossômicos 56% 44% Bastos-Rodrigues et al. (artigo em preparação)
Cromossomo X 55% 45% Santos-Lopes et al. (artigo em preparação)
106
4.3.2.5 Análise de componente principal (PCA)
A análise de componente principal (PCA) foi feita utilizando-se as freqüências
haplotípicas, para os Pretos e Brancos brasileiros, populações da África e Eurásia (Figura
24), que apresentou 91% da informação nos dois componentes. O primeiro componente, com
59,3% da informação, separou a África dos Pretos brasileiros, e o segundo componente
separou a África e os Pretos da Eurásia e dos Brancos brasileiros.
Os Pretos brasileiros e a África não apresentaram proximidade no gráfico de PCA,
devido a esse perfil decidimos investigar a relação entre os Pretos brasileiros e os africanos
do Painel do HGDP-CEPH. Com isso fizemos uma análise de componente principal apenas
com as sete populações africanas e com os Pretos brasileiros (Figura 25), nela podemos
observar que os Pretos Brasileiros formaram um pequeno agrupamento com as populações:
Bantu_NE (Quênia), Mandenka (Senegal) e Yoruba (Nigéria) do Painel do HGDP-CEPH. Isso
significa que a separação que visualizamos, entre Pretos brasileiros e África (Figura 24), se
deve à grande diferenciação genética entre as populações africanas do Painel; e também
pela contribuição ancestral africana, específica de algumas regiões, para os Pretos
brasileiros.
107
Figura 24. Representação gráfica da análise de componente principal com as freqüências haplotípicas
dos Pretos e Brancos brasileiros, e as populações da África e Eurásia do Painel do HGDP-CEPH. O
primeiro componente apresentou 56,9% da informação e o segundo, 35,3%.
Figura 25. Representação gráfica da análise de componente principal com as freqüências haplotípicas
dos Pretos brasileiros e as populações da África do Painel do HGDP-CEPH. O primeiro componente
apresentou 29% da informação e o segundo, 25%.
108
4.3.2.6 Estrutura Populacional
A análise Bayesiana da diferenciação genética entre as populações foi realizada por
meio do programa BAPS 2.2 (Bayesian Analysis of Population Structure), desenvolvido por
Corander et al.,( 2003), e que possui a vantagem de tratar os números de diferentes
populações como um parâmetro desconhecido, o que significa que, se o programa percebe
que duas populações, devido ao alto grau de fluxo gênico ou uma recente fundação, podem
ser consideradas apenas uma única população panmítica, ele agrupa as populações. Todos
os grupos de combinações são considerados, a priori, igualmente possíveis, e o programa
fornece a partição mais provável entre os grupos populações que pode ser representado em
dendograma (Corander et al., 2004). No BAPS, utilizamos as freqüências haplotípicas do
bloco haplotípico reduzido dos Pretos e Brancos brasileiros, o que comprovou a ausência de
estrutura genética vista na AMOVA (Tabela 14). O BAPS agrupou os Pretos e Brancos
brasileiros formando um único grupo com a probabilidade posteriori igual a 1, mostrando a
similaridade genética entre esses dois grupos de brasileiros, classificados de acordo com cor
da pele.
Utilizamos a análise do BAPS com os Pretos e Brancos brasileiros, e com as
populações parentais África e Eurásia. O programa identificou, com a probabilidade posteriori
de 0,977, três agrupamentos: o primeiro, formado pelos Brancos brasileiros e a Eurásia; o
segundo, com os Pretos brasileiros; e o terceiro, formado pela África (Figura 26). Os valores
de Fst, para diferenciação dos agrupamentos, foram de 0,148±0,027 para Brancos brasileiros
e Eurásia versus Pretos brasileiros; de 0,086±0,024 para Brancos brasileiros e Eurásia
versus África; e de 0,067±0,015 para Pretos brasileiros e África. Esses agrupamentos são
formados de acordo com as freqüências similares encontradas nas populações, fornecendo
resultados semelhantes aos encontrados no gráfico de PCA (Figura 24), com o agrupamento
dos Brancos e a Eurásia, e os Pretos na localização intermediária entre a Eurásia e a África,
de acordo com as freqüência dos haplótipos.
109
Da mesma forma que na análise do PCA (Figura 24), fizemos a análise no BAPS
apenas com as populações africanas do Painel e os Pretos brasileiros. Dessa forma, o
programa identificou quatro agrupamentos com probabilidade posteriori de 0,565: o grupo 1,
formado pelas populações Pigmeus Biaka; o grupo 2, formado por Pretos brasileiros,
Mandenka, Yoruba e Bantu_NE; o grupo 3, por San e Bantu_SE; e o grupo 4, por Pigmeu
Mbuti. Essa partição está representada no dendograma da Figura 28. Novamente
visualizamos o agrupamento dos Pretos brasileiros com as populações do oeste africano
(Mandenka e Yoruba), cuja região é descrita por dados históricos e dados do DNA
mitocondrial como uma das regiões que mais enviou escravos africanos para o Brasil
(Gonçalves et al., 2008; Hünemeier et al., 2007). Também observamos a população de
Bantu_NE (Quênia), do leste-central africano, que também participou, mas com menores
freqüências, do tráfico de escravos para o Brasil (Silva et al., 2006).
Todas as análises foram realizadas utilizando-se uma estimativa de 100.000 passos
para MCMC e 5.000 passos de burn-in.
110
Figura 26. Dendograma com a representação da melhor partição identificada pelo programa BAPS,
para os Pretos e Brancos brasileiros e as populações da África e Eurásia do Painel do HGDP-CEPH.
111
Figura 27. Dendograma com a representação da melhor partição identificada pelo programa BAPS
para os Pretos brasileiros e as populações da África do Painel do HGDP-CEPH.
112
4.3.2.7 Redes haplotípicas
Redes haplotípicas foram construídas pelo cálculo de median joining, com dados das
freqüências haplotípicas do bloco haplotípico reduzido dos brasileiros e populações da África
e Eurásia, utilizando-se o programa Network 4.1.0.6 (Bandelt et al., 1999). Na Figura 28,
podemos observar, na rede haplotípica, a presença de efeito fundador que resultou na
predominância de apenas cinco haplótipos principais, amplamente distribuídos e bastante
freqüentes entre as populações.
Verificamos a proporção de indivíduos distribuídos nos cinco haplótipos principais, ou
seja, o número de indivíduos de cada população encontrado em cada um desses cinco
haplótipos (1-5 da Figura 28). Essa análise revelou uma distribuição bastante interessante, na
qual os Pretos brasileiros têm 55% dos seus indivíduos distribuídos entre os cinco haplótipos
principais, enquanto que os Brancos brasileiros correspondem a 85% dos indivíduos,
novamente observamos valores intermediários aos encontrados na África, com 42%, e na
Eurásia, com 92% dos indivíduos distribuídos nos cinco haplótipos.
Utilizamos a mesma abordagem do Capítulo 2 desta tese para inferir os prováveis
haplótipos fundadores a partir da rede haplotípica gerada no programa Network 4.1.0.6
(Bandelt et al., 1999). O haplótipo número 2, formado pelo alelo 16,0,27 dos marcadores:
DXS1002, DXS225 e DXS1019, respectivamente, é o haplótipo mais comum entre os cinco
principais. Próximos a esse haplótipo, com a diferença de apenas um passo mutacional,
estão os haplótipos: 3 (15,0,27) e 1 (17,0,27), que, provavelmente, formavam um grupo de
haplótipos que saiu da África para povoar os outros continentes. Esse número limitado de
haplótipos com inserção evidencia, mais uma vez, a presença do efeito fundador após a
saída do homem moderno da África para os demais continentes.
113
Figura 28. Rede haplotípica em que as cores representam os haplótipos encontrados nos Pretos e
Brancos brasileiros e as populações da África e da Eurásia do Painel do HGDP-CEPH. Os haplótipos
mais freqüentes estão numerados de 1-5, e as setas destacam os haplótipos formados pelos
marcadores DXS1002, DXS225 e DXS1019.
114
4.3.3 DISCUSSÃO
A matriz triíbrida do povo brasileiro tem sido investigada por diversos pesquisadores,
com o intuito de obter informações sobre a diversidade e ancestralidade encontradas na atual
população brasileira, contribuindo com o entendimento da história molecular da formação do
povo brasileiro. Neste capítulo, buscamos fornecer informações sobre o processo de
formação do povo brasileiro utilizando uma nova ferramenta molecular, um bloco haplotípico
no cromossomo X, que possui características interessantes, e que tem-se mostrado bastante
informativo para estudos evolutivos.
Nesta análise, reduzimos o nosso bloco haplotípico para dois microssatélites
(DXS1002 e DXS1019) e a inserção DXS225. Os dois microssatélites foram escolhidos por
possuírem as menores taxas de mutação (1,04 e 0,34 x10-3, respectivamente) dentro do
bloco haplotípico original (Capítulo 1 desta tese). Reduzimos o número de marcadores para
ampliar o número de compartilhamentos entre os grupos de brasileiros (Pretos e Brancos) e
as populações parentais (África e Eurásia). Para evidenciar, de forma mais clara, esse fato,
comparamos os resultados de diversidade haplotípica, compartilhamento de haplótipos e
análise de variância molecular entre os blocos haplotípico completo (DXS1012, DXS1002,
DXS225, DXS1019 e DXS8114) e o reduzido (DXS1002, DXS225 e DXS1019), quando
verificamos, para o bloco haplotípico reduzido, uma maior proporção de haplótipos
compartilhados entre os brasileiros e as populações parentais e, na AMOVA, uma
variabilidade genética um pouco maior (Tabelas 12 e 14). Com isso, realizamos as demais
análises deste capítulo utilizando apenas os dados do bloco haplotípico reduzido.
Utilizamos o bloco haplotípico para estudar dois grupos de brasileiros da cidade de
São Paulo, um deles formado por 107 indivíduos classificados como Brancos, e outro, por 97
indivíduos classificados como Pretos. Entre os 204 brasileiros encontramos, no bloco
haplotípico completo um total de 119 haplótipos, e 42 haplótipos no bloco haplotípico
reduzido. A diversidade haplotípica do bloco completo foi maior (0,994±0,002) que a
observada no bloco reduzido (0,987±0,002), o que é esperado devido à redução no número
115
de marcadores analisados. Enquanto que a diversidade encontrada entre os grupos de
brasileiros tanto com o bloco haplotípico completo quanto com o bloco reduzido revelou uma
maior diversidade nos Pretos brasileiros (0,994±0,002-0,905±0,018, bloco completo e
reduzido, respectivamente), comparada com a encontrada entre os Brancos brasileiros
(0,972±006-0,826±0,022, bloco completo e reduzido, respectivamente), sendo esses índices
de diversidade intermediários aos encontrados nas populações da África (0,992±0,003-
0,947±0,006) e da Eurásia (0,953±0,006-0,754±0,015), demonstrando uma similaridade entre
os grupos de brasileiros e as populações parentais (África e Eurásia) (Tabela 12).
Apesar dos grupos de brasileiros serem distintos fenotipicamente, utilizando os
diferentes sistemas de classificação, observamos uma similaridade genética entre os Pretos
e os Brancos da cidade de São Paulo na AMOVA, com 99,1-98,6% da variabilidade genética
encontrada dentro das populações, ou seja, entre os indivíduos e apenas 0,9-1,3% entre os
Pretos e os Brancos brasileiros para os blocos completo e reduzido, respectivamente
(Tabelas 13 e 14).
Essa similaridade genética foi confirmada pela análise Bayesiana de estrutura
populacional utilizando o programa BAPS 2.2 (Corander et al., 2004), para os dados do bloco
reduzido, que demonstrou que os indivíduos classificados como Pretos e Brancos de São
Paulo, formaram um único agrupamento. O que corrobora com estudos prévios utilizando
marcadores informativos de ancestralidade (AIMs)(Parra et al., 2003), e microssatélites do
cromossomo Y (Pimenta et al., 2006), que encontraram pouca correlação entre
ancestralidade genômica e cor da pele em indivíduos brasileiros.
Entretanto, a contribuição ancestral para esses dois grupos de brasileiros é bastante
distinta, mas visualizamos uma introgressão da contribuição européia nos brasileiros.
Encontramos nos indivíduos classificados como Pretos 55% de ancestralidade africana e
45% de ancestralidade euroasiática, enquanto que os indivíduos classificados como Brancos
têm 71% de ancestralidade euroasiática e 29%, de africana. Elevados valores de contribuição
européia, variando entre 42% a 64%, em Pretos brasileiros, também foram visualizados com
outros marcadores moleculares, como DNA mitocondrial (Gonçalves et al., 2008, Hünemeier
116
et al., 2007), cromossomo Y e autossomos (Suarez-Kurtz et al., 2007), com os maiores
índices encontrados em populações de Porto Alegre (Marrero et al., 2005) . Na Tabela 15
podemos comparar os dados de contribuição genética para diferentes marcadores.
Esses altos valores de contribuição ancestral européia também retratam o padrão de
reprodução preferencial envolvendo os homens (europeus colonizadores) e as mulheres
(ameríndias nativas e escravas africanas), o qual iniciou o processo de povoamento e
continuou, de maneira mais discreta, durante muitos anos. Tal padrão foi observado com
marcadores de linhagens: Y com maior contribuição européia (Carvalho-Silva et al., 2001), e
DNA mitocondrial com 60% das linhagens africanas e ameríndias (Alves-Silva et al., 2000).
Esse padrão também foi observado em outros paises da América Latina (Bedoya et al.,
2006), o que demonstra que essa é uma característica dos colonizadores ibéricos.
Gonçalves et al.,(2007) propõem que os altos índices de contribuição européia
masculina encontrada nos brasileiros estão também associados à categorização “racial”, que,
no Brasil, corresponde à cor da pele, e à categorização social, das crianças originadas dessa
relação. Com as crianças que possuem características européias, por exemplo cor da pele
mais clara, são consideradas brancas e categorização social mais elevada, enquanto as
crianças com cor da pele mais escura são classificadas como africanas e categorização
social mais baixa, sendo que a contribuição genética é a mesma para as duas crianças, o
que pode aumentar o número de pretos com ancestralidade européia.
A contribuição africana encontrada com os dados do bloco haplotípico do
cromossomo X para os Brancos brasileiros foi bastante alta (21%), se comparada com os
dados do cromossomo Y, em que a contribuição africana varia de 0-4% (Carvalho-Silva et al.,
2001; Gonçalves et al., 2008, Hünemeier et al., 2007) e nos polimorfismos de inserção e
deleção (Indels) autossômicos em 11% (Suarez-Kurtz et al., 2007) (Tabela 15). Essa alta
freqüência de contribuição africana confirma o caráter intermediário dos marcadores do
cromossomo X, em que podemos observar a contribuição paterna e materna no mesmo
marcador.
117
As análises de componente principal e a análise bayesiana de estrutura populacional,
com os Pretos e Brancos brasileiros e as populações da África e Eurásia, revelaram um
agrupamento entre os Brancos brasileiros e as populações da Eurásia. No entanto, o mesmo
não foi visto para os Pretos brasileiros e as populações da África (Figuras 24 e 26), o que
pode ocorrer devido à grande variabilidade encontrada entre as populações africanas e ao
perfil regional de contribuição africana para os Pretos brasileiros.
Dessa forma, quando analisamos apenas as populações africanas e os Pretos
brasileiros, visualizamos um agrupamento dos Pretos com as populações do oeste e leste-
central africanos (Figuras 25 e 27). Essas regiões da África já foram descritas por dados
históricos e de DNA mitocondrial, como fonte de escravos africanos para o Brasil, vindos
principalmente da costa oeste da África para São Paulo (Bortolini et al., 2004; Gonçalves et
al., 2008; Klein, 2002).
Esses resultados demonstram a eficiência do bloco haplotípico em estudos evolutivos,
o qual é capaz de fornecer informações coerentes sobre as rotas ancestrais dos escravos
africanos para a cidade de São Paulo, já que isso não foi possível para os marcadores do
cromossomo Y, pois as mesmas rotas não foram visualizadas devido à ausência de
estratificação significante nas freqüências haplotípicas entre as regiões do oeste e centro-
oeste africanos (Gonçalves et al., 2008).
Na rede haplotípica, verificamos a presença do efeito fundador, que reduziu o número
de haplótipos para cinco haplótipos principais (Figura 28), em que está distribuída a maioria
dos indivíduos; no entanto, quando calculamos a proporção de indivíduos nos cinco
haplótipos, novamente observamos um padrão intermediário entre os Pretos (55%) e Brancos
(85%) brasileiros e as populações parentais da África (42%) e Eurásia (92%). A rede
haplotípica foi utilizada para inferir os prováveis haplótipos fundadores, de acordo com a sua
distribuição e freqüência. Com a ausência da inserção DXS225, o haplótipo 2 pode ser
considerado o provável haplótipo ancestral da Eurásia, que pertenceu ao grupo inicial que
saiu da África. Enquanto que, com a presença da inserção, os haplótipos 5 e 4 pertencem,
provavelmente ao segundo grupo que saiu da África carregando a inserção DXS225.
118
5 CONCLUSÃO GERAL
119
A partir dos estudos filogeográficos realizados com populações mundiais e brasileiras, com a
utilização de marcadores moleculares em uma região com baixa taxa de recombinação do
cromossomo X, podemos concluir:
• O bloco haplotípico, na região Xq21.1-Xq21.3, que apresenta as menores taxas de
recombinação do cromossomo X, é formado por quatro microssatélites (DXS1012,
DXS1002, DXS1019 e DXS8114), e uma inserção Alu (DXS225) está em completo
desequilíbrio de ligação, observado por meio de diferentes análises.
• Esse bloco haplotípico fornece informações complementares aos marcadores
moleculares tradicionais (autossomos, cromossomo Y e DNA mitocondrial). Primeiro,
devido às características do cromossomo X, que são bastante interessantes para
estudos evolutivos, como: tamanho efetivo intermediário, alternância entre os sexos, e
hemizigosidade em homens. E segundo, que qualquer marcador, formado por
marcadores com diferentes taxas de mutação, poderá fornecer histórias evolutivas
diferentes, tornando-se um marcador mais informativo.
• A ampla distribuição da inserção DXS225 nas regiões mundiais e a análise de
coalescência sugerem a origem dessa inserção antes do homem moderno sair da
África, há aproximadamente 94.400 anos (CI 24.300-310.000).
• A análise de variância molecular (AMOVA) demonstrou pouca estrutura populacional,
com altos níveis de variabilidade (92% a 99%) dentro das populações, ou seja, entre
os indivíduos. Com exceção apenas da América e Oceania, que possuem alta
variabilidade genética entre as populações.
• Os índices de diversidade de Nei, para os marcadores e para o bloco haplotípicos,
foram altos: DXS1012 (0,829), DXS1002 (0,721), DXS225 (0,415), DXS1019 (0,560) e
DXS8114 (0,798) e (0,979) para o bloco haplotípico.
• Os maiores índices de diversidade haplotípica são encontrados na África. Tais índices
sofreram uma grande redução logo após o homem sair da África, até chegar aos
120
menores valores de diversidade na América. Essa diminuição na diversidade segue o
padrão de expansão do homem moderno, seguindo da África para o Leste Asiático,
depois para a Eurásia, Oceania e, por último, para as Américas.
• As regiões Oriente Médio, Ásia Central e Europa do Painel HGDP-CEPH possuem
grande similaridade genética, o que permite agrupá-las em uma única região, a
Eurásia.
• O tempo do mais recente ancestral comum (TMRCA), estimado para o nosso bloco
haplotípico, foi de 182.000 anos (CI 56.700-479.000), com valores aproximados ao
TMRCA encontrado por meio de marcadores moleculares e os dados paleontológicos.
• O compartilhamento de haplótipos revelou uma genealogia parental do Leste Asiático
com a Oceania e a América, demonstrando que o bloco haplotípico é uma ferramenta
interessante para se estudar em questões sobre o povoamento das Américas.
• As redes haplotípicas revelaram que, durante o processo de expansão da África,
ocorreu uma serie de efeitos fundadores e gargalos populacionais, reduzindo o
número de haplótipos.
• A elevada contribuição ancestral euroasiática para os Pretos e Brancos de São Paulo
corrobora com os dados históricos e moleculares relativos ao padrão de povoamento
que ocorreu nas Américas, com a contribuição paterna quase exclusiva dos
colonizadores europeus, e a materna vinda das nativas ameríndias e das escravas
africanas.
• Com as análises de componente principal e bayesiana da estrutura populacional,
verificamos uma similaridade genética entre os indivíduos classificados como Pretos
brasileiros e as populações do oeste e leste-central africanos, do Painel do HGDP-
CEPH, o que corrobora, mais uma vez, com os dados históricos e os do DNA
mitocondrial, referentes à origem dos escravos africanos que vieram para o Brasil.
• O bloco haplotípico, na forma reduzida, foi capaz de fornecer informações sobre a
diversidade e ancestralidade brasileiras, confirmando dados históricos e de outros
121
marcadores moleculares e que colabora para o entendimento do processo de
formação do povo brasileiro.
• O bloco haplotípico do cromossomo X permitiu fazer inferências evolutivas a respeito
das populações humanas encontradas no Painel do HGDP-CEPH e das populações
brasileiras, demonstrando ser um marcador robusto para estudos filogeográficos.
• Em nossos estudos, os resultados encontrados corroboram com a origem africana e
recente entre 100.000-200.000 anos, para o homem anatomicamente moderno.
122
6 CONSIDERAÇÕES FINAIS
123
A utilização de diferentes marcadores moleculares, para revelar aspectos sobre a
história evolutiva das populações humanas, tem sido o enfoque de diversos estudos há vários
anos. Os marcadores moleculares mais utilizados nesse tipo de estudo são os marcadores
de linhagens: cromossomo Y e DNA mitocondrial, que revelam aspectos relacionados à
linhagem paterna e materna, respectivamente, demonstrando a necessidade de se ter uma
visão mais ampla desses aspectos evolutivos, o que torna necessário o estudo de outras
regiões do genoma, tanto nos cromossomos autossômicos quanto em regiões do
cromossomo X.
Com o intuito de utilizar um marcador molecular que possuísse características que o
tornassem mais informativo ou complementar aos marcadores tradicionalmente utilizados,
surgiu o objetivo desta tese de Doutorado, que realiza estudos filogeográficos utilizando
marcadores no cromossomo X, devido às características que esse cromossomo possui, como
as descritas a seguir. A alternância entre os sexos, em um determinado momento, tem-se 1/3
dos cromossomos X no sexo masculino e 2/3 no sexo feminino. Na geração seguinte, os
cromossomos X da geração masculina anterior irão constituir metade dos 2/3 de
cromossomos X presentes na geração feminina. No caso do sexo masculino, o 1/3 de
cromossomos X presentes na próxima geração serão de origem feminina. Essa característica
imprime ao cromossomo X um efeito equalizador quanto aos fenômenos demográficos
sofridos tanto pelo sexo feminino quanto pelo masculino. Outra característica importante é o
fato de o cromossomo X estar presente, em cópia única, em homens, o que permite
estabelecer a fase dos haplótipos, fornecendo a identificação direta da relação entre os alelos
para os locos estudados.
Utilizamos marcadores localizados em uma região de 130 Kb, no intervalo Xq21.1-
Xq21.3, que apresenta as taxas de recombinação mais baixas do cromossomo X, apenas
0,16 cM/Mb em comparação com a média do cromossomo 1,3 cM/Mb. Essa região foi
delimitada por Rinaldo W. Pereira, durante o seu Doutorado no laboratório de Genética
Bioquímica da UFMG, o qual caracterizou uma inserção Alu flanqueada por alguns
124
microssatélites (Pereira et al., 2006). Na busca por novos marcadores nessa região,
descrevemos dois novos microssatélites (DXS1012 e DXS1019) próximos a inserção Alu.
Com isso, inicialmente padronizamos um bloco formado por sete microssatélites e a inserção
Alu, agora denominada DXS225, e depositada junto com os novos microssatélites no
Genome Database (GDB).
Após diferentes análises para verificar se os marcadores que compõem o bloco
haplotípico estavam em desequilíbrio de ligação, excluímos três microssatélites (DXS995,
DXS8076 e DXS1050), por não estarem em completo desequilíbrio de ligação. Com isso, o
bloco haplotípico ficou formado por quatro microssatélites (DXS1012, DXS1002, DXS1019 e
DXS8114) e a inserção Alu (DXS225) em completo desequilíbrio de ligação.
Após a padronização do bloco haplotípico do cromossomo X (Capítulo 1), passamos
a ter como objetivo utilizar esse novo marcador em estudos evolutivos: o primeiro foi realizar
análises filogeográficas com as populações mundiais que compõem o Painel do HGDP-
CEPH (Capítulo 2), e o segundo foi estudar a diversidade e a ancestralidade genéticas
encontradas nos brasileiros (Capítulo 3).
Nesses estudos nosso marcador demonstrou ser bastante útil e informativo, capaz
de fornecer informações complementares a respeito dos aspectos evolutivos das populações
humanas, permitindo estimar o tempo do mais recente ancestral comum (TMRCA), para o
bloco haplotípico, em 182.000 anos e o tempo da inserção DXS225 em 94.000 anos,
demonstrando a origem recente e africana do homem moderno.
Nosso bloco haplotípico também possibilitou estimar a contribuição ancestral dos
africanos e dos euroasiáticos para os grupos de brasileiros classificados como Brancos e
Pretos da cidade de São Paulo.
Conclui-se que os resultados dos três capítulos desenvolvidos nesta tese mostram
que padronizamos um bloco haplotípico no cromossomo X, formado por marcadores com
diferentes taxas de mutação, em completo desequilíbrio de ligação, o qual pode ser utilizado
como ferramenta de investigação em estudos populacionais e evolutivos. Os capítulos
125
descritos nesta tese deram origem a dois artigos publicados (Anexos 1 e 2) e a outro em fase
de preparação (Anexo 3).
Como perspectiva desta tese, temos o uso do nosso marcador em estudos
filogeográficos com diferentes populações. Como também, a busca e caracterização de
novos marcadores moleculares em diferentes regiões do genoma humano.
Um exemplo do uso do bloco haplotípico, seria para analisar questões relativas ao
povoamento do continente americano, como o número de ondas migratórias e as prováveis
populações ancestrais que deram origem aos nativos americanos. Utilizando-se da
característica intermediária do nosso marcador, para obter informações dos componentes
genéticos femininos e masculinos das populações ameríndias, fornecendo informações
complementares aos dados obtidos por meio da análise de marcadores do cromossomo Y,
do DNA mitocondrial e dados craniométricos das populações ameríndias.
126
7 REFERÊNCIAS BIBLIOGRÁFICAS
127
Abe-Sandes K, Silva WA, Zago MA (2004) Heterogeneity of the Y chromosome in Afro-
Brazilian Populations. Hum Biol 76(1)77-86.
Alves-Silva J, da Silva Santos M, Guimarães PE, Ferreira AC, Bandelt HJ, Pena SDJ, Prado VF. (2000). The ancestry of Brazilian mtDNA lineages. Am J Hum Genet. 67:444-461.
Anderson S, Bankier AT, Barrell BG, de Bruijn MH, Coulson AR, Drouin J,Eperon IC, Nierlich
DP, Roe BA, Sanger F, Schreier PH, Smith AJ, Staden R, Young IG. (1981). Sequence and organization of the human mitochondrial genome. Nature. 290:457-465.
Athanasiadis G, Esteban E, Via M, Dugoujon JM, Moschonas N, Chaabani H, Moral P.
(2007). The X chromosome Alu insertions as a tool for human population genetics: data from European and African human groups. Eur J Hum Genet. 15(5):578-583.
Bandelt HJ, Forster P, Rohl A (1999) Median-joining networks for inferring intraspecific
phylogenies. Mol Biol Evol 16:37-48. Barrett JC, Fry B, Maller J, Daly MJ. (2005) Haploview: analysis and visualization of LD and
haplotype maps. Bioinformatics. 21(2):263-265. Bastos-Rodrigues L, Pimenta JR, Pena SDJ. (2006) The genetic structure of human
populations studied through short insertion-deletion polymorphisms. Ann hum Genet.70:1-8.
Battilana J, Fagundes NJ, Heller AH, Goldani A, Freitas LB, Tarazona-Santos E, Munkhbat B,
Munkhtuvshin N, Krylov M, Benevolenskaia L, Arnett FC, Batzer MA, Deininger PL, Salzano FM, Bonatto SL.(2006) Alu insertion polymorphisms in Native Americans and related Asian populations. Ann Hum Biol. 33(2):142-160.
Batzer MA e Deininger PL. (1991) A human-specific subfamily of Alu sequences. Genomics
9:481-487.
Bedoya G, Montoya P, Garcia J, Soto I, Bourgeois S, Carvajal L, Labuda D, Alvarez V, Ospina J, Hedrick PW, Ruiz-Linares A (2006) Admixture dynamics in Hispanics: a shift in the nuclear genetic ancestry of a South American population isolate. Proc Natl Acad Sci USA 103:7234-7239.
Benson G. (1999). Tandem repeats finder: a program to analyze DNA sequences. Nucleic Acids Res . 27(2):573-580.
Bennett EA, Coleman LE, Tsui C, Pittard WS, Devine SE. (2004) Natural genetic variation
caused by transposable elements in humans. Genetics.168:933-951.
Bortolini MC, Silva WA, Zago MA, Elion J, Krishnamoorthy R, Gonçalves VF, Pena SD (2004) The phylogeography of mitochondrial DNA haplogroup L3g in Africa and the Atlantic slave trade. Am J Hum Genet 75:522-524.
Brinkmann B, Klintschar M, Neuhuber F, Huhne J, Rolf B. (1998) Mutation rate in human microsatellites: influence of the structure and length of the tandem repeat. Am J Hum Genet. 62(6):1408-1415.
Brookes AJ. (1999) The essence of SNPs. Gene. 234(2)177-186. Bydlowski SP, de Moura-Neto RS, Soares RP, Silva R, Debes-Bravo AA, Morganti L. (2003)
Genetic data on 12 STR (F13A01, F13B, FESFPS, LPL, CSF1PO, TPOX, TH01, vWA,
128
D16S539, D13S317, D5S818) from four ethnic groups of São Paulo, Brazil. For Sci Int. 135(1):67-71.
Callinan PA, Hedges DJ, Salem AH, Xing J, Walker JA, Garber RK, Watkins WS, Bamshad
MJ, Jorde LB, Batzer MA. (2003) Comprehensive analysis of Alu-associated diversity on the human sex chromosomes. Gene. 317(1-2):103-110.
Cann RL, Stoneking M, Wilson AC. (1987) Mitochondrial DNA and Human evolution.
Nature.325(1):31-36. Cann HM, de Toma C, Cazes L, Legrand MF, Morel V, Piouffre L, Bodmer J, Bodmer WF,
Bonne-Tamir B, Cambon-Thomsen A, Chen Z, Chu J, Carcassi C, Contu L, Du R, Excoffier L, Ferrara GB, Friedlaender JS, Groot H, Gurwitz D, Jenkins T, Herrera RJ, Huang X, Kidd J, Kidd KK, Langaney A, Lin AA, Mehdi SQ, Parham P, Piazza A, Pistillo MP, Qian Y, Shu Q, Xu J, Zhu S, Weber JL, Greely HT, Feldman MW, Thomas G, Dausset J, Cavalli-Sforza LL. (2002) A human genome diversity cell line panel. Science. 296(5566):261-262.
Carrel L, Willard HF. (2005) X-inativation profile reveals extensive variability in X-linked gene
expression in females. Nature.434:400-404. Cavalli-Sforza LL., Menozzi P, Piazza A. (1994) The History and Geography of Human
Genes. Princeton University Press, Princenton. Cavalli-Sforza LL. (1998). The DNA revolution in population genetics. Trends Genet 14(2):60-
65. Cavalli-Sforza LL, Feldman MW. (2003) The application of molecular genetic approaches to
the study of human evolution. Nat Genet.33:266-275. Cavalli-Sforza LL. (2005) The human genome diversity project: past, present and future.
Science. 296:261-262.
Carvalho-Silva DR, Santos FR, Rocha J, Pena SD (2001) The phylogeography of Brazilian Y-chromosome lineages. Am J Hum Genet. 68:281-286.
Conrad DF, Jakobsson M, Coop G, Wen X, Wall JD, et al. (2006) A worldwide survey of haplotype variation and linkage disequilibrium in the human genome. Nat Genet 38:1251-1260.
Corander J, Waldmann P, Sillanpaa MJ (2003) Bayesian analysis of genetic differentiation between populations. Genetics 163:367-374.
Corander J, Waldmann P, Marttinen P, Sillanpaa MJ (2004) BAPS 2: enhanced possibilities for the analysis of genetic population structure. Bioinformatics 20:2363-2369.
Corella A, Bert F, Pérez-Pérez A, Gené M, Turbón D. (2007) Mitochondrial DNA diversity of the Amerindian populations living in the Andean Piedmont of Bolivia: Chimane, Moseten, Aymara and Quechua. Ann Hum Biol. 34(1):34-55.
Corpet F. (1988) Multiple sequence alignment with hierarchical clustering. Nucl Acids
Res16(22)10881-10890. Dagan T, Sorek R, Sharon E, Ast G, Graur D. (2004) AluGene: a database of Alu elements
incorporated within protein-coding genes. Nucl Acids Res. 32(Database)D489-D492.
129
Deininger PL, Batzer MA, Hutchison CA, Edgell MH. (1992) Master genes in mammalian
repetitive DNA amplification. Trends Genet 8:307-311. Dib C, Fauré S, Fizames C, Samson D, Drouot N, Vignal A, Millasseau P, Marc S, Hazan J,
Seboun E, Lathrop M, Gyapay G, Morissette J, Weissenbach J. (1996) A comprehensive genetic map of the human genome based on 5,264 microsatellites. Nature.380:152-154.
Donnelly A, Kozman AK, Gedeon S, Webb S, Lynch M, Sutherland GR, Richards RI, Mulley
AC. (1994) A linkage map of microsatellite markers on the human X chromosome. Genomics. 20:363-370.
Excoffier L, Smouse PE, Quattro JM. (1992) Analysis of molecular variance inferred from
metric distances among DNA haplotypes: application to human mitochondrial DNA restriction data. Genetics. 131:479-491.
Fuselli S, Tarazona-Santos E, Dupanloup I, Soto A, Luiselli D, Pettener D. (2003) Mitochondrial DNA diversity in South América and the Genetic history of Andean Highlanders. Mol Biol Evol. 20(10):1682-1691.
Gabriel SB, Schaffner SF, Nguyen H, Moore JM, Roy J, Blumenstiel B, Higgins J, DeFelice M, Lochner A, Faggart M, Liu-Cordero SN, Rotimi C, Adeyemo A, Cooper R, Ward R, Lander ES, Daly MJ, Altshuler D. (2002) The structure of haplotype blocks in the human genome. Science.296:2225-2229.
Garrigan D, Mobasher Z, Severson T, Wilder JA, Hammer MF. (2005) Evidence for Archaic Asian ancestry on the human X chromosome. Mol Biol Evol. 22(2)189-192.
Gonçalves VF, Prosdocimi F, Santos LS, Ortega JM, Pena SD (2007) Sex-biased gene flow in African Americans but not in American Causasians. Genet Mol Res. 6(2)156-161
Gonçalves VF, Carvalho CMB, Bortolini MC, Bydlowski SP, Pena SD (2008) The phylogeography of African Brazilians. Hum Hered 65:23-32.
Hamilton G, Stoneking M, Excoffier L. (2005) Molecular analysis reveals tighter social regulation of immigration in patrilocal populations than in matrilocal populations. Proc Natl Acad Sci USA. 102(21)7476-7480.
Hammer MF. (1994) A recent insertion of an Alu element on the Y chromosome is a useful marker for human population studies. Mol Biol Evol 11:749-761.
Hammer MF. (1995) A recent common ancestry for human Y chromosomes. Nature. 378:376-378.
Harding RM, Fullerton SM, Griffiths RC. (1997) Archaic African and Asian lineages in the
genetic ancestry of modern humans. Am J Hum Genet. 60:772-789. Harpending H (1994) Gene frequencies, DNA sequence, and Human origins. Perspect Biol
Med 37(3):384-394. Harris EE, Hey J. (1999) X chromosome evidence for ancient human histories. Proc Natl Acad
Sci U S A 96:3320-3324. Hedrick WP. (1987) Gametic disequilibrium measures: proceed with caution. Genetics.
117:331-341.
130
Hey J. (1997) Mitochondrial and nuclear genes present conflicting portraits of humain origins. Mol Biol Evol. 14(2):166-172.
Hey J (2007) On the Number of New World Founders: A population Genetic Portrait of the
Peopling of the Americas. PLoS Biol. 3(6)e193. Holtkemper U, Rolf B, Hohoff C, Forster P, Brinkmann B. (2001) Mutation rates at two human
Y-chromosomal microsatellite loci using small pool PCR techniques. Hum Mol Genet. 10(6):629-633.
Houck CM, Rinehart FP, Schmid CW. (1979) A ubiquitous family of repeated DNA sequences
in the human genome. J Mol Biol 132:289-306.
Hünemeier T, Carvalho CMB, Marrero AR, Salzano FM, Pena SD, Bortolini MC (2007) Niger-Congo Speaking Populations and the Formation of the Brazilian Gene Pool: mtDNA and Y-Chromosome Data. Am J Phys Anthropol 113:854-867.
Huttley GA, Smith MW, Carrington M, O'Brien SJ. (1999) A scan for linkage disequilibrium across the human genome. Genetics 152:1711-22.
IBGE- Instituto Brasileiro de Geografia Estatística (2000) Brasil: 500 Anos de Povoamento. Rio de Janeiro. IBGE pp 219.
Igmann M, Kaessmann H, Pääbo S, Gyllensten U. (2000) Mitochondrial genome variation and the origin of modern humans. Nature. 408:708-713.
International Human Genome Sequencing Consortium. (2001) Initial sequencing and analysis
of the human genome. Nature 409:860-921. Jeffreys AJ, Kauppi L, Neumann R. (2001) Intensely punctuate meiotic recombination in the
class II region of the major histocompatibility complex. Nat Genet 29:217-222. Jorde LB, Rogers AR, Bamshad M, Watkins WS, Krakowiak P, Sung S, Kere J, Harpending
HC. (1997) Microsatellite diversity and the demographic history of modern humans. Proc Natl Acad Sci U S A 94:3100-3103.
Jorde LB, Watkins WS, Bamshad MJ, Dixon ME, Ricker CE, Seielstad MT, Batzer MA. (2000)
The distribution of human genetic diversity: a comparison of mitochondrial, autosomal, and Y-chromosome data. Am J Hum Genet. 66(3):979-88.
Kaessmann H, Heibig F, Haeseler AV, Pääbo S. (1999) DNA sequence variation in a non-
coding region of low recombination on the human X chromosome. Nat Genet 22:78-81. Kaessmann H, e Pääbo S. (2002). The genetical history of human and great apes. J Inter
Med. 251:1-18. Kaessmann H, Zöllner S, Gustafsson AC, Wiebe V, Laan M, Lundeberg J, Uhlén M, Pääbo S.
(2002) Extensive linkage disequilibrium in small human populations in Eurasia. Am J Hum Genet.70:673-685.
Katoh T, Mano S, Ikuta T, Munkhbat B, Tounai K, Ando H, Munkhtuvshin N, Imanishi T, Inoko
H, Tamiya G. (2002) Genetic isolates in East Asia: a study of linkage disequilibrium in the X chromosome. Am J Hum Genet. 71(2):395-400.
131
Katoh T, Mano S, Munkhbat B, Tounai K, Oyungerel G, Chae GT, Han H, Jia GJ, Tokanaga K, Munkhutuvshin N, Tamiya G, Inoko H. (2005) Genetic features of Khoton Mongolians revealed by SNP analysis of the X chromosome. Gene. 378:1-8.
Klein HS (2002) As origens dos escravos brasileiros. In: Pena SDJ (eds) Homo brasilis. Aspectos genéticos, lingüisticos, históricos e socioantropológico da formação do povo brasileiro. Ribeirão Preto:FUNPEC Editora. pp 93-112.
Laan M, Wiebe V, Khusnutdinova E, Remm M, Pääbo S. (2005) X-chromosome as a marker for population history: linkage disequilibrium and haplotype study in Eurasian populations. Eur J hum Genet.13:452-462.
Labuda D, Zietkiewicz E. (1994) Evolution of secondary structure in the family of 7SL-like
RNAs. J Mol Evol 39:506-518. Lahn BT, Pearson NM, Jegalian K. (2001) The human Y chromosome, in the light of evolution.
Nat Rev Genet. 2(3):207-216. Latini V, Sole G, Doratiotto S, Poddie D, Memmi M, Varesi L, Vona G, Cao A, Ristaldi MS.
(2004) Genetic isolates in Corsica (France): linkage disequilibrium extension analysis on the Xq13 region. Eur J hum Genet.12:613-619.
Leopoldino AM, Pena SD. (2003) The mutational spectrum of human autosomal
tetranucleotide microsatellites. Hum Mutat. 21(1):71-79. Lewin R. 1999. Evolução Humana. 1ª ed. Atheneu Ed. São Paulo. pp526. Li N, e Stephens M. (2003) Modeling linkage disequilibrium and identifying recombination
hotspots using single-nucleotide polymorphism data. Genetics.165:2213-2233. Liu H, Prugnolle F, Manica A, Balloux F (2006) A geographically explicit genetic model of
worldwise human-settlement history. Am J Hum Genet. 79:230-237. Lovelli A, Moreau C, Yotova V, Xiao F, Bourgeois S, Gehl D, Bertranpetit J, Schurr E, Labuda
D. (2005) Ethiopia: between Sub-Saharan African and Western Eurasia. Ann hum Genet. 69:275-287.
Lucotte G, Ngo NY. (1985) p49f, A highly polymorphic probe, that detects Taq1 RFLPs on the
human Y chromosome. Nucleic Acids Res 13:8285. Lyon MF. (1961) Gene action in the X-chromosome of the mouse. Nature 190:372-373. Macaulay V, Hill C, Achilli A, Rengo C, Clarke D, Meehan W, Blackburn J, Semino O,
Scozzari R, Cruciani F. (2005) Single, rapid coastal settlement of Asia revealed by analysis of complete mitochondrial genomes. Science. 308:1034-1036.
Mellars P (2006) Going East: new genetic and archaeological perspectives on the modern
human colonization of Eurasia. Science. 313:796-800. McDougall I, Fleagle JG.(2005) Stratigraphic placement and age of modern human from
Kibish, Ethiopia. Nature. 433:733-736. Mountain JL, Knight A, Jobin M, Gignoux C, Miller A, Lin AA, Underhill PA. (2002) SNPSTRs:
empirically derived, rapidly typed, autosomal haplotypes for inference of population history and mutational processes. Genome Res. 12(11):1766-72.
132
Myers S, Bottolo L, Freeman C, McVean G, Donnelly P. (2005) A fine-scale map of
recombination rates and hotspots across the human genome. Science.310:321-324. Nagaraja R, MacMillan S, Kere J, Jones C, Griffin S, Schmatz M, Terrell J, Shomaker M,
Jermak C, Hott C, Masisi M, Mumm S, Srivastava A, Pilia G, Featherstone T, Mazzarella R, Kesterson S, McCauley B, Railey B, Burough F, Nowotny V, D'Urso M, States D, Brownstein B, Schlessinger D. (1997) X chromosome map at 75-kb STS resolution, revealing extremes of recombination and GC content. Genome Res. 7(3):210-22.
Nei M. (1978) Estimation of average heterozygosity and genetic distance from a small number
of individuals. Genetics.89:583-590. Nei M. (1987) Molecular Evolutionary Genetics. Columbia University Press, New York. Pääbo S. (2003) The mosaic that is our genome. Nature. 421:409-412.
Parra FC, Amada RC, Lambertucci JR, Rocha J, Antunes CM, Pena SDJ (2003) Color and genomic ancestry in Brazilians. Proc Natl Acad Sci USA 100:177-182.
Pena SDJ, Carvalho-Silva DR, Alves-Silva J, Prado VF, Santos FR. (2000). Retrato molecular do Brasil. Ciência Hoje. 27:16-25.
Pena SDJ. (2002) Retrato molecular do Brasil, Versão 2001. In: “Homo brasilis : Aspectos
Genéticos, Linguísticos, Históricos e Culturais da Formação do Povo Brasileiro” (Editor: Sérgio D.J. Pena, Editora FUNPEC).
Pena SDJ. (2007) The evolution and Structure of human Genetic Diversity. In Pharmacogenomics in Admixed Populations. Suarez-Kurtz G (eds). Austin, Landes Bioscience. Available: http://www.eurekah.com/chapter/3190In press.
Pereira WR. (2002) Caracterização e Utilização de Microssatélites, Inserção Alu e SNPs em uma Região com Depressão de Recombinação no Cromossomo X Humano.Tese apresentada para obtenção do titulo de doutor ao departamento de Bioquímica e Imunologia,UFMG. Belo Horizonte.
Pereira WR; Pena, SDJ (2006) Phylogeography of haplotypes of five microsatellites located in
a low-recombination region of the X chromosome: studies worldwide and in Brazilian populations. Genetica. 126(1-2):243-250.
Pereira WR, Santos SS, Pena SDJ. (2006) A novel polymorphic Alu insertion embedded in a
LINE 1 retrotransposon in the human X chromosome (DXS225): identification and worldwide population study. Genet Mol Res.5(1):63-71.
Pimenta JR, Zuccherato LW, Debes AA, Maselli L, Soares RP, Moura-Neto RS, Rocha J, Bydlowski SP, Pena SDJ (2006) Color and Genomic Ancestry in Brazilians: A study with Forensic Microsatellites. Hum Hered 62:190-195.
Price AL, Patterson NJ, Plenge RM, Weinblatt ME, Shadick NA, Reich D. (2006) Principal components analysis corrects for stratification in genome-wide association studies. Nat Genet. 38(8):904-909.
Ramachandran S, Rosenberg NA, Zhivotovsky LA, Feldman MW. (2004) Robustness of the inference of human population structure: a comparison of X-chromosomal and autosomal microsatellites. Hum Genome. 1(2):87-97.
133
Ramachandran S, Deshpande O, Roseman CC, Rosenberg NA, Feldman MW, et al. (2005)
Support from the relationship of genetic and geographic distance in human populations for a serial founder effect originating in Africa. Proc Natl Acad Sci U S A 102:15942-15947.
Ramakrishnan U, e Mountain JL. (2004) Precision and Accuracy of Divergence Time
Estimates from STR and SNPSTR Variation. Mol Biol Evol. 2(10):1960-1971. Reynolds J, Weir BS, Cockerham CC. (1983) Estimation for the coancestry coefficient: basis
for short-term genetic distance. Genetics.105:767-779.
Ribeiro D, (1995) O Povo Brasileiro: Formação e Sentido do Brasil. São Paulo, Companhia das letras.
Rodriguez-Delfin LA, Rubin-de-Celis V, Zago MA. (2001) Genetic Diversity in an Andean Population from Peru and Regional Migration Patterns of Amerindians in South America: Data from Y Chromosome and Mitochondrial DNA. Hum Hered. 51:97-106.
Rosenberg NA, Pritchard KJ, Weber JL, Cann MH, Kidd KK, Zhivotovsky LA, Feldman MW.
(2002) Genetic Structure of Human Populations. Science. 298:2381-2385.
Rosenberg NA (2006) Standardized subsets of the HGDP-CEPH Human Genome Diversity Cell Line Panel, accounting for atypical and duplicated samples and pairs of close relatives. Ann Hum Genet . 70:841-847.
Ross MT, et al (2005) The DNA sequence of the human X chromosome. Nature.434:325-336. Roux KH, e Hecker KH. (1997) One-step optimization using touchdown and stepdown PCR.
Methods Mol Biol 67:39-45. Roy-Engel AM, Carroll ML, Vogel E, Garber RK, Nguyen SV, Salem AH, Batzer MA,
Deininger PL. (2001) Alu insertion polymorphisms for the study of human genomic diversity. Genetics 159(1):279-290.
Salzano FM, Freire-Maia N (1967) Populações brasileiras, aspectos demográficos, genéticos
e antropológicos. Companhia Editora Nacional, São Paulo. Sambrook, J., Fritsch, E.F., Maniats, T. (1981) Molecular Clonig: A laboratory Manual. 2 ed.
New York: Cold Spring Harbor Press. Santos FR, Hurtz MH, Coimbra CEA, Santos RV, Salzano FM, Pena SDJ. (1995) Further
evidence for existence of major founder Y chromosome haplotype in Amerindians. Braz J Genet.18:669-672.
Santos FR, e Tyler-Smith C. (1996) Reading the human Y chromosome: the emerging DNA
markers and human genetic history. Braz. J. Genet. 19:665-670. Santos FR, Pandya A, Tyler-Smith C, Pena SDJ, Schanfield M, Leonard WR, Osipova L,
Crawford MH, Mitchell RJ. (1999) The central Siberian orgin for native American Y chromosomes. Am J Hum Genet. 64:619-628.
Santos ,F.R. e Tarazona-Santos,E. (2002a) A história do povoamento pré-colombiano das
Américas e o cromossomo Y humano. In: “Homo brasilis : Aspectos Genéticos, Linguísticos, Históricos e Culturais da Formação do Povo Brasileiro” (Editor: Sérgio D.J. Pena, Editora FUNPEC).
134
Santos, F.R. e Tarazona-santos, E. (2002b) The peopling of the Americas: A second major
migration? Am. J. Hum. Genet. 70:1377-1380. Santos FR, e Bonatto SL. (2004) Genética de Populações Humanas. In: “Genômica”
(Organizador: Luís Mir, Editora Atheneu). Santos SS. (2004) Análise da variabilidade genética de populações dos Andes. Dissertação
de mestrado apresentada para obtenção do titulo de mestre ao departamento de Biologia Geral/Pós-graduação em genética,UFMG. Belo Horizonte.
Schaffner SF. (2004) The X chromosome in population genetics. Nat Rev Genet.5(1):43-51. Schlotterer C, e Tautz D. (1992) Slippage synthesis of simple sequence DNA. Nucleic Acids
Res 20:211-215. Schmid CW. (1996) Alu: structure, origin, evolution, significance and function of one- tenth of
human DNA. Prog Nucleic Acid Res Mol Biol 53:283-319. Schneider S, Roessli D, Excoffier L. (2000) Arlequin version. 2000: a software for population
genetics data analysis. Genetics and biometry laboratory, University of geneva, Switzerland.
Seldin MF, Morii T, Collins-Schramm HE, Chima B, Kittles R, Criswell LA, Li H.(2004) Putative
ancestral origins of chromosomal segments in individual African American: implications for admixture mapping. Genome Res.14:1076-1084.
Shriver MD, Parra EJ, Dios S, Bonilla C, Norton H, Jovel C, Pfaff C, Jones C, Massac A,
Cameron N, Baron A, Jackson T, Argyropoulos G, Jin L, Hoggart CJ, Mckeigue PM, Kittles R A. (2003) Skin pigmentation, biogeographical ancestry and admixture mapping. Hum Genet. 112:387-399.
Silva WA, Bortolini MC, Schneider MPC, Marrrero A, Elion J, Krishnamoorthy R, Zago MA (2006) mtDNA Haplogroup Analysis of Black Brazilian and Sub-Saharan Populations: Implications for the Atlantic Slave Trade. Hum Biol 78(1):29-41.
Storto L, e Velden FFV. (2005) Povos Indígenas no Brasil - Karitiana. Available:http://www.socioambiental.org/pib/epi/karitiana/karitiana.shtm, Accessed 15 March 2007.
Suarez-Kurtz G, Vargens DD, Struchiner CJ, Bastos-Rodrigues L, Pena SD (2007) Self-
reported skin color, genomic ancestry and the distribution of GST polymorphisms. Fharmacogenetics and Genomics. 17:765-771.
Taillon-Miller P, Gu Z, Li Q, Hillier L, Kwok PY. (1998) Overlapping genomic sequences: a
treasure trove of single-nucleotide polymorphisms. Genome Res 8:748-754. Tarazona-Santos ,E., Carvalho-Silva, D.R., Pettener, D.,Luiselli, D., Stefano, G.F., Labarga,
C.M., Rickards,O., Tyler-Smith,C., Pena, S.D.J., Santos,F.R. (2001) Genetic differentiation in south Amerindians is related to environmental and cultural diversity: Evidence from the Y chromosome. Am J Hum Genet. 68:1485-1496.
Tarazona-Santos E, (2002) Variabilidade molecular do cromossomo Y em populações nativas americanas. Tese apresentada para obtenção de titulo de Doutor ao Departamento de Bioquímica e Imunologia, UFMG, Belo Horizonte.
135
Templeton, A. (1997) Out of Africa? What do genes tell us? Curr Opin Genet Dev. 7:841-847. The International HapMap Consortium. (2005) A haplotype map of the human genome.
Nature. 437:1299-1319. Tishkoff SA, Pakstis AJ, Stoneking M, Kidd JR, Destro-Bisol G, Sanjantila A, Lu RB, Deinard
AS, Sirugo G, Jenkins T, Kidd KK, Clark AG. (2000) Short tandem-repeat polymorphism/Alu haplotype variation at the PLAT locus: implications for modern human origins. Am J Hum Genet. 67(4):901-25.
Trinkaus E. (2005) Early modern humans. Ann Rev Anthropol. 34:207-230. Vogt PH, Affara N, Davey P, Hammer M, Jobling MA, Lau YF, Mitchell M, Schempp W, Tyler-
Smith C, Williams G, Yen P, Rappold GA. (1997) Report of the third international workshop on Y chromosome mapping. Cytogenet Cell Genet 79:1-20.
Wang, J. (2003) Maximum-Likelihood Estimation of Admixture Proportions From Genetic
Data. Genetics.164:747-765. Wang S, Lewis CM, Jakobsson M, Ramachandran S, Ray N, Bedoya G, Rojas W, Parra MV,
Molina JA, Gallo C, Mazzotti G, Poletti G, Hill K, Hurtado AM, Labuda D, Klitz W, Barrantes R, Bortolini MC, Salzano FM, Petzl-Erler ML, Tsuneto LT, Llop E, Rothhammer F, Excoffier L, Feldman MW, Rosenberg NA, Ruiz-Linares A. (2007) Genetic variation and population structure in native Americans. PLoS Genet. 3(11):e185.
Wallace DC. (1995) Mitochondrial DNA variation in human evolution, degenerative disease,
and aging. Am J Hum Genet. 57:201-223. Weber JL, David D, Heil J, Fan Y, Zhao C, Marth G. (2002) Human diallelic insertion/deletion
polymorphisms. Am J Hum Genet. 71:854-862. Weir B S. (2003) Uses of DNA and genetic markers for forensics and population studies.
Theor Pop Biol . 63:171–172. Weiss G, von Haeseler A. (1996) Estimating the age of the common ancestor of men from the
ZFY intron. Science. 272:1359-1360. Wilson IJ, Balding DG (1998) Genealogical inference from microsatellite data. Genetics
150:499-510. Wilson IJ, Weale ME and Balding DJ (2003) Inferences from DNA data: population histories,
evolutionary processes and forensic match probabilities. J R Stat Soc Ser A 166:155-201. Xiao FX, Yotova V, Zietkiewicz E, Lovell A, Gehl D, Bourgeois S, Moreau C, Spanaki C,
Plaitakis A, Moisan JP, Labuda D. (2004) Human X-chromosomal lineages in Europe reveal Middle Eastern and Asiatic contacts. Eur J hum Genet. 12:301-311.
Xu H, Chakraborty R and Fu Y-X (2005) Mutation Rate Variation at Human Dinucleotide
Microsatellites. Genetics 170:305-312. Yu N, Zhao Z, Fu YX, Sambuughin N, Ramsay M, Jenkins T, Leskinen E, Patthy L, Jorde LB,
Kuromori T, Li WH. (2001) Global patterns of human DNA sequence variation in a 10-kb region on chromosome 1. Mol Biol Evol 18:214-222.
136
Zegura LS, Karafet TM, Zhivotovisky LA, Hammer MF (2004) High-resolution SNPs and microsatellite haplotypes point to a single recenty entry of Native American Y chromosomes into the Americas. Mol Biol Evol. 21(1):164-175.
Zhivotvsky LA. (2001) Estimation divergence Time with the use of microsatellite genetic
distances:Impacts of Population Grouwth and Gene Flow. Mol Biol Evol. 18(5):700-709.
137
8 ANEXOS
138
ANEXO 1
Artigo publicado - Rinaldo Wellerson Pereira, Simone Silva dos Santos, Sérgio Danilo Junho Pena (2006). A novel polymorphic Alu insertion embedded in a LINE 1 retrotransposon in the human X chromosome (DXS225): identification and worldwide population study. Genetics and Molecular Research.5(1):63-71.
139
ANEXO 2
Artigo publicado – Simone S. Santos-Lopes, Rinaldo W. Pereira, Ian J. Wilson, Sérgio D. J. Pena (2007). A Worldwide Phylogeography for the Human X Chromosome. PLoS ONE.2(6):e557.
140
ANEXO 3
Artigo em preparação – Simone S. Santos-Lopes, Sérgio P. Bydlowski, Sérgio D. J. Pena (2007). The Diversity and Ancestry in Brazilians: evidence from the X chromosome.