ANÁLISE DA FREQUÊNCIA ALÉLICA DE 15 LOCI STR NA ... · D19S433 e D2S1338, os genótipos...
-
Upload
hoangnguyet -
Category
Documents
-
view
217 -
download
0
Transcript of ANÁLISE DA FREQUÊNCIA ALÉLICA DE 15 LOCI STR NA ... · D19S433 e D2S1338, os genótipos...
UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE
CENTRO DE CIÊNCIAS DA SAÚDE
PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIAS FARMACÊUTICAS
ANÁLISE DA FREQUÊNCIA ALÉLICA DE 15 LOCI STR NA
POPULAÇÃO DO RIO GRANDE DO NORTE
TAISSA MARIA MOURA DE OLIVEIRA
NATAL
2012
TAISSA MARIA MOURA DE OLIVEIRA
ANÁLISE DA FREQUÊNCIA ALÉLICA DE 15 LOCI STR NA
POPULAÇÃO DO RIO GRANDE DO NORTE
Orientador: Prof. Dr. Geraldo Barroso Cavalcanti Júnior
NATAL
2012
Dissertação apresentada ao Programa de Pós-Graduação em Ciências Farmacêuticas da Universidade Federal do Rio Grande do Norte, como requisito final à obtenção do título de Mestre em Ciências Farmacêuticas.
TAISSA MARIA MOURA DE OLIVEIRA
ANÁLISE DA FREQUÊNCIA ALÉLICA DE 15 LOCI STR NA POPULAÇÃO DO RIO GRANDE DO NORTE
Banca Examinadora:
_______________________________________
Prof. Dr. Geraldo Barroso Cavalcanti Júnior
Presidente – UFRN
_______________________________________
Prof. Dr. Carlos Roberto Alves
Examinador Externo – FIOCRUZ/RJ
_______________________________________
Profa. Dra. Tereza Neuma de Souza Brito
Examinador Interno – UFRN
Natal, 24 de fevereiro de 2012
NATAL / RN
2012
A meus pais, Jayme e Marizeth, pelo
incentivo na busca do conhecimento.
Fonte de inspiração, exemplo de
dedicação e respeito. Aos meus irmãos
Jayme Júnior e Sanderson, pelo apoio
incondicional e amizade. À minha
sobrinha Valentina, pela alegria que
soma à minha vida. A eles, todo o meu
amor e admiração.
DEDICATÓRIA
AGRADECIMENTOS
A Deus, fonte de toda Sabedoria. Por guiar meus passos e não me deixar fraquejar.
A Ele, toda Honra e toda Glória.
Aos meus pais, irmãos, sobrinha, cunhadas, meu muito obrigada por tudo.
Ao Professor Dr. Geraldo Barroso pela sua orientação, amizade e confiança que
tanto contribuíram para a minha formação acadêmica.
Ao Laboratório DNA Center que me abriu as portas desde a graduação. Aos
queridos mestres Gioconda Leão, Andréa Fernandes e Roberto Chaves por todos os
ensinamentos e confiança depositada. Aos colegas e funcionários, em especial
Juliana Freire pela ajuda neste trabalho. A Erica Gil, inicialmente uma parceira
profissional, hoje, uma amiga que posso contar sempre.
A todos os docentes do Programa de Pós-graduação em Ciências Farmacêuticas,
em especial o Professor Dr. Matheus Pedroza, por toda a dedicação nos momentos
em que precisei de seus conselhos e orientações. Às funcionárias Fábia e Aureliana
pela paciência, sempre dispostas a ajudar.
À CAPES, pela concessão da bolsa de estudo.
Ao Professor Dr. Paulo Marinho, quem primeiro me apresentou à Biologia Molecular,
pelo constante apoio.
Ao Professor e amigo Carlos Maia pela valiosa ajuda e disponibilidade.
Aos amigos Paulo Raimann e Weslley Tsutsumida, da Life Technologies, por toda a
ajuda despendida no início deste trabalho.
À Italo Medeiros e ao Professor Dr. Flávio Freire pelo auxílio com as análises
estatísticas.
Aos titulares da Banca Examinadora, Professora Dra. Tereza Neuma e Professor Dr.
Carlos Roberto, pelas contribuições, críticas, elogios e por terem prontamente
aceitado fazer parte desta banca.
Aos meus verdadeiros amigos, irmãos que Deus me permitiu escolher, pelas críticas,
sugestões, orações, paciência e incentivo.
A todos, que de alguma forma, contribuíram para a minha formação pessoal e
profissional, minha eterna gratidão!
RESUMO
As populações humanas apresentam um considerável número de loci polimórficos,
cujo uso e aplicações vão desde a construção de mapas de ligação até estudos de
evolução das populações, passando pela determinação de paternidade, medicina
forense e migração. Atualmente, os STRs (Short Tandem Repeats) são
considerados os marcadores de identificação humana por excelência, título em
grande parte devido a sua abundância e elevada variabilidade, devido ao fato de
serem facilmente amplificáveis pela Reação em Cadeia da Polimerase, PCR
(Polymerase Chain Reaction), funcionarem com baixas quantidades de DNA e
serem passíveis de automação com processos envolvendo detecção por
fluorescência. A formação de bancos de dados regionais, contendo as frequências
alélicas da população de uma microrregião, fornece subsídios para aumentar a
confiabilidade dos resultados de determinação de vínculo genético. Neste trabalho,
visa-se a obtenção de um banco de dados das frequências alélicas de 15 loci
polimórficos moleculares (D8S1179, D21S11, D7S820, CSF1PO, D19S433, vWA,
TPOX, D18S51, D3S1358, TH01, D13S317, D16S539, D2S1338, D5S818 e FGA),
em uma população classificada como nascida no Estado do Rio Grande do Norte,
Brasil, totalizando 1100 indivíduos não aparentados. Para avaliação das frequências,
amostras de DNA foram submetidas à amplificação por PCR, e os genótipos foram
obtidos através de eletroforese capilar em sequenciador genético. As frequências
apuradas no presente estudo foram comparadas com as da população brasileira em
geral e com as de outros estados do Brasil. Com exceção dos loci D21S11,
D19S433 e D2S1338, os genótipos encontrados da população do RN mostram-se
em Equilíbrio de Hardy-Weinberg, e sem grandes diferenças significativas entre as
frequências encontradas nas populações estudadas. Os loci mais informativos foram
D2S1338 e D18S51, enquanto que o locus menos informativo foi o TPOX.
Palavras-chave: Frequência alélica; STR; Rio Grande do Norte; Brasil.
ABSTRACT
Human population have a significant number of polymorphic loci, whose use and
applications range from construction of linkage maps, to study the evolution of
populations, through the determination of paternity, forensic medicine and migration.
Currently, STRs (Short Tanden Repeats) markers are considered the major markers
for human identification, mainly due to its abundance and high variability because of
the fact that they are easily amplifiable by PCR (Polymerase Chain Reaction), work
with low amounts of DNA and be capable of automation processes involving
fluorescence detection. The creation of regional databases containing allele
frequencies of population provide subsidies to increase the reliability of the results of
determining the genetic link. This paper aims to obtain a database of allele
frequencies of 15 polymorphic molecular loci (D8S1179, D21S11, D7S820, CSF1PO,
D19S433, vWA, TPOX, D18S51, D3S1358, TH01, D13S317, D16S539, D2S1338,
D5S818 e FGA) in a population classifies as born in the State of Rio Grande do
Norte, Brazil, totaling 1100 unrelated individuals. To evaluate the frequency, DNA
samples were submitted to PCR amplification, followed by capilarry electrophoresis
genetic sequencer. The frequencies identified in this study were compared with
brazilian population in general and other states in Brazil. Except for the loci D21S11,
D19S433 and D2D1338, the genotypes found were in Hardy-Weinberg equilibrium
and no significant differences among the frequencies were found in the populations
studied. The most informative loci was D2S1338 and D18S51, and the less
informative is the locus TPOX.
Keywords: Allele frequencies; STR; Rio Grande do Norte; Brazil.
LISTA DE FIGURAS
Figura 1 - Estrutura do DNA composta por íntrons e exons 16
Figura 2 - Marcador STR 21
Figura 3 - Sequência do locus TPOX 21
Figura 4 - Funcionamento da eletroforese capilar 24
Figura 5 - Esquema do posicionamento do primers 24
Figura 6 - Material utilizado na extração de DNA 35
Figura 7 - Loci contemplados no kit AmpFlSTR Identifiler 37
Figura 8 - Eletroferograma 38
Figura 9 - Mesorregiões do Rio Grande do Norte 41
Figura 10 - Distribuição dos indivíduos estudados entre as mesorregiões 42
Figura 11 - Locus D21S11 54
Figura 12 - Locus D13317 54
Figura 13 - Locus D3S1358 55
Figura 14 - Locus VWA 55
Figura 15 - Locus D7S820 56
Figura 16 - Locus D16S539 56
Figura 17 - Locus D18S51 57
Figura 18 - Locus CSF 57
Figura 19 - Locus D5S818 58
Figura 20 - Locus TH01 58
Figura 21 - Locus TPOX 59
Figura 22 - Locus FGA 59
Figura 23 - Locus D8S1179 60
Figura 24 - Locus D2S1338 60
Figura 25 - Locus D19S433 61
LISTA DE TABELAS
Tabela 1 - Distribuição das 1100 amostras entre as Mesorregiões 42
Tabela 2 - Frequência alélica e parâmetros estatísticos para os 15 STRs
estudados na população do Rio Grande do Norte 43
Tabela 3 - Frequências alélicas para o locus D21S11 46
Tabela 4 - Frequências alélicas para o locus D13S317 46
Tabela 5 - Frequências alélicas para o locus D3S1358 46
Tabela 6 - Frequências alélicas para o locus vWA 47
Tabela 7 - Frequências alélicas para o locus D7S820 47
Tabela 8 - Frequências alélicas para o locus D16S539 47
Tabela 9 - Frequências alélicas para o locus D18S51 48
Tabela 10 - Frequências alélicas para o locus CSF 48
Tabela 11 - Frequências alélicas para o locus D5S518 48
Tabela 12 - Frequências alélicas para o locus TH01 49
Tabela 13 - Frequências alélicas para o locus TPOX 49
Tabela 14 - Frequências alélicas para o locus FGA 49
Tabela 15 - Frequências alélicas para o locus D8S1179 50
Tabela 16 - Frequências alélicas para o locus D2S1338 50
Tabela 17 - Frequências alélicas para o locus D19S433 51
Tabela 18 - Alelos mais frequentes no RN e no Brasil 52
Tabela 19 - Alelos mais frequentes no RN e em Portugal 53
LISTA DE ABREVIATURAS E SIGLAS
AABB American Association of Blood Banks
CODIS Combined Database Index System
DNA Deoxyribonucleic acid
FBI Federal Bureau Ivestigation
FSS Forensic Science Service
GEP Grupo Espanhol-Português
IBGE Instituto Brasileiro de Geografia e Estatística
INDELs Polimorfismos de Inserção e Deleção
ISFG Internatioanl Society of Forensic Genetic
kb Kilobase
MP Probabilidade de Matching
NDNDA Banco de dados de DNA nacional do Reino Unido
pb Par de base
PCR Polymeraase Chain Reaction
PD Poder de Discriminação
PE Poder de Exclusão
PIC Conteúdo de Informação Polimórfica
PNCQ Programa Nacional de Controle de Qualidade
RFLP Restriction Fragment Length Polymorphism
SNP Single Nucleotide Polymorphism
STR Short Tandem Repeat
VNTR Variable Number of Tandem Repeats
µL Microlitro
SUMÁRIO
1 INTRODUÇÃO 12
2 REVISÃO DE LITERATURA 14
2.1 ESTRUTURA DO GENOMA HUMANO 14
2.2 MARCADORES POLIMÓRFICOS DE USO CORRENTE EM
GENÉTICA FORENSE 16
2.2.1 STRs 20
2.3 TÉCNICAS DE BIOLOGIA MOLECULAR APLICADAS À
IDENTIFICAÇÃO HUMANA 22
2.4 BANCOS DE DADOS 27
2.5 ESTUDOS DE FREQUÊNCIA NA INVESTIGAÇÃO FORENSE 29
3 JUSTIFICATIVA 33
4 OBJETIVOS 34
4.1 OBJETIVOS GERAIS 34
4.2 OBJETIVOS ESPECÍFICOS 34
5 METODOLOGIA 35
5.1 CASUÍSTICA 35
5.2 MATERIAL E MÉTODOS 35
5.2.1 Extração do DNA 35
5.2.2 Amplificação 36
5.2.3 Análise de Fragmentos 37
5.2.4 Controles 39
5.2.5 Análises Estatísticas 39
5.2.6 Aspectos Éticos 40
6 RESULTADOS E DISCUSSÃO 41
7 CONCLUSÕES 62
REFERÊNCIAS BIBLIOGRÁFICAS 63
12
1 INTRODUÇÃO
A história da Genética Humana, como uma ciência baseada em teoria,
começou em 1865 quando Gregor Mendel publicou o seu trabalho “Experimentos
em Plantas Híbridas”. Posteriormente Galton, fundador da Eugenia, com seu estudo
“Talentos Hereditários e Caráter”, procurou apresentá-la como a ciência que
forneceria as bases teóricas para não só compreender os mecanismos da
transmissão dos caracteres entre as gerações, como também contribuir
positivamente para a melhoria das características do conjunto populacional.
O campo da genética de populações surgiu entre as décadas de 1920 e 1930
graças a Ronald Fisher, John Burdon Sanderson Haldane e Sewall Wright, cujos
trabalhos forneceram embasamento suficiente para a criação da Teoria Sintética da
Evolução, ou Síntese Evolutiva Moderna. Esta pode ser compreendida,
basicamente, por princípios que aliam a teoria da evolução das espécies de Charles
Darwin às leis de herança biológica de Mendel e à própria genética populacional.
Esta última fundamenta-se na descrição da variabilidade genética existente e na
investigação dos mecanismos que a influenciam. Para isso, os trabalhos baseiam-se
na observação da distribuição dos polimorfismos genéticos de indivíduos
pertencentes a uma determinada população e suas variações sob a influência de
forças evolutivas como seleção natural, deriva genética, mutação e fluxo gênico
(BEIGUELMAN, 2008).
Há mais de um século, desde a descoberta dos grupos sanguíneos, que
polimorfismos em humanos vêm auxiliando a resolução de questões forenses.
Iniciando pelo polimorfismo de grupos sanguíneos, em seguida pelos polimorfismos
de grupos protéicos/enzimáticos e pelos primeiros polimorfismos em sequência de
DNA (RFLPs), o grande salto deu-se com a identificação dos polimorfismos de
sequência repetitivas do tipo minissatélites (SCHNEIDER, 1997). Os minissatélites e
sua alta variabilidade permitiram ao Sir Alec Jefreys, no início da dedada de 80, as
primeiras aplicações da genética forense em um contexto moderno como
conhecemos hoje. No entanto, foi a caracterização dos microssatélites e a
possibilidade de genotipá-los por PCR os eventos que permitiram ao campo da
genética forense sua consolidação. Atualmente, a base de qualquer laboratório de
genética forense é a utilização de, no mínimo, 13 microssatélites autossômicos
13
amplificados pela PCR e genotipados utilizando a eletroforese em sequenciadores
automáticos de DNA (BUTLER, 2005).
Quimicamente, o DNA é igual em todas as pessoas, diferindo somente no
conteúdo informacional que é dado pela sequência de bases. Cerca de apenas 0,1%
de todo o genoma humano difere de uma pessoa para outra, sendo justamente
nesta diferença em que se baseiam as técnicas de identificação, pois não existem
duas pessoas com a mesma sequência de bases no seu DNA, exceto no caso de
gêmeos idênticos (NAKAMURA, Y. 2009).
Com o início do Projeto Genoma Humano em 1990 e subsequente
disponibilização de sequenciadores automáticos de DNA capazes de gerar dados
genômicos em grande escala, surgiu a necessidade de novas ferramentas
estatísticas para a análise desses bancos de dados (BUTLER, 2006).
Importante ressaltar que o advento das técnicas de análise do DNA propiciou
a fixação estatística da paternidade, atribuindo o percentual de certeza de que
aquela alegada paternidade seria efetivamente correspondente ao vínculo biológico
requerido. Isso é feito por meio de cálculos de probabilidade que inferem 100% à
exclusão de vínculo investigado e taxa muito próxima desse percentual para
inclusão (PENA, 2005).
Há um número variado de materiais biológicos para obtenção do DNA e
realização de testes laboratoriais de identificação humana, tais como tecido ósseo,
bulbo capilar, material de biópsia, saliva, sangue, dentre outros. É possível obter
DNA de praticamente todos os tecidos do corpo humano, variando apenas a
quantidade de DNA que é possível extrair de cada um desses tecidos (STRACHAN;
READ, 2002).
O Brasil, com sua população de proporções continentais, altamente
polimórfica em virtude de sua miscigenação, necessita de estudos que auxiliem no
melhor entendimento desta. Diante disso, o presente estudo tem como objetivo
realizar uma análise da frequência alélica de 15 loci STR, em população nascida no
Estado do Rio Grande do Norte, a fim de viabilizar sua aplicação em casos de
investigação de paternidade e forenses, através da utilização de parâmetros
estatísticos, além de um melhor entendimento da formação da população do nosso
Estado.
14
2 REVISÃO DE LITERATURA
2.1 ESTRUTURA DO GENOMA HUMANO
Em 1953, os cientistas Francis Crick e James Watson descobriram a estrutura
do DNA, que é uma macromolécula formada pelo encadeamento de subunidades
individuais denominadas de nucleotídeos. Por sua vez, cada nucleotídeo é composto
de três unidades básicas: um grupamento fosfato, um açúcar (pentose) e uma base
nitrogenada, podendo esta ser Adenina, Timina, Citosina ou Guanina. (BUTLER,
2005).
O DNA é responsável pelo armazenamento de toda a informação genética,
sendo encontrado nos cromossomos do núcleo (DNA genômico) e nas mitocôndrias
(DNA mitocondrial), podendo ser extraído de amostras de sangue, esfregaço bucal,
saliva, ossos, dentes, tecidos, órgãos, fios de cabelo, sêmen, urina, dentre outros
materiais biológicos (STRACHAN; READ, 2002). É nele que estão localizados os
genes, depositários das informações genéticas responsáveis pelas atividades da
célula. Cada gene, por sua vez, faz parte de uma estrutura denominada cromossomo
e encontra-se em locais específicos conhecidos como locus genético (ALBERTS et
al., 1999).
A sequência de nucleotídeos codifica a sequência de aminoácidos através
dos códons, entretanto, somente cerca de 3 a 5% do conteúdo total de DNA codifica
proteínas. Essas sequências codificadoras são intercaladas por extensas
sequências de DNA inativo (não-codificador). As regiões do DNA que codificam
proteínas são chamadas de éxons, enquanto as regiões que não codificam
proteínas, pois são removidas após a transcrição do DNA, são chamadas de íntrons.
Estes apresentam tamanho variável que pode ser de 50 até 10.000 nucleotídeos,
considerando-se que, em muitos casos, o tamanho cumulativo dos íntrons é muito
maior que o dos éxons (MARQUES et al, 2003; ALBERTS et al, 1999). Os íntrons
contêm uma grande proporção de DNA repetitivo (grupos de pares de bases que se
repetem, lado a lado). O DNA de cópia única constitui aproximadamente 50% do
genoma humano, enquanto que o genoma restante é composto por sequências de
15
DNA repetitivo que se intercalam com DNA de cópia única. A função da maior parte
desse DNA repetitivo ainda não é conhecida, porém, aparentemente uma pequena
parte dele atua na estabilização da estrutura do cromossomo (NAKAMURA, 2009;
ALBERTS et al, 1999).
O DNA repetitivo não codificador pode ser classificado em DNA repetitivo
disperso ou DNA satélite. O DNA repetitivo disperso é composto por sequências não
agrupadas, mais complexas, espalhadas em numerosas localizações no genoma. Já
o DNA satélite possui sequências agrupadas que constituem de 10 a 15% do
genoma (JORDE, 2004)
A sequência como estão dispostas as bases nitrogenadas no DNA é o que
diferencia o genoma de cada pessoa, pois a estrutura química é igual para todos. No
genoma humano existem mais de três bilhões de nucleotídeos. Deste total, cerca de
99,9% das regiões do DNA possuem a mesma sequência de bases nitrogenadas.
Apenas 0,1% das regiões da molécula apresentam variações na sequência de
nucleotídeos, são os chamados polimorfismos do DNA. As técnicas de identificação
humana se apóiam na análise dessas regiões variáveis. O estudo da variabilidade
destas regiões tem levado à conclusão de que não existem duas pessoas que
apresentem a mesma sequência de DNA, com exceção dos gêmeos univitelinos
(NAKAMURA, Y. 2009; LI et al, 2009).
As diferentes variações no número de repetições do DNA em um determinado
local do cromossomo são chamadas de alelos, que constituem o que é conhecido
como polimorfismo genético. Nos indivíduos, em cada locus há dois alelos, com
exceção dos cromossomos sexuais no sexo masculino, que apresentam um alelo em
cada locus tanto no cromossomo X quanto no cromossomo Y. Quando dois alelos
são idênticos, o indivíduo é homozigoto e quando são diferentes, ele é heterozigoto
para esse locus (OTTO, 2004).
16
Figura 1: Estrutura do DNA composta por íntrons e éxons. Os íntrons são removidos
após a transcrição e os éxons são unidos e então as proteínas são codificadas Fonte: http://svmcompbio.tuebingen.mpg.de/splicing.html
Já o DNA mitocondrial é outro tipo de material que pode ser utilizado na
identificação humana, sendo a principal vantagem o seu alto número de cópias por
célula (de centenas a milhares de organelas). Em casos onde a amostra de DNA
extraída é muito pequena ou degradada, tal como em tecidos esqueletizados, a
probabilidade de obtenção de um perfil de DNA a partir do DNA mitocondrial é maior
que qualquer marcador encontrado no DNA genômico (PANETO, 2006; SWEET;
DIZZINO, 1996). Por este motivo, a análise do DNA mitocondrial para fins forenses
fica reservada principalmente para tecidos antigos como ossos, cabelos e dentes,
nos quais o DNA nuclear já não oferece mais condições de análise (BUDOWLE et al.,
2003).
2.2 MARCADORES POLIMÓRFICOS DE USO CORRENTE EM GENÉTICA
FORENSE
Nos testes de determinação de identidade genética são estudadas regiões
genômicas em que há variação entre pessoas normais, sendo tais regiões
chamadas de “polimorfismos de DNA” ou “marcadores de DNA”. Nos últimos anos
foram desenvolvidas diversas técnicas para estudo de diferentes tipos de
17
polimorfismos de DNA, no qual os cientistas e laboratórios podem escolher o método
mais adequado para solucionar problema em mãos (PENA, 2005).
O DNA satélite é composto por sequências altamente repetitivas simples ou
moderadamente complexas. As sequências deste tipo de DNA ocorrem em tandem,
ou seja, de maneira consecutiva, e sua classificação é realizada segundo a
localização no genoma, número total de repetições e comprimento das unidades
repetidas. O DNA satélite pode ser agrupado em duas subclasses principais
(BUTLER, 2006):
• Minissatélites ou VNTR (Variable Number of Tandem Repeats ou Número
Variável de Repetições Consecutivas): Sequências de tamanho médio (de
10 a 100 pb) cujo número de repetições pode variar desde duas até vinte
ou mais repetições;
• Microssatélites ou STRs (Short Tandem Repeats ou Repetições Curtas
Consecutivas): Pequenas repetições, em geral de 2 a 4 nucleotídeos.
Geralmente são observados até 30 alelos em uma população para apenas
1 locus.
Mais recentemente, os abundantes polimorfismos de base única (SNPs) e os
polimorfismos de inserção/deleção (INDELs) têm emergido como possíveis
alternativas às ferramentas moleculares em genética forense.
MINISSATÉLITES OU VNTRs (DNA FINGERPRINT)
Em 1985, Jeffreys e colaboradores, na Inglaterra, foram os primeiros a
demonstrar que algumas sondas especiais (sondas multilocais) eram capazes de
reconhecer simultaneamente diversas regiões de minissatélites, produzindo padrões
de bandas complexos e específicos para cada indivíduo. Estes padrões foram
chamados de "Impressões Digitais de DNA" ou “DNA Fingerprint”, uma vez que tal
resultado proporcionava um padrão único de identificação de cada indivíduo,
tornando bastante improvável que duas pessoas possuam o mesmo perfil, salvo em
casos de gêmeos univitelinos (Pena, 2005).
A técnica utilizada para o estudo destas sequências altamente polimórficas,
RFLP (Restriction Fragment Length Polymorphism), se baseia no fato de que a
molécula de DNA pode ser cortada em sítios específicos por proteínas denominadas
enzimas de restrição. O RFLP é gerado por diferenças no tamanho do fragmento de
18
DNA digerido pela enzima de restrição devido a substituições no sítio de
reconhecimento da endonuclease (BUTLER, 2005).
Os minissatélites possuem locus mais polimórficos que os microssatélites.
Geralmente, enquanto 5 loci de VNTR são suficientes para obtenção de resultados
satisfatórios na identificação humana, cerca de 12 ou mais loci de STR são
necessários para o mesmo resultado. Entretanto, os VNTRs estão, atualmente, em
desuso na resolução de casos médico-legais, devido ao fato de, entre outras razões,
requerem uma quantidade apreciável de DNA não degradado, além de se tratar de
uma metodologia bastante laboriosa e demorada (NAKAMURA, 2009).
MICROSSATÉLITES OU STRs
São constituídos de pequenas sequências repetidas consecutivamente que
ocorrem a cada 20 kb no genoma humano. Essas sequências repetitivas podem ter
de 2 a 5 pb e geralmente não ultrapassam os 200pb. Nos últimos anos, a descoberta
e o desenvolvimento dos STRs polimórficos como marcadores genéticos
estimularam a elaboração de mapas de ligação, a identificação e caracterização de
genes ligados a doenças e a simplificação e precisão da tipagem de DNA com intuito
de identificar pessoas (BUTLER, 2005).
Na tipagem de regiões STR, através da técnica PCR, são utilizados,
usualmente, sistemas multiplexes, onde vários pares de “primers” orientam
simultâneas reações de amplificação, gerando produtos de múltiplos loci. Os alelos
amplificados são separados em eletroforese. Estes são denominados em função do
número de vezes que uma determinada unidade de repetição está presente no lócus
em questão. Esta forma de nomenclatura permite uma melhoria na padronização
(BUTLER et al., 2004).
Com o avanço da tecnologia, foram desenvolvidos processos automatizados
para análise de loci STR. Acoplou-se a produção de primers marcados com
diferentes corantes fluoróforos e sistemas de detecção a laser em aparatos de
separação eletroforética. Sistemas para amplificação simultânea de 15, 21, até 31
loci STR (ROBLEDO et al, 2009) já encontram-se disponibilizados para uso corrente
em tipagem humana por DNA. Desta maneira, a tipagem ou identificação de um
indivíduo, pode ser realizada em um único tubo, no qual múltiplas reações de
amplificação estarão sendo processadas (BUTLER, 2005).
19
A amplificação de loci STRs por sistema Multiplex oferece diversos benefícios
para a análise de amostras biológicas. Primeiramente, torna-se capaz de analisar
uma grande quantidade de marcadores genéticos consumindo apenas uma pequena
alíquota de amostra. Assim, menos amostra é consumida em comparação ao que
poderia ser utilizado se fossem analisados os loci separadamente.
Consequentemente, ao se amplificar todos os loci desejados em uma única reação,
diminui-se a manipulação, reduzindo a possibilidade de contaminação. Por último, o
sistema multiplex facilita a automatização de processos analíticos (BUDOWLE,
2011).
MARCADORES BI-ALÉLICOS
Além dos minissatélites e microssatélites há dois grandes grupos de
polimorfismos no genoma humano - os polimorfismos de substituição de
nucleotídeos únicos (Single Nucleotide Polymorphisms, ou SNPs) e os polimorfismos
de inserção ou deleção de um ou mais nucleotídeos (INDELs). (KOCH, 2008), sendo
os SNPs mais abundantes, com mais de 10 milhões já identificados e mapeados no
genoma humano. Podem ser estudados em produtos de amplificação muito curtos,
de aproximadamente 50 pb ou menos, o que é vantajoso quando se tem DNA
extremamente degradado, ou em pouca quantidade (PENA, 2005).
Entretanto, os SNPs apresentam algumas limitações. Primeiro, o número de
SNPs necessários é quatro vezes maior do que o número de STRs
(CHAKRABORTY et al., 1999; GILL, 2000). Assim, aproximadamente 60 SNPs
serão necessários para se obter um poder de discriminação equivalente àquele
obtido com os sistemas multiplex de STRs em uso na área forense (GILL et al,
2004). Além disso, as vantagens de custo ainda não estão claras. A despeito das
vantagens e desvantagens da aplicação de SNPs em genética forense, os teste de
paternidade ainda podem ser realizados de maneira mais simples e a custo mais
baixo utilizando os STRs, sem falar na experiência em STRs ao longo dos últimos 10
anos (AMORIM; PEREIRA, 2005).
20
2.2.1 STRs
Os marcadores STRs foram primeiramente descritos como ferramenta efetiva
para identificação humana no início de 1990 (BUTLER, 2006). Os de maior valor
para a identificação humana são aqueles que apresentam maior polimorfismo (maior
número de alelos), menor tamanho, maior frequência de heterozigotos (maior que
90%) e baixa frequência de mutações (GALANTE FILHO et al, 1999).
Devido ao seu alto poder de discriminação entre indivíduos e praticidade, a
análise de STRs se tornou rotina em testes de parentesco e genética forense. A
sensibilidade, maior polimorfismo, elevado índice de discriminação e heterozigose
são características importantes na escolha de determinados STRs para fins forenses
(TAMAKI; JEFFREYS, 2005).
Além da classificação de acordo com o tamanho, os STRs também podem ser
classificados de acordo com a composição dos blocos de sequência. Aqueles com
repetições de mesmo tamanho e sequência são classificados como microssatélites
de repetição simples. Microssatélites com duas ou mais repetições simples
adjacentes diferindo nos motivos de repetição são classificados como repetições
compostas. Microssatélites complexos são aqueles constituídos por blocos de
repetição variando em tamanho. Microssatélites com blocos diferindo em tamanho e
em sequência são classificados como repetições complexas hipervariáveis. Essa
última categoria de marcadores do tipo STR não é comumente utilizada em tipagem
de DNA forense devido a dificuldades com nomenclatura alélica e medida de
variabilidade entre laboratórios. (BUTLER, 2005).
De acordo com as recomendações internacionais, designadamente da
Sociedade Internacional de Genética Forense (ISFG), a denominação dos alelos dos
STRs deve fazer-se de acordo com o número de unidades de repetição,
exemplificadas nas figuras 2 e 3. A figura 2 mostra o alelo 7 do locus D5S818, ou
seja, 7 repetições da sequência AGAT neste locus, já a figura 3 mostra a
representação do alelo 11 do locus TPOX.
Figura 2: Marcador STR, mostrando sete
Figura 3: Sequência do locus Fonte:
Existem situações onde um alelo de um loco STR contém um número
incompleto de repetições. Microvariantes é o termo dado aos alelos que contém
unidades de repetição incompleta.
incompleta, será designado pelo
número de pares de bases da unidade de repetição incompleta, separados por um
ponto (DIXON et al., 2006
no loco TH01, que contém nove repetições tetranuc
ura 2: Marcador STR, mostrando sete unidades de repetição AGAT do
locus TPOX no Genbank, mostrando as unidades de repetição deste.Fonte: http://www.cstl.nist.gov/strbase/images/tpox.jpg
Existem situações onde um alelo de um loco STR contém um número
incompleto de repetições. Microvariantes é o termo dado aos alelos que contém
unidades de repetição incompleta. Se um alelo apresentar uma unidade de repetição
incompleta, será designado pelo número de unidades de repetição completas e pelo
número de pares de bases da unidade de repetição incompleta, separados por um
DIXON et al., 2006). Um exemplo comum de uma microvariante é o alelo 9.3
no loco TH01, que contém nove repetições tetranucleotídicas e uma repetição
21
de repetição AGAT do locus D5S818
, mostrando as unidades de repetição deste.
http://www.cstl.nist.gov/strbase/images/tpox.jpg
Existem situações onde um alelo de um loco STR contém um número
incompleto de repetições. Microvariantes é o termo dado aos alelos que contém
Se um alelo apresentar uma unidade de repetição
número de unidades de repetição completas e pelo
número de pares de bases da unidade de repetição incompleta, separados por um
Um exemplo comum de uma microvariante é o alelo 9.3
leotídicas e uma repetição
22
incompleta de três nucleotídeos, pois na décima repetição falta uma única adenina
fora da normal na unidade de repetição AATG (BUTLER, 2006).
As análises de STRs são de fundamental importância para a ciência forense,
principalmente coma criação de bancos de dados contendo as frequências alélicas
de STRs das populações. Os cálculos estatísticos utilizam como base as frequências
alélicas de cada marcador STR encontrado em representantes da população
estudada (GILL, 2006).
2.3 TÉCNICAS DE BIOLOGIA MOLECULAR APLICADAS À IDENTIFICAÇÃO
HUMANA
Os testes de vínculo genético por DNA são de alta confiabilidade, sendo
aceitos como prova legal em casos judiciais, como inclusão e exclusão de
paternidade e na identificação humana (PARDINI et al, 2001), sendo possível obter
DNA de praticamente todos os tecidos do corpo humano, variando apenas a
quantidade de DNA que é possível extrair de cada um desses tecidos (BUTLER,
2005)
A investigação de vínculo genético sempre mereceu atenção especial da
sociedade e da justiça. No início, os casos de paternidade eram resolvidos
utilizando-se os polimorfismos eritrocitários e protéicos. Estas técnicas, apesar de
simples e baratas, tinham a desvantagem de só fazer afirmações sobre a exclusão
da paternidade e apenas a suposição sobre a probabilidade de um determinado
indivíduo ser o pai biológico da pessoa em questão. Outra desvantagem com
relação à análise de proteínas se relaciona à quantidade de material biológico
necessária para a realização dos testes e a facilidade com que se degradam, além
de não serem capazes de detectar muitos alelos. Para estudos de identificação
humana elas não são as mais indicadas devido ao seu baixo poder discriminatório
(KOCK; ANDRADE, 2008).
Em 1985, Jeffreys et al. propuseram a existência de polimorfismos no DNA
humano. Ao contrário da análise convencional de grupos sanguíneos, a qual
depende de sangue ou outros fluidos corpóreos, os resultados dos perfis analisados
23
não dependem da natureza do material ou do tipo celular analisado, uma vez que a
informação genética está contida em todas as células somáticas de todos os
indivíduos. Por este motivo, o mesmo tipo de DNA de um determinado indivíduo
pode ser obtido de qualquer tecido do corpo humano, enquanto que a análise
utilizando marcadores protéicos ou sanguíneos é restrita a células onde tais
proteínas ou antígenos são expressos e secretados (SCHNEIDER, 1997).
Outro passo importante foi dado quando se verificou que era possível utilizar
a técnica de PCR na detecção de polimorfismos no DNA. A PCR consiste na
reprodução, in vitro, do processo de duplicação do DNA. Uma ou mais fitas de DNA
servem como molde (template), e têm uma dada sequência gênica demarcada
através de oligonucleotídeos – primers (cerca de 20 pares de bases). Estes se
anelam, por hibridação, às suas sequências complementares, indicando o início e o
fim do fragmento desejado, que passa a ser copiado, através do acréscimo, em
ambas as fitas do DNA molde, de nucleotídeos complementares presentes na
reação, sob a ação de uma enzima Taq DNA Polimerase, termorresistente,
proveniente da bactéria Thermus aquaticus (BUTLER, 2005).
Com a automação, uma das técnicas de grande destaque para avaliação
dos produtos amplificados é a eletroforese capilar. Nesta técnica, cada amostra, já
amplificada pela PCR, é processada em cerca de 40 minutos e os produtos da PCR
são separados por tamanho e cor do fluorocromo, utilizando eletroforese seguida por
detecção baseada na fluorescência induzida por laser. Uma voltagem é aplicada por
um determinado tempo para mover as moléculas da amostra através do polímero
presente no capilar. Quando os fragmentos de DNA alcançam a janela de detecção,
as moléculas marcadas com corantes são excitadas pelo laser, emitindo
fluorescência. Esta é coletada simultaneamente e espectralmente separadas. Um
padrão interno, contendo fragmentos de DNA de tamanho conhecido e marcado com
corante diferente, deve ser processado por eletroforese junto com cada amostra. Os
dados, coletados na forma de eletroferogramas, são analisados por um software que
automaticamente determina o tamanho dos alelos com base no padrão interno
(BUTLER, 2004). O funcionamento da eletroforese capilar é esquematizado na
figura 4.
Figura 4: Funcionamento da eletro
A figura 5 mostra um marcador STR em um DNA molde e os primers que se
anelam em ambos os lados da região de repetição. Um dos primers é marcado na
extremidade 5’ terminal com um fluorocromo,
global do produto de PCR, assim como o número de repetições presentes na região
STR. Os produtos de PCR são separados por tamanho e cor do fluorocromo durante
a eletroforese (BUTLER, 2004).
Figura 5: (A) Esquema do posicionamento dos primers(B) Padrão de peso molecular para o marcador D3S1538
heterozigotas, mostrando diferentes genótipos. Valores abaixo dos picos indicam o número de sequências repetidas presentes no alelo
Funcionamento da eletroforese capilar (BUTLER, 2005)
mostra um marcador STR em um DNA molde e os primers que se
anelam em ambos os lados da região de repetição. Um dos primers é marcado na
extremidade 5’ terminal com um fluorocromo, e estes primers
global do produto de PCR, assim como o número de repetições presentes na região
Os produtos de PCR são separados por tamanho e cor do fluorocromo durante
a eletroforese (BUTLER, 2004).
Figura 5: (A) Esquema do posicionamento dos primers para amplificação de um marcador STR.(B) Padrão de peso molecular para o marcador D3S1538 e duas amostras de DNA,
heterozigotas, mostrando diferentes genótipos. Valores abaixo dos picos indicam o número de sequências repetidas presentes no alelo (BUTLER, 2004).
24
forese capilar (BUTLER, 2005)
mostra um marcador STR em um DNA molde e os primers que se
anelam em ambos os lados da região de repetição. Um dos primers é marcado na
e estes primers definem o tamanho
global do produto de PCR, assim como o número de repetições presentes na região
Os produtos de PCR são separados por tamanho e cor do fluorocromo durante
para amplificação de um marcador STR.
e duas amostras de DNA, heterozigotas, mostrando diferentes genótipos. Valores abaixo dos picos indicam o número de
.
25
Foi observado então que, além de completamente compatíveis com os
resultados obtidos com os métodos anteriormente utilizados (grupos sanguíneos,
Antígenos Leucocitários Humanos ou HLA), o DNA é mais informativo, pois seu
elevado polimorfismo permite a inclusão de paternidade (NAKAMURA, 2009). Os
métodos disponíveis até então só permitiam fazer exclusões a respeito da
paternidade. Importante ressaltar que o advento das técnicas de análise do DNA
propiciou a fixação estatística da paternidade, atribuindo o percentual de certeza de
que o indivíduo é o pai biológico (inclusão de paternidade). Isso é feito por meio de
cálculos de probabilidade, que inferem 100% à exclusão do vínculo investigado e
taxa próxima desse percentual para a inclusão de paternidade (PENA, 2005). Assim,
a análise estatística envolvida nos procedimentos de DNA passou a ser de primordial
importância, não só em processos de investigação de paternidade, como também em
questões forenses.
De acordo com a AABB (American Association of Blood Bank), órgão
regulamentador para testes de vínculo genético para identificar indivíduos,
recomenda-se o estudo de, no mínimo, 13 loci, e os dados são usados para criar um
perfil de DNA de cada indivíduo (BUTLER, 2005).
Em caso de identificação forense, alguns exemplos do uso do DNA podem
ser listados, tais como:
• Identificar potenciais suspeitos, dos quais o DNA foi encontrado em
cenas de crime;
• Inocentar pessoas acusadas erroneamente de crimes;
• Identificar vítimas de crimes e catástrofes;
• Estabelecer paternidade ou outro vínculo familiar.
O Federal Bureau of Investigation (FBI) usa um padrão de 13 STR loci
específicos para o CODIS (Combined DNA Index System), o programa de
computador que opera os bancos de dados locais, estaduais e nacionais de perfis
de DNA de criminosos, pessoas envolvidas em crimes não resolvidos e pessoas
desaparecidas. A possibilidade de dois indivíduos possuírem o mesmo perfil nos 13
loci analisados é de um em um bilhão (BUTLER, 2005).
26
No nosso estudo, foram analisados 15 loci, abaixo listados no Quadro 1:
LOCUS LOCALIZAÇÃO SEQUÊNCIA REPETITIVA
MARCADOR FLUORESCENTE
ACESSO GENBANK
TPOX CROMOSSOMO 2
2p25.3
GAAT NED
(Amarelo)
M68651
D2S1338 CROMOSSOMO 2
2q35
[TGCC][TTCC] VIC
(Verde)
G08202
D3S1358 CROMOSSOMO 3
3p21
[TCTG][TCTA] VIC
(Verde)
NT_005997
FGA CROMOSSOMO 4
4q28
CTTT PET
(Vermelho)
M64982
D5S818 CROMOSSOMO 5
5q21-q31
AGAT PET
(Vermelho)
G08446
CSF1PO CROMOSSOMO 5
5q33.3-34
TAGA 6-FAM
(Azul)
X14720
D7S820 CROMOSSOMO 7
7q21.11
GATA 6-FAM
(Azul)
G08616
D8S1179 CROMOSSOMO 8
8q24.1-24.2
[TCTA][TCTG] 6-FAM
(Azul)
G08710
TH01 CROMOSSOMO 11
11p15.5
TCAT VIC
(Verde)
D00269
VWA CROMOSSOMO 12
12p13.31
[TCTG][TCTA] NED
(Amarelo)
M25858
D13S317 CROMOSSOMO 13
13q22-q31
TATC VIC
(Verde)
G09017
D16S539 CROMOSSOMO 16
16q22-24
GATA VIC
(Verde)
G07925
D18S51 CROMOSSOMO 18
18q21.3
AGAA NED
(Amarelo)
L18333
D19S433 CROMOSSOMO 19
19q12
AAGG NED
(Amarelo)
G08036
D21S511 CROMOSSOMO 21
21q21.1
[TCTA][TCTG] 6-FAM
(Azul)
AP000433
Quadro 1: Localização no genoma dos loci analisados, sua sequência, fluoróforo marcador e acesso no Genbank (Fonte: BUTLER, 2005; Applied Biosystems)
27
2.4 BANCOS DE DADOS
O crescimento de bancos de dados de DNA vem fazendo aumentar o
envolvimento da polícia científica no auxílio da aplicação da lei. Além de sua função
essencial de ligar crimes e suspeitos, tais bancos colecionam informações sobre
crimes e criminosos. A análise desses dados pode aumentar a compreensão do
contexto no qual as Ciências Forenses funcionam como ferramentas para a justiça
criminal (SMITH, 2006; SCHNEIDER, 2009).
A aprovação da primeira legislação que permitia a coleta e o armazenamento
de amostras de DNA de condenados deu-se na Virgínia (EUA) em 1989, e os
bancos de dados de DNA eram compostos por perfis VNTR. Porém foi o Reino
Unido que estabeleceu legalmente um banco de dados de DNA nacional baseado
em uma pelataforma de tecnologia STR (BUTLER, 2006).
O Forensic Science Service (FSS), órgão inglês pioneiro no desenvolvimento
e implementação de tecnologias de DNA e em abrir caminho para a formação do
primeiro banco de dados no mundo, começou a procurar novos loci e variação na
população de estudo com candidatos de loci STR. Juntamente com outros
laboratórios europeus, lançaram o sistema multiplex SGM, e em 1995 foi lançado o
NDNAD (Banco de Dados de DNA Nacional do Reino Unido) que contemplava o
sistema multiplex SGM adicionado ao marcador sexual Amelogenina (WERRET,
1997; BUTLER, 2006).
Observando o sucesso obtido pela tipagem por STR no Reino Unido, o
laboratório do FBI (Fereral Bureau of Investigation) liderou esforços nos EUA para
estabelecer o núcleo dos loci STR que formariam o CODIS (Combined DNA Index
System), sistema nacional de banco de dados americano, o mais conhecido e mais
importante no mundo. Em um projeto que durou aproximadamente 18 meses e
envolveu 22 laboratórios americanos, foram avaliados 17 loci STR de kits já
comercializados e em testes, das empresas “Applied Biosystems” e “Promega
Corporation”, e em 1997 foram anunciados os 13 loci STR que compunham o
CODIS, quais sejam: CSF1PO, FGA, TH01, TPOX, VWA, D3S1358, D5S818,
D7S820, D8S1179, D13S317, D16S539, D18S51 e D21S11 (BUTLER, 2004, 2006).
Nesse sistema existem dois arquivos diferentes de perfis genéticos cujos objetivos
se completam: o Forensic Index (Índice Forense) que contém perfis genéticos
28
obtidos a partir de cenas de crime; e o Offender Index (Índice de Criminosos) que
contém perfis genéticos de criminosos condenados por crimes sexuais e outros
crimes violentos (PENA, 2005). A possibilidade de dois indivíduos possuírem o
mesmo perfil nos 13 loci analisados é de um em um bilhão.
Os mesmos marcadores STRs são usados em várias circunstâncias. Existem
oito loci STR (FGA, TH01, VWA, D3S1358, D8S1179, D16S539, D18S51 e D21S11)
que compões tanto o banco de dados dos Estados Unidos quanto o da Europa, fato
este que permite uma possível colaboração internacional (BUTLER, 2005).
Atualmente muitos países dispõem de sistemas de Bancos de Dados de DNA,
como a Nova Zelândia, Alemanha, Áustria, Suíça, Canadá, França, Itália e, na
América do Sul, o Chile. Existem programas para implantação de bancos de dados
de DNA em países como Argentina, Cuba, Líbano, entre outros (GILL, 2006).
O Brasil ainda não conta com um sistema de banco de dados de informações
genéticas de criminosos ou pessoas desaparecidas como ferramentas investigativas
eficientes para armazenamento, busca e cruzamento de informações (FIGUEIREDO;
PARADELA, 2010), embora já existam esforços para uma padronização em relação
aos métodos para análise de DNA.
Em 2005 foi criada no Brasil a Rede Nacional de Genética Forense, formado
por peritos federais e estaduais, atuantes em Genética Forense, e professores
universitários. Em 2009, o CODIS, sistema nacional de banco de dados americano,
foi repassado para o Brasil pelos EUA sem ônus algum. Todos os 17 estados
brasileiros que possuem laboratório de DNA criminal assinaram os Acordos de
Cooperação Técnica com a Polícia Federal, sendo o sistema já instalado em 2010.
No Nordeste, apenas os estados de Ceará, Paraíba e Bahia contribuem com o
Banco Nacional de DNA (JACQUES, 2011).
O banco de dados de perfis genéticos é usado para comparar perfis de
suspeitos cadastrados no banco e identificar criminosos a partir de outros crimes,
podendo ser usado para provar a inocência ou culpa de suspeitos, assim como
identificar restos mortais e amostras biológicas (DOLINSKY; PEREIRA, 2007). Esse
banco tem alterado o sistema de justiça criminal em muitos países, principalmente
por fornecer a chance de identificação de indivíduos e resolução de casos sem
suspeitos, caso não existam amostras para serem comparadas com o material
coletado na cena do crime (WALSH, 2004).
29
Ao longo da aplicação dos conhecimentos do DNA para a viabilização da
Justiça, foram sendo desenvolvidos bancos de dados das padronizações genotípicas
das populações. Inicialmente, utilizavam-se nas identificações das frequências
populacionais os bancos de dados do FBI para a população geral norte-americana.
Posteriormente a caucasóide norte-americana. Depois a população geral latino-
americana, a caucasóide, negróide e amarela latino-americana e, finalmente, passou-
se a utilizar os bancos de dados específicos da população brasileira
(GRATTAPAGLIA et al. 2001)
2.5 ESTUDOS DE FREQUÊNCIA NA INVESTIGAÇÃO FORENSE
O delineamento das experiências de Mendel permitiu-lhe uma interpretação
estatística muito simples dos resultados, mas suficiente para enunciar alguns
princípios básicos da hereditariedade. Com base num grande número de
cruzamentos de ervilhas, Mendel "probabilizou" os diferentes genótipos, fenótipos e
a presença de genes que estão associados à transmissão da hereditariedade de
geração em geração (BEIGUELMAN, 2008).
Li et al. (2009) mostraram que a variação genética dentro da população é
responsável pela maioria da diversidade humana; no entanto, a variação entre as
populações é suficiente para mostrar a presença de estrutura genética entre estas. A
contribuição genética ancestral pode ser obtida por meio da comparação da
frequência de alelos de determinadas regiões genômicas entre a população alvo e
as possíveis parentais, ou seja, aquelas que contribuíram de alguma forma com
alguns indivíduos, genomas, para a formação da população alvo (RIBEIRO, 2009).
A Genética Populacional tem como um dos objetivos analisar as
consequências da aplicação dos princípios mendelianos em determinada população,
estudando os efeitos das mutações, seleção natural, migração e deriva genética. É
de grande interesse em Antropologia e em Medicina legal, pois quando se efetua a
valorização da prova pericial, se faz necessário conhecer alguns parâmetros
estatísticos da população referência (BEIGUELMAN, 2008).
Sabe-se que diferentes populações apresentam alelos em frequências
diferentes e algumas vezes únicos, por isso a necessidade do estudo de diferentes
30
marcadores naquela população para saber quais alelos presentes e em que
frequência, a fim de se definir quais são os melhores marcadores a serem utilizados
nestes casos. Assim, para que a identificação através de STRs possa ser
rapidamente incorporada com efetiva confiabilidade à população brasileira, é de
extrema importância a realização de estudos populacionais (OLIVEIRA et al, 2002) e
nestes estudos a investigação deve ser realizada em indivíduos sem nenhum grau
de parentesco, a fim de possibilitar a determinação da frequência alélica da
população.
Para a realização da identificação humana é mais interessante utilizar
marcadores moleculares que apresentem grande variabilidade dentro da população,
ou seja, alto grau de polimorfismo, de forma que a probabilidade de duas pessoas
apresentarem um mesmo alelo torne-se menor. Sendo assim, a realização de
pesquisas para a obtenção de frequências alélicas populacionais tornam-se
extremamente importantes, possibilitando a divulgação desses dados, através da
literatura científica e, também, por banco de dados (sistemas nos quais são
armazenados perfis de DNA referentes a um conjunto de marcadores moleculares)
podendo ser aplicados na investigação forense (GÓIS, 2006).
Populações que se encontram em regiões diferentes ou apresentam origem
distinta podem apresentar alelos em frequências diferentes e algumas vezes, únicos.
Portanto, quando se deseja identificar um indivíduo proveniente de determinada
população, é necessário o estudo de diferentes marcadores naquela população para
saber quais são os alelos presentes e em que frequência, a fim de se definir quais
são os melhores marcadores a serem utilizados nestes casos.
Tal distribuição alélica será aplicada nos cálculos estatísticos realizados em
testes de identificação humana e de paternidade, a fim de dar força e credibilidade às
informações obtidas pela análise da evidência genética (amostra biológica). A base
para esses cálculos de frequências de alelos derivou dos estudos de Hardy-
Weinberg. O Princípio de Hardy-Weinberg é um modelo matemático simples que
demonstra que as frequências genotípicas de uma população se mantêm constantes
quando não há força evolutiva atuando sobre a mesma. Para que o princípio possa
ser demonstrado, a população em questão deve estar em equilíbrio genético,
devendo ela apresentar as seguintes características (BEIGUELMAN, 2008):
1) A população analisada deve ser grande o suficiente para que não ocorram
desvios estatísticos;
31
2) Não deve haver fluxo gênico entre diferentes populações;
3) Não deve haver a ocorrência de mutações;
4) Os casamentos devem ocorrer aleatoriamente, não existindo, por
conseguinte, casamentos preferenciais entre indivíduos por causa de seu genótipo,
fenótipo, estratificação social ou consangüinidade. Aliás, por serem os casamentos
realizados aleatoriamente, os casamentos consangüíneos podem existir, desde que
ocorram aleatoriamente
5) Não pode haver atuação da seleção natural.
Este tipo de população é chamada de população ideal e apesar de nenhuma
população humana preencher as condições descritas acima, a prática tem
demonstrado que em numerosas populações humanas, os genótipos se distribuem
de acordo com a Lei de Hardy-Weinberg, sendo esta muito útil para se estudarem
populações e os mecanismos evolutivos que violam o Princípio (BEIGUELMAN,
2008).
Existem diversos parâmetros estatísticos para determinar a eficácia de um
marcador genético na conclusão de casos na área da Genética e Biologia Forense,
sendo diferentes para cada situação (investigação biológica de filiação, criminalística
biológica e identificação genética individual). Para que se possa usar um marcador
genético tem que se realizar um estudo desse marcador na população em questão.
Abaixo estão listados aguns dos principais parâmetros populacionais usado em
Genética e Biologia Forense (BEIGUELMAN, 2008; McMANUS et al, 2011):
• Poder de Exclusão: O PE de um marcador genético numa determinada
população é um parâmetro importante no que concerne à investigação
biológica da paternidade. Pode ser definido como a percentagem de
indivíduos falsamente acusados, cuja paternidade ficaria excluída, com
base nesse marcador.
• Poder de Discriminação: O PD é um parâmetro estatístico a priori que se
define como a probabilidade de dois indivíduos, retirados ao acaso da
mesma população e não aparentados entre si, se possam diferenciar
geneticamente, mediante a análise de um sistema ou conjunto de
sistemas genéticos. Quanto maior for o número de sistemas genéticos
considerados, maior o valor de PD, existindo maior capacidade de
discriminar vários indivíduos de uma população.
32
• Probabilidade de Matching (MP): Também conhecida como Match
Probability ou Probabilidade de Coincidência, é a probabilidade de dois
indivíduos terem o mesmo padrão genotípico. Portanto, é o oposto da
Probabilidade de Discriminação.
• Heterozigosidade: Trata-se de um parâmetro que representa a
probabilidade de dois alelos do mesmo locus, escolhidos ao acaso na
população, serem diferentes. A heterozigosidade observada (Ho) define-
se como o número de indivíduos heterozigóticos observados,
relativamente ao número total de indivíduos da população. A variabilidade
genética de uma população é quantificada pela heterozigosidade média
esperada (He) por locus. Este valor consiste na média aritmética dos
valores de heterozigosidade dos vários loci analisados. He difere de Ho
porque ela é uma previsão baseada na frequência alélica conhecida,
oriunda de amostras individuais.
• Conteúdo Informativo de Polimorfismo (PIC): É a capacidade informativa
de um locus analisando-se seu conteúdo em informação polimórfica. PIC
superiores a 0,5 são considerados muito informativos.
33
3 JUSTIFICATIVA
Até o presente momento, há poucos trabalhos no Brasil cujo enfoque esteja
voltado para a construção de um banco de dados de frequências alélicas para os
marcadores comumente utilizados em identificação humana, que contemplem 15 loci
polimórficos ou mais, assim como uma maior quantidade de indivíduos analisados.
Portanto, faz-se necessário a caracterização da população do estado do Rio
Grande do Norte através da introdução de mais marcadores genético moleculares,
capazes de auxiliar na resolução de identificação humana (testes de paternidade) e
de medicina forense.
34
4 OBJETIVOS
4.1 OBJETIVO GERAL
Propor a montagem de um banco de dados composto pelas frequências
alélicas de 15 loci polimórficos de um grupo de indivíduos no estado do Rio Grande
do Norte.
4.2 OBJETIVOS ESPECÍFICOS
Determinar parâmetros populacionais de importância para estudos de
identificação humana, tais como índices de Heterozigozidade, Poder de Exclusão,
Poder de Discriminação, Índice de Paternidade típico, entre outros.
Fazer uma comparação genético-populacional entre o Rio Grande do Norte e
outras populações do Brasil (com dados de outros autores), com base nos
resultados obtidos dos loci analisados neste trabalho.
35
5 METODOLOGIA
5.1 CASUÍSTICA
As amostras que alimentam o banco de dados do laboratório utilizadas neste
trabalho são provenientes de sangue periférico coletados por punção digital de 1100
indivíduos não relacionados entre si, saudáveis, de ambos os sexos e obtidos de
casos de teste de paternidade no estado do Rio Grande do Norte, divididos entre
551 homens e 549 mulheres. No momento da coleta do material biológico utilizado
para avaliação dos seus padrões genéticos para fins de paternidade, cada indivíduo
assinou um documento denominado “Termo de Identificação das Partes e
Autorização para Realização da Coleta”, no qual afirmou que os materiais foram
coletados em única oportunidade, que ali se encontrava de livre e espontânea
vontade, que não sofreu transfusão sanguínea recente, nem transplante de medula
óssea, e que os dados gerados poderiam ser utilizados para fins estatísticos.
Tais amostras foram coletadas em Natal-RN, no Laboratório DNA Center, e
em laboratórios de apoio no estado, localizados em Mossoró, Caicó, Nova Cruz,
Assu, Canguaretama, Goianinha e Campo Grande. O processamento do material
utilizado foi realizado no Laboratório DNA Center.
5.2 MATERIAIS E MÉTODOS
5.2.1 Extração do DNA
O DNA genômico foi extraído das células brancas do sangue periférico,
impregnado em papel de filtro FTA Card® (Whatman Bioscience, Cambridge, UK).
Tal método de coleta permite a conservação da amostra sem a necessidade de
refrigeração, pois é impregnado com uma mistura de substâncias químicas
responsáveis por lisar a membrana celular, imobilizar e estabilizar os ácidos
36
nucléicos e inibir o crescimento de bactérias, fungos e vírus, permitindo a
conservação da amostra à temperatura ambiente por vários anos (SMITH;
BURGOYNE, 2004). Assim, as amostras biológicas podem ser transportadas e
armazenadas de forma prática, facilitando a rotina laboratorial. Outra grande
vantagem do papel de filtro FTA Card® é que resultados consistentes podem ser
obtidos sem necessidade de quantificação do DNA (BUTLER, 2005).
Foi utilizado um disco de 1,5 mm de diâmetro deste papel de filtro, cortado
com o auxilio do dispositivo Harris Micro Punch® (Whatman-Bioscience) e
depositados em microtubos de 200 µL. Em seguida, o disco foi submetido a duas
lavagens de 30 minutos, com agitação manual por inversão a cada 5 minutos, uma
com 200 µL do reagente FTA® Purification Reagent, da Whatman-GE, e outra com
200 µL de água ultrapura. Após as duas lavagens, o disco contendo DNA secou em
temperatura ambiente por algumas horas, antes da amplificação.
Figura 6: Material utilizado na extração de DNA pelo método FTA Card.
Fonte: Acervo pessoal
5.2.2 Amplificação
Na determinação dos 15 loci polimórficos, foi utilizada a técnica de Reação
em Cadeia da Polimerase (PCR) pelo sistema Multiplex, ou seja, os 15 loci foram
amplificados numa mesma reação, em termoclicador Veriti 96-Well Thermal Cycler
(Applied Biosystems, Foster City, CA, USA). Aproximadamente 1 ng de DNA
(quantidade prevista, de acordo com o fabricante, em um disco extraído) foi
amplificado utilizando o kit comercial AmpFlSTR® Identifiler PCR Amplification Kit
(Applied Biosystems), com um volume final de 12,5 µL. As condições de ciclos da
PCR foram as seguintes: 95° C por 11 minutos (desnaturação da fita dupla de DNA);
37
28 ciclos de 94° C por 1 minuto, 59° C por 1 minuto e 72° C por 1 minuto (ciclos de
desnaturação, anelamento dos primers e extensão da nova fita de DNA); em
seguida 60° C por 60 minutos (extensão final) e 4° C por infinito tempo, obedecendo
as condições padronizadas pelo fabricante.
A figura 7 representa os 15 loci analisados no kit AmpFlSTR® Identifiler, seus
respectivos tamanhos de fragmentos gerados após amplificação e as cores
representativas de seus marcadores fluorescentes.
Figura 7: Loci contemplados no kit AmpFlSTR Identifiler.
Fonte: Manual do fabricante
5.2.3 Análise de Fragmentos
Os produtos amplificados sofreram eletroforese capilar em sequenciador ABI
3130® Genetic Analyzer (Applied Biosystems). Amostra de um µL de produto de
PCR foi adicionada a 8,7µL de Hi-Di Formamide (agente desnaturante) e 0,3 µL de
padrão interno GeneScan-500 LIZ Size Standard. A eletroforese foi gerenciada
utilizando o software Data Collection (versão 3.0) (Applied Biosystems).
A análise dos dados e o tamanho do fragmento alélico foram determinados
utilizando o software Genemapper ID (versão 3.2). Um padrão de peso molecular
(allelic ladder, ou escada alélica) fornecido no kit foi utilizado para determinação
38
alélica. A figura 8 exemplifica um eletroferograma, mostrando os 15 loci STR
estudados e seus alelos, assim como o marcador sexual Amelogenina.
Figura 8: Eletroferograma, contemplando os 15 STRs
analisados e o marcador sexual Amelogenina. Fonte: Acervo do laboratório
39
5.2.4 Controles
AmpFlSTR® Control DNA 9947A foi utilizado como controle da reação de
amplificação e para certificação do correto alinhamento da escada alélica.
Amostras do controle de qualidade do GEP-ISFG (Grupo Espanhol e
Português da Sociedade Internacional de Genética Forense) e do PNCQ (Programa
Nacional de Controle de Qualidade) foram analisadas para testar a qualidade da
metodologia. Todos os resultados obtidos estavam de acordo com os controles de
qualidade.
5.2.5 Análises Estatísticas
Foi realizado o cálculo amostral para se obter o número de indivíduos
representativo de cada mesorregião estudada, assim como do Estado do Rio
Grande do Norte como um todo.
Após a obtenção dos perfis alélicos, foram determinadas as frequências
alélicas dos 15 marcadores. A determinação dessas frequências foi realizada com o
auxílio do programa PowerStats ver. 12 (Promega) pelo método da frequência
relativa, ou seja, através do número de repetições do alelo observado nas amostras
(TEREBA, 1999). Foram calculados também por este programa os parâmetros
estatísticos de interesse na prática forense e em exames de paternidade.
Posteriormente, com os dados de frequência obtidos, foi realizado com o programa
Arlequim ver. 3.11 o Teste Exato para avaliar a divergência do Equilíbrio de Hardy-
Weimberg. O programa Arlequin fornece métodos para analisar os padrões de
diversidade genética dentro e entre amostras de uma população (EXCOFFIER et al,
2005).
40
5.2.6 Aspectos Éticos
No presente estudo não houve a identificação pessoal dos indivíduos, visto
que as análises foram restritas aos alelos investigados obtidos do banco de dados
do laboratório DNA Center. Este estudo faz parte do projeto aprovado pelo CEP-
UFRN com o número do processo 0312.0.000-051-06, que tem por objetivo
investigar polimorfismos de doenças hereditárias e de identificação humana.
6 RESULTADOS E DISCUSSÃO
Para uma melhor representatividade da população do Rio Grande do Norte
como um todo, as amostras obtidas foram classificadas nas quatro mesorregiões
estabelecidas pelo IBGE, de acordo com a c
Mesorregião é uma subdivisão dos estados brasileiros que congrega diversos
municípios de uma área geográfica com sim
2010). São elas: Mesorregião Oeste
(M2), Mesorregião Agreste Potiguar (M3) e Mesorregião Leste Potiguar (M4),
indicadas na figura 7.
A mesorregião Oeste Potiguar é a de maior extensão territorial, com
21.167,130 km2, englobando também a maior quantidade de municípios (62 ao todo)
com uma população de 781.439 habitantes.
menos populosa, com 374.364 habitantes
km². A mesorregião do Agreste Potiguar é a terceira mais populosa do estado,
sendo a única em que nenhum de seus municípios possui litoral, possuindo
aproximadamente 414.021 habitantes, distribuídos em uma área territorial de
RESULTADOS E DISCUSSÃO
Para uma melhor representatividade da população do Rio Grande do Norte
amostras obtidas foram classificadas nas quatro mesorregiões
estabelecidas pelo IBGE, de acordo com a cidade natal de cada indivíduo.
esorregião é uma subdivisão dos estados brasileiros que congrega diversos
municípios de uma área geográfica com similaridades econômicas e sociais (IBGE,
elas: Mesorregião Oeste Potiguar (M1), Mesorregião Central Potiguar
Agreste Potiguar (M3) e Mesorregião Leste Potiguar (M4),
Figura 9: Mesorregiões do Rio Grande do NorteFonte: http://portal.rn.gov.br
região Oeste Potiguar é a de maior extensão territorial, com
, englobando também a maior quantidade de municípios (62 ao todo)
com uma população de 781.439 habitantes. A mesorregião Central
374.364 habitantes distribuídos em uma área de
A mesorregião do Agreste Potiguar é a terceira mais populosa do estado,
sendo a única em que nenhum de seus municípios possui litoral, possuindo
414.021 habitantes, distribuídos em uma área territorial de
41
Para uma melhor representatividade da população do Rio Grande do Norte
amostras obtidas foram classificadas nas quatro mesorregiões
idade natal de cada indivíduo.
esorregião é uma subdivisão dos estados brasileiros que congrega diversos
dades econômicas e sociais (IBGE,
Potiguar (M1), Mesorregião Central Potiguar
Agreste Potiguar (M3) e Mesorregião Leste Potiguar (M4),
Norte
região Oeste Potiguar é a de maior extensão territorial, com
, englobando também a maior quantidade de municípios (62 ao todo)
mesorregião Central Potiguar é a
em uma área de 15.810,436
A mesorregião do Agreste Potiguar é a terceira mais populosa do estado,
sendo a única em que nenhum de seus municípios possui litoral, possuindo
414.021 habitantes, distribuídos em uma área territorial de
9.367,384 km2. E finalmente,
extensão territorial (6.451,841 km²), sendo a mais populosa do estado, com
1.473.936 habitantes (IBGE, 2010).
A tabela 1 apresenta a quantidade de habitantes de cada mesorregião do Rio
Grande do Norte e o número de ind
distribuições destes em cada mesorregião.
Tabela 1: Distribuição das 1100 amostras entre as
MESORREGIÃO
Oeste Potiguar (M1) Central Potiguar (M2) Agreste Potiguar (M3) Leste Potiguar (M4)
TOTAL
Figura 10: Distribuição dos indivíduos estudados entre as
mesorregiões do RN
As frequências alélicas dos 15
pessoas nascidas no Rio Grande do Norte estão apresentadas na Tabela 2, assim
como os parâmetros estatísticos
paternidade e o Equilíbrio de Hardy
DISTRIBUIÇÃO ENTRE AS MESORREGIÕES
. E finalmente, a mesoregião do Leste Potiguar, que possui a menor
451,841 km²), sendo a mais populosa do estado, com
1.473.936 habitantes (IBGE, 2010).
bela 1 apresenta a quantidade de habitantes de cada mesorregião do Rio
número de indivíduos estudados, já a figura 10
distribuições destes em cada mesorregião.
Tabela 1: Distribuição das 1100 amostras entre as Mesorregiões
NÚMERO DE INDIVÍDUOS ESTUDADOS
NÚMERO DE INDIVÍDUOS TOTAIS
278 781.439
183 374.364179 414.021460 1.473.936
1100 3.168.027
: Distribuição dos indivíduos estudados entre as
mesorregiões do RN
As frequências alélicas dos 15 loci STRs estudados na população de
pessoas nascidas no Rio Grande do Norte estão apresentadas na Tabela 2, assim
como os parâmetros estatísticos importantes para estudos forenses e teste de
ade e o Equilíbrio de Hardy-Weinberg.
Oeste Potiguar
(M1)
25%
Central Potiguar
(M2)
17%Agreste
Potiguar (M3)
16%
Leste Potiguar
(M4)
42%
DISTRIBUIÇÃO ENTRE AS MESORREGIÕES
42
a mesoregião do Leste Potiguar, que possui a menor
451,841 km²), sendo a mais populosa do estado, com
bela 1 apresenta a quantidade de habitantes de cada mesorregião do Rio
ivíduos estudados, já a figura 10 apresenta as
Mesorregiões:
NÚMERO DE INDIVÍDUOS TOTAIS
781.439
374.364 414.021
1.473.936
3.168.027
: Distribuição dos indivíduos estudados entre as
STRs estudados na população de
pessoas nascidas no Rio Grande do Norte estão apresentadas na Tabela 2, assim
importantes para estudos forenses e teste de
43
Tabela 2: Frequência alélica e parâmetros estatísticos para os 15 STRs estudados na
população do Rio Grande do Norte
ALELO D21S11 D13S317 D3S1338 VWA D7S820 D16S539 D18S51 CSF D5S818 TH01 TPOX FGA D8S1179 D2S1338 D19S433
6
0,223 0,023
7
0,011
0,012 0,034 0,231 0,001
8
0,098
0,140 0,031
0,022 0,016 0,146 0,455
0,006
9
0,086
0,118 0,174
0,019 0,036 0,175 0,117
0,006
0,001
9,3
0,217
10
0,054
0,298 0,081 0,007 0,234 0,080 0,008 0,055
0,069
0,005
11
0,288 0,001 0,001 0,230 0,273 0,012 0,312 0,320
0,293
0,063
0,022
11,2
0,001
12
0,301 0,004
0,177 0,273 0,125 0,325 0,326
0,056
0,143
0,106
12,2
0,013
13
0,127 0,005 0,005 0,023 0,148 0,120 0,062 0,174
0,271
0,260
13,2
0,001
0,043
14
0,044 0,095 0,079 0,003 0,020 0,156 0,010 0,011
0,260 0,001 0,286
14,2
0,001
0,033
15
0,002 0,304 0,118
0,001 0,167 0,003 0,002
0,143 0,002 0,133
15,2
0,048
16
0,251 0,272
0,133
0,035 0,036 0,032
16,2
0,013
17
0,203 0,283
0,124
0,001 0,003 0,214 0,001
17,2
0,001
18
0,128 0,155
0,069
0,009
0,095 0,001
18,2
0,002
0,001
19
0,009 0,067
0,048
0,065
0,122
20
0,018
0,019
0,112
0,136
21
0,002
0,009
0,160
0,050
22
0,005
0,141
0,072
22,2
0,003
23
0,001
0,146
0,112
23,2
0,002
24
0,159
0,072
24,2 0,001
0,000
25 0,001
0,122
0,065
26 0,001
0,050
0,021
27 0,023
0,001
0,013
0,002
28 0,153
0,005
29 0,217
0,002
30 0,261
0,001
30,2 0,025
31 0,052
31,2 0,104
0,002
32 0,014
32,2 0,102
0,001
33 0,001
33,2 0,026
34,2 0,003
0,001
35 0,003
36 0,009
43,2
0,001
45,2 0,001
n 2200 2200 2200 2200 2200 2200 2200 2200 2200 2200 2200 2200 2200 2200 2200
Ho 0.820 0,775 0,764 0,782 0,763 0,800 0,877 0,726 0,720 0,768 0,672 0,865 0,77 0,878 0,813
He 0.839 0.788 0,778 0,798 0,793 0,793 0,877 0,735 0,752 0,797 0,686 0,874 0,808 0,881 0,814
P <0,001 0.839 0,316 0,379 0,100 0,552 0,496 0,786 0,128 0,569 0,695 0,341 0,259 0,017 0,031
PD 0,954 0,927 0,917 0,933 0,928 0,924 0,971 0,884 0,901 0,929 0,856 0,970 0,939 0,974 0,940
PE 0,636 0,554 0,533 0,566 0,532 0,599 0,749 0,494 0,460 0,552 0,386 0,763 0,545 0,751 0,623
PIC 0.820 0,762 0,743 0,769 0,762 0,761 0,869 0,691 0,713 0,766 0,639 0,860 0,782 0,869 0,792
PI 2,780 2,227 2,115 2,292 2,107 2,500 4,074 1,930 1,786 2,216 1,522 3,691 2,174 4,104 2,670
MP 0,046 0,073 0,083 0,067 0,072 0,076 0,029 0,116 0,099 0,071 0,144 0,030 0,061 0,026 0,060
n: número de alelos analisados; Ho: heterozigose observada; He: heterozigose esperada; P: Equilíbrio de Hardy-Weinberg, baseado no teste exato de Markov; PD: poder de discriminação; PE: poder de exclusão; PIC: conteúdo informativo de polimorfismo; PI: índice de paternidade típico; MP: Probabilidade de 2 indivíduos terem o mesmo padrão genotípico.
44
A maioria dos marcadores avaliados em nosso estudo apresentou-se em
equilíbrio de Hardy-Weinberg (HW), com exceção dos loci D2S1338, D19S433 e
D21S11 que apresentaram valor de P inferior ao nível de significância admitido de
0,05. Entretanto, após a correção de Bonferroni (WEIR et al, 1996) utilizando o
número de loci analisados, as diferenças observadas não foram estatisticamente
significativas, com exceção do locus D21S11 (P<0,0033). Tal fato demonstra uma
situação de normalidade na distribuição populacional.
Estudos realizados em outros estados do Brasil também mostraram algumas
inconsistências no equilíbrio de HW em relação a alguns marcadores. O locus
D21S11 se apresentou em desequilíbrio no estudo realizado com 3000 indivíduos
em Santa Catarina (OCAMPOS et al, 2009).
Analisando os parâmetros mostrados na Tabela 2 por meio dos testes
estatísticos, observou-se que para todos os marcadores, os índices de
Heterozigosidade esperados situam-se próximos aos níveis de Heterozigosidade
observados. O locus D2S1338 apresentou o maior nível de Heterozigosidade
(87,8%), enquanto que o locus TPOX apresentou o menor nível (67%), sendo este,
portanto, o de menor grau de variabilidade, corroborando com os estudos de
Grattapaglia et al em 2001.
Dos quinze loci estudados, os loci D2S133 e D18S51 apresentaram, ambos,
PIC de 0,869, sugerindo alto poder informativo pois apresentaram maior conteúdo
polimórfico. Diferentemente do D2S1338 e D18S51, o locus menos informativo
encontrado foi TPOX, com PIC de 0,639, o qual, também foi encontrado na pesquisa
de Fridman et al, em 2008.
Outro requisito analisado para a variabilidade na aplicação forense é o Poder
de Discriminação, a fim de verificar a probabilidade de que, ao escolher
aleatoriamente uma amostra, ela possa ser identificada em relação às demais
(DESMARAIS et al, 1998). Os loci mais polimórficos e mais discriminativos
analisados no presente trabalho foram respectivamente: D2S1338 (PD = 0,974),
D18S51 (PD = 0,971) e FGA (PD = 0,970). Nossos achados corroboram exatamente
o que foi encontrado no estudo feito na população brasileira (FRIDMAN et al, 2008)
e no Rio Grande do Sul (CHULA et al, 2008), assim como na maioria dos estudos
que contemplam esses marcadores.
O Poder de Exclusão, como mencionado anteriormente, é um parâmetro
importante no que concerne à investigação biológica de paternidade, sendo definido
45
como a percentagem de indivíduos falsamente acusados, cuja paternidade ficaria
excluída, com base nesse marcador. No nosso estudo, os três loci com maior PE
foram FGA, D2S1338 e D18S51, com valores entre 0,763 e 0,749, também
corroborando com os estudos que contemplam estes marcadores, variando apenas
a sua ordem. Entretanto, em todos os estudos avaliados que contemplam o locus
TPOX, este apresentou-se com o menor Poder de Exclusão (FRIDMAN et al, 2008;
CHULA et al, 2008; FERREIRA DA SILVA et al, 2002; OCAMPOS et al, 2009;
GRATTAPAGLIA et al, 2001; DELLALIBERA et al., 2004; GÓES et al, 2004;
POIARES et al, 2009).
As frequências alélicas encontradas na população do Rio Grande do Norte
foram comparadas com as frequências encontradas em outros estudos
populacionais, tais como Paraíba (GOMES et al, 2007), Pernambuco
(DELLALIBERA et al, 2004), Amazonas (RODRIGUES et al, 2007), Rio de Janeiro
(GÓES et al, 2004), Mato Grosso do Sul (SILVA et al, 2004), Paraná (POIARES et
al, 2009), Santa Catarina (OCAMPOS et al, 2009), Rio Grande do Sul (CHULA et al,
2009) e dois estudos da população brasileira (GRATTAPAGLIA et al, 2001;
FRIDMAN et al,2008). Estas estão apresentadas nas tabelas a seguir: D21D11
(Tabela 3); D13S317 (Tabela 4); D3S1358 (Tabela 5); vWA (Tabela 6); D7S820
(Tabela 7); D16S539 (Tabela 8); D18S51 (Tabela 9); CSF (Tabela 10); D5S818
(Tabela 11); TH01 (Tabela 12); TPOX (Tabela 13); FGA (Tabela 14); D8S1179
(Tabela 15); D2S1338 (Tabela 16); D19S422 (Tabela 17).
46
Tabela 3: Frequências alélicas para o locus D21S11
ALELO RN PB PE AM RJ MS PR SC RS BR1 BR2
24,2 0,001 - - 0,006 0,003 - 0,002 0,001 0,001 0,003 0,003
25 0,001 0,002 0,001 0,003 0,001 - 0,001 - 0,001 0,001 0,001
26 0,001 - 0,005 0,003 - - 0,001 0,001 0,001 0,001 -
27 0,023 0,028 0,009 0,031 0,025 0,025 0,026 0,027 0,025 0,028 0,034
28 0,153 0,173 0,077 0,115 0,183 0,113 0,153 0,14 0,151 0,141 0,162
29 0,217 0,199 0,199 0,191 0,16 0,211 0,219 0,223 0,217 0,217 0,203
30 0,261 0,203 0,222 0,271 0,25 0,24 0,247 0,236 0,249 0,253 0,224
30,2 0,025 0,033 0,004 0,054 0,021 0,039 0,032 0,034 0,033 0,038 0,028
31 0,052 0,079 0,161 0,078 0,065 0,103 0,059 0,073 0,064 0,063 0,065
31,2 0,104 0,105 0,035 0,08 0,108 0,098 0,097 0,105 0,103 0,099 0,103
32 0,014 0,014 0,083 0,012 0,011 0,015 0,011 0,008 0,008 0,012 0,011
33 0,001 0,010 0,087 0,003 0,001 - 0,001 0,001 0.001 0,002 0,004
32,2 0,102 0,079 0,074 0,1 0,098 0,078 0,103 0,106 0,094 0,100 0,093
33,2 0,026 0,019 0,002 0,029 0,037 0,059 0,036 0,034 0,035 0,033 0,039
34,2 0,003 0,006 0,001 0,008 0,006 0,005 0,003 0,002 0,004 0,002 0,004
35 0,003 0,014 0,012 0,003 0,008 0,005 0,003 0,002 0,005 0,004 0,013
36 0,009 0,003 0,003 0,006 0,005 0,005 0,001 0,001 0,001 0,001 -
RN: Rio Grande do Norte; PB: Paraíba; PE: Pernambuco; AM: Amazonas; RJ: Rio de Janeiro; MS: Mato Grosso do Sul; PR: Paraná; SC: Santa Catarina; RS: Rio Grande do Sul; BR1: Brasil (2001); BR2: Brasil (2008).
Tabela 4: Frequências alélicas para o locus D13S317
ALELO RN PB PE AM RJ MS PR SC RS BR1 BR2
8 0,098 0,08 0,079 0,1 0,076 0,077 0,112 0,109 0,1 0,113 0,088
9 0,086 0,087 0,082 0,115 0,078 0,091 0,092 0,084 0,089 0,095 0,077
10 0,054 0,077 0,056 0,042 0,065 0,024 0,06 0,054 0,057 0,055 0,051
11 0,288 0,297 0,338 0,222 0,298 0,322 0,292 0,298 0,286 0,298 0,279
12 0,301 0,317 0,304 0,314 0,322 0,308 0,274 0,277 0,294 0,274 0,249
13 0,127 0,102 0,103 0,152 0,128 0,13 0,159 0,129 0,121 0,114 0,138
14 0,044 0,04 0,036 0,009 0,031 0,048 0,047 0,047 0,049 0,048 0,048
15 0,002 - 0,002 0,002 - - 0,002 0,002 0,002 0,003 -
RN: Rio Grande do Norte; PB: Paraíba; PE: Pernambuco; AM: Amazonas; RJ: Rio de Janeiro; MS: Mato Grosso do Sul; PR: Paraná; SC: Santa Catarina; RS: Rio Grande do Sul; BR1: Brasil (2001); BR2: Brasil (2008).
Tabela 5: Frequências alélicas para o locus D3S1358
ALELO RN AM RJ MS PR SC RS BR1 BR2
11 0,001 - 0,001 - 0,001 0,001 - 0,001 -
12 0,004 0,002 0,001 0,01 0,002 0,002 0,002 0,003 -
13 0,005 0,003 0,001 0,005 0,003 0,002 0,003 0,003 -
14 0,095 0,059 0,1 0,064 0,097 0,091 0,1 0,092 0,076
15 0,304 0,322 0,293 0,294 0,286 0,284 0,293 0,292 0,324
16 0,251 0,289 0,262 0,255 0,253 0,265 0,265 0,252 0,276
17 0,203 0,157 0,205 0,186 0,204 0,212 0,195 0,218 0,201
18 0,128 0,134 0,126 0,181 0,142 0,133 0,128 0,126 0,108
19 0,009 0,023 0,008 0,005 0,012 0,009 0,012 0,011 0,008
RN: Rio Grande do Norte; AM: Amazonas; RJ: Rio de Janeiro; MS: Mato Grosso do Sul; PR: Paraná; SC: Santa Catarina; RS: Rio Grande do Sul; BR1: Brasil (2001); BR2: Brasil (2008).
47
Tabela 6: Frequências alélicas para o locus vWA
ALELO RN PB PE AM RJ MS PR SC RS BR1 BR2
11 0,001 0,005 0,007 0,008 0,008 - 0,002 0,001 0,003 0,002 0,004
13 0,005 0,005 0,007 0,015 0,006 0,01 0,004 0,002 0,003 0,006 0,002
14 0,079 0,068 0,074 0,068 0,083 0,088 0,088 0,086 0,081 0,084 0,084
15 0,118 0,105 0,152 0,134 0,162 0,113 0,124 0,121 0,122 0,123 0,138
16 0,272 0,302 0,256 0,263 0,243 0,275 0,249 0,245 0,262 0,246 0,262
17 0,283 0,253 0,27 0,288 0,255 0,275 0,264 0,267 0,263 0,274 0,248
18 0,155 0,182 0,158 0,148 0,165 0,142 0,184 0,185 0,179 0,184 0,156
19 0,067 0,07 0,061 0,057 0,058 0,074 0,069 0,077 0,077 0,061 0,079
20 0,018 0,008 0,013 0,02 0,015 0,02 0,013 0,014 0,009 0,019 0,015
21 0,002 0,002 0,001 - 0,003 0,005 0,002 0,001 0,001 0,001 0,004
RN: Rio Grande do Norte; PB: Paraíba; PE: Pernambuco; AM: Amazonas; RJ: Rio de Janeiro; MS: Mato Grosso do Sul; PR: Paraná; SC: Santa Catarina; RS: Rio Grande do Sul; BR1: Brasil (2001); BR2: Brasil (2008).
Tabela 7: Frequências alélicas para o locus D7S820
ALELO RN PB PE AM RJ MS PR SC RS BR1 BR2
7 0,011 0,009 0,017 0,019 0,02 0,024 0,017 0,018 0,012 0,012 0,012
8 0,140 0,128 0,148 0,132 0,187 0,159 0,156 0,134 0,139 0,162 0,177
9 0,118 0,122 0,112 0,117 0,096 0,096 0,118 0,127 0,02 0,124 0,133
10 0,298 0,31 0,286 0,297 0,298 0,269 0,267 0,275 0,276 0,259 0,291
11 0,230 0,222 0,228 0,212 0,2 0,245 0,238 0,239 0,245 0,256 0,228
12 0,177 0,167 0,169 0,117 0,156 0,173 0,169 0,167 0,168 0,163 0,31
13 0,023 0,039 0,035 0,095 0,036 0,029 0,031 0,035 0,027 0,021 0,067
14 0,003 0,003 0,005 0,009 0,005 0,005 0,003 0,003 0,003 0,003 0,007
RN: Rio Grande do Norte; PB: Paraíba; PE: Pernambuco; AM: Amazonas; RJ: Rio de Janeiro; MS: Mato Grosso do Sul; PR: Paraná; SC: Santa Catarina; RS: Rio Grande do Sul; BR1: Brasil (2001); BR2: Brasil (2008).
Tabela 8: Frequências alélicas para o locus D16S539
ALELO RN PB PE AM RJ MS PR SC RS BR1 BR2
8 0,031 0,022 0,015 0,026 0,025 0,029 0,022 0,021 0,021 0,023 0,02
9 0,174 0,158 0,157 0,177 0,198 0,163 0,142 0,134 0,146 0,159 0,18
10 0,081 0,105 0,093 0,099 0,068 0,053 0,072 0,075 0,084 0,084 0,103
11 0,273 0,296 0,303 0,286 0,282 0,298 0,289 0,296 0,283 0,295 0,285
12 0,273 0,249 0,235 0,239 0,235 0,26 0,284 0,281 0,279 0,25 -
13 0,148 0,142 0,17 0,151 0,161 0,149 0,159 0,167 0,164 0,156 -
14 0,020 0,026 0,026 0,019 0,03 0,048 0,029 0,023 0,022 0,029 0,022
15 0,001 0,002 0,001 0,003 - - 0,001 0,001 0,002 0,003 -
RN: Rio Grande do Norte; PB: Paraíba; PE: Pernambuco; AM: Amazonas; RJ: Rio de Janeiro; MS: Mato Grosso do Sul; PR: Paraná; SC: Santa Catarina; RS: Rio Grande do Sul; BR1: Brasil (2001); BR2: Brasil (2008).
48
Tabela 9: Frequências alélicas para o locus D18S51
ALELO RN PB PE AM RJ MS PR SC RS BR1 BR2
10 0,007 0,006 0,01 0,009 0,016 0,01 0,011 0,011 0,012 0,01 0,003
11 0,012 0,019 0,032 0,008 0,005 0,015 0,01 0,01 0,005 0,011 0,013
12 0,125 0,097 0,121 0,12 0,121 0,093 0,125 0,137 0,129 0,134 0,336
13 0,120 0,137 0,123 0,115 0,116 0,108 0,125 0,111 0,106 0,113 0,203
13,2 0,001 - - - - - - - 0,001 0,001 0,001
14 0,156 0,148 0,152 0,159 0,115 0,176 0,173 0,055 0,184 0,141 0,133
14,2 0,001 - 0,001 - - - 0,001 - - - -
15 0,167 0,134 - 0,139 0,148 0,147 0,148 0,149 0,145 0,139 0,139
16 0,133 0,149 0,001 0,169 0,152 0,132 0,134 0,139 0,141 0,152 0,153
17 0,124 0,134 0,165 0,122 0,118 0,132 0,116 0,118 0,114 0,137 0,136
18 0,069 0,069 0,13 0,088 0,083 0,18 0,067 0,077 0,067 0,071 0,082
19 0,048 0,039 0,109 0,037 0,058 0,049 0,042 0,046 0,055 0,046 0,067
20 0,019 0,016 0,019 0,025 0,033 0,015 0,023 0,017 0,018 0,025 0,032
21 0,009 0,028 0,012 0,005 0,013 0,015 0,011 0,007 0,009 0,011 0,015
22 0,005 0,006 0,001 0,003 0,011 - 0,004 0,003 0,004 0,005 0,003
23 0,001 0,002 0,001 - 0,001 - 0,002 0,001 0,001 0,001 0,001
27 0,001 - - - 0,001 0,025 0,001 - - - 0,001
RN: Rio Grande do Norte; PB: Paraíba; PE: Pernambuco; AM: Amazonas; RJ: Rio de Janeiro; MS: Mato Grosso do Sul; PR: Paraná; SC: Santa Catarina; RS: Rio Grande do Sul; BR1: Brasil (2001); BR2: Brasil (2008).
Tabela 10: Frequências alélicas para o locus CSF
ALELO RN PB PE AM RJ MS PR SC RS BR1 BR2
7 0,012 0,014 0,017 0,011 0,026 0,029 0,004 0,005 0,01 0,01 0,025
8 0,022 0,02 0,018 0,017 0,016 0,01 0,01 0,009 0,01 0,012 0,024
9 0,019 0,031 0,019 0,022 0,02 0,024 0,024 0,02 0,02 0,018 0,022
10 0,234 0,276 0,306 0,274 0,272 0,25 0,265 0,269 0,264 0,263 0,269
11 0,312 0,286 0,269 0,295 0,278 0,327 0,303 0,296 0,299 0,307 0,275
12 0,325 0,297 0,313 0,303 0,323 0,288 0,316 0,32 0,316 0,326 0,002
13 0,062 0,059 0,048 0,003 0,053 0,072 0,065 0,066 0,07 0,054 0,004
14 0,010 0,009 0,009 0,009 0,006 - 0,008 0,011 0,007 0,007 0,006
15 0,002 0,006 0,001 0,002 0,001 - 0,001 0,001 0,001 - -
RN: Rio Grande do Norte; PB: Paraíba; PE: Pernambuco; AM: Amazonas; RJ: Rio de Janeiro; MS: Mato Grosso do Sul; PR: Paraná; SC: Santa Catarina; RS: Rio Grande do Sul; BR1: Brasil (2001); BR2: Brasil (2008).
Tabela 11: Frequências alélicas para o locus D5S81
ALELO RN AM RJ MS PR SC RS BR1 BR2
7 0,034 0.008 0,015 0,024 0,017 0,016 0.025 0,008 -
8 0,016 0.025 0,015 0,024 0,008 0,007 0,01 0,025 0,021
9 0,036 0.059 0,026 0,024 0,04 0,044 0,045 0,059 0,053
10 0,080 0,065 0,052 0,067 0,062 0,065 0,054 0,065 0,057
11 0,320 0,285 0,328 0,365 0,342 0,336 0,332 0,285 0,307
12 0,326 0,4 0,37 0,361 0,353 0,355 0,342 0,12 0,001
13 0,174 0,148 0,178 0,115 0,159 0,159 0,175 0,115 0,01
14 0,011 0,011 0,013 0,019 0,016 0,013 0,012 0,011 -
15 0,002 0,002 - - 0,001 0,001 0,001 0,002 -
RN: Rio Grande do Norte; AM: Amazonas; RJ: Rio de Janeiro; MS: Mato Grosso do Sul; PR: Paraná; SC: Santa Catarina; RS: Rio Grande do Sul; BR1: Brasil (2001); BR2: Brasil (2008).
49
Tabela 12: Frequências alélicas para o locus TH01
ALELO RN PB PE AM RJ MS PR SC RS BR1 BR2
6 0,223 0,191 0,21 0,226 0,198 0,245 0,235 0,23 0,226 0,206 0,221
7 0,231 0,248 0,253 0,262 0,258 0,225 0,205 0,207 0,215 0,222 0,244
8 0,146 0,166 0,155 0,12 0,187 0,162 0,127 0,122 0,138 0,124 0,152
9 0,175 0,146 0,166 0,165 0,143 0,172 0,159 0,165 0,161 0,176 0,173
9,3 0,217 0,242 0,204 0,211 0,208 0,186 0,259 0,263 0,246 0,258 0,197
10 0,008 0,005 0,012 0,005 0,003 0,005 0,011 0,009 0,01 0,014 0,011
RN: Rio Grande do Norte; PB: Paraíba; PE: Pernambuco; AM: Amazonas; RJ: Rio de Janeiro; MS: Mato Grosso do Sul; PR: Paraná; SC: Santa Catarina; RS: Rio Grande do Sul; BR1: Brasil (2001); BR2: Brasil (2008).
Tabela 13: Frequências alélicas para o locus TPOX
ALELO RN PB PE AM RJ MS PR SC RS BR1 BR2
6 0,023 0,022 0,019 0,014 0,025 0,01 0,008 0,009 0,013 0,011 0,027
7 0,001 0,008 0,006 0,003 0,003 - 0,004 0,002 0,004 0,003 -
8 0,455 0,423 0,444 0,41 0,465 0,436 0,469 0,493 0,482 0,445 0,461
9 0,117 0,132 0,132 0,12 0,148 0,093 0,114 0,103 0,119 0,126 0,135
10 0,055 0,076 0,065 0,066 0,056 0,083 0,064 0,063 0,06 0,074 0,063
11 0,293 0,267 0,288 0,294 0,262 0,358 0,0282 0,275 0,265 0,291 0,263
12 0,056 0,07 0,046 0,092 0,038 0,015 0,054 0,048 0,051 0,048 0,114
RN: Rio Grande do Norte; PB: Paraíba; PE: Pernambuco; AM: Amazonas; RJ: Rio de Janeiro; MS: Mato Grosso do Sul; PR: Paraná; SC: Santa Catarina; RS: Rio Grande do Sul; BR1: Brasil (2001); BR2: Brasil (2008).
Tabela 14: Frequências alélicas para o locus FGA
ALELO RN PE AM RJ MS PR SC RS BR1 BR2
17 0,001 0,002 - 0,001 0,005 0,001 0,001 0,001 - -
18 0,009 0,012 0,01 0,013 0,015 0,009 0,007 0,009 0,007 0,006
18,2 0,002 0,004 0,005 - - 0,001 0,001 0,002 - 0,004
19 0,065 0,049 0,099 0,048 0,083 0,077 0,072 0,074 0,063 0,08
20 0,112 0,106 0,118 0,111 0,118 0,119 0,119 0,103 0,112 0,106
21 0,160 0,14 0,14 0,151 0,167 0,164 0,163 0,158 0,168 0,145
22 0,141 0,153 0,135 0,197 0,113 0,162 0,162 0,169 0,177 0,167
22,2 0,003 0,010 0,002 - - 0,004 0,005 0,004 0,002 0,006
23 0,146 0,118 0,118 0,143 0,181 0,146 0,15 0,149 0,143 0,147
23,2 0,002 0,002 - - - 0,002 0,002 0,003 - 0,001
24 0,159 0,149 0,172 0,133 0,123 0,146 0,15 0,147 0,15 0,16
25 0,122 0,144 0,07 0,126 0,132 0,102 0,101 0,111 0,11 0,094
26 0,050 0,041 0,01 0,033 0,049 0,041 0,038 0,042 0,044 0,048
27 0,013 0,006 0,005 0,028 0,005 0,01 0,011 0,013 0,015 0,026
28 0,005 0,014 0,002 0,003 0,029 0,003 0,004 0,003 0,004 0,01
29 0,002 0,002 0,002 0,003 - 0,001 0,001 0,001 0,001 0,001
30 0,001 0,006 - 0,001 0,005 0,0004 - - 0,002 -
31,2 0,002 - - - - 0,001 0,001 0,001 - 0,002
32,2 0,001 - - - - 0,0002 - - - -
34,2 0,001 - - - - - - - - -
43,2 0,001 - - - - 0,0002 0,0003 - - -
45,2 0,001 - - - 0,001 0,0001 - 0,001 - 0,001
RN: Rio Grande do Norte; PE: Pernambuco; AM: Amazonas; RJ: Rio de Janeiro; MS: Mato Grosso do Sul; PR: Paraná; SC: Santa Catarina; RS: Rio Grande do Sul; BR1: Brasil (2001); BR2: Brasil (2008)
50
Tabela 15: Frequências alélicas para o locus D8S1179
ALELO RN PB PE AM RJ MS PR SC RS BR1 BR2
8 0,006 0,005 0,007 0,007 0,005 0,005 0,009 0,008 0,01 0,008 0,004
9 0,006 0,009 0,017 0,012 0,003 - 0,009 0,012 0,007 0,011 0,005
10 0,069 0,069 0,077 0,056 0,051 0,098 0,076 0,081 0,07 0,075 0,061
11 0,063 0,058 0,072 0,068 0,065 0,083 0,081 0,076 0,081 0,088 0,081
12 0,143 0,131 0,138 0,143 0,13 0,123 0,136 0,131 0,141 0,121 0,121
13 0,271 0,298 0,289 0,32 0,29 0,25 0,295 0,301 0,298 0,285 0,292
14 0,260 0,228 0,215 0,244 0,257 0,27 0,237 0,238 0,235 0,245 0,26
15 0,143 0,16 0,156 0,109 0,158 0,127 0,118 0,12 0,125 0,127 0,144
16 0,035 0,032 0,024 0,039 0,031 0,034 0,03 0,025 0,027 0,035 0,028
17 0,003 0,005 0,005 0,002 0,008 0,01 0,005 0,005 0,003 0,005 0,003
RN: Rio Grande do Norte; PB: Paraíba; PE: Pernambuco; AM: Amazonas; RJ: Rio de Janeiro; MS: Mato Grosso do Sul; PR: Paraná; SC: Santa Catarina; RS: Rio Grande do Sul; BR1: Brasil (2001); BR2: Brasil (2008).
Tabela 16: Frequências alélicas para o locus D2S1338
ALELO RN RJ PR RS BR2
14 0,001 - 0,001 0,001 -
15 0,002 - 0,001 0,002 0,001
16 0,036 0,041 0,041 0,043 0,057
17 0,214 0,226 0,209 0,213 0,208
18 0,095 0,058 0,092 0,091 0,075
19 0,122 0,118 0,115 0,123 0,116
20 0,136 0,135 0,136 0,129 0,122
21 0,050 0,062 0,042 0,047 0,079
22 0,072 0,094 0,058 0,057 0,087
23 0,112 0,099 0,127 0,127 0,097
24 0,072 0,081 0,086 0,079 0,083
25 0,065 0,06 0,074 0,066 0,059
26 0,021 0,019 0,014 0,016 0,014
27 0,002 0,002 0,002 0,002 0,003
RN: Rio Grande do Norte; RJ: Rio de Janeiro; PR: Paraná; RS: Rio Grande do Sul; BR2: Brasil (2008).
51
Tabela 17: Frequências alélicas para o locus D19S433
ALELO RN RJ PR RS BR2
9 0,001 0,002 - 0,0002 0,001
10 0,005 0,006 0,001 0,001 0,009
11 0,022 0,027 0,015 0,012 0,029
11,2 0,001 - - - -
12 0,106 0,067 0,092 0,1 0,002
12,2 0,013 0,012 0,009 0,011 0,016
13 0,260 0,234 0,238 0,242 0,008
13,2 0,043 0,035 0,034 0,039 0,052
14 0,286 0,286 0,307 0,299 0,277
14,2 0,033 0,052 0,026 0,028 0,045
15 0,133 0,15 0,155 0,158 0,127
15,2 0,048 0,05 0,055 0,049 0,045
16 0,032 0,046 0,041 0,037 0,037
16,2 0,013 0,029 0,016 0,015 0,019
17 0,001 - 0,001 0,002 0,003
17,2 0,001 - 0,001 0,001 0,002
18 0,001 - 0,0001 - -
18,2 0,001 - 0,0009 0,0002 0,002
RN: Rio Grande do Norte; RJ: Rio de Janeiro; PR: Paraná; RS: Rio Grande do Sul; BR2: Brasil (2008).
Foi possível encontrar neste estudo alguns alelos raros, não encontrados em
outros trabalhos aqui analisados, como o alelo 34,2 do locus FGA e os alelos 11,2 e
18 do locus D19S433.
Comparando-se as frequências alélicas dos 15 marcadores STRs estudados
neste trabalho com as frequências das populações mencionadas anteriormente, não
foram observadas diferenças representativas entre elas, de acordo com as Tabelas
3-17. Porém, dentre os estudos citados, foi observado uma maior aproximação com
relação à população do Rio Grande do Sul (CHULA et at., 2009), e no Nordeste,
com a população do Recife (DELLALIBERA et al, 2004). Por outro lado, observou-se
um maior distanciamento com relação à população do Amazonas (RODRIGUES et
al, 2007). Existem poucos trabalhos no Nordeste que contemplem os 15 marcadores
STRs estudados, tornando difícil uma comparação entre populações na nossa
região.
Por outro lado, quando comparamos apenas os alelos mais frequentes de
cada loci na tabela 18, percebemos que em 6 dos 15 loci estudados, não houve
coincidências entre os alelos mais freqüentes no Rio Grande do Norte e na
população brasileira, segundo Fridman et al, e em 3 de 13 loci comparados, entre a
52
população do Rio Grande do Norte e do Brasil, segundo Grattapaglia et al, podendo-
se suspeitar de um possível distanciamento entre os perfis genéticos das
populações. Este fato pode ser melhor esclarecido se realizado os testes de
distanciamento genético entre as populações.
Tabela 18: Alelos mais frequentes no RN e no Brasil
LOCUS RN BR1 BR2
D21S11 30 30 30
D13S317 12 11 11
D3S1358 15 15 15
VWA 17 17 16
D7S820 10 10 10
D16S539 11/12 11 11
D18S11 15 16 16
CSF 12 12 11
D5S818 12 11 11
TH01 7 7 7
TPOX 8 8 8
FGA 21 22 22
D8S1179 13 13 13
D2S1338 17
17
D19S433 14 14
RN: Rio Grande do Norte; BR1: Brasil (2001); BR2: Brasil (2008).
A origem da população potiguar está ligada à união de três povos:
negros, indígenas e portugueses, que também estão ligados à formação da
população brasileira. Entretanto, o Rio Grande do Norte também recebeu influência
de franceses, espanhóis e de forma mais acentuada, de holandeses, principalmente
no interior do Estado (IBGE, 2010).
Comparando-se nossos dados com os dados de um estudo realizado na
população do norte de Portugal (PINHEIRO et al, 2004), percebe-se a semelhança
entre os locus mais frequentes. Dos 13 loci comparados, apenas 4 não coincidiram,
mostrando uma forte aproximação entre as duas populações, como indicada na
tabela 19.
53
Tabela 19: Comparação entre os alelos mais frequentes no RN e em Portugal.
LOCUS RN PORTUGAL
D21S11 30 30
D13S317 12 11
D3S1358 15 15
VWA 17 17
D7S820 10 10
D16S539 11/12 12
D18S11 15 16
CSF 12 12
D5S818 12 12
TH01 7 9.3
TPOX 8 8
FGA 21 22
D8S1179 13 13
RN: Rio Grande do Norte
Com relação às frequências alélicas entre as mesorregiões do RN, foi
possível detectar um equilíbrio na distribuição destas. Os marcadores mais
polimórficos encontrados neste estudo são também os de maior diferença na
distribuição das frequências alélicas entre as mesorregiões, como é o caso do
D2S1338, D18S51 E FGA. O locus de distribuição mais homogênea é o TPOX.
O presente estudo se faz importante no meio jurídico, pois várias vezes os
exames de DNA são empregados em processos de investigação de paternidade e,
não raro, são feitos questionamentos quanto à fidelidade do vínculo genético obtido
pelo emprego de banco de frequências não regionais.
54
Figura 11: Locus D21S11
M1: Oeste Potiguar. M2: Central Potiguar. M3: Agreste Potiguar. M4: Leste Potiguar.
Figura 12: Locus D13S317
M1: Oeste Potiguar. M2: Central Potiguar. M3: Agreste Potiguar. M4: Leste Potiguar.
0,00
0,05
0,10
0,15
0,20
0,25
0,30
24,2 25
25,2 26 27 28 29 30
30,2 31
31,2
31,2
1 32
32,2 33
33,2 34
34,2 35
35,2 36
Fre
quên
cia
Alelo
Mesorregião 1
Mesorregião 2
Mesorregião 3
Mesorregião 4
0,00
0,05
0,10
0,15
0,20
0,25
0,30
0,35
0,40
8 9 10 11 12 13 14 15
Fre
quên
cia
Alelo
Mesorregião 1
Mesorregião 2
Mesorregião 3
Mesorregião 4
55
Figura 13: Locus D3S1358
M1: Oeste Potiguar. M2: Central Potiguar. M3: Agreste Potiguar. M4: Leste Potiguar.
Figura 14: Locus VWA
M1: Oeste Potiguar. M2: Central Potiguar. M3: Agreste Potiguar. M4: Leste Potiguar.
0,00
0,05
0,10
0,15
0,20
0,25
0,30
0,35
11 12 13 14 15 16 17 18 19
Fre
quên
cia
Alelo
Mesorregião 1
Mesorregião 2
Mesorregião 3
Mesorregião 4
0,00
0,05
0,10
0,15
0,20
0,25
0,30
0,35
11 12 13 14 15 16 17 18 19 20 21
Fre
quên
cia
Alelo
Mesorregião 1
Mesorregião 2
Mesorregião 3
Mesorregião 4
56
Figura 15: Locus D7S820
M1: Oeste Potiguar. M2: Central Potiguar. M3: Agreste Potiguar. M4: Leste Potiguar.
Figura 16: Locus D16S539
M1: Oeste Potiguar. M2: Central Potiguar. M3: Agreste Potiguar. M4: Leste Potiguar.
0,00
0,05
0,10
0,15
0,20
0,25
0,30
0,35
0,40
7 8 9 10 11 12 13 14
Fre
quên
cia
Alelo
Mesorregião 1Mesorregião 2Mesorregião 3Mesorregião 4
0,00
0,05
0,10
0,15
0,20
0,25
0,30
0,35
5 6 8 9 10 11 12 13 14 15
Fre
quên
cia
Alelo
Mesorregião 1
Mesorregião 2
Mesorregião 3
Mesorregião 4
57
Figura 17: Locus D18S11
M1: Oeste Potiguar. M2: Central Potiguar. M3: Agreste Potiguar. M4: Leste Potiguar.
Figura 18: Locus CSF
M1: Oeste Potiguar. M2: Central Potiguar. M3: Agreste Potiguar. M4: Leste Potiguar
0,00
0,05
0,10
0,15
0,20
0,25
10
10,2 11 12 13
13,2 14
14,2 15 16 17 18 19 20 21
21,2 22 23 26 27
Fre
quên
cia
Alelo
Mesorregião 1
Mesorregião 2
Mesorregião 3
Mesorregião 4
0,00
0,05
0,10
0,15
0,20
0,25
0,30
0,35
0,40
6 7 8 9 10 11 12 13 14 15
Fre
quên
cia
Alelo
Mesorregião 1Mesorregião 2Mesorregião 3Mesorregião 4
58
Figura 19: Locus D5S818
M1: Oeste Potiguar. M2: Central Potiguar. M3: Agreste Potiguar. M4: Leste Potiguar.
Figura 20: Locus TH01
M1: Oeste Potiguar. M2: Central Potiguar. M3: Agreste Potiguar. M4: Leste Potiguar.
0,00
0,05
0,10
0,15
0,20
0,25
0,30
0,35
0,40
6 7 8 9 10 11 12 13 14 15
Fre
quên
cia
Alelo
Mesorregião 1Mesorregião 2Mesorregião 3Mesorregião 4
0,00
0,05
0,10
0,15
0,20
0,25
0,30
5 6 7 8 9
9,3 10
Fre
quên
cia
Alelo
Mesorregião 1Mesorregião 2Mesorregião 3Mesorregião 4
59
Figura 21: Locus TPOX
M1: Oeste Potiguar. M2: Central Potiguar. M3: Agreste Potiguar. M4: Leste Potiguar.
Figura 22: Locus FGA
M1: Oeste Potiguar. M2: Central Potiguar. M3: Agreste Potiguar. M4: Leste Potiguar.
0,00
0,05
0,10
0,15
0,20
0,25
0,30
0,35
0,40
0,45
0,50
0,55
6 7 8 9 10 11 12
Fre
quên
cia
Alelo
Mesorregião 1Mesorregião 2Mesorregião 3Mesorregião 4
0,00
0,05
0,10
0,15
0,20
0,25
16 17 18
18,2 19 20 21
21,2 22
22,2 23
23,2 24
24,2 25 26 27 28 29 30
31,2
32,2
34,2
43,2
45,2
Fre
quên
cia
Alelo
Mesorregião 1
Mesorregião 2
Mesorregião 3
Mesorregião 4
60
Figura 23: Locus D8S1179
M1: Oeste Potiguar. M2: Central Potiguar. M3: Agreste Potiguar. M4: Leste Potiguar.
Figura 24: Locus D2S1338
M1: Oeste Potiguar. M2: Central Potiguar. M3: Agreste Potiguar. M4: Leste Potiguar.
0,00
0,05
0,10
0,15
0,20
0,25
0,30
0,35
8 9 10 11 12 13 14 15 16 17 18
Fre
quên
cia
Alelo
Mesorregião 1Mesorregião 2Mesorregião 3Mesorregião 4
0,00
0,05
0,10
0,15
0,20
0,25
14 15 16 17 18 19 20 21 22 23 24 25 26 27
Fre
quên
cia
Alelo
Mesorregião 1
Mesorregião 2
Mesorregião 3
Mesorregião 4
61
Figura 25: Locus D19S433
0,00
0,05
0,10
0,15
0,20
0,25
0,30
0,35
9 10 11
11,2 12
12,2 13
13,2 14
14,2 15
15,2 16
16,2 18
18,2 19 25
Fre
quên
cia
Alelo
Mesorregião 1
Mesorregião 2
Mesorregião 3
Mesorregião 4
62
7 CONCLUSÃO
Pelos resultados obtidos, pode-se observar que as frequências alélicas da
população de pessoas nascidas no Estado do Rio Grande do Norte têm, no geral,
distribuição em equilíbrio de Hardy-Weinberg e, ao compararmos as frequências
encontradas em cada um dos 15 marcadores STRs estudados com as frequências
obtidas em outras populações, observamos que não há distorção significante. Os
parâmetros forenses calculados mostraram que os loci estudados são úteis para a
solução de problemas relacionados com identificação humana na amostra analisada.
Como perspectiva de continuidade deste estudo, pretende-se analisar os
dados das frequências alélicas dos 15 loci STR das populações dos países que
supostamente tiveram influência na formação da população do Rio Grande do Norte,
comparando-os com os dados obtidos das mesorregiões, podendo assim, traçar um
perfil da formação da população do nosso Estado.
63
REFERÊNCIAS BIBLIOGRÁFICAS
ALBERTS, B.; BRAY, D.; JONHSON, A.; LEWIS, J.; RAFF, M.; ROBERTS, K.; WALTER, P. Fundamentos da Biologia Celular: uma introdução à biologia molecular da célula. 1. ed. Porto Alegre: Artmed, 1999. AMORIM, A; PEREIRA, L. Pros and cons in use of SNPs in forensic kinship investigation: a comparative analysis with STR. Forensic Sci. Int., v. 150, n. 1, p. 17-21, 2005. BEIGUELMAN, B. Genética de Populações Humanas. 1. ed. Ribeirão Preto: SBG, 2008. BUDOWLE, B.; ALLARD, M. W.; WILSON, M.; CHAKRABORTY, E. R. Forensics and mitochondrial DNA: Applications, Debates, and Foundations. Annual Review of Genomics and human genetics, v. 4, p. 119-141, set. 2003. BUDOWLE, B.; GE, J.; CHAKRABORTY, R.; EISENBERG, A. J.; GREEN, R.; MULERO, J.; LAGACE, R.; HENNESSY, L. Population genetic analyses of the NGM STR loci. Int. J. Legal Med., v. 125, p. 101-109, 2011. BUTLER, J. M.; BUEL, E.; CRIVELLENTE, F.; McCORD, B. R. Forensic DNA typing by capillary electrophoresis using the ABI Prism 310 and 3100 genetic analyzers for STR analysis. Electrophoresis, v. 25, p.1397-1412, 2004. BUTLER, J. M. Forensic DNA typing. 2nd ed. San Diego: Elservier Academic Press, 2005. BUTLER, J. M. Review: genetics and genomics of core STR loci used in human identity testing. J. Forensic Sci, p. 1-48, mar, 2006. CHAKRABORTY, R., STIVERS, D.N., SU, B., ZHONG, Y., BUDOWLE, B. The utility of short tandem repeat loci beyond human identification: Implications for development of new DNA typing systems. Electrophoresis, v. 20, p. 1982-1996, 1999. CHULA, F. G. L.; RODENBUSCH, R.; SCHUMACHER, S.; GRANDI, T.; MICHELON, C. T.; GASTALDO, A. Z.; COSTI, C.; CARVALHO, B.; DA SILVA, C. M. D. 15 STR
64
loci frequencies with mutation rates in the population from Rio Grande do Sul, Southern Brazil. Forensic Science International:Genétics, v. 3, p. 35-38, 2009. DELLALIBERA, E., HAVRO, M. L. B.; SOUZA, M.; KAJIHARA, K.; MAURICIO-DA- SILVA, L.; SILVA, R. S. Genetic analysis of 13STR loci in the population from the State of Pernambuco, northeast Brazil, Forensic Science International. v. 146, p. 57-59, 2004. DESMARAIS, D., ZHONG, Y., CHAKRABORTY, R., PERREAULT, C., BUSQUE, L. Development of a highly polymorphic STR marker for identity testing purposes at the human androgen receptor gene (HUMARA). Journal of Forensic Science. v. 43, p. 1046–1049, 1998. DIXON, L. A. et al. Analysis of artificially degraded DNA using STRs and SNPs: results os a colaborative European exercise. Forensic Science International. v. 164, p. 33-44, 2006. DOLINSKY, L. C.; PEREIRA, L. M. C. V. DNA Forense. Saúde e ambiente em Revista, Duque de Caxias, v. 2, n. 2, p. 11-22, jul-dez. 2007. EXCOFFIER, L.; LAVAL, G.; SCHNEIDER, S. Arlequin version. 3.0: An integrated software package for population genetics data analysis. Evolution Bioinform Online, v. 1, p. 47-50, 2005. FERREIRA DA SILVA, L. A.; PIMENTEL, B. J.; AZEVEDO, D. A.; SILVA, E. N. P.; SANTOS, S. S. Allele frequencies of nine STR loci D16S539, D7S820, D13S317, CSF1PO, TPOX, TH01, F13A01, FESFPS and vWA—in the population from Alagoas, northeastern Brazil. Forencic Science International, v. 130, p. 187-188, 2002. FIGUEIREDO, S. L.; PARADELA, R. E. Bancos de dados de DNA: Uma ferramenta investigativa útil. In: Âmbito Jurídico. Disponível em: <http://www.ambitojuridico.com.br/pdfsGerados/artigos/1235.pdf >. Acesso em: abr.2010 FRIDMAN, C; SANTOS, P. C. C.; KOHLER, P.; GARCIA, C. F.; LOPEZ, L. F.; MASSAD, E.; GATTÁS, G. J. F. Brasilian populations profile of 15 STR markers. Forensic Science International: Genetics, v. 2, p. 1-4, 2007. GALANTE-FILHO, H.; FIGINI, A. L.; REIS, A. B.; JOBIM, L. F.; SILVA, M. Identificação humana. Porto Alegre: Sagra Luzzatto, 1999.
65
GILL, P. et al. An investigation of the rigor of interpretation rules for STRs derived from less than 100 pg of DNA. Forensic Science International. v. 112, p. 17-40, 2000. GILL, P.; WERRETT, D. J.; BUDOWLE, B.; GUERRIERI, R. An assessment of whether SNPs will replace STRs in national DNA databases-Joint considerations of the DNA working group of the European Network of Forensic Science Institutes (ENFSI) and the Scientific Working Group on DNA Analysis Methods (SWGDAM). Science&Justice, v. 44, n. 1, p. 51-53, 2004. GILL, P. The evolution of DNA databases: recommendations for new European STR loci. Forensic Science International, v. 156, p. 242-244, 2006. GÓIS, A. C. S.; SILVA, D. A.; GIL, E. H. F.; SILVA, M. T. D.; PEREIRA, R. W.; CARVALHO, E. F. Allele frequencies data and statistic parameters for 16 STR loci—D19S433, D2S1338, CSF1PO, D16S539, D7S820, D21S11, D18S51, D13S317, D5S818, FGA, Penta E, TH01, vWA, D8S1179, TPOX, D3S1358—in the Rio de Janeiro population, Brazil. Forensic Science International, v. 140, p. 131-132, 2004. GÓIS, C. C. Estudo de frequências alélicas de 12 microssatélites do cromossomo Y na população brasileira de Araraquara e da região da grande São Paulo. Dissertação (Mestrado em Odontologia)-Faculdade de Odontologia, Universidade de São Paulo, São Paulo, 2006. GOMES, A. V., MAURICIO-DA-SILVA, L., RAPOSO, G., VIEIRA, J. R. C., SILVA, R. S. 13 STR loci frequencies in the population from Paraíba, Northeast Brazil. Forencic Science International. [S.l.], v. 173, p. 231-234, mar. 2007. GRATTAPAGLIA, D.; SCHIMIDT, A. B.; COSTA E SILVA, C.; STRINGHER, C.; FERNANDES, A. P.; FERREIRA, M. E. Brazilian population database for the 13 STR loci of the AmpFlSTR Profiler Plus and Cofiler multiplex kits. Forensic Science International, v. 118, p. 91-94, 2001. IBGE, Censo demoráfico, 2000. JACQUES, G. Informação verbal. Mesa Redonda - CODIS no Brasil: Situação atual do Banco informatizado de dados Genéticos do FBI para amostras de vestígios, de criminosos e de vítimas. In: 3º Congresso Brasileiro de Genética Forense. Porto Alegre, maio 2011. JORDE, L. B.; CAREY, J. C.; BAMSHAD, M. J.; WHITE, R. L. Genética Médica. 3. ed. Rio de Janeiro: Elsevier, 2004.
66
KOCH, A.; ANDRADE, F. M. A utilização de técnicas de biologia molecular na genetic forense: uma revisão. Rev. Bras. Anal. Clin. v. 40, p. 17-23, 2008. LI, H.; TANG, H.; ZHANG, Q.; JIAO, Z.; BAI, J.; CHANG, S. A multiplex PCR for 4 X chromossome STR markers and population data form Beijing Ham ethnic group. Legal Medicine, v. 11, p. 248-250, 2009. MARQUES, E. K.; ROCHA, A. B.; FONSECA, A. S. K. Diagnóstico Genético-Molecular. Canoas: Ulbra, 2003. McMANUS, C.; PAIVA, S.; CORRÊA, P. S.; SEIXAS, L.; MELO, C. B. Estatísticas para descrever genética de populações. IN: Série Técnica: Genética. Disponível em: <www.animal.com.br>. Acesso em abr. de 2011. NAKAMURA, Y. DNA variations in human and medical genetics: 25 years of my experience. Journal of Human Genetics. v. 54, p. 1–8, 2009. OCAMPOS, M., FERNANDES, R. C., LATORRE, A. F. S., SILVA, C. M. D., KORNDOFFER, F. P., GIAMARUSTI, A. C., MENEZES, M. E. 15 STR loci frequencies in the population from Santa Catarina, Southern Brazil. Forencic Science Internatonal:Genetics. [S.l.], v. 3, p. 129-131, 2009. OLIVEIRA, R. N.; NUNES, F. D.; ANZAI, E. K.; DARUGE, E.; MESQUITA, R. A.; OZAKI, A. N. Population studies of the Y-chromosome of loci DYS390, DYS391 and DYS393 in brazilian subjects and its use in human identification. J. Forensic Odontostomatol, v. 20, n. 1, p. 6-9, 2002. OTTO, P. G.; OTTO, P. A.; FROTA-PESSOA, O. Genética Humana e Clínica. 2. ed. São Paulo: ROCA, 2004. PANETO, G. G.; Utilização do DNA mitocondrial no contexto forense brasileiro. 2006. Dissertação de Mestrado-Faculdade de Ciências Farmacêuticas, UNESP, Araraquara, 2006. PARDINI, V. C.; FERREIRA, A. C. S.; GOMES, K. B.; RODRIGUEZ, S. L. B. Uso do DNA proveniente de polpa dentária para identificação humana: relato de caso e técnica. CROMG, v. 7, n. 1, p. 33-35, 2001.
67
PENA, S. D. J. Segurança Pública: determinação de identidade genética pelo DNA. In: Seminários Temáticos para a 3ª Conferência Nacional de C, T & I. Parcerias Estratégicas, v. 20, p. 447-460, 2005. PINHEIRO, M. F.; CAINÉ, L.; PONTES, L.; ABRANTES, D.; LIMA, G.; PEREIRA, M. J.; REZENDE, P. Allele frequencies of sixteen STRs in the populations of nothern Portugal. Forensic Science International, v. 148, p. 221-223, 2005. POIARES, L. A.; OSÓRIO, P. S.; SPANHOL, F. A.; COLTRE, S. C.; RODENBUSCH, R.; CASTELO BRANCO, C.; PACHECO, P. R.; MOTA-VIEIRA, L.; LARGURA, A.; SANDRINI, F.; DA SILVA, C. M. D. 15 STR loci frequencies in the population from Paraná, Southern Brazil. Forensic Science International:Genetics, v. 4, p. 23-24, 2009. RIBEIRO, G. G. B. L. Análise genética de marcadores do tipo STR e INDEL em cromossomos sexuais humanos em populações remanescentes de quilombos. 2009. 180 f. Tese (Doutorado em Biologia Animal)-Instituto de Ciências Biológicas, Universidade de Brasília, Brasília, 2009. ROBLEDO, R., PIRAS, I., BEGGS, W., CALÒ, C. Analysis of 31 STR loci in the genetic isolate of Carloforte (Sardinia, Italy). Genetics and Molecular Biology, v. 32, n. 3, p. 462-463, 2009. RODRIGUES, E. M. R.; PALHA, T. J. B. F.; DOS SANTOS, S. E. B. Allele frequencies data and statistic parameters for 13 STR loci in a population of the Brazilian Amazon Region, Forensic Science International. v. 168, p. 244–247, 2007. SCHNEIDER, P. M. Basic issues in forensic DNA typing. Forensic Science International, v. 88, p. 17-22, 1997. SCHNEIDER, P. M. Expansion of the European standard set of DNA database loci: the current situation. Profiles in DNA. v. 12, n. 1, p. 6-7, 2009. SILVA, D. A., CROUSE, C. A., CHAKRABORTY, R., GÓES, A. C. S., CARVALHO, E. F. Statistical analyses of 14 short tandem repeat loci in Brazilian populations from Rio de Janeiro and Mato Grosso do Sul states for forensic and identity testing purposes.Forensic Science International, v. 139, p.173-176, 2004. SMITH, L. M.; BURGOYNE, L. A. Collecting, archiving and processing DNA from wildlife samples using FTA data basing paper. Ecology, v. 4, p. 4–9, 2004.
68
SMITH, M. E. Let’s make the DNA identification database as inclusive as possible. Journal of Law, Medicine & Ethics, v. 34, n. 4, p. 385-389, 2006. STRACHAN, T; READ, A. Genética molecular humana. 2. ed. Porto Alegre: Artmed; 2002. SWEET, D.; DIZZINO, J. A. Personal identification through dental evidence - tooth fragments to DNA. J. Calif.Dent. Assoc. v. 24, n. 5, p. 35-42, 1996. TAMAKI, K; JEFFREYS, A. Human tandem repeat sequences in forensic DNA typing. Legal Medicine, v. 7, p. 244-250, 2005. TEREBA, A. Tools for analysis of populations statistics. Profiles in DNA, v. 2, n. 3, 1999. Disponível em: <http://www.promega.com/geneticidtools>. Acesso em: jun. de 2010. WALSH, J. S. Recent advances in forensic genetics. Expert Rev. Mol. Diagn, v. 4, n. 1, p. 31-40, 2004. WEIR, B. S. Multiple Tests: Genetic Data Analysis, vol. II, Sinauer Associates, USA, p. 134., 1996.
WERRETT, D. J. The national DNA database. Forensic Sci Int, v. 88, p. 33-42, 1997.
69
ARTIGO CIENTÍFICO PARA PUBLICAÇÃO SEGUNDO AS NORMAS DA
REVISTA FORENSIC SCIENCE INTERNATIONAL
15 STR loci frequencies in the population from Rio Grande do Norte,
Brazil
Taissa Maria Moura de Oliveiraab, Andrea Luciana Cunha Fernandesa, Gioconda Dias Rodrigues Leãoa, Roberto Chaves de Vasconcelosa, Erica Aires Gila, Juliana Mendonça Freirea, Geraldo Barroso Cavalcanti Júniorb.
a Laboratório DNA Center. Av. Afonso Pena, 952, TIrol. Natal-RN. CEP: 59020-100.
Brasil. b Programa de Pós-graduação em Ciências Farmacêuticas – UFRN.
Email address: [email protected]
ABSTRACT
Allele frequencies for 15 Short Tandem Repeats loci (D8S1179, D21S11, D7S820,
CSF1PO, D19S433, vWA, TPOX, D18S51, D3S1358, TH01, D13S317, D16S539,
D2S1338, D5S818 e FGA) were obtained from a sample of 1100 unrelated
individuals undergoing paternity testing. The population is from Rio Grande do Norte,
Northeastern Brazil. The loci are the most commonly used in forensic and paternity
testing, being analyzed by the AmpFlSTR® Identifiler (Applied Biosystems)
commercial kit. The most polimorphic loci were D2S1338 and D18S51. Excepting the
D21S11, D19S433 and D2S1338, all loci were in Hardy-Weinberg equilibrium.
Comparative analyses between our population data and other populations are
presented.
Keywords: Short Tandem Repeats, Allele frequency, Rio Grande do Norte, Brazil.
70
Introduction
Many forensic laboratories worldwide are evaluating and implementing highly
polymorphic DNA loci, whose polymorphism derive from Short Tandem Repeated
(STR) core sequences. Simultaneous amplification and subsequent typing of a
number of these STR loci have significantly enhanced the capabilities of forensic
scientists to analyze DNA derived from biological specimens [1]. It is well known that
the use of Short Tandem Repeats for forensic purposes requires the existence of
databases that reflect the allele distribution in the population they will be applied, that
provides subsidies to improve the reliability of the results of determination of the
genetic link [2]. Thus, when assessing the frequency of the microregion, a possible
distortion of data is sent off. Our aim is to study the allele frequencies for 15 STR loci
and calculate the statistical parameters of forensic interest, in a sample provenient
from Rio Grande do Norte State, Brazil.
Population
The allelic frequency of 15 short tandem repeats - STR (D8S1179, D21S11, D7S820,
CSF1PO, D3S1358, TH01, D13S317, D16S539, D2S1338, D19S433, VWA, TPOX,
D18S51, D5S818, FGA) was evaluated in population from Rio Grande do Norte
State, localized in the northeast region of Brazil. The current population is about 3
million inhabitants (according to IBGE, 2010), divided into four mesoregions, named:
Oeste Potiguar, Cental Potiguar, Agreste Potiguar and Leste Potiguar.
Blood samples from 1,100 unrelated individuals were obtained from paternity testing
cases conducted in each mesoregion of the State and shipped immediately to DNA
Center Laboratory (Natal City) for analysis. This sample is representative of the
population of Rio Grande do Norte State, and 25% of the individuals included are
from the Oeste Potiguar mesoregion, 17% from the Central Potiguar, 16% from the
Agreste Potiguar and 42% from the Leste Potiguar.
Donors were subjected to an interview in order to obtain their informed consent.
DNA Extraction
DNA was extracted from blood spots on Whatman FTA cards using the
manufacturer’s protocols.
71
PCR
A total of 0.5–1.0 ng of DNA, contained in a 1.2 mm circle of FTA paper, was used to
simultaneous amplification of 15 STR loci (multiplex PCR) plus the gender
determination marker, Amelogenin, performed using the AmpFlSTR® IdentifilerTM
PCR Amplification Kit (Applied Biosystems, Foster City, CA, USA) according to the
user’s manual recommendations.
Typing
Separation of PCR products was carried out by capillary electrophoresis on an ABI
PRISM1 3130xl Genetic Analyzer (Applied Biosystems). Genotyping was performed
by comparison with sequenced allelic ladders provided with the kit, using the
GeneMapper ID 3.2 software.
Quality control
Proficiency testing of the GEP-ISFG Working Group and PNCQ (‘‘Programa Nacional
de Controle de Qualidade em Biologia Molecular’’, sponsored by the SBAC -
Sociedade Brasileira de Análises Clínicas).
Analysis of data
Statistical analysis for allele frequencies, Power of Discrimination, Matching
Probability, Polymorphism Information Content and Power of Exclusion were
calculated using PowerStats v.13 software [3]. Deviation from Hardy-Weinberg
equilibrium, Observed and Expected Heterozygosity was calculated using Arlequin
v3.11 software [4].
Results
The allele frequencies and statistical parameters obtained for the 15 STR loci in Rio
Grande do Norte are shown in Table 1.
72
Table 1: Allele frequencies and statistic parameters of forensic interest for 15 STR loci in the
population of Rio Grande do Norte, Brazil.
ALELO D21S11 D13S317 D3S1338 VWA D7S820 D16S539 D18S51 CSF D5S818 TH01 TPOX FGA D8S1179 D2S1338 D19S433
6
0,223 0,023
7
0,011
0,012 0,034 0,231 0,001
8
0,098
0,140 0,031
0,022 0,016 0,146 0,455
0,006
9
0,086
0,118 0,174
0,019 0,036 0,175 0,117
0,006
0,001
9,3
0,217
10
0,054
0,298 0,081 0,007 0,234 0,080 0,008 0,055
0,069
0,005
11
0,288 0,001 0,001 0,230 0,273 0,012 0,312 0,320
0,293
0,063
0,022
11,2
0,001
12
0,301 0,004
0,177 0,273 0,125 0,325 0,326
0,056
0,143
0,106
12,2
0,013
13
0,127 0,005 0,005 0,023 0,148 0,120 0,062 0,174
0,271
0,260
13,2
0,001
0,043
14
0,044 0,095 0,079 0,003 0,020 0,156 0,010 0,011
0,260 0,001 0,286
14,2
0,001
0,033
15
0,002 0,304 0,118
0,001 0,167 0,003 0,002
0,143 0,002 0,133
15,2
0,048
16
0,251 0,272
0,133
0,035 0,036 0,032
16,2
0,013
17
0,203 0,283
0,124
0,001 0,003 0,214 0,001
17,2
0,001
18
0,128 0,155
0,069
0,009
0,095 0,001
18,2
0,002
0,001
19
0,009 0,067
0,048
0,065
0,122
20
0,018
0,019
0,112
0,136
21
0,002
0,009
0,160
0,050
22
0,005
0,141
0,072
22,2
0,003
23
0,001
0,146
0,112
23,2
0,002
24
0,159
0,072
24,2 0,001
0,000
25 0,001
0,122
0,065
26 0,001
0,050
0,021
27 0,023
0,001
0,013
0,002
28 0,153
0,005
29 0,217
0,002
30 0,261
0,001
30,2 0,025
31 0,052
31,2 0,104
0,002
32 0,014
32,2 0,102
0,001
33 0,001
33,2 0,026
34,2 0,003
0,001
35 0,003
36 0,009
43,2
0,001
45,2 0,001
n 2200 2200 2200 2200 2200 2200 2200 2200 2200 2200 2200 2200 2200 2200 2200
Ho 0.820 0,775 0,764 0,782 0,763 0,800 0,877 0,726 0,720 0,768 0,672 0,865 0,77 0,878 0,813
He 0.839 0.788 0,778 0,798 0,793 0,793 0,877 0,735 0,752 0,797 0,686 0,874 0,808 0,881 0,814
P <0,001 0.839 0,316 0,379 0,100 0,552 0,496 0,786 0,128 0,569 0,695 0,341 0,259 0,017 0,031
PD 0,954 0,927 0,917 0,933 0,928 0,924 0,971 0,884 0,901 0,929 0,856 0,970 0,939 0,974 0,940
PE 0,636 0,554 0,533 0,566 0,532 0,599 0,749 0,494 0,460 0,552 0,386 0,763 0,545 0,751 0,623
PIC 0.820 0,762 0,743 0,769 0,762 0,761 0,869 0,691 0,713 0,766 0,639 0,860 0,782 0,869 0,792
PI 2,780 2,227 2,115 2,292 2,107 2,500 4,074 1,930 1,786 2,216 1,522 3,691 2,174 4,104 2,670
MP 0,046 0,073 0,083 0,067 0,072 0,076 0,029 0,116 0,099 0,071 0,144 0,030 0,061 0,026 0,060
n, number of alleles; Ho, heterozygosity observed; He, heterozygosity expected; P, exact test probability for Hardy–Weinberg equilibrium; PIC, polymorphism information content; DP, discrimination power; MP, matching probability; TPI, typical paternity index; PE, power of exclusion.
73
Other markes
All the loci analysed reached the Hardy-Weinberg equilibrium in the population
studied (P > 0.05), except D21S11 locus (P = 0.00007), D2S1338 (P = 0.017) and
D19S433 (P = 0,031). When the Bonferroni correction [5] was employed using the
number of loci analysed (P > 0.0033), the differences observed were not statistically
significant, except for the D21S11 locus.
In the State of Rio Grande do Norte population, the observed heterozygosity (HO)
ranges from 0.672 (TPOX) to 0.878 (D2S1338). The Power of Discrimination (PD)
varies between 0.856 (TPOX) and 0.974 (D2S1338) and the probability of exclusion
(PE) varies between 0.386 (TPOX) and 0.751 (D2S1338). The most polymorphic
genetic markers is D18S51 and D2S1338 (both with PIC value of 0.8644) and the
least polymorphic is TPOX (0.639).
The frequency distribution pattern of the 15 STR loci analyzed was compare to the
ones obtained for other Brazilian populations [6-13], and we could find some rare
alleles, as alleles 11,2 and 18 in D19S433 and allele 34,2 in FGA.
The comparison of the allelic frequency of this 15 loci studied in the population form
Rio Grande do Norte State with others Brazilian populations [6-3] show that our
population is genetically more proximal of the population of the State of Pernambuco
[7] and genetically more distant of the population from the State of Amazonas [12]
The forensic parameters regarding the 15 STR loci are useful in terms of variability,
paternity and forensic purposes for the Rio Grande do Norte population.
74
References
[1] BUTLER, J. M. Review: genetics and genomics of core STR loci used in human identity testing. J. Forensic Sci, p. 1-48, mar, 2006.
[2] GRATTAPAGLIA, D.; SCHIMIDT, A. B.; COSTA E SILVA, C.; STRINGHER, C.; FERNANDES, A. P.; FERREIRA, M. E. Brazilian population database for the 13 STR loci of the AmpFlSTR Profiler Plus and Cofiler multiplex kits. Forensic Science International, v. 118, p. 91-94, 2001.
[3] TEREBA, A. Tools for analysis of populations statistics. Profiles in DNA, v. 2, n. 3, 1999. Disponível em: <http://www.promega.com/geneticidtools>. Acesso em: jun. de 2010.
[4] EXCOFFIER, L.; LAVAL, G.; SCHNEIDER, S. Arlequin version. 3.0: An integrated software package for population genetics data analysis. Evolution Bioinform Online, v. 1, p. 47-50, 2005.
[5] DESMARAIS, D., ZHONG, Y., CHAKRABORTY, R., PERREAULT, C., BUSQUE, L. Development of a highly polymorphic STR marker for identity testing purposes at the human androgen receptor gene (HUMARA). Journal of Forensic Science. v. 43, p. 1046–1049, 1998.
[6] CHULA, F. G. L.; RODENBUSCH, R.; SCHUMACHER, S.; GRANDI, T.; MICHELON, C. T.; GASTALDO, A. Z.; COSTI, C.; CARVALHO, B.; DA SILVA, C. M. D. 15 STR loci frequencies with mutation rates in the population from Rio Grande do Sul, Southern Brazil. Forensic Science International:Genétics, v. 3, p. 35-38, 2009.
[7] DELLALIBERA, E., HAVRO, M. L. B.; SOUZA, M.; KAJIHARA, K.; MAURICIO-DA- SILVA, L.; SILVA, R. S. Genetic analysis of 13STR loci in the population from the State of Pernambuco, northeast Brazil, Forensic Science International. v. 146, p. 57-59, 2004.
[8] FRIDMAN, C; SANTOS, P. C. C.; KOHLER, P.; GARCIA, C. F.; LOPEZ, L. F.; MASSAD, E.; GATTÁS, G. J. F. Brasilian populations profile of 15 STR markers. Forensic Science International: Genetics, v. 2, p. 1-4, 2007.
[9] GÓIS, A. C. S.; SILVA, D. A.; GIL, E. H. F.; SILVA, M. T. D.; PEREIRA, R. W.; CARVALHO, E. F. Allele frequencies data and statistic parameters for 16 STR loci—D19S433, D2S1338, CSF1PO, D16S539, D7S820, D21S11, D18S51, D13S317, D5S818, FGA, Penta E, TH01, vWA, D8S1179, TPOX, D3S1358—in the Rio de Janeiro population, Brazil. Forensic Science International, v. 140, p. 131-132, 2004.
[10] OCAMPOS, M., FERNANDES, R. C., LATORRE, A. F. S., SILVA, C. M. D., KORNDOFFER, F. P., GIAMARUSTI, A. C., MENEZES, M. E. 15 STR loci frequencies in the population from Santa Catarina, Southern Brazil. Forencic Science Internatonal:Genetics. [S.l.], v. 3, p. 129-131, 2009.
[11] POIARES, L. A.; OSÓRIO, P. S.; SPANHOL, F. A.; COLTRE, S. C.; RODENBUSCH, R.; CASTELO BRANCO, C.; PACHECO, P. R.; MOTA-VIEIRA, L.; LARGURA, A.; SANDRINI, F.; DA SILVA, C. M. D. 15 STR loci frequencies in the population from Paraná, Southern Brazil. Forensic Science International:Genetics, v. 4, p. 23-24, 2009.
[12] RODRIGUES, E. M. R.; PALHA, T. J. B. F.; DOS SANTOS, S. E. B. Allele frequencies data and statistic parameters for 13 STR loci in a population of the Brazilian Amazon Region, Forensic Science International. v. 168, p. 244–247, 2007.
75
[13] SILVA, D. A., CROUSE, C. A., CHAKRABORTY, R., GÓES, A. C. S., CARVALHO, E. F. Statistical analyses of 14 short tandem repeat loci in Brazilian populations from Rio de Janeiro and Mato Grosso do Sul states for forensic and identity testing purposes.Forensic Science International, v. 139, p.173-176, 2004.