ANÁLISE DA FREQUÊNCIA ALÉLICA DE 15 LOCI STR NA ... · D19S433 e D2S1338, os genótipos...

UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE

CENTRO DE CIÊNCIAS DA SAÚDE

PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIAS FARMACÊUTICAS

ANÁLISE DA FREQUÊNCIA ALÉLICA DE 15 LOCI STR NA

POPULAÇÃO DO RIO GRANDE DO NORTE

TAISSA MARIA MOURA DE OLIVEIRA

NATAL

2012


ANÁLISE DA FREQUÊNCIA ALÉLICA DE 15 LOCI STR NA

POPULAÇÃO DO RIO GRANDE DO NORTE

Orientador: Prof. Dr. Geraldo Barroso Cavalcanti Júnior

NATAL

2012

Dissertação apresentada ao Programa de Pós-Graduação em Ciências Farmacêuticas da Universidade Federal do Rio Grande do Norte, como requisito final à obtenção do título de Mestre em Ciências Farmacêuticas.


ANÁLISE DA FREQUÊNCIA ALÉLICA DE 15 LOCI STR NA POPULAÇÃO DO RIO GRANDE DO NORTE

Banca Examinadora:

_______________________________________

Prof. Dr. Geraldo Barroso Cavalcanti Júnior

Presidente – UFRN

_______________________________________

Prof. Dr. Carlos Roberto Alves

Examinador Externo – FIOCRUZ/RJ

_______________________________________

Profa. Dra. Tereza Neuma de Souza Brito

Examinador Interno – UFRN

Natal, 24 de fevereiro de 2012

NATAL / RN

2012

A meus pais, Jayme e Marizeth, pelo

incentivo na busca do conhecimento.

Fonte de inspiração, exemplo de

dedicação e respeito. Aos meus irmãos

Jayme Júnior e Sanderson, pelo apoio

incondicional e amizade. À minha

sobrinha Valentina, pela alegria que

soma à minha vida. A eles, todo o meu

amor e admiração.

DEDICATÓRIA

AGRADECIMENTOS

A Deus, fonte de toda Sabedoria. Por guiar meus passos e não me deixar fraquejar.

A Ele, toda Honra e toda Glória.

Aos meus pais, irmãos, sobrinha, cunhadas, meu muito obrigada por tudo.

Ao Professor Dr. Geraldo Barroso pela sua orientação, amizade e confiança que

tanto contribuíram para a minha formação acadêmica.

Ao Laboratório DNA Center que me abriu as portas desde a graduação. Aos

queridos mestres Gioconda Leão, Andréa Fernandes e Roberto Chaves por todos os

ensinamentos e confiança depositada. Aos colegas e funcionários, em especial

Juliana Freire pela ajuda neste trabalho. A Erica Gil, inicialmente uma parceira

profissional, hoje, uma amiga que posso contar sempre.

A todos os docentes do Programa de Pós-graduação em Ciências Farmacêuticas,

em especial o Professor Dr. Matheus Pedroza, por toda a dedicação nos momentos

em que precisei de seus conselhos e orientações. Às funcionárias Fábia e Aureliana

pela paciência, sempre dispostas a ajudar.

À CAPES, pela concessão da bolsa de estudo.

Ao Professor Dr. Paulo Marinho, quem primeiro me apresentou à Biologia Molecular,

pelo constante apoio.

Ao Professor e amigo Carlos Maia pela valiosa ajuda e disponibilidade.

Aos amigos Paulo Raimann e Weslley Tsutsumida, da Life Technologies, por toda a

ajuda despendida no início deste trabalho.

À Italo Medeiros e ao Professor Dr. Flávio Freire pelo auxílio com as análises

estatísticas.

Aos titulares da Banca Examinadora, Professora Dra. Tereza Neuma e Professor Dr.

Carlos Roberto, pelas contribuições, críticas, elogios e por terem prontamente

aceitado fazer parte desta banca.

Aos meus verdadeiros amigos, irmãos que Deus me permitiu escolher, pelas críticas,

sugestões, orações, paciência e incentivo.

A todos, que de alguma forma, contribuíram para a minha formação pessoal e

profissional, minha eterna gratidão!

RESUMO

As populações humanas apresentam um considerável número de loci polimórficos,

cujo uso e aplicações vão desde a construção de mapas de ligação até estudos de

evolução das populações, passando pela determinação de paternidade, medicina

forense e migração. Atualmente, os STRs (Short Tandem Repeats) são

considerados os marcadores de identificação humana por excelência, título em

grande parte devido a sua abundância e elevada variabilidade, devido ao fato de

serem facilmente amplificáveis pela Reação em Cadeia da Polimerase, PCR

(Polymerase Chain Reaction), funcionarem com baixas quantidades de DNA e

serem passíveis de automação com processos envolvendo detecção por

fluorescência. A formação de bancos de dados regionais, contendo as frequências

alélicas da população de uma microrregião, fornece subsídios para aumentar a

confiabilidade dos resultados de determinação de vínculo genético. Neste trabalho,

visa-se a obtenção de um banco de dados das frequências alélicas de 15 loci

polimórficos moleculares (D8S1179, D21S11, D7S820, CSF1PO, D19S433, vWA,

TPOX, D18S51, D3S1358, TH01, D13S317, D16S539, D2S1338, D5S818 e FGA),

em uma população classificada como nascida no Estado do Rio Grande do Norte,

Brasil, totalizando 1100 indivíduos não aparentados. Para avaliação das frequências,

amostras de DNA foram submetidas à amplificação por PCR, e os genótipos foram

obtidos através de eletroforese capilar em sequenciador genético. As frequências

apuradas no presente estudo foram comparadas com as da população brasileira em

geral e com as de outros estados do Brasil. Com exceção dos loci D21S11,

D19S433 e D2S1338, os genótipos encontrados da população do RN mostram-se

em Equilíbrio de Hardy-Weinberg, e sem grandes diferenças significativas entre as

frequências encontradas nas populações estudadas. Os loci mais informativos foram

D2S1338 e D18S51, enquanto que o locus menos informativo foi o TPOX.

Palavras-chave: Frequência alélica; STR; Rio Grande do Norte; Brasil.

ABSTRACT

Human population have a significant number of polymorphic loci, whose use and

applications range from construction of linkage maps, to study the evolution of

populations, through the determination of paternity, forensic medicine and migration.

Currently, STRs (Short Tanden Repeats) markers are considered the major markers

for human identification, mainly due to its abundance and high variability because of

the fact that they are easily amplifiable by PCR (Polymerase Chain Reaction), work

with low amounts of DNA and be capable of automation processes involving

fluorescence detection. The creation of regional databases containing allele

frequencies of population provide subsidies to increase the reliability of the results of

determining the genetic link. This paper aims to obtain a database of allele

frequencies of 15 polymorphic molecular loci (D8S1179, D21S11, D7S820, CSF1PO,

D19S433, vWA, TPOX, D18S51, D3S1358, TH01, D13S317, D16S539, D2S1338,

D5S818 e FGA) in a population classifies as born in the State of Rio Grande do

Norte, Brazil, totaling 1100 unrelated individuals. To evaluate the frequency, DNA

samples were submitted to PCR amplification, followed by capilarry electrophoresis

genetic sequencer. The frequencies identified in this study were compared with

brazilian population in general and other states in Brazil. Except for the loci D21S11,

D19S433 and D2D1338, the genotypes found were in Hardy-Weinberg equilibrium

and no significant differences among the frequencies were found in the populations

studied. The most informative loci was D2S1338 and D18S51, and the less

informative is the locus TPOX.

Keywords: Allele frequencies; STR; Rio Grande do Norte; Brazil.

LISTA DE FIGURAS

Figura 1 - Estrutura do DNA composta por íntrons e exons 16

Figura 2 - Marcador STR 21

Figura 3 - Sequência do locus TPOX 21

Figura 4 - Funcionamento da eletroforese capilar 24

Figura 5 - Esquema do posicionamento do primers 24

Figura 6 - Material utilizado na extração de DNA 35

Figura 7 - Loci contemplados no kit AmpFlSTR Identifiler 37

Figura 8 - Eletroferograma 38

Figura 9 - Mesorregiões do Rio Grande do Norte 41

Figura 10 - Distribuição dos indivíduos estudados entre as mesorregiões 42

Figura 11 - Locus D21S11 54

Figura 12 - Locus D13317 54


Figura 14 - Locus VWA 55




Figura 18 - Locus CSF 57


Figura 20 - Locus TH01 58

Figura 21 - Locus TPOX 59

Figura 22 - Locus FGA 59




LISTA DE TABELAS

Tabela 1 - Distribuição das 1100 amostras entre as Mesorregiões 42

Tabela 2 - Frequência alélica e parâmetros estatísticos para os 15 STRs

estudados na população do Rio Grande do Norte 43

Tabela 3 - Frequências alélicas para o locus D21S11 46



Tabela 6 - Frequências alélicas para o locus vWA 47




Tabela 10 - Frequências alélicas para o locus CSF 48


Tabela 12 - Frequências alélicas para o locus TH01 49

Tabela 13 - Frequências alélicas para o locus TPOX 49

Tabela 14 - Frequências alélicas para o locus FGA 49




Tabela 18 - Alelos mais frequentes no RN e no Brasil 52

Tabela 19 - Alelos mais frequentes no RN e em Portugal 53

LISTA DE ABREVIATURAS E SIGLAS

AABB American Association of Blood Banks

CODIS Combined Database Index System

DNA Deoxyribonucleic acid

FBI Federal Bureau Ivestigation

FSS Forensic Science Service

GEP Grupo Espanhol-Português

IBGE Instituto Brasileiro de Geografia e Estatística

INDELs Polimorfismos de Inserção e Deleção

ISFG Internatioanl Society of Forensic Genetic

kb Kilobase

MP Probabilidade de Matching

NDNDA Banco de dados de DNA nacional do Reino Unido

pb Par de base

PCR Polymeraase Chain Reaction

PD Poder de Discriminação

PE Poder de Exclusão

PIC Conteúdo de Informação Polimórfica

PNCQ Programa Nacional de Controle de Qualidade

RFLP Restriction Fragment Length Polymorphism

SNP Single Nucleotide Polymorphism

STR Short Tandem Repeat

VNTR Variable Number of Tandem Repeats

µL Microlitro

SUMÁRIO

1 INTRODUÇÃO 12

2 REVISÃO DE LITERATURA 14

2.1 ESTRUTURA DO GENOMA HUMANO 14

2.2 MARCADORES POLIMÓRFICOS DE USO CORRENTE EM

GENÉTICA FORENSE 16

2.2.1 STRs 20

2.3 TÉCNICAS DE BIOLOGIA MOLECULAR APLICADAS À

IDENTIFICAÇÃO HUMANA 22

2.4 BANCOS DE DADOS 27

2.5 ESTUDOS DE FREQUÊNCIA NA INVESTIGAÇÃO FORENSE 29

3 JUSTIFICATIVA 33

4 OBJETIVOS 34

4.1 OBJETIVOS GERAIS 34

4.2 OBJETIVOS ESPECÍFICOS 34

5 METODOLOGIA 35

5.1 CASUÍSTICA 35

5.2 MATERIAL E MÉTODOS 35

5.2.1 Extração do DNA 35

5.2.2 Amplificação 36

5.2.3 Análise de Fragmentos 37

5.2.4 Controles 39

5.2.5 Análises Estatísticas 39

5.2.6 Aspectos Éticos 40

6 RESULTADOS E DISCUSSÃO 41

7 CONCLUSÕES 62

REFERÊNCIAS BIBLIOGRÁFICAS 63

12

1 INTRODUÇÃO

A história da Genética Humana, como uma ciência baseada em teoria,

começou em 1865 quando Gregor Mendel publicou o seu trabalho “Experimentos

em Plantas Híbridas”. Posteriormente Galton, fundador da Eugenia, com seu estudo

“Talentos Hereditários e Caráter”, procurou apresentá-la como a ciência que

forneceria as bases teóricas para não só compreender os mecanismos da

transmissão dos caracteres entre as gerações, como também contribuir

positivamente para a melhoria das características do conjunto populacional.

O campo da genética de populações surgiu entre as décadas de 1920 e 1930

graças a Ronald Fisher, John Burdon Sanderson Haldane e Sewall Wright, cujos

trabalhos forneceram embasamento suficiente para a criação da Teoria Sintética da

Evolução, ou Síntese Evolutiva Moderna. Esta pode ser compreendida,

basicamente, por princípios que aliam a teoria da evolução das espécies de Charles

Darwin às leis de herança biológica de Mendel e à própria genética populacional.

Esta última fundamenta-se na descrição da variabilidade genética existente e na

investigação dos mecanismos que a influenciam. Para isso, os trabalhos baseiam-se

na observação da distribuição dos polimorfismos genéticos de indivíduos

pertencentes a uma determinada população e suas variações sob a influência de

forças evolutivas como seleção natural, deriva genética, mutação e fluxo gênico

(BEIGUELMAN, 2008).

Há mais de um século, desde a descoberta dos grupos sanguíneos, que

polimorfismos em humanos vêm auxiliando a resolução de questões forenses.

Iniciando pelo polimorfismo de grupos sanguíneos, em seguida pelos polimorfismos

de grupos protéicos/enzimáticos e pelos primeiros polimorfismos em sequência de

DNA (RFLPs), o grande salto deu-se com a identificação dos polimorfismos de

sequência repetitivas do tipo minissatélites (SCHNEIDER, 1997). Os minissatélites e

sua alta variabilidade permitiram ao Sir Alec Jefreys, no início da dedada de 80, as

primeiras aplicações da genética forense em um contexto moderno como

conhecemos hoje. No entanto, foi a caracterização dos microssatélites e a

possibilidade de genotipá-los por PCR os eventos que permitiram ao campo da

genética forense sua consolidação. Atualmente, a base de qualquer laboratório de

genética forense é a utilização de, no mínimo, 13 microssatélites autossômicos

13

amplificados pela PCR e genotipados utilizando a eletroforese em sequenciadores

automáticos de DNA (BUTLER, 2005).

Quimicamente, o DNA é igual em todas as pessoas, diferindo somente no

conteúdo informacional que é dado pela sequência de bases. Cerca de apenas 0,1%

de todo o genoma humano difere de uma pessoa para outra, sendo justamente

nesta diferença em que se baseiam as técnicas de identificação, pois não existem

duas pessoas com a mesma sequência de bases no seu DNA, exceto no caso de

gêmeos idênticos (NAKAMURA, Y. 2009).

Com o início do Projeto Genoma Humano em 1990 e subsequente

disponibilização de sequenciadores automáticos de DNA capazes de gerar dados

genômicos em grande escala, surgiu a necessidade de novas ferramentas

estatísticas para a análise desses bancos de dados (BUTLER, 2006).

Importante ressaltar que o advento das técnicas de análise do DNA propiciou

a fixação estatística da paternidade, atribuindo o percentual de certeza de que

aquela alegada paternidade seria efetivamente correspondente ao vínculo biológico

requerido. Isso é feito por meio de cálculos de probabilidade que inferem 100% à

exclusão de vínculo investigado e taxa muito próxima desse percentual para

inclusão (PENA, 2005).

Há um número variado de materiais biológicos para obtenção do DNA e

realização de testes laboratoriais de identificação humana, tais como tecido ósseo,

bulbo capilar, material de biópsia, saliva, sangue, dentre outros. É possível obter

DNA de praticamente todos os tecidos do corpo humano, variando apenas a

quantidade de DNA que é possível extrair de cada um desses tecidos (STRACHAN;

READ, 2002).

O Brasil, com sua população de proporções continentais, altamente

polimórfica em virtude de sua miscigenação, necessita de estudos que auxiliem no

melhor entendimento desta. Diante disso, o presente estudo tem como objetivo

realizar uma análise da frequência alélica de 15 loci STR, em população nascida no

Estado do Rio Grande do Norte, a fim de viabilizar sua aplicação em casos de

investigação de paternidade e forenses, através da utilização de parâmetros

estatísticos, além de um melhor entendimento da formação da população do nosso

Estado.

14

2 REVISÃO DE LITERATURA

2.1 ESTRUTURA DO GENOMA HUMANO

Em 1953, os cientistas Francis Crick e James Watson descobriram a estrutura

do DNA, que é uma macromolécula formada pelo encadeamento de subunidades

individuais denominadas de nucleotídeos. Por sua vez, cada nucleotídeo é composto

de três unidades básicas: um grupamento fosfato, um açúcar (pentose) e uma base

nitrogenada, podendo esta ser Adenina, Timina, Citosina ou Guanina. (BUTLER,

2005).

O DNA é responsável pelo armazenamento de toda a informação genética,

sendo encontrado nos cromossomos do núcleo (DNA genômico) e nas mitocôndrias

(DNA mitocondrial), podendo ser extraído de amostras de sangue, esfregaço bucal,

saliva, ossos, dentes, tecidos, órgãos, fios de cabelo, sêmen, urina, dentre outros

materiais biológicos (STRACHAN; READ, 2002). É nele que estão localizados os

genes, depositários das informações genéticas responsáveis pelas atividades da

célula. Cada gene, por sua vez, faz parte de uma estrutura denominada cromossomo

e encontra-se em locais específicos conhecidos como locus genético (ALBERTS et

al., 1999).

A sequência de nucleotídeos codifica a sequência de aminoácidos através

dos códons, entretanto, somente cerca de 3 a 5% do conteúdo total de DNA codifica

proteínas. Essas sequências codificadoras são intercaladas por extensas

sequências de DNA inativo (não-codificador). As regiões do DNA que codificam

proteínas são chamadas de éxons, enquanto as regiões que não codificam

proteínas, pois são removidas após a transcrição do DNA, são chamadas de íntrons.

Estes apresentam tamanho variável que pode ser de 50 até 10.000 nucleotídeos,

considerando-se que, em muitos casos, o tamanho cumulativo dos íntrons é muito

maior que o dos éxons (MARQUES et al, 2003; ALBERTS et al, 1999). Os íntrons

contêm uma grande proporção de DNA repetitivo (grupos de pares de bases que se

repetem, lado a lado). O DNA de cópia única constitui aproximadamente 50% do

genoma humano, enquanto que o genoma restante é composto por sequências de

15

DNA repetitivo que se intercalam com DNA de cópia única. A função da maior parte

desse DNA repetitivo ainda não é conhecida, porém, aparentemente uma pequena

parte dele atua na estabilização da estrutura do cromossomo (NAKAMURA, 2009;

ALBERTS et al, 1999).

O DNA repetitivo não codificador pode ser classificado em DNA repetitivo

disperso ou DNA satélite. O DNA repetitivo disperso é composto por sequências não

agrupadas, mais complexas, espalhadas em numerosas localizações no genoma. Já

o DNA satélite possui sequências agrupadas que constituem de 10 a 15% do

genoma (JORDE, 2004)

A sequência como estão dispostas as bases nitrogenadas no DNA é o que

diferencia o genoma de cada pessoa, pois a estrutura química é igual para todos. No

genoma humano existem mais de três bilhões de nucleotídeos. Deste total, cerca de

99,9% das regiões do DNA possuem a mesma sequência de bases nitrogenadas.

Apenas 0,1% das regiões da molécula apresentam variações na sequência de

nucleotídeos, são os chamados polimorfismos do DNA. As técnicas de identificação

humana se apóiam na análise dessas regiões variáveis. O estudo da variabilidade

destas regiões tem levado à conclusão de que não existem duas pessoas que

apresentem a mesma sequência de DNA, com exceção dos gêmeos univitelinos

(NAKAMURA, Y. 2009; LI et al, 2009).

As diferentes variações no número de repetições do DNA em um determinado

local do cromossomo são chamadas de alelos, que constituem o que é conhecido

como polimorfismo genético. Nos indivíduos, em cada locus há dois alelos, com

exceção dos cromossomos sexuais no sexo masculino, que apresentam um alelo em

cada locus tanto no cromossomo X quanto no cromossomo Y. Quando dois alelos

são idênticos, o indivíduo é homozigoto e quando são diferentes, ele é heterozigoto

para esse locus (OTTO, 2004).

16

Figura 1: Estrutura do DNA composta por íntrons e éxons. Os íntrons são removidos

após a transcrição e os éxons são unidos e então as proteínas são codificadas Fonte: http://svmcompbio.tuebingen.mpg.de/splicing.html

Já o DNA mitocondrial é outro tipo de material que pode ser utilizado na

identificação humana, sendo a principal vantagem o seu alto número de cópias por

célula (de centenas a milhares de organelas). Em casos onde a amostra de DNA

extraída é muito pequena ou degradada, tal como em tecidos esqueletizados, a

probabilidade de obtenção de um perfil de DNA a partir do DNA mitocondrial é maior

que qualquer marcador encontrado no DNA genômico (PANETO, 2006; SWEET;

DIZZINO, 1996). Por este motivo, a análise do DNA mitocondrial para fins forenses

fica reservada principalmente para tecidos antigos como ossos, cabelos e dentes,

nos quais o DNA nuclear já não oferece mais condições de análise (BUDOWLE et al.,

2003).

2.2 MARCADORES POLIMÓRFICOS DE USO CORRENTE EM GENÉTICA

FORENSE

Nos testes de determinação de identidade genética são estudadas regiões

genômicas em que há variação entre pessoas normais, sendo tais regiões

chamadas de “polimorfismos de DNA” ou “marcadores de DNA”. Nos últimos anos

foram desenvolvidas diversas técnicas para estudo de diferentes tipos de

17

polimorfismos de DNA, no qual os cientistas e laboratórios podem escolher o método

mais adequado para solucionar problema em mãos (PENA, 2005).

O DNA satélite é composto por sequências altamente repetitivas simples ou

moderadamente complexas. As sequências deste tipo de DNA ocorrem em tandem,

ou seja, de maneira consecutiva, e sua classificação é realizada segundo a

localização no genoma, número total de repetições e comprimento das unidades

repetidas. O DNA satélite pode ser agrupado em duas subclasses principais

(BUTLER, 2006):

• Minissatélites ou VNTR (Variable Number of Tandem Repeats ou Número

Variável de Repetições Consecutivas): Sequências de tamanho médio (de

10 a 100 pb) cujo número de repetições pode variar desde duas até vinte

ou mais repetições;

• Microssatélites ou STRs (Short Tandem Repeats ou Repetições Curtas

Consecutivas): Pequenas repetições, em geral de 2 a 4 nucleotídeos.

Geralmente são observados até 30 alelos em uma população para apenas

1 locus.

Mais recentemente, os abundantes polimorfismos de base única (SNPs) e os

polimorfismos de inserção/deleção (INDELs) têm emergido como possíveis

alternativas às ferramentas moleculares em genética forense.

MINISSATÉLITES OU VNTRs (DNA FINGERPRINT)

Em 1985, Jeffreys e colaboradores, na Inglaterra, foram os primeiros a

demonstrar que algumas sondas especiais (sondas multilocais) eram capazes de

reconhecer simultaneamente diversas regiões de minissatélites, produzindo padrões

de bandas complexos e específicos para cada indivíduo. Estes padrões foram

chamados de "Impressões Digitais de DNA" ou “DNA Fingerprint”, uma vez que tal

resultado proporcionava um padrão único de identificação de cada indivíduo,

tornando bastante improvável que duas pessoas possuam o mesmo perfil, salvo em

casos de gêmeos univitelinos (Pena, 2005).

A técnica utilizada para o estudo destas sequências altamente polimórficas,

RFLP (Restriction Fragment Length Polymorphism), se baseia no fato de que a

molécula de DNA pode ser cortada em sítios específicos por proteínas denominadas

enzimas de restrição. O RFLP é gerado por diferenças no tamanho do fragmento de

18

DNA digerido pela enzima de restrição devido a substituições no sítio de

reconhecimento da endonuclease (BUTLER, 2005).

Os minissatélites possuem locus mais polimórficos que os microssatélites.

Geralmente, enquanto 5 loci de VNTR são suficientes para obtenção de resultados

satisfatórios na identificação humana, cerca de 12 ou mais loci de STR são

necessários para o mesmo resultado. Entretanto, os VNTRs estão, atualmente, em

desuso na resolução de casos médico-legais, devido ao fato de, entre outras razões,

requerem uma quantidade apreciável de DNA não degradado, além de se tratar de

uma metodologia bastante laboriosa e demorada (NAKAMURA, 2009).

MICROSSATÉLITES OU STRs

São constituídos de pequenas sequências repetidas consecutivamente que

ocorrem a cada 20 kb no genoma humano. Essas sequências repetitivas podem ter

de 2 a 5 pb e geralmente não ultrapassam os 200pb. Nos últimos anos, a descoberta

e o desenvolvimento dos STRs polimórficos como marcadores genéticos

estimularam a elaboração de mapas de ligação, a identificação e caracterização de

genes ligados a doenças e a simplificação e precisão da tipagem de DNA com intuito

de identificar pessoas (BUTLER, 2005).

Na tipagem de regiões STR, através da técnica PCR, são utilizados,

usualmente, sistemas multiplexes, onde vários pares de “primers” orientam

simultâneas reações de amplificação, gerando produtos de múltiplos loci. Os alelos

amplificados são separados em eletroforese. Estes são denominados em função do

número de vezes que uma determinada unidade de repetição está presente no lócus

em questão. Esta forma de nomenclatura permite uma melhoria na padronização

(BUTLER et al., 2004).

Com o avanço da tecnologia, foram desenvolvidos processos automatizados

para análise de loci STR. Acoplou-se a produção de primers marcados com

diferentes corantes fluoróforos e sistemas de detecção a laser em aparatos de

separação eletroforética. Sistemas para amplificação simultânea de 15, 21, até 31

loci STR (ROBLEDO et al, 2009) já encontram-se disponibilizados para uso corrente

em tipagem humana por DNA. Desta maneira, a tipagem ou identificação de um

indivíduo, pode ser realizada em um único tubo, no qual múltiplas reações de

amplificação estarão sendo processadas (BUTLER, 2005).

19

A amplificação de loci STRs por sistema Multiplex oferece diversos benefícios

para a análise de amostras biológicas. Primeiramente, torna-se capaz de analisar

uma grande quantidade de marcadores genéticos consumindo apenas uma pequena

alíquota de amostra. Assim, menos amostra é consumida em comparação ao que

poderia ser utilizado se fossem analisados os loci separadamente.

Consequentemente, ao se amplificar todos os loci desejados em uma única reação,

diminui-se a manipulação, reduzindo a possibilidade de contaminação. Por último, o

sistema multiplex facilita a automatização de processos analíticos (BUDOWLE,

2011).

MARCADORES BI-ALÉLICOS

Além dos minissatélites e microssatélites há dois grandes grupos de

polimorfismos no genoma humano - os polimorfismos de substituição de

nucleotídeos únicos (Single Nucleotide Polymorphisms, ou SNPs) e os polimorfismos

de inserção ou deleção de um ou mais nucleotídeos (INDELs). (KOCH, 2008), sendo

os SNPs mais abundantes, com mais de 10 milhões já identificados e mapeados no

genoma humano. Podem ser estudados em produtos de amplificação muito curtos,

de aproximadamente 50 pb ou menos, o que é vantajoso quando se tem DNA

extremamente degradado, ou em pouca quantidade (PENA, 2005).

Entretanto, os SNPs apresentam algumas limitações. Primeiro, o número de

SNPs necessários é quatro vezes maior do que o número de STRs

(CHAKRABORTY et al., 1999; GILL, 2000). Assim, aproximadamente 60 SNPs

serão necessários para se obter um poder de discriminação equivalente àquele

obtido com os sistemas multiplex de STRs em uso na área forense (GILL et al,

2004). Além disso, as vantagens de custo ainda não estão claras. A despeito das

vantagens e desvantagens da aplicação de SNPs em genética forense, os teste de

paternidade ainda podem ser realizados de maneira mais simples e a custo mais

baixo utilizando os STRs, sem falar na experiência em STRs ao longo dos últimos 10

anos (AMORIM; PEREIRA, 2005).

20

2.2.1 STRs

Os marcadores STRs foram primeiramente descritos como ferramenta efetiva

para identificação humana no início de 1990 (BUTLER, 2006). Os de maior valor

para a identificação humana são aqueles que apresentam maior polimorfismo (maior

número de alelos), menor tamanho, maior frequência de heterozigotos (maior que

90%) e baixa frequência de mutações (GALANTE FILHO et al, 1999).

Devido ao seu alto poder de discriminação entre indivíduos e praticidade, a

análise de STRs se tornou rotina em testes de parentesco e genética forense. A

sensibilidade, maior polimorfismo, elevado índice de discriminação e heterozigose

são características importantes na escolha de determinados STRs para fins forenses

(TAMAKI; JEFFREYS, 2005).

Além da classificação de acordo com o tamanho, os STRs também podem ser

classificados de acordo com a composição dos blocos de sequência. Aqueles com

repetições de mesmo tamanho e sequência são classificados como microssatélites

de repetição simples. Microssatélites com duas ou mais repetições simples

adjacentes diferindo nos motivos de repetição são classificados como repetições

compostas. Microssatélites complexos são aqueles constituídos por blocos de

repetição variando em tamanho. Microssatélites com blocos diferindo em tamanho e

em sequência são classificados como repetições complexas hipervariáveis. Essa

última categoria de marcadores do tipo STR não é comumente utilizada em tipagem

de DNA forense devido a dificuldades com nomenclatura alélica e medida de

variabilidade entre laboratórios. (BUTLER, 2005).

De acordo com as recomendações internacionais, designadamente da

Sociedade Internacional de Genética Forense (ISFG), a denominação dos alelos dos

STRs deve fazer-se de acordo com o número de unidades de repetição,

exemplificadas nas figuras 2 e 3. A figura 2 mostra o alelo 7 do locus D5S818, ou

seja, 7 repetições da sequência AGAT neste locus, já a figura 3 mostra a

representação do alelo 11 do locus TPOX.

Figura 2: Marcador STR, mostrando sete

Figura 3: Sequência do locus Fonte:

Existem situações onde um alelo de um loco STR contém um número

incompleto de repetições. Microvariantes é o termo dado aos alelos que contém

unidades de repetição incompleta.

incompleta, será designado pelo

número de pares de bases da unidade de repetição incompleta, separados por um

ponto (DIXON et al., 2006

no loco TH01, que contém nove repetições tetranuc

ura 2: Marcador STR, mostrando sete unidades de repetição AGAT do

locus TPOX no Genbank, mostrando as unidades de repetição deste.Fonte: http://www.cstl.nist.gov/strbase/images/tpox.jpg



unidades de repetição incompleta. Se um alelo apresentar uma unidade de repetição

incompleta, será designado pelo número de unidades de repetição completas e pelo


DIXON et al., 2006). Um exemplo comum de uma microvariante é o alelo 9.3

no loco TH01, que contém nove repetições tetranucleotídicas e uma repetição

21

de repetição AGAT do locus D5S818

, mostrando as unidades de repetição deste.

http://www.cstl.nist.gov/strbase/images/tpox.jpg



Se um alelo apresentar uma unidade de repetição

número de unidades de repetição completas e pelo


Um exemplo comum de uma microvariante é o alelo 9.3

leotídicas e uma repetição

22

incompleta de três nucleotídeos, pois na décima repetição falta uma única adenina

fora da normal na unidade de repetição AATG (BUTLER, 2006).

As análises de STRs são de fundamental importância para a ciência forense,

principalmente coma criação de bancos de dados contendo as frequências alélicas

de STRs das populações. Os cálculos estatísticos utilizam como base as frequências

alélicas de cada marcador STR encontrado em representantes da população

estudada (GILL, 2006).

2.3 TÉCNICAS DE BIOLOGIA MOLECULAR APLICADAS À IDENTIFICAÇÃO

HUMANA

Os testes de vínculo genético por DNA são de alta confiabilidade, sendo

aceitos como prova legal em casos judiciais, como inclusão e exclusão de

paternidade e na identificação humana (PARDINI et al, 2001), sendo possível obter

DNA de praticamente todos os tecidos do corpo humano, variando apenas a

quantidade de DNA que é possível extrair de cada um desses tecidos (BUTLER,

2005)

A investigação de vínculo genético sempre mereceu atenção especial da

sociedade e da justiça. No início, os casos de paternidade eram resolvidos

utilizando-se os polimorfismos eritrocitários e protéicos. Estas técnicas, apesar de

simples e baratas, tinham a desvantagem de só fazer afirmações sobre a exclusão

da paternidade e apenas a suposição sobre a probabilidade de um determinado

indivíduo ser o pai biológico da pessoa em questão. Outra desvantagem com

relação à análise de proteínas se relaciona à quantidade de material biológico

necessária para a realização dos testes e a facilidade com que se degradam, além

de não serem capazes de detectar muitos alelos. Para estudos de identificação

humana elas não são as mais indicadas devido ao seu baixo poder discriminatório

(KOCK; ANDRADE, 2008).

Em 1985, Jeffreys et al. propuseram a existência de polimorfismos no DNA

humano. Ao contrário da análise convencional de grupos sanguíneos, a qual

depende de sangue ou outros fluidos corpóreos, os resultados dos perfis analisados

23

não dependem da natureza do material ou do tipo celular analisado, uma vez que a

informação genética está contida em todas as células somáticas de todos os

indivíduos. Por este motivo, o mesmo tipo de DNA de um determinado indivíduo

pode ser obtido de qualquer tecido do corpo humano, enquanto que a análise

utilizando marcadores protéicos ou sanguíneos é restrita a células onde tais

proteínas ou antígenos são expressos e secretados (SCHNEIDER, 1997).

Outro passo importante foi dado quando se verificou que era possível utilizar

a técnica de PCR na detecção de polimorfismos no DNA. A PCR consiste na

reprodução, in vitro, do processo de duplicação do DNA. Uma ou mais fitas de DNA

servem como molde (template), e têm uma dada sequência gênica demarcada

através de oligonucleotídeos – primers (cerca de 20 pares de bases). Estes se

anelam, por hibridação, às suas sequências complementares, indicando o início e o

fim do fragmento desejado, que passa a ser copiado, através do acréscimo, em

ambas as fitas do DNA molde, de nucleotídeos complementares presentes na

reação, sob a ação de uma enzima Taq DNA Polimerase, termorresistente,

proveniente da bactéria Thermus aquaticus (BUTLER, 2005).

Com a automação, uma das técnicas de grande destaque para avaliação

dos produtos amplificados é a eletroforese capilar. Nesta técnica, cada amostra, já

amplificada pela PCR, é processada em cerca de 40 minutos e os produtos da PCR

são separados por tamanho e cor do fluorocromo, utilizando eletroforese seguida por

detecção baseada na fluorescência induzida por laser. Uma voltagem é aplicada por

um determinado tempo para mover as moléculas da amostra através do polímero

presente no capilar. Quando os fragmentos de DNA alcançam a janela de detecção,

as moléculas marcadas com corantes são excitadas pelo laser, emitindo

fluorescência. Esta é coletada simultaneamente e espectralmente separadas. Um

padrão interno, contendo fragmentos de DNA de tamanho conhecido e marcado com

corante diferente, deve ser processado por eletroforese junto com cada amostra. Os

dados, coletados na forma de eletroferogramas, são analisados por um software que

automaticamente determina o tamanho dos alelos com base no padrão interno

(BUTLER, 2004). O funcionamento da eletroforese capilar é esquematizado na

figura 4.

Figura 4: Funcionamento da eletro

A figura 5 mostra um marcador STR em um DNA molde e os primers que se

anelam em ambos os lados da região de repetição. Um dos primers é marcado na

extremidade 5’ terminal com um fluorocromo,

global do produto de PCR, assim como o número de repetições presentes na região

STR. Os produtos de PCR são separados por tamanho e cor do fluorocromo durante

a eletroforese (BUTLER, 2004).

Figura 5: (A) Esquema do posicionamento dos primers(B) Padrão de peso molecular para o marcador D3S1538

heterozigotas, mostrando diferentes genótipos. Valores abaixo dos picos indicam o número de sequências repetidas presentes no alelo

Funcionamento da eletroforese capilar (BUTLER, 2005)

mostra um marcador STR em um DNA molde e os primers que se


extremidade 5’ terminal com um fluorocromo, e estes primers


Os produtos de PCR são separados por tamanho e cor do fluorocromo durante

a eletroforese (BUTLER, 2004).

Figura 5: (A) Esquema do posicionamento dos primers para amplificação de um marcador STR.(B) Padrão de peso molecular para o marcador D3S1538 e duas amostras de DNA,

heterozigotas, mostrando diferentes genótipos. Valores abaixo dos picos indicam o número de sequências repetidas presentes no alelo (BUTLER, 2004).

24

forese capilar (BUTLER, 2005)

mostra um marcador STR em um DNA molde e os primers que se


e estes primers definem o tamanho


Os produtos de PCR são separados por tamanho e cor do fluorocromo durante

para amplificação de um marcador STR.

e duas amostras de DNA, heterozigotas, mostrando diferentes genótipos. Valores abaixo dos picos indicam o número de

.

25

Foi observado então que, além de completamente compatíveis com os

resultados obtidos com os métodos anteriormente utilizados (grupos sanguíneos,

Antígenos Leucocitários Humanos ou HLA), o DNA é mais informativo, pois seu

elevado polimorfismo permite a inclusão de paternidade (NAKAMURA, 2009). Os

métodos disponíveis até então só permitiam fazer exclusões a respeito da

paternidade. Importante ressaltar que o advento das técnicas de análise do DNA

propiciou a fixação estatística da paternidade, atribuindo o percentual de certeza de

que o indivíduo é o pai biológico (inclusão de paternidade). Isso é feito por meio de

cálculos de probabilidade, que inferem 100% à exclusão do vínculo investigado e

taxa próxima desse percentual para a inclusão de paternidade (PENA, 2005). Assim,

a análise estatística envolvida nos procedimentos de DNA passou a ser de primordial

importância, não só em processos de investigação de paternidade, como também em

questões forenses.

De acordo com a AABB (American Association of Blood Bank), órgão

regulamentador para testes de vínculo genético para identificar indivíduos,

recomenda-se o estudo de, no mínimo, 13 loci, e os dados são usados para criar um

perfil de DNA de cada indivíduo (BUTLER, 2005).

Em caso de identificação forense, alguns exemplos do uso do DNA podem

ser listados, tais como:

• Identificar potenciais suspeitos, dos quais o DNA foi encontrado em

cenas de crime;

• Inocentar pessoas acusadas erroneamente de crimes;

• Identificar vítimas de crimes e catástrofes;

• Estabelecer paternidade ou outro vínculo familiar.

O Federal Bureau of Investigation (FBI) usa um padrão de 13 STR loci

específicos para o CODIS (Combined DNA Index System), o programa de

computador que opera os bancos de dados locais, estaduais e nacionais de perfis

de DNA de criminosos, pessoas envolvidas em crimes não resolvidos e pessoas

desaparecidas. A possibilidade de dois indivíduos possuírem o mesmo perfil nos 13

loci analisados é de um em um bilhão (BUTLER, 2005).

26

No nosso estudo, foram analisados 15 loci, abaixo listados no Quadro 1:

LOCUS LOCALIZAÇÃO SEQUÊNCIA REPETITIVA

MARCADOR FLUORESCENTE

ACESSO GENBANK

TPOX CROMOSSOMO 2

2p25.3

GAAT NED

(Amarelo)

M68651

D2S1338 CROMOSSOMO 2

2q35

[TGCC][TTCC] VIC

(Verde)

G08202


3p21

[TCTG][TCTA] VIC

(Verde)

NT_005997

FGA CROMOSSOMO 4

4q28

CTTT PET

(Vermelho)

M64982

D5S818 CROMOSSOMO 5

5q21-q31

AGAT PET

(Vermelho)

G08446

CSF1PO CROMOSSOMO 5

5q33.3-34

TAGA 6-FAM

(Azul)

X14720

D7S820 CROMOSSOMO 7

7q21.11

GATA 6-FAM

(Azul)

G08616


8q24.1-24.2

[TCTA][TCTG] 6-FAM

(Azul)

G08710

TH01 CROMOSSOMO 11

11p15.5

TCAT VIC

(Verde)

D00269

VWA CROMOSSOMO 12

12p13.31

[TCTG][TCTA] NED

(Amarelo)

M25858


13q22-q31

TATC VIC

(Verde)

G09017


16q22-24

GATA VIC

(Verde)

G07925


18q21.3

AGAA NED

(Amarelo)

L18333


19q12

AAGG NED

(Amarelo)

G08036


21q21.1

[TCTA][TCTG] 6-FAM

(Azul)

AP000433

Quadro 1: Localização no genoma dos loci analisados, sua sequência, fluoróforo marcador e acesso no Genbank (Fonte: BUTLER, 2005; Applied Biosystems)

27

2.4 BANCOS DE DADOS

O crescimento de bancos de dados de DNA vem fazendo aumentar o

envolvimento da polícia científica no auxílio da aplicação da lei. Além de sua função

essencial de ligar crimes e suspeitos, tais bancos colecionam informações sobre

crimes e criminosos. A análise desses dados pode aumentar a compreensão do

contexto no qual as Ciências Forenses funcionam como ferramentas para a justiça

criminal (SMITH, 2006; SCHNEIDER, 2009).

A aprovação da primeira legislação que permitia a coleta e o armazenamento

de amostras de DNA de condenados deu-se na Virgínia (EUA) em 1989, e os

bancos de dados de DNA eram compostos por perfis VNTR. Porém foi o Reino

Unido que estabeleceu legalmente um banco de dados de DNA nacional baseado

em uma pelataforma de tecnologia STR (BUTLER, 2006).

O Forensic Science Service (FSS), órgão inglês pioneiro no desenvolvimento

e implementação de tecnologias de DNA e em abrir caminho para a formação do

primeiro banco de dados no mundo, começou a procurar novos loci e variação na

população de estudo com candidatos de loci STR. Juntamente com outros

laboratórios europeus, lançaram o sistema multiplex SGM, e em 1995 foi lançado o

NDNAD (Banco de Dados de DNA Nacional do Reino Unido) que contemplava o

sistema multiplex SGM adicionado ao marcador sexual Amelogenina (WERRET,

1997; BUTLER, 2006).

Observando o sucesso obtido pela tipagem por STR no Reino Unido, o

laboratório do FBI (Fereral Bureau of Investigation) liderou esforços nos EUA para

estabelecer o núcleo dos loci STR que formariam o CODIS (Combined DNA Index

System), sistema nacional de banco de dados americano, o mais conhecido e mais

importante no mundo. Em um projeto que durou aproximadamente 18 meses e

envolveu 22 laboratórios americanos, foram avaliados 17 loci STR de kits já

comercializados e em testes, das empresas “Applied Biosystems” e “Promega

Corporation”, e em 1997 foram anunciados os 13 loci STR que compunham o

CODIS, quais sejam: CSF1PO, FGA, TH01, TPOX, VWA, D3S1358, D5S818,

D7S820, D8S1179, D13S317, D16S539, D18S51 e D21S11 (BUTLER, 2004, 2006).

Nesse sistema existem dois arquivos diferentes de perfis genéticos cujos objetivos

se completam: o Forensic Index (Índice Forense) que contém perfis genéticos

28

obtidos a partir de cenas de crime; e o Offender Index (Índice de Criminosos) que

contém perfis genéticos de criminosos condenados por crimes sexuais e outros

crimes violentos (PENA, 2005). A possibilidade de dois indivíduos possuírem o

mesmo perfil nos 13 loci analisados é de um em um bilhão.

Os mesmos marcadores STRs são usados em várias circunstâncias. Existem

oito loci STR (FGA, TH01, VWA, D3S1358, D8S1179, D16S539, D18S51 e D21S11)

que compões tanto o banco de dados dos Estados Unidos quanto o da Europa, fato

este que permite uma possível colaboração internacional (BUTLER, 2005).

Atualmente muitos países dispõem de sistemas de Bancos de Dados de DNA,

como a Nova Zelândia, Alemanha, Áustria, Suíça, Canadá, França, Itália e, na

América do Sul, o Chile. Existem programas para implantação de bancos de dados

de DNA em países como Argentina, Cuba, Líbano, entre outros (GILL, 2006).

O Brasil ainda não conta com um sistema de banco de dados de informações

genéticas de criminosos ou pessoas desaparecidas como ferramentas investigativas

eficientes para armazenamento, busca e cruzamento de informações (FIGUEIREDO;

PARADELA, 2010), embora já existam esforços para uma padronização em relação

aos métodos para análise de DNA.

Em 2005 foi criada no Brasil a Rede Nacional de Genética Forense, formado

por peritos federais e estaduais, atuantes em Genética Forense, e professores

universitários. Em 2009, o CODIS, sistema nacional de banco de dados americano,

foi repassado para o Brasil pelos EUA sem ônus algum. Todos os 17 estados

brasileiros que possuem laboratório de DNA criminal assinaram os Acordos de

Cooperação Técnica com a Polícia Federal, sendo o sistema já instalado em 2010.

No Nordeste, apenas os estados de Ceará, Paraíba e Bahia contribuem com o

Banco Nacional de DNA (JACQUES, 2011).

O banco de dados de perfis genéticos é usado para comparar perfis de

suspeitos cadastrados no banco e identificar criminosos a partir de outros crimes,

podendo ser usado para provar a inocência ou culpa de suspeitos, assim como

identificar restos mortais e amostras biológicas (DOLINSKY; PEREIRA, 2007). Esse

banco tem alterado o sistema de justiça criminal em muitos países, principalmente

por fornecer a chance de identificação de indivíduos e resolução de casos sem

suspeitos, caso não existam amostras para serem comparadas com o material

coletado na cena do crime (WALSH, 2004).

29

Ao longo da aplicação dos conhecimentos do DNA para a viabilização da

Justiça, foram sendo desenvolvidos bancos de dados das padronizações genotípicas

das populações. Inicialmente, utilizavam-se nas identificações das frequências

populacionais os bancos de dados do FBI para a população geral norte-americana.

Posteriormente a caucasóide norte-americana. Depois a população geral latino-

americana, a caucasóide, negróide e amarela latino-americana e, finalmente, passou-

se a utilizar os bancos de dados específicos da população brasileira

(GRATTAPAGLIA et al. 2001)

2.5 ESTUDOS DE FREQUÊNCIA NA INVESTIGAÇÃO FORENSE

O delineamento das experiências de Mendel permitiu-lhe uma interpretação

estatística muito simples dos resultados, mas suficiente para enunciar alguns

princípios básicos da hereditariedade. Com base num grande número de

cruzamentos de ervilhas, Mendel "probabilizou" os diferentes genótipos, fenótipos e

a presença de genes que estão associados à transmissão da hereditariedade de

geração em geração (BEIGUELMAN, 2008).

Li et al. (2009) mostraram que a variação genética dentro da população é

responsável pela maioria da diversidade humana; no entanto, a variação entre as

populações é suficiente para mostrar a presença de estrutura genética entre estas. A

contribuição genética ancestral pode ser obtida por meio da comparação da

frequência de alelos de determinadas regiões genômicas entre a população alvo e

as possíveis parentais, ou seja, aquelas que contribuíram de alguma forma com

alguns indivíduos, genomas, para a formação da população alvo (RIBEIRO, 2009).

A Genética Populacional tem como um dos objetivos analisar as

consequências da aplicação dos princípios mendelianos em determinada população,

estudando os efeitos das mutações, seleção natural, migração e deriva genética. É

de grande interesse em Antropologia e em Medicina legal, pois quando se efetua a

valorização da prova pericial, se faz necessário conhecer alguns parâmetros

estatísticos da população referência (BEIGUELMAN, 2008).

Sabe-se que diferentes populações apresentam alelos em frequências

diferentes e algumas vezes únicos, por isso a necessidade do estudo de diferentes

30

marcadores naquela população para saber quais alelos presentes e em que

frequência, a fim de se definir quais são os melhores marcadores a serem utilizados

nestes casos. Assim, para que a identificação através de STRs possa ser

rapidamente incorporada com efetiva confiabilidade à população brasileira, é de

extrema importância a realização de estudos populacionais (OLIVEIRA et al, 2002) e

nestes estudos a investigação deve ser realizada em indivíduos sem nenhum grau

de parentesco, a fim de possibilitar a determinação da frequência alélica da

população.

Para a realização da identificação humana é mais interessante utilizar

marcadores moleculares que apresentem grande variabilidade dentro da população,

ou seja, alto grau de polimorfismo, de forma que a probabilidade de duas pessoas

apresentarem um mesmo alelo torne-se menor. Sendo assim, a realização de

pesquisas para a obtenção de frequências alélicas populacionais tornam-se

extremamente importantes, possibilitando a divulgação desses dados, através da

literatura científica e, também, por banco de dados (sistemas nos quais são

armazenados perfis de DNA referentes a um conjunto de marcadores moleculares)

podendo ser aplicados na investigação forense (GÓIS, 2006).

Populações que se encontram em regiões diferentes ou apresentam origem

distinta podem apresentar alelos em frequências diferentes e algumas vezes, únicos.

Portanto, quando se deseja identificar um indivíduo proveniente de determinada

população, é necessário o estudo de diferentes marcadores naquela população para

saber quais são os alelos presentes e em que frequência, a fim de se definir quais

são os melhores marcadores a serem utilizados nestes casos.

Tal distribuição alélica será aplicada nos cálculos estatísticos realizados em

testes de identificação humana e de paternidade, a fim de dar força e credibilidade às

informações obtidas pela análise da evidência genética (amostra biológica). A base

para esses cálculos de frequências de alelos derivou dos estudos de Hardy-

Weinberg. O Princípio de Hardy-Weinberg é um modelo matemático simples que

demonstra que as frequências genotípicas de uma população se mantêm constantes

quando não há força evolutiva atuando sobre a mesma. Para que o princípio possa

ser demonstrado, a população em questão deve estar em equilíbrio genético,

devendo ela apresentar as seguintes características (BEIGUELMAN, 2008):

1) A população analisada deve ser grande o suficiente para que não ocorram

desvios estatísticos;

31

2) Não deve haver fluxo gênico entre diferentes populações;

3) Não deve haver a ocorrência de mutações;

4) Os casamentos devem ocorrer aleatoriamente, não existindo, por

conseguinte, casamentos preferenciais entre indivíduos por causa de seu genótipo,

fenótipo, estratificação social ou consangüinidade. Aliás, por serem os casamentos

realizados aleatoriamente, os casamentos consangüíneos podem existir, desde que

ocorram aleatoriamente

5) Não pode haver atuação da seleção natural.

Este tipo de população é chamada de população ideal e apesar de nenhuma

população humana preencher as condições descritas acima, a prática tem

demonstrado que em numerosas populações humanas, os genótipos se distribuem

de acordo com a Lei de Hardy-Weinberg, sendo esta muito útil para se estudarem

populações e os mecanismos evolutivos que violam o Princípio (BEIGUELMAN,

2008).

Existem diversos parâmetros estatísticos para determinar a eficácia de um

marcador genético na conclusão de casos na área da Genética e Biologia Forense,

sendo diferentes para cada situação (investigação biológica de filiação, criminalística

biológica e identificação genética individual). Para que se possa usar um marcador

genético tem que se realizar um estudo desse marcador na população em questão.

Abaixo estão listados aguns dos principais parâmetros populacionais usado em

Genética e Biologia Forense (BEIGUELMAN, 2008; McMANUS et al, 2011):

• Poder de Exclusão: O PE de um marcador genético numa determinada

população é um parâmetro importante no que concerne à investigação

biológica da paternidade. Pode ser definido como a percentagem de

indivíduos falsamente acusados, cuja paternidade ficaria excluída, com

base nesse marcador.

• Poder de Discriminação: O PD é um parâmetro estatístico a priori que se

define como a probabilidade de dois indivíduos, retirados ao acaso da

mesma população e não aparentados entre si, se possam diferenciar

geneticamente, mediante a análise de um sistema ou conjunto de

sistemas genéticos. Quanto maior for o número de sistemas genéticos

considerados, maior o valor de PD, existindo maior capacidade de

discriminar vários indivíduos de uma população.

32

• Probabilidade de Matching (MP): Também conhecida como Match

Probability ou Probabilidade de Coincidência, é a probabilidade de dois

indivíduos terem o mesmo padrão genotípico. Portanto, é o oposto da

Probabilidade de Discriminação.

• Heterozigosidade: Trata-se de um parâmetro que representa a

probabilidade de dois alelos do mesmo locus, escolhidos ao acaso na

população, serem diferentes. A heterozigosidade observada (Ho) define-

se como o número de indivíduos heterozigóticos observados,

relativamente ao número total de indivíduos da população. A variabilidade

genética de uma população é quantificada pela heterozigosidade média

esperada (He) por locus. Este valor consiste na média aritmética dos

valores de heterozigosidade dos vários loci analisados. He difere de Ho

porque ela é uma previsão baseada na frequência alélica conhecida,

oriunda de amostras individuais.

• Conteúdo Informativo de Polimorfismo (PIC): É a capacidade informativa

de um locus analisando-se seu conteúdo em informação polimórfica. PIC

superiores a 0,5 são considerados muito informativos.

33

3 JUSTIFICATIVA

Até o presente momento, há poucos trabalhos no Brasil cujo enfoque esteja

voltado para a construção de um banco de dados de frequências alélicas para os

marcadores comumente utilizados em identificação humana, que contemplem 15 loci

polimórficos ou mais, assim como uma maior quantidade de indivíduos analisados.

Portanto, faz-se necessário a caracterização da população do estado do Rio

Grande do Norte através da introdução de mais marcadores genético moleculares,

capazes de auxiliar na resolução de identificação humana (testes de paternidade) e

de medicina forense.

34

4 OBJETIVOS

4.1 OBJETIVO GERAL

Propor a montagem de um banco de dados composto pelas frequências

alélicas de 15 loci polimórficos de um grupo de indivíduos no estado do Rio Grande

do Norte.

4.2 OBJETIVOS ESPECÍFICOS

Determinar parâmetros populacionais de importância para estudos de

identificação humana, tais como índices de Heterozigozidade, Poder de Exclusão,

Poder de Discriminação, Índice de Paternidade típico, entre outros.

Fazer uma comparação genético-populacional entre o Rio Grande do Norte e

outras populações do Brasil (com dados de outros autores), com base nos

resultados obtidos dos loci analisados neste trabalho.

35

5 METODOLOGIA

5.1 CASUÍSTICA

As amostras que alimentam o banco de dados do laboratório utilizadas neste

trabalho são provenientes de sangue periférico coletados por punção digital de 1100

indivíduos não relacionados entre si, saudáveis, de ambos os sexos e obtidos de

casos de teste de paternidade no estado do Rio Grande do Norte, divididos entre

551 homens e 549 mulheres. No momento da coleta do material biológico utilizado

para avaliação dos seus padrões genéticos para fins de paternidade, cada indivíduo

assinou um documento denominado “Termo de Identificação das Partes e

Autorização para Realização da Coleta”, no qual afirmou que os materiais foram

coletados em única oportunidade, que ali se encontrava de livre e espontânea

vontade, que não sofreu transfusão sanguínea recente, nem transplante de medula

óssea, e que os dados gerados poderiam ser utilizados para fins estatísticos.

Tais amostras foram coletadas em Natal-RN, no Laboratório DNA Center, e

em laboratórios de apoio no estado, localizados em Mossoró, Caicó, Nova Cruz,

Assu, Canguaretama, Goianinha e Campo Grande. O processamento do material

utilizado foi realizado no Laboratório DNA Center.

5.2 MATERIAIS E MÉTODOS

5.2.1 Extração do DNA

O DNA genômico foi extraído das células brancas do sangue periférico,

impregnado em papel de filtro FTA Card® (Whatman Bioscience, Cambridge, UK).

Tal método de coleta permite a conservação da amostra sem a necessidade de

refrigeração, pois é impregnado com uma mistura de substâncias químicas

responsáveis por lisar a membrana celular, imobilizar e estabilizar os ácidos

36

nucléicos e inibir o crescimento de bactérias, fungos e vírus, permitindo a

conservação da amostra à temperatura ambiente por vários anos (SMITH;

BURGOYNE, 2004). Assim, as amostras biológicas podem ser transportadas e

armazenadas de forma prática, facilitando a rotina laboratorial. Outra grande

vantagem do papel de filtro FTA Card® é que resultados consistentes podem ser

obtidos sem necessidade de quantificação do DNA (BUTLER, 2005).

Foi utilizado um disco de 1,5 mm de diâmetro deste papel de filtro, cortado

com o auxilio do dispositivo Harris Micro Punch® (Whatman-Bioscience) e

depositados em microtubos de 200 µL. Em seguida, o disco foi submetido a duas

lavagens de 30 minutos, com agitação manual por inversão a cada 5 minutos, uma

com 200 µL do reagente FTA® Purification Reagent, da Whatman-GE, e outra com

200 µL de água ultrapura. Após as duas lavagens, o disco contendo DNA secou em

temperatura ambiente por algumas horas, antes da amplificação.

Figura 6: Material utilizado na extração de DNA pelo método FTA Card.

Fonte: Acervo pessoal

5.2.2 Amplificação

Na determinação dos 15 loci polimórficos, foi utilizada a técnica de Reação

em Cadeia da Polimerase (PCR) pelo sistema Multiplex, ou seja, os 15 loci foram

amplificados numa mesma reação, em termoclicador Veriti 96-Well Thermal Cycler

(Applied Biosystems, Foster City, CA, USA). Aproximadamente 1 ng de DNA

(quantidade prevista, de acordo com o fabricante, em um disco extraído) foi

amplificado utilizando o kit comercial AmpFlSTR® Identifiler PCR Amplification Kit

(Applied Biosystems), com um volume final de 12,5 µL. As condições de ciclos da

PCR foram as seguintes: 95° C por 11 minutos (desnaturação da fita dupla de DNA);

37

28 ciclos de 94° C por 1 minuto, 59° C por 1 minuto e 72° C por 1 minuto (ciclos de

desnaturação, anelamento dos primers e extensão da nova fita de DNA); em

seguida 60° C por 60 minutos (extensão final) e 4° C por infinito tempo, obedecendo

as condições padronizadas pelo fabricante.

A figura 7 representa os 15 loci analisados no kit AmpFlSTR® Identifiler, seus

respectivos tamanhos de fragmentos gerados após amplificação e as cores

representativas de seus marcadores fluorescentes.

Figura 7: Loci contemplados no kit AmpFlSTR Identifiler.

Fonte: Manual do fabricante

5.2.3 Análise de Fragmentos

Os produtos amplificados sofreram eletroforese capilar em sequenciador ABI

3130® Genetic Analyzer (Applied Biosystems). Amostra de um µL de produto de

PCR foi adicionada a 8,7µL de Hi-Di Formamide (agente desnaturante) e 0,3 µL de

padrão interno GeneScan-500 LIZ Size Standard. A eletroforese foi gerenciada

utilizando o software Data Collection (versão 3.0) (Applied Biosystems).

A análise dos dados e o tamanho do fragmento alélico foram determinados

utilizando o software Genemapper ID (versão 3.2). Um padrão de peso molecular

(allelic ladder, ou escada alélica) fornecido no kit foi utilizado para determinação

38

alélica. A figura 8 exemplifica um eletroferograma, mostrando os 15 loci STR

estudados e seus alelos, assim como o marcador sexual Amelogenina.

Figura 8: Eletroferograma, contemplando os 15 STRs

analisados e o marcador sexual Amelogenina. Fonte: Acervo do laboratório

39

5.2.4 Controles

AmpFlSTR® Control DNA 9947A foi utilizado como controle da reação de

amplificação e para certificação do correto alinhamento da escada alélica.

Amostras do controle de qualidade do GEP-ISFG (Grupo Espanhol e

Português da Sociedade Internacional de Genética Forense) e do PNCQ (Programa

Nacional de Controle de Qualidade) foram analisadas para testar a qualidade da

metodologia. Todos os resultados obtidos estavam de acordo com os controles de

qualidade.

5.2.5 Análises Estatísticas

Foi realizado o cálculo amostral para se obter o número de indivíduos

representativo de cada mesorregião estudada, assim como do Estado do Rio

Grande do Norte como um todo.

Após a obtenção dos perfis alélicos, foram determinadas as frequências

alélicas dos 15 marcadores. A determinação dessas frequências foi realizada com o

auxílio do programa PowerStats ver. 12 (Promega) pelo método da frequência

relativa, ou seja, através do número de repetições do alelo observado nas amostras

(TEREBA, 1999). Foram calculados também por este programa os parâmetros

estatísticos de interesse na prática forense e em exames de paternidade.

Posteriormente, com os dados de frequência obtidos, foi realizado com o programa

Arlequim ver. 3.11 o Teste Exato para avaliar a divergência do Equilíbrio de Hardy-

Weimberg. O programa Arlequin fornece métodos para analisar os padrões de

diversidade genética dentro e entre amostras de uma população (EXCOFFIER et al,

2005).

40

5.2.6 Aspectos Éticos

No presente estudo não houve a identificação pessoal dos indivíduos, visto

que as análises foram restritas aos alelos investigados obtidos do banco de dados

do laboratório DNA Center. Este estudo faz parte do projeto aprovado pelo CEP-

UFRN com o número do processo 0312.0.000-051-06, que tem por objetivo

investigar polimorfismos de doenças hereditárias e de identificação humana.

6 RESULTADOS E DISCUSSÃO

Para uma melhor representatividade da população do Rio Grande do Norte

como um todo, as amostras obtidas foram classificadas nas quatro mesorregiões

estabelecidas pelo IBGE, de acordo com a c

Mesorregião é uma subdivisão dos estados brasileiros que congrega diversos

municípios de uma área geográfica com sim

2010). São elas: Mesorregião Oeste

(M2), Mesorregião Agreste Potiguar (M3) e Mesorregião Leste Potiguar (M4),

indicadas na figura 7.

A mesorregião Oeste Potiguar é a de maior extensão territorial, com

21.167,130 km2, englobando também a maior quantidade de municípios (62 ao todo)

com uma população de 781.439 habitantes.

menos populosa, com 374.364 habitantes

km². A mesorregião do Agreste Potiguar é a terceira mais populosa do estado,

sendo a única em que nenhum de seus municípios possui litoral, possuindo

aproximadamente 414.021 habitantes, distribuídos em uma área territorial de

RESULTADOS E DISCUSSÃO


amostras obtidas foram classificadas nas quatro mesorregiões

estabelecidas pelo IBGE, de acordo com a cidade natal de cada indivíduo.

esorregião é uma subdivisão dos estados brasileiros que congrega diversos

municípios de uma área geográfica com similaridades econômicas e sociais (IBGE,

elas: Mesorregião Oeste Potiguar (M1), Mesorregião Central Potiguar

Agreste Potiguar (M3) e Mesorregião Leste Potiguar (M4),

Figura 9: Mesorregiões do Rio Grande do NorteFonte: http://portal.rn.gov.br

região Oeste Potiguar é a de maior extensão territorial, com

, englobando também a maior quantidade de municípios (62 ao todo)

com uma população de 781.439 habitantes. A mesorregião Central

374.364 habitantes distribuídos em uma área de

A mesorregião do Agreste Potiguar é a terceira mais populosa do estado,


414.021 habitantes, distribuídos em uma área territorial de

41


amostras obtidas foram classificadas nas quatro mesorregiões

idade natal de cada indivíduo.

esorregião é uma subdivisão dos estados brasileiros que congrega diversos

dades econômicas e sociais (IBGE,

Potiguar (M1), Mesorregião Central Potiguar

Agreste Potiguar (M3) e Mesorregião Leste Potiguar (M4),

Norte

região Oeste Potiguar é a de maior extensão territorial, com

, englobando também a maior quantidade de municípios (62 ao todo)

mesorregião Central Potiguar é a

em uma área de 15.810,436

A mesorregião do Agreste Potiguar é a terceira mais populosa do estado,


414.021 habitantes, distribuídos em uma área territorial de

9.367,384 km2. E finalmente,

extensão territorial (6.451,841 km²), sendo a mais populosa do estado, com

1.473.936 habitantes (IBGE, 2010).

A tabela 1 apresenta a quantidade de habitantes de cada mesorregião do Rio

Grande do Norte e o número de ind

distribuições destes em cada mesorregião.

Tabela 1: Distribuição das 1100 amostras entre as

MESORREGIÃO

Oeste Potiguar (M1) Central Potiguar (M2) Agreste Potiguar (M3) Leste Potiguar (M4)

TOTAL

Figura 10: Distribuição dos indivíduos estudados entre as

mesorregiões do RN

As frequências alélicas dos 15

pessoas nascidas no Rio Grande do Norte estão apresentadas na Tabela 2, assim

como os parâmetros estatísticos

paternidade e o Equilíbrio de Hardy

DISTRIBUIÇÃO ENTRE AS MESORREGIÕES

. E finalmente, a mesoregião do Leste Potiguar, que possui a menor

451,841 km²), sendo a mais populosa do estado, com

1.473.936 habitantes (IBGE, 2010).

bela 1 apresenta a quantidade de habitantes de cada mesorregião do Rio

número de indivíduos estudados, já a figura 10

distribuições destes em cada mesorregião.

Tabela 1: Distribuição das 1100 amostras entre as Mesorregiões

NÚMERO DE INDIVÍDUOS ESTUDADOS

NÚMERO DE INDIVÍDUOS TOTAIS

278 781.439

183 374.364179 414.021460 1.473.936

1100 3.168.027

: Distribuição dos indivíduos estudados entre as

mesorregiões do RN

As frequências alélicas dos 15 loci STRs estudados na população de


como os parâmetros estatísticos importantes para estudos forenses e teste de

ade e o Equilíbrio de Hardy-Weinberg.

Oeste Potiguar

(M1)

25%

Central Potiguar

(M2)

17%Agreste

Potiguar (M3)

16%

Leste Potiguar

(M4)

42%

DISTRIBUIÇÃO ENTRE AS MESORREGIÕES

42

a mesoregião do Leste Potiguar, que possui a menor

451,841 km²), sendo a mais populosa do estado, com

bela 1 apresenta a quantidade de habitantes de cada mesorregião do Rio

ivíduos estudados, já a figura 10 apresenta as

Mesorregiões:

NÚMERO DE INDIVÍDUOS TOTAIS

781.439

374.364 414.021

1.473.936

3.168.027

: Distribuição dos indivíduos estudados entre as

STRs estudados na população de


importantes para estudos forenses e teste de

43

Tabela 2: Frequência alélica e parâmetros estatísticos para os 15 STRs estudados na

população do Rio Grande do Norte

ALELO D21S11 D13S317 D3S1338 VWA D7S820 D16S539 D18S51 CSF D5S818 TH01 TPOX FGA D8S1179 D2S1338 D19S433

6

0,223 0,023

7

0,011

0,012 0,034 0,231 0,001

8

0,098

0,140 0,031

0,022 0,016 0,146 0,455

0,006

9

0,086

0,118 0,174

0,019 0,036 0,175 0,117

0,006

0,001

9,3

0,217

10

0,054

0,298 0,081 0,007 0,234 0,080 0,008 0,055

0,069

0,005

11

0,288 0,001 0,001 0,230 0,273 0,012 0,312 0,320

0,293

0,063

0,022

11,2

0,001

12

0,301 0,004

0,177 0,273 0,125 0,325 0,326

0,056

0,143

0,106

12,2

0,013

13

0,127 0,005 0,005 0,023 0,148 0,120 0,062 0,174

0,271

0,260

13,2

0,001

0,043

14

0,044 0,095 0,079 0,003 0,020 0,156 0,010 0,011

0,260 0,001 0,286

14,2

0,001

0,033

15

0,002 0,304 0,118

0,001 0,167 0,003 0,002

0,143 0,002 0,133

15,2

0,048

16

0,251 0,272

0,133

0,035 0,036 0,032

16,2

0,013

17

0,203 0,283

0,124

0,001 0,003 0,214 0,001

17,2

0,001

18

0,128 0,155

0,069

0,009

0,095 0,001

18,2

0,002

0,001

19

0,009 0,067

0,048

0,065

0,122

20

0,018

0,019

0,112

0,136

21

0,002

0,009

0,160

0,050

22

0,005

0,141

0,072

22,2

0,003

23

0,001

0,146

0,112

23,2

0,002

24

0,159

0,072

24,2 0,001

0,000

25 0,001

0,122

0,065

26 0,001

0,050

0,021

27 0,023

0,001

0,013

0,002

28 0,153

0,005

29 0,217

0,002

30 0,261

0,001

30,2 0,025

31 0,052

31,2 0,104

0,002

32 0,014

32,2 0,102

0,001

33 0,001

33,2 0,026

34,2 0,003

0,001

35 0,003

36 0,009

43,2

0,001

45,2 0,001

n 2200 2200 2200 2200 2200 2200 2200 2200 2200 2200 2200 2200 2200 2200 2200

Ho 0.820 0,775 0,764 0,782 0,763 0,800 0,877 0,726 0,720 0,768 0,672 0,865 0,77 0,878 0,813

He 0.839 0.788 0,778 0,798 0,793 0,793 0,877 0,735 0,752 0,797 0,686 0,874 0,808 0,881 0,814

P <0,001 0.839 0,316 0,379 0,100 0,552 0,496 0,786 0,128 0,569 0,695 0,341 0,259 0,017 0,031

PD 0,954 0,927 0,917 0,933 0,928 0,924 0,971 0,884 0,901 0,929 0,856 0,970 0,939 0,974 0,940

PE 0,636 0,554 0,533 0,566 0,532 0,599 0,749 0,494 0,460 0,552 0,386 0,763 0,545 0,751 0,623

PIC 0.820 0,762 0,743 0,769 0,762 0,761 0,869 0,691 0,713 0,766 0,639 0,860 0,782 0,869 0,792

PI 2,780 2,227 2,115 2,292 2,107 2,500 4,074 1,930 1,786 2,216 1,522 3,691 2,174 4,104 2,670

MP 0,046 0,073 0,083 0,067 0,072 0,076 0,029 0,116 0,099 0,071 0,144 0,030 0,061 0,026 0,060

n: número de alelos analisados; Ho: heterozigose observada; He: heterozigose esperada; P: Equilíbrio de Hardy-Weinberg, baseado no teste exato de Markov; PD: poder de discriminação; PE: poder de exclusão; PIC: conteúdo informativo de polimorfismo; PI: índice de paternidade típico; MP: Probabilidade de 2 indivíduos terem o mesmo padrão genotípico.

44

A maioria dos marcadores avaliados em nosso estudo apresentou-se em

equilíbrio de Hardy-Weinberg (HW), com exceção dos loci D2S1338, D19S433 e

D21S11 que apresentaram valor de P inferior ao nível de significância admitido de

0,05. Entretanto, após a correção de Bonferroni (WEIR et al, 1996) utilizando o

número de loci analisados, as diferenças observadas não foram estatisticamente

significativas, com exceção do locus D21S11 (P<0,0033). Tal fato demonstra uma

situação de normalidade na distribuição populacional.

Estudos realizados em outros estados do Brasil também mostraram algumas

inconsistências no equilíbrio de HW em relação a alguns marcadores. O locus

D21S11 se apresentou em desequilíbrio no estudo realizado com 3000 indivíduos

em Santa Catarina (OCAMPOS et al, 2009).

Analisando os parâmetros mostrados na Tabela 2 por meio dos testes

estatísticos, observou-se que para todos os marcadores, os índices de

Heterozigosidade esperados situam-se próximos aos níveis de Heterozigosidade

observados. O locus D2S1338 apresentou o maior nível de Heterozigosidade

(87,8%), enquanto que o locus TPOX apresentou o menor nível (67%), sendo este,

portanto, o de menor grau de variabilidade, corroborando com os estudos de

Grattapaglia et al em 2001.

Dos quinze loci estudados, os loci D2S133 e D18S51 apresentaram, ambos,

PIC de 0,869, sugerindo alto poder informativo pois apresentaram maior conteúdo

polimórfico. Diferentemente do D2S1338 e D18S51, o locus menos informativo

encontrado foi TPOX, com PIC de 0,639, o qual, também foi encontrado na pesquisa

de Fridman et al, em 2008.

Outro requisito analisado para a variabilidade na aplicação forense é o Poder

de Discriminação, a fim de verificar a probabilidade de que, ao escolher

aleatoriamente uma amostra, ela possa ser identificada em relação às demais

(DESMARAIS et al, 1998). Os loci mais polimórficos e mais discriminativos

analisados no presente trabalho foram respectivamente: D2S1338 (PD = 0,974),

D18S51 (PD = 0,971) e FGA (PD = 0,970). Nossos achados corroboram exatamente

o que foi encontrado no estudo feito na população brasileira (FRIDMAN et al, 2008)

e no Rio Grande do Sul (CHULA et al, 2008), assim como na maioria dos estudos

que contemplam esses marcadores.

O Poder de Exclusão, como mencionado anteriormente, é um parâmetro

importante no que concerne à investigação biológica de paternidade, sendo definido

45

como a percentagem de indivíduos falsamente acusados, cuja paternidade ficaria

excluída, com base nesse marcador. No nosso estudo, os três loci com maior PE

foram FGA, D2S1338 e D18S51, com valores entre 0,763 e 0,749, também

corroborando com os estudos que contemplam estes marcadores, variando apenas

a sua ordem. Entretanto, em todos os estudos avaliados que contemplam o locus

TPOX, este apresentou-se com o menor Poder de Exclusão (FRIDMAN et al, 2008;

CHULA et al, 2008; FERREIRA DA SILVA et al, 2002; OCAMPOS et al, 2009;

GRATTAPAGLIA et al, 2001; DELLALIBERA et al., 2004; GÓES et al, 2004;

POIARES et al, 2009).

As frequências alélicas encontradas na população do Rio Grande do Norte

foram comparadas com as frequências encontradas em outros estudos

populacionais, tais como Paraíba (GOMES et al, 2007), Pernambuco

(DELLALIBERA et al, 2004), Amazonas (RODRIGUES et al, 2007), Rio de Janeiro

(GÓES et al, 2004), Mato Grosso do Sul (SILVA et al, 2004), Paraná (POIARES et

al, 2009), Santa Catarina (OCAMPOS et al, 2009), Rio Grande do Sul (CHULA et al,

2009) e dois estudos da população brasileira (GRATTAPAGLIA et al, 2001;

FRIDMAN et al,2008). Estas estão apresentadas nas tabelas a seguir: D21D11

(Tabela 3); D13S317 (Tabela 4); D3S1358 (Tabela 5); vWA (Tabela 6); D7S820

(Tabela 7); D16S539 (Tabela 8); D18S51 (Tabela 9); CSF (Tabela 10); D5S818

(Tabela 11); TH01 (Tabela 12); TPOX (Tabela 13); FGA (Tabela 14); D8S1179

(Tabela 15); D2S1338 (Tabela 16); D19S422 (Tabela 17).

46

Tabela 3: Frequências alélicas para o locus D21S11

ALELO RN PB PE AM RJ MS PR SC RS BR1 BR2

24,2 0,001 - - 0,006 0,003 - 0,002 0,001 0,001 0,003 0,003

25 0,001 0,002 0,001 0,003 0,001 - 0,001 - 0,001 0,001 0,001

26 0,001 - 0,005 0,003 - - 0,001 0,001 0,001 0,001 -

27 0,023 0,028 0,009 0,031 0,025 0,025 0,026 0,027 0,025 0,028 0,034

28 0,153 0,173 0,077 0,115 0,183 0,113 0,153 0,14 0,151 0,141 0,162

29 0,217 0,199 0,199 0,191 0,16 0,211 0,219 0,223 0,217 0,217 0,203

30 0,261 0,203 0,222 0,271 0,25 0,24 0,247 0,236 0,249 0,253 0,224

30,2 0,025 0,033 0,004 0,054 0,021 0,039 0,032 0,034 0,033 0,038 0,028

31 0,052 0,079 0,161 0,078 0,065 0,103 0,059 0,073 0,064 0,063 0,065

31,2 0,104 0,105 0,035 0,08 0,108 0,098 0,097 0,105 0,103 0,099 0,103

32 0,014 0,014 0,083 0,012 0,011 0,015 0,011 0,008 0,008 0,012 0,011

33 0,001 0,010 0,087 0,003 0,001 - 0,001 0,001 0.001 0,002 0,004

32,2 0,102 0,079 0,074 0,1 0,098 0,078 0,103 0,106 0,094 0,100 0,093

33,2 0,026 0,019 0,002 0,029 0,037 0,059 0,036 0,034 0,035 0,033 0,039

34,2 0,003 0,006 0,001 0,008 0,006 0,005 0,003 0,002 0,004 0,002 0,004

35 0,003 0,014 0,012 0,003 0,008 0,005 0,003 0,002 0,005 0,004 0,013

36 0,009 0,003 0,003 0,006 0,005 0,005 0,001 0,001 0,001 0,001 -

RN: Rio Grande do Norte; PB: Paraíba; PE: Pernambuco; AM: Amazonas; RJ: Rio de Janeiro; MS: Mato Grosso do Sul; PR: Paraná; SC: Santa Catarina; RS: Rio Grande do Sul; BR1: Brasil (2001); BR2: Brasil (2008).



8 0,098 0,08 0,079 0,1 0,076 0,077 0,112 0,109 0,1 0,113 0,088

9 0,086 0,087 0,082 0,115 0,078 0,091 0,092 0,084 0,089 0,095 0,077

10 0,054 0,077 0,056 0,042 0,065 0,024 0,06 0,054 0,057 0,055 0,051

11 0,288 0,297 0,338 0,222 0,298 0,322 0,292 0,298 0,286 0,298 0,279

12 0,301 0,317 0,304 0,314 0,322 0,308 0,274 0,277 0,294 0,274 0,249

13 0,127 0,102 0,103 0,152 0,128 0,13 0,159 0,129 0,121 0,114 0,138

14 0,044 0,04 0,036 0,009 0,031 0,048 0,047 0,047 0,049 0,048 0,048

15 0,002 - 0,002 0,002 - - 0,002 0,002 0,002 0,003 -



ALELO RN AM RJ MS PR SC RS BR1 BR2

11 0,001 - 0,001 - 0,001 0,001 - 0,001 -

12 0,004 0,002 0,001 0,01 0,002 0,002 0,002 0,003 -

13 0,005 0,003 0,001 0,005 0,003 0,002 0,003 0,003 -

14 0,095 0,059 0,1 0,064 0,097 0,091 0,1 0,092 0,076

15 0,304 0,322 0,293 0,294 0,286 0,284 0,293 0,292 0,324

16 0,251 0,289 0,262 0,255 0,253 0,265 0,265 0,252 0,276

17 0,203 0,157 0,205 0,186 0,204 0,212 0,195 0,218 0,201

18 0,128 0,134 0,126 0,181 0,142 0,133 0,128 0,126 0,108

19 0,009 0,023 0,008 0,005 0,012 0,009 0,012 0,011 0,008

RN: Rio Grande do Norte; AM: Amazonas; RJ: Rio de Janeiro; MS: Mato Grosso do Sul; PR: Paraná; SC: Santa Catarina; RS: Rio Grande do Sul; BR1: Brasil (2001); BR2: Brasil (2008).

47

Tabela 6: Frequências alélicas para o locus vWA


11 0,001 0,005 0,007 0,008 0,008 - 0,002 0,001 0,003 0,002 0,004

13 0,005 0,005 0,007 0,015 0,006 0,01 0,004 0,002 0,003 0,006 0,002

14 0,079 0,068 0,074 0,068 0,083 0,088 0,088 0,086 0,081 0,084 0,084

15 0,118 0,105 0,152 0,134 0,162 0,113 0,124 0,121 0,122 0,123 0,138

16 0,272 0,302 0,256 0,263 0,243 0,275 0,249 0,245 0,262 0,246 0,262

17 0,283 0,253 0,27 0,288 0,255 0,275 0,264 0,267 0,263 0,274 0,248

18 0,155 0,182 0,158 0,148 0,165 0,142 0,184 0,185 0,179 0,184 0,156

19 0,067 0,07 0,061 0,057 0,058 0,074 0,069 0,077 0,077 0,061 0,079

20 0,018 0,008 0,013 0,02 0,015 0,02 0,013 0,014 0,009 0,019 0,015

21 0,002 0,002 0,001 - 0,003 0,005 0,002 0,001 0,001 0,001 0,004




7 0,011 0,009 0,017 0,019 0,02 0,024 0,017 0,018 0,012 0,012 0,012

8 0,140 0,128 0,148 0,132 0,187 0,159 0,156 0,134 0,139 0,162 0,177

9 0,118 0,122 0,112 0,117 0,096 0,096 0,118 0,127 0,02 0,124 0,133

10 0,298 0,31 0,286 0,297 0,298 0,269 0,267 0,275 0,276 0,259 0,291

11 0,230 0,222 0,228 0,212 0,2 0,245 0,238 0,239 0,245 0,256 0,228

12 0,177 0,167 0,169 0,117 0,156 0,173 0,169 0,167 0,168 0,163 0,31

13 0,023 0,039 0,035 0,095 0,036 0,029 0,031 0,035 0,027 0,021 0,067

14 0,003 0,003 0,005 0,009 0,005 0,005 0,003 0,003 0,003 0,003 0,007




8 0,031 0,022 0,015 0,026 0,025 0,029 0,022 0,021 0,021 0,023 0,02

9 0,174 0,158 0,157 0,177 0,198 0,163 0,142 0,134 0,146 0,159 0,18

10 0,081 0,105 0,093 0,099 0,068 0,053 0,072 0,075 0,084 0,084 0,103

11 0,273 0,296 0,303 0,286 0,282 0,298 0,289 0,296 0,283 0,295 0,285

12 0,273 0,249 0,235 0,239 0,235 0,26 0,284 0,281 0,279 0,25 -

13 0,148 0,142 0,17 0,151 0,161 0,149 0,159 0,167 0,164 0,156 -

14 0,020 0,026 0,026 0,019 0,03 0,048 0,029 0,023 0,022 0,029 0,022

15 0,001 0,002 0,001 0,003 - - 0,001 0,001 0,002 0,003 -


48



10 0,007 0,006 0,01 0,009 0,016 0,01 0,011 0,011 0,012 0,01 0,003

11 0,012 0,019 0,032 0,008 0,005 0,015 0,01 0,01 0,005 0,011 0,013

12 0,125 0,097 0,121 0,12 0,121 0,093 0,125 0,137 0,129 0,134 0,336

13 0,120 0,137 0,123 0,115 0,116 0,108 0,125 0,111 0,106 0,113 0,203

13,2 0,001 - - - - - - - 0,001 0,001 0,001

14 0,156 0,148 0,152 0,159 0,115 0,176 0,173 0,055 0,184 0,141 0,133

14,2 0,001 - 0,001 - - - 0,001 - - - -

15 0,167 0,134 - 0,139 0,148 0,147 0,148 0,149 0,145 0,139 0,139

16 0,133 0,149 0,001 0,169 0,152 0,132 0,134 0,139 0,141 0,152 0,153

17 0,124 0,134 0,165 0,122 0,118 0,132 0,116 0,118 0,114 0,137 0,136

18 0,069 0,069 0,13 0,088 0,083 0,18 0,067 0,077 0,067 0,071 0,082

19 0,048 0,039 0,109 0,037 0,058 0,049 0,042 0,046 0,055 0,046 0,067

20 0,019 0,016 0,019 0,025 0,033 0,015 0,023 0,017 0,018 0,025 0,032

21 0,009 0,028 0,012 0,005 0,013 0,015 0,011 0,007 0,009 0,011 0,015

22 0,005 0,006 0,001 0,003 0,011 - 0,004 0,003 0,004 0,005 0,003

23 0,001 0,002 0,001 - 0,001 - 0,002 0,001 0,001 0,001 0,001

27 0,001 - - - 0,001 0,025 0,001 - - - 0,001


Tabela 10: Frequências alélicas para o locus CSF


7 0,012 0,014 0,017 0,011 0,026 0,029 0,004 0,005 0,01 0,01 0,025

8 0,022 0,02 0,018 0,017 0,016 0,01 0,01 0,009 0,01 0,012 0,024

9 0,019 0,031 0,019 0,022 0,02 0,024 0,024 0,02 0,02 0,018 0,022

10 0,234 0,276 0,306 0,274 0,272 0,25 0,265 0,269 0,264 0,263 0,269

11 0,312 0,286 0,269 0,295 0,278 0,327 0,303 0,296 0,299 0,307 0,275

12 0,325 0,297 0,313 0,303 0,323 0,288 0,316 0,32 0,316 0,326 0,002

13 0,062 0,059 0,048 0,003 0,053 0,072 0,065 0,066 0,07 0,054 0,004

14 0,010 0,009 0,009 0,009 0,006 - 0,008 0,011 0,007 0,007 0,006

15 0,002 0,006 0,001 0,002 0,001 - 0,001 0,001 0,001 - -



ALELO RN AM RJ MS PR SC RS BR1 BR2

7 0,034 0.008 0,015 0,024 0,017 0,016 0.025 0,008 -

8 0,016 0.025 0,015 0,024 0,008 0,007 0,01 0,025 0,021

9 0,036 0.059 0,026 0,024 0,04 0,044 0,045 0,059 0,053

10 0,080 0,065 0,052 0,067 0,062 0,065 0,054 0,065 0,057

11 0,320 0,285 0,328 0,365 0,342 0,336 0,332 0,285 0,307

12 0,326 0,4 0,37 0,361 0,353 0,355 0,342 0,12 0,001

13 0,174 0,148 0,178 0,115 0,159 0,159 0,175 0,115 0,01

14 0,011 0,011 0,013 0,019 0,016 0,013 0,012 0,011 -

15 0,002 0,002 - - 0,001 0,001 0,001 0,002 -

RN: Rio Grande do Norte; AM: Amazonas; RJ: Rio de Janeiro; MS: Mato Grosso do Sul; PR: Paraná; SC: Santa Catarina; RS: Rio Grande do Sul; BR1: Brasil (2001); BR2: Brasil (2008).

49

Tabela 12: Frequências alélicas para o locus TH01


6 0,223 0,191 0,21 0,226 0,198 0,245 0,235 0,23 0,226 0,206 0,221

7 0,231 0,248 0,253 0,262 0,258 0,225 0,205 0,207 0,215 0,222 0,244

8 0,146 0,166 0,155 0,12 0,187 0,162 0,127 0,122 0,138 0,124 0,152

9 0,175 0,146 0,166 0,165 0,143 0,172 0,159 0,165 0,161 0,176 0,173

9,3 0,217 0,242 0,204 0,211 0,208 0,186 0,259 0,263 0,246 0,258 0,197

10 0,008 0,005 0,012 0,005 0,003 0,005 0,011 0,009 0,01 0,014 0,011


Tabela 13: Frequências alélicas para o locus TPOX


6 0,023 0,022 0,019 0,014 0,025 0,01 0,008 0,009 0,013 0,011 0,027

7 0,001 0,008 0,006 0,003 0,003 - 0,004 0,002 0,004 0,003 -

8 0,455 0,423 0,444 0,41 0,465 0,436 0,469 0,493 0,482 0,445 0,461

9 0,117 0,132 0,132 0,12 0,148 0,093 0,114 0,103 0,119 0,126 0,135

10 0,055 0,076 0,065 0,066 0,056 0,083 0,064 0,063 0,06 0,074 0,063

11 0,293 0,267 0,288 0,294 0,262 0,358 0,0282 0,275 0,265 0,291 0,263

12 0,056 0,07 0,046 0,092 0,038 0,015 0,054 0,048 0,051 0,048 0,114


Tabela 14: Frequências alélicas para o locus FGA

ALELO RN PE AM RJ MS PR SC RS BR1 BR2

17 0,001 0,002 - 0,001 0,005 0,001 0,001 0,001 - -

18 0,009 0,012 0,01 0,013 0,015 0,009 0,007 0,009 0,007 0,006

18,2 0,002 0,004 0,005 - - 0,001 0,001 0,002 - 0,004

19 0,065 0,049 0,099 0,048 0,083 0,077 0,072 0,074 0,063 0,08

20 0,112 0,106 0,118 0,111 0,118 0,119 0,119 0,103 0,112 0,106

21 0,160 0,14 0,14 0,151 0,167 0,164 0,163 0,158 0,168 0,145

22 0,141 0,153 0,135 0,197 0,113 0,162 0,162 0,169 0,177 0,167

22,2 0,003 0,010 0,002 - - 0,004 0,005 0,004 0,002 0,006

23 0,146 0,118 0,118 0,143 0,181 0,146 0,15 0,149 0,143 0,147

23,2 0,002 0,002 - - - 0,002 0,002 0,003 - 0,001

24 0,159 0,149 0,172 0,133 0,123 0,146 0,15 0,147 0,15 0,16

25 0,122 0,144 0,07 0,126 0,132 0,102 0,101 0,111 0,11 0,094

26 0,050 0,041 0,01 0,033 0,049 0,041 0,038 0,042 0,044 0,048

27 0,013 0,006 0,005 0,028 0,005 0,01 0,011 0,013 0,015 0,026

28 0,005 0,014 0,002 0,003 0,029 0,003 0,004 0,003 0,004 0,01

29 0,002 0,002 0,002 0,003 - 0,001 0,001 0,001 0,001 0,001

30 0,001 0,006 - 0,001 0,005 0,0004 - - 0,002 -

31,2 0,002 - - - - 0,001 0,001 0,001 - 0,002

32,2 0,001 - - - - 0,0002 - - - -

34,2 0,001 - - - - - - - - -

43,2 0,001 - - - - 0,0002 0,0003 - - -

45,2 0,001 - - - 0,001 0,0001 - 0,001 - 0,001

RN: Rio Grande do Norte; PE: Pernambuco; AM: Amazonas; RJ: Rio de Janeiro; MS: Mato Grosso do Sul; PR: Paraná; SC: Santa Catarina; RS: Rio Grande do Sul; BR1: Brasil (2001); BR2: Brasil (2008)

50



8 0,006 0,005 0,007 0,007 0,005 0,005 0,009 0,008 0,01 0,008 0,004

9 0,006 0,009 0,017 0,012 0,003 - 0,009 0,012 0,007 0,011 0,005

10 0,069 0,069 0,077 0,056 0,051 0,098 0,076 0,081 0,07 0,075 0,061

11 0,063 0,058 0,072 0,068 0,065 0,083 0,081 0,076 0,081 0,088 0,081

12 0,143 0,131 0,138 0,143 0,13 0,123 0,136 0,131 0,141 0,121 0,121

13 0,271 0,298 0,289 0,32 0,29 0,25 0,295 0,301 0,298 0,285 0,292

14 0,260 0,228 0,215 0,244 0,257 0,27 0,237 0,238 0,235 0,245 0,26

15 0,143 0,16 0,156 0,109 0,158 0,127 0,118 0,12 0,125 0,127 0,144

16 0,035 0,032 0,024 0,039 0,031 0,034 0,03 0,025 0,027 0,035 0,028

17 0,003 0,005 0,005 0,002 0,008 0,01 0,005 0,005 0,003 0,005 0,003



ALELO RN RJ PR RS BR2

14 0,001 - 0,001 0,001 -

15 0,002 - 0,001 0,002 0,001

16 0,036 0,041 0,041 0,043 0,057

17 0,214 0,226 0,209 0,213 0,208

18 0,095 0,058 0,092 0,091 0,075

19 0,122 0,118 0,115 0,123 0,116

20 0,136 0,135 0,136 0,129 0,122

21 0,050 0,062 0,042 0,047 0,079

22 0,072 0,094 0,058 0,057 0,087

23 0,112 0,099 0,127 0,127 0,097

24 0,072 0,081 0,086 0,079 0,083

25 0,065 0,06 0,074 0,066 0,059

26 0,021 0,019 0,014 0,016 0,014

27 0,002 0,002 0,002 0,002 0,003

RN: Rio Grande do Norte; RJ: Rio de Janeiro; PR: Paraná; RS: Rio Grande do Sul; BR2: Brasil (2008).

51


ALELO RN RJ PR RS BR2

9 0,001 0,002 - 0,0002 0,001

10 0,005 0,006 0,001 0,001 0,009

11 0,022 0,027 0,015 0,012 0,029

11,2 0,001 - - - -

12 0,106 0,067 0,092 0,1 0,002

12,2 0,013 0,012 0,009 0,011 0,016

13 0,260 0,234 0,238 0,242 0,008

13,2 0,043 0,035 0,034 0,039 0,052

14 0,286 0,286 0,307 0,299 0,277

14,2 0,033 0,052 0,026 0,028 0,045

15 0,133 0,15 0,155 0,158 0,127

15,2 0,048 0,05 0,055 0,049 0,045

16 0,032 0,046 0,041 0,037 0,037

16,2 0,013 0,029 0,016 0,015 0,019

17 0,001 - 0,001 0,002 0,003

17,2 0,001 - 0,001 0,001 0,002

18 0,001 - 0,0001 - -

18,2 0,001 - 0,0009 0,0002 0,002

RN: Rio Grande do Norte; RJ: Rio de Janeiro; PR: Paraná; RS: Rio Grande do Sul; BR2: Brasil (2008).

Foi possível encontrar neste estudo alguns alelos raros, não encontrados em

outros trabalhos aqui analisados, como o alelo 34,2 do locus FGA e os alelos 11,2 e

18 do locus D19S433.

Comparando-se as frequências alélicas dos 15 marcadores STRs estudados

neste trabalho com as frequências das populações mencionadas anteriormente, não

foram observadas diferenças representativas entre elas, de acordo com as Tabelas

3-17. Porém, dentre os estudos citados, foi observado uma maior aproximação com

relação à população do Rio Grande do Sul (CHULA et at., 2009), e no Nordeste,

com a população do Recife (DELLALIBERA et al, 2004). Por outro lado, observou-se

um maior distanciamento com relação à população do Amazonas (RODRIGUES et

al, 2007). Existem poucos trabalhos no Nordeste que contemplem os 15 marcadores

STRs estudados, tornando difícil uma comparação entre populações na nossa

região.

Por outro lado, quando comparamos apenas os alelos mais frequentes de

cada loci na tabela 18, percebemos que em 6 dos 15 loci estudados, não houve

coincidências entre os alelos mais freqüentes no Rio Grande do Norte e na

população brasileira, segundo Fridman et al, e em 3 de 13 loci comparados, entre a

52

população do Rio Grande do Norte e do Brasil, segundo Grattapaglia et al, podendo-

se suspeitar de um possível distanciamento entre os perfis genéticos das

populações. Este fato pode ser melhor esclarecido se realizado os testes de

distanciamento genético entre as populações.

Tabela 18: Alelos mais frequentes no RN e no Brasil

LOCUS RN BR1 BR2

D21S11 30 30 30

D13S317 12 11 11

D3S1358 15 15 15

VWA 17 17 16

D7S820 10 10 10

D16S539 11/12 11 11

D18S11 15 16 16

CSF 12 12 11

D5S818 12 11 11

TH01 7 7 7

TPOX 8 8 8

FGA 21 22 22

D8S1179 13 13 13

D2S1338 17

17

D19S433 14 14

RN: Rio Grande do Norte; BR1: Brasil (2001); BR2: Brasil (2008).

A origem da população potiguar está ligada à união de três povos:

negros, indígenas e portugueses, que também estão ligados à formação da

população brasileira. Entretanto, o Rio Grande do Norte também recebeu influência

de franceses, espanhóis e de forma mais acentuada, de holandeses, principalmente

no interior do Estado (IBGE, 2010).

Comparando-se nossos dados com os dados de um estudo realizado na

população do norte de Portugal (PINHEIRO et al, 2004), percebe-se a semelhança

entre os locus mais frequentes. Dos 13 loci comparados, apenas 4 não coincidiram,

mostrando uma forte aproximação entre as duas populações, como indicada na

tabela 19.

53

Tabela 19: Comparação entre os alelos mais frequentes no RN e em Portugal.

LOCUS RN PORTUGAL

D21S11 30 30

D13S317 12 11

D3S1358 15 15

VWA 17 17

D7S820 10 10

D16S539 11/12 12

D18S11 15 16

CSF 12 12

D5S818 12 12

TH01 7 9.3

TPOX 8 8

FGA 21 22

D8S1179 13 13

RN: Rio Grande do Norte

Com relação às frequências alélicas entre as mesorregiões do RN, foi

possível detectar um equilíbrio na distribuição destas. Os marcadores mais

polimórficos encontrados neste estudo são também os de maior diferença na

distribuição das frequências alélicas entre as mesorregiões, como é o caso do

D2S1338, D18S51 E FGA. O locus de distribuição mais homogênea é o TPOX.

O presente estudo se faz importante no meio jurídico, pois várias vezes os

exames de DNA são empregados em processos de investigação de paternidade e,

não raro, são feitos questionamentos quanto à fidelidade do vínculo genético obtido

pelo emprego de banco de frequências não regionais.

54

Figura 11: Locus D21S11

M1: Oeste Potiguar. M2: Central Potiguar. M3: Agreste Potiguar. M4: Leste Potiguar.



0,00

0,05

0,10

0,15

0,20

0,25

0,30

24,2 25

25,2 26 27 28 29 30

30,2 31

31,2

31,2

1 32

32,2 33

33,2 34

34,2 35

35,2 36

Fre

quên

cia

Alelo

Mesorregião 1

Mesorregião 2

Mesorregião 3

Mesorregião 4

0,00

0,05

0,10

0,15

0,20

0,25

0,30

0,35

0,40

8 9 10 11 12 13 14 15

Fre

quên

cia

Alelo

Mesorregião 1

Mesorregião 2

Mesorregião 3

Mesorregião 4

55



Figura 14: Locus VWA


0,00

0,05

0,10

0,15

0,20

0,25

0,30

0,35

11 12 13 14 15 16 17 18 19

Fre

quên

cia

Alelo

Mesorregião 1

Mesorregião 2

Mesorregião 3

Mesorregião 4

0,00

0,05

0,10

0,15

0,20

0,25

0,30

0,35

11 12 13 14 15 16 17 18 19 20 21

Fre

quên

cia

Alelo

Mesorregião 1

Mesorregião 2

Mesorregião 3

Mesorregião 4

56





0,00

0,05

0,10

0,15

0,20

0,25

0,30

0,35

0,40

7 8 9 10 11 12 13 14

Fre

quên

cia

Alelo

Mesorregião 1Mesorregião 2Mesorregião 3Mesorregião 4

0,00

0,05

0,10

0,15

0,20

0,25

0,30

0,35

5 6 8 9 10 11 12 13 14 15

Fre

quên

cia

Alelo

Mesorregião 1

Mesorregião 2

Mesorregião 3

Mesorregião 4

57



Figura 18: Locus CSF

M1: Oeste Potiguar. M2: Central Potiguar. M3: Agreste Potiguar. M4: Leste Potiguar

0,00

0,05

0,10

0,15

0,20

0,25

10

10,2 11 12 13

13,2 14

14,2 15 16 17 18 19 20 21

21,2 22 23 26 27

Fre

quên

cia

Alelo

Mesorregião 1

Mesorregião 2

Mesorregião 3

Mesorregião 4

0,00

0,05

0,10

0,15

0,20

0,25

0,30

0,35

0,40

6 7 8 9 10 11 12 13 14 15

Fre

quên

cia

Alelo


58



Figura 20: Locus TH01


0,00

0,05

0,10

0,15

0,20

0,25

0,30

0,35

0,40

6 7 8 9 10 11 12 13 14 15

Fre

quên

cia

Alelo


0,00

0,05

0,10

0,15

0,20

0,25

0,30

5 6 7 8 9

9,3 10

Fre

quên

cia

Alelo


59

Figura 21: Locus TPOX


Figura 22: Locus FGA


0,00

0,05

0,10

0,15

0,20

0,25

0,30

0,35

0,40

0,45

0,50

0,55

6 7 8 9 10 11 12

Fre

quên

cia

Alelo


0,00

0,05

0,10

0,15

0,20

0,25

16 17 18

18,2 19 20 21

21,2 22

22,2 23

23,2 24

24,2 25 26 27 28 29 30

31,2

32,2

34,2

43,2

45,2

Fre

quên

cia

Alelo

Mesorregião 1

Mesorregião 2

Mesorregião 3

Mesorregião 4

60





0,00

0,05

0,10

0,15

0,20

0,25

0,30

0,35

8 9 10 11 12 13 14 15 16 17 18

Fre

quên

cia

Alelo


0,00

0,05

0,10

0,15

0,20

0,25

14 15 16 17 18 19 20 21 22 23 24 25 26 27

Fre

quên

cia

Alelo

Mesorregião 1

Mesorregião 2

Mesorregião 3

Mesorregião 4

61


0,00

0,05

0,10

0,15

0,20

0,25

0,30

0,35

9 10 11

11,2 12

12,2 13

13,2 14

14,2 15

15,2 16

16,2 18

18,2 19 25

Fre

quên

cia

Alelo

Mesorregião 1

Mesorregião 2

Mesorregião 3

Mesorregião 4

62

7 CONCLUSÃO

Pelos resultados obtidos, pode-se observar que as frequências alélicas da

população de pessoas nascidas no Estado do Rio Grande do Norte têm, no geral,

distribuição em equilíbrio de Hardy-Weinberg e, ao compararmos as frequências

encontradas em cada um dos 15 marcadores STRs estudados com as frequências

obtidas em outras populações, observamos que não há distorção significante. Os

parâmetros forenses calculados mostraram que os loci estudados são úteis para a

solução de problemas relacionados com identificação humana na amostra analisada.

Como perspectiva de continuidade deste estudo, pretende-se analisar os

dados das frequências alélicas dos 15 loci STR das populações dos países que

supostamente tiveram influência na formação da população do Rio Grande do Norte,

comparando-os com os dados obtidos das mesorregiões, podendo assim, traçar um

perfil da formação da população do nosso Estado.

63

REFERÊNCIAS BIBLIOGRÁFICAS

ALBERTS, B.; BRAY, D.; JONHSON, A.; LEWIS, J.; RAFF, M.; ROBERTS, K.; WALTER, P. Fundamentos da Biologia Celular: uma introdução à biologia molecular da célula. 1. ed. Porto Alegre: Artmed, 1999. AMORIM, A; PEREIRA, L. Pros and cons in use of SNPs in forensic kinship investigation: a comparative analysis with STR. Forensic Sci. Int., v. 150, n. 1, p. 17-21, 2005. BEIGUELMAN, B. Genética de Populações Humanas. 1. ed. Ribeirão Preto: SBG, 2008. BUDOWLE, B.; ALLARD, M. W.; WILSON, M.; CHAKRABORTY, E. R. Forensics and mitochondrial DNA: Applications, Debates, and Foundations. Annual Review of Genomics and human genetics, v. 4, p. 119-141, set. 2003. BUDOWLE, B.; GE, J.; CHAKRABORTY, R.; EISENBERG, A. J.; GREEN, R.; MULERO, J.; LAGACE, R.; HENNESSY, L. Population genetic analyses of the NGM STR loci. Int. J. Legal Med., v. 125, p. 101-109, 2011. BUTLER, J. M.; BUEL, E.; CRIVELLENTE, F.; McCORD, B. R. Forensic DNA typing by capillary electrophoresis using the ABI Prism 310 and 3100 genetic analyzers for STR analysis. Electrophoresis, v. 25, p.1397-1412, 2004. BUTLER, J. M. Forensic DNA typing. 2nd ed. San Diego: Elservier Academic Press, 2005. BUTLER, J. M. Review: genetics and genomics of core STR loci used in human identity testing. J. Forensic Sci, p. 1-48, mar, 2006. CHAKRABORTY, R., STIVERS, D.N., SU, B., ZHONG, Y., BUDOWLE, B. The utility of short tandem repeat loci beyond human identification: Implications for development of new DNA typing systems. Electrophoresis, v. 20, p. 1982-1996, 1999. CHULA, F. G. L.; RODENBUSCH, R.; SCHUMACHER, S.; GRANDI, T.; MICHELON, C. T.; GASTALDO, A. Z.; COSTI, C.; CARVALHO, B.; DA SILVA, C. M. D. 15 STR

64

loci frequencies with mutation rates in the population from Rio Grande do Sul, Southern Brazil. Forensic Science International:Genétics, v. 3, p. 35-38, 2009. DELLALIBERA, E., HAVRO, M. L. B.; SOUZA, M.; KAJIHARA, K.; MAURICIO-DA- SILVA, L.; SILVA, R. S. Genetic analysis of 13STR loci in the population from the State of Pernambuco, northeast Brazil, Forensic Science International. v. 146, p. 57-59, 2004. DESMARAIS, D., ZHONG, Y., CHAKRABORTY, R., PERREAULT, C., BUSQUE, L. Development of a highly polymorphic STR marker for identity testing purposes at the human androgen receptor gene (HUMARA). Journal of Forensic Science. v. 43, p. 1046–1049, 1998. DIXON, L. A. et al. Analysis of artificially degraded DNA using STRs and SNPs: results os a colaborative European exercise. Forensic Science International. v. 164, p. 33-44, 2006. DOLINSKY, L. C.; PEREIRA, L. M. C. V. DNA Forense. Saúde e ambiente em Revista, Duque de Caxias, v. 2, n. 2, p. 11-22, jul-dez. 2007. EXCOFFIER, L.; LAVAL, G.; SCHNEIDER, S. Arlequin version. 3.0: An integrated software package for population genetics data analysis. Evolution Bioinform Online, v. 1, p. 47-50, 2005. FERREIRA DA SILVA, L. A.; PIMENTEL, B. J.; AZEVEDO, D. A.; SILVA, E. N. P.; SANTOS, S. S. Allele frequencies of nine STR loci D16S539, D7S820, D13S317, CSF1PO, TPOX, TH01, F13A01, FESFPS and vWA—in the population from Alagoas, northeastern Brazil. Forencic Science International, v. 130, p. 187-188, 2002. FIGUEIREDO, S. L.; PARADELA, R. E. Bancos de dados de DNA: Uma ferramenta investigativa útil. In: Âmbito Jurídico. Disponível em: <http://www.ambitojuridico.com.br/pdfsGerados/artigos/1235.pdf >. Acesso em: abr.2010 FRIDMAN, C; SANTOS, P. C. C.; KOHLER, P.; GARCIA, C. F.; LOPEZ, L. F.; MASSAD, E.; GATTÁS, G. J. F. Brasilian populations profile of 15 STR markers. Forensic Science International: Genetics, v. 2, p. 1-4, 2007. GALANTE-FILHO, H.; FIGINI, A. L.; REIS, A. B.; JOBIM, L. F.; SILVA, M. Identificação humana. Porto Alegre: Sagra Luzzatto, 1999.

65

GILL, P. et al. An investigation of the rigor of interpretation rules for STRs derived from less than 100 pg of DNA. Forensic Science International. v. 112, p. 17-40, 2000. GILL, P.; WERRETT, D. J.; BUDOWLE, B.; GUERRIERI, R. An assessment of whether SNPs will replace STRs in national DNA databases-Joint considerations of the DNA working group of the European Network of Forensic Science Institutes (ENFSI) and the Scientific Working Group on DNA Analysis Methods (SWGDAM). Science&Justice, v. 44, n. 1, p. 51-53, 2004. GILL, P. The evolution of DNA databases: recommendations for new European STR loci. Forensic Science International, v. 156, p. 242-244, 2006. GÓIS, A. C. S.; SILVA, D. A.; GIL, E. H. F.; SILVA, M. T. D.; PEREIRA, R. W.; CARVALHO, E. F. Allele frequencies data and statistic parameters for 16 STR loci—D19S433, D2S1338, CSF1PO, D16S539, D7S820, D21S11, D18S51, D13S317, D5S818, FGA, Penta E, TH01, vWA, D8S1179, TPOX, D3S1358—in the Rio de Janeiro population, Brazil. Forensic Science International, v. 140, p. 131-132, 2004. GÓIS, C. C. Estudo de frequências alélicas de 12 microssatélites do cromossomo Y na população brasileira de Araraquara e da região da grande São Paulo. Dissertação (Mestrado em Odontologia)-Faculdade de Odontologia, Universidade de São Paulo, São Paulo, 2006. GOMES, A. V., MAURICIO-DA-SILVA, L., RAPOSO, G., VIEIRA, J. R. C., SILVA, R. S. 13 STR loci frequencies in the population from Paraíba, Northeast Brazil. Forencic Science International. [S.l.], v. 173, p. 231-234, mar. 2007. GRATTAPAGLIA, D.; SCHIMIDT, A. B.; COSTA E SILVA, C.; STRINGHER, C.; FERNANDES, A. P.; FERREIRA, M. E. Brazilian population database for the 13 STR loci of the AmpFlSTR Profiler Plus and Cofiler multiplex kits. Forensic Science International, v. 118, p. 91-94, 2001. IBGE, Censo demoráfico, 2000. JACQUES, G. Informação verbal. Mesa Redonda - CODIS no Brasil: Situação atual do Banco informatizado de dados Genéticos do FBI para amostras de vestígios, de criminosos e de vítimas. In: 3º Congresso Brasileiro de Genética Forense. Porto Alegre, maio 2011. JORDE, L. B.; CAREY, J. C.; BAMSHAD, M. J.; WHITE, R. L. Genética Médica. 3. ed. Rio de Janeiro: Elsevier, 2004.

66

KOCH, A.; ANDRADE, F. M. A utilização de técnicas de biologia molecular na genetic forense: uma revisão. Rev. Bras. Anal. Clin. v. 40, p. 17-23, 2008. LI, H.; TANG, H.; ZHANG, Q.; JIAO, Z.; BAI, J.; CHANG, S. A multiplex PCR for 4 X chromossome STR markers and population data form Beijing Ham ethnic group. Legal Medicine, v. 11, p. 248-250, 2009. MARQUES, E. K.; ROCHA, A. B.; FONSECA, A. S. K. Diagnóstico Genético-Molecular. Canoas: Ulbra, 2003. McMANUS, C.; PAIVA, S.; CORRÊA, P. S.; SEIXAS, L.; MELO, C. B. Estatísticas para descrever genética de populações. IN: Série Técnica: Genética. Disponível em: <www.animal.com.br>. Acesso em abr. de 2011. NAKAMURA, Y. DNA variations in human and medical genetics: 25 years of my experience. Journal of Human Genetics. v. 54, p. 1–8, 2009. OCAMPOS, M., FERNANDES, R. C., LATORRE, A. F. S., SILVA, C. M. D., KORNDOFFER, F. P., GIAMARUSTI, A. C., MENEZES, M. E. 15 STR loci frequencies in the population from Santa Catarina, Southern Brazil. Forencic Science Internatonal:Genetics. [S.l.], v. 3, p. 129-131, 2009. OLIVEIRA, R. N.; NUNES, F. D.; ANZAI, E. K.; DARUGE, E.; MESQUITA, R. A.; OZAKI, A. N. Population studies of the Y-chromosome of loci DYS390, DYS391 and DYS393 in brazilian subjects and its use in human identification. J. Forensic Odontostomatol, v. 20, n. 1, p. 6-9, 2002. OTTO, P. G.; OTTO, P. A.; FROTA-PESSOA, O. Genética Humana e Clínica. 2. ed. São Paulo: ROCA, 2004. PANETO, G. G.; Utilização do DNA mitocondrial no contexto forense brasileiro. 2006. Dissertação de Mestrado-Faculdade de Ciências Farmacêuticas, UNESP, Araraquara, 2006. PARDINI, V. C.; FERREIRA, A. C. S.; GOMES, K. B.; RODRIGUEZ, S. L. B. Uso do DNA proveniente de polpa dentária para identificação humana: relato de caso e técnica. CROMG, v. 7, n. 1, p. 33-35, 2001.

67

PENA, S. D. J. Segurança Pública: determinação de identidade genética pelo DNA. In: Seminários Temáticos para a 3ª Conferência Nacional de C, T & I. Parcerias Estratégicas, v. 20, p. 447-460, 2005. PINHEIRO, M. F.; CAINÉ, L.; PONTES, L.; ABRANTES, D.; LIMA, G.; PEREIRA, M. J.; REZENDE, P. Allele frequencies of sixteen STRs in the populations of nothern Portugal. Forensic Science International, v. 148, p. 221-223, 2005. POIARES, L. A.; OSÓRIO, P. S.; SPANHOL, F. A.; COLTRE, S. C.; RODENBUSCH, R.; CASTELO BRANCO, C.; PACHECO, P. R.; MOTA-VIEIRA, L.; LARGURA, A.; SANDRINI, F.; DA SILVA, C. M. D. 15 STR loci frequencies in the population from Paraná, Southern Brazil. Forensic Science International:Genetics, v. 4, p. 23-24, 2009. RIBEIRO, G. G. B. L. Análise genética de marcadores do tipo STR e INDEL em cromossomos sexuais humanos em populações remanescentes de quilombos. 2009. 180 f. Tese (Doutorado em Biologia Animal)-Instituto de Ciências Biológicas, Universidade de Brasília, Brasília, 2009. ROBLEDO, R., PIRAS, I., BEGGS, W., CALÒ, C. Analysis of 31 STR loci in the genetic isolate of Carloforte (Sardinia, Italy). Genetics and Molecular Biology, v. 32, n. 3, p. 462-463, 2009. RODRIGUES, E. M. R.; PALHA, T. J. B. F.; DOS SANTOS, S. E. B. Allele frequencies data and statistic parameters for 13 STR loci in a population of the Brazilian Amazon Region, Forensic Science International. v. 168, p. 244–247, 2007. SCHNEIDER, P. M. Basic issues in forensic DNA typing. Forensic Science International, v. 88, p. 17-22, 1997. SCHNEIDER, P. M. Expansion of the European standard set of DNA database loci: the current situation. Profiles in DNA. v. 12, n. 1, p. 6-7, 2009. SILVA, D. A., CROUSE, C. A., CHAKRABORTY, R., GÓES, A. C. S., CARVALHO, E. F. Statistical analyses of 14 short tandem repeat loci in Brazilian populations from Rio de Janeiro and Mato Grosso do Sul states for forensic and identity testing purposes.Forensic Science International, v. 139, p.173-176, 2004. SMITH, L. M.; BURGOYNE, L. A. Collecting, archiving and processing DNA from wildlife samples using FTA data basing paper. Ecology, v. 4, p. 4–9, 2004.

68

SMITH, M. E. Let’s make the DNA identification database as inclusive as possible. Journal of Law, Medicine & Ethics, v. 34, n. 4, p. 385-389, 2006. STRACHAN, T; READ, A. Genética molecular humana. 2. ed. Porto Alegre: Artmed; 2002. SWEET, D.; DIZZINO, J. A. Personal identification through dental evidence - tooth fragments to DNA. J. Calif.Dent. Assoc. v. 24, n. 5, p. 35-42, 1996. TAMAKI, K; JEFFREYS, A. Human tandem repeat sequences in forensic DNA typing. Legal Medicine, v. 7, p. 244-250, 2005. TEREBA, A. Tools for analysis of populations statistics. Profiles in DNA, v. 2, n. 3, 1999. Disponível em: <http://www.promega.com/geneticidtools>. Acesso em: jun. de 2010. WALSH, J. S. Recent advances in forensic genetics. Expert Rev. Mol. Diagn, v. 4, n. 1, p. 31-40, 2004. WEIR, B. S. Multiple Tests: Genetic Data Analysis, vol. II, Sinauer Associates, USA, p. 134., 1996.

WERRETT, D. J. The national DNA database. Forensic Sci Int, v. 88, p. 33-42, 1997.

69

ARTIGO CIENTÍFICO PARA PUBLICAÇÃO SEGUNDO AS NORMAS DA

REVISTA FORENSIC SCIENCE INTERNATIONAL

15 STR loci frequencies in the population from Rio Grande do Norte,

Brazil

Taissa Maria Moura de Oliveiraab, Andrea Luciana Cunha Fernandesa, Gioconda Dias Rodrigues Leãoa, Roberto Chaves de Vasconcelosa, Erica Aires Gila, Juliana Mendonça Freirea, Geraldo Barroso Cavalcanti Júniorb.

a Laboratório DNA Center. Av. Afonso Pena, 952, TIrol. Natal-RN. CEP: 59020-100.

Brasil. b Programa de Pós-graduação em Ciências Farmacêuticas – UFRN.

Email address: [email protected]

ABSTRACT

Allele frequencies for 15 Short Tandem Repeats loci (D8S1179, D21S11, D7S820,

CSF1PO, D19S433, vWA, TPOX, D18S51, D3S1358, TH01, D13S317, D16S539,

D2S1338, D5S818 e FGA) were obtained from a sample of 1100 unrelated

individuals undergoing paternity testing. The population is from Rio Grande do Norte,

Northeastern Brazil. The loci are the most commonly used in forensic and paternity

testing, being analyzed by the AmpFlSTR® Identifiler (Applied Biosystems)

commercial kit. The most polimorphic loci were D2S1338 and D18S51. Excepting the

D21S11, D19S433 and D2S1338, all loci were in Hardy-Weinberg equilibrium.

Comparative analyses between our population data and other populations are

presented.

Keywords: Short Tandem Repeats, Allele frequency, Rio Grande do Norte, Brazil.

70

Introduction

Many forensic laboratories worldwide are evaluating and implementing highly

polymorphic DNA loci, whose polymorphism derive from Short Tandem Repeated

(STR) core sequences. Simultaneous amplification and subsequent typing of a

number of these STR loci have significantly enhanced the capabilities of forensic

scientists to analyze DNA derived from biological specimens [1]. It is well known that

the use of Short Tandem Repeats for forensic purposes requires the existence of

databases that reflect the allele distribution in the population they will be applied, that

provides subsidies to improve the reliability of the results of determination of the

genetic link [2]. Thus, when assessing the frequency of the microregion, a possible

distortion of data is sent off. Our aim is to study the allele frequencies for 15 STR loci

and calculate the statistical parameters of forensic interest, in a sample provenient

from Rio Grande do Norte State, Brazil.

Population

The allelic frequency of 15 short tandem repeats - STR (D8S1179, D21S11, D7S820,

CSF1PO, D3S1358, TH01, D13S317, D16S539, D2S1338, D19S433, VWA, TPOX,

D18S51, D5S818, FGA) was evaluated in population from Rio Grande do Norte

State, localized in the northeast region of Brazil. The current population is about 3

million inhabitants (according to IBGE, 2010), divided into four mesoregions, named:

Oeste Potiguar, Cental Potiguar, Agreste Potiguar and Leste Potiguar.

Blood samples from 1,100 unrelated individuals were obtained from paternity testing

cases conducted in each mesoregion of the State and shipped immediately to DNA

Center Laboratory (Natal City) for analysis. This sample is representative of the

population of Rio Grande do Norte State, and 25% of the individuals included are

from the Oeste Potiguar mesoregion, 17% from the Central Potiguar, 16% from the

Agreste Potiguar and 42% from the Leste Potiguar.

Donors were subjected to an interview in order to obtain their informed consent.

DNA Extraction

DNA was extracted from blood spots on Whatman FTA cards using the

manufacturer’s protocols.

71

PCR

A total of 0.5–1.0 ng of DNA, contained in a 1.2 mm circle of FTA paper, was used to

simultaneous amplification of 15 STR loci (multiplex PCR) plus the gender

determination marker, Amelogenin, performed using the AmpFlSTR® IdentifilerTM

PCR Amplification Kit (Applied Biosystems, Foster City, CA, USA) according to the

user’s manual recommendations.

Typing

Separation of PCR products was carried out by capillary electrophoresis on an ABI

PRISM1 3130xl Genetic Analyzer (Applied Biosystems). Genotyping was performed

by comparison with sequenced allelic ladders provided with the kit, using the

GeneMapper ID 3.2 software.

Quality control

Proficiency testing of the GEP-ISFG Working Group and PNCQ (‘‘Programa Nacional

de Controle de Qualidade em Biologia Molecular’’, sponsored by the SBAC -

Sociedade Brasileira de Análises Clínicas).

Analysis of data

Statistical analysis for allele frequencies, Power of Discrimination, Matching

Probability, Polymorphism Information Content and Power of Exclusion were

calculated using PowerStats v.13 software [3]. Deviation from Hardy-Weinberg

equilibrium, Observed and Expected Heterozygosity was calculated using Arlequin

v3.11 software [4].

Results

The allele frequencies and statistical parameters obtained for the 15 STR loci in Rio

Grande do Norte are shown in Table 1.

72

Table 1: Allele frequencies and statistic parameters of forensic interest for 15 STR loci in the

population of Rio Grande do Norte, Brazil.

ALELO D21S11 D13S317 D3S1338 VWA D7S820 D16S539 D18S51 CSF D5S818 TH01 TPOX FGA D8S1179 D2S1338 D19S433

6

0,223 0,023

7

0,011

0,012 0,034 0,231 0,001

8

0,098

0,140 0,031

0,022 0,016 0,146 0,455

0,006

9

0,086

0,118 0,174

0,019 0,036 0,175 0,117

0,006

0,001

9,3

0,217

10

0,054

0,298 0,081 0,007 0,234 0,080 0,008 0,055

0,069

0,005

11

0,288 0,001 0,001 0,230 0,273 0,012 0,312 0,320

0,293

0,063

0,022

11,2

0,001

12

0,301 0,004

0,177 0,273 0,125 0,325 0,326

0,056

0,143

0,106

12,2

0,013

13

0,127 0,005 0,005 0,023 0,148 0,120 0,062 0,174

0,271

0,260

13,2

0,001

0,043

14

0,044 0,095 0,079 0,003 0,020 0,156 0,010 0,011

0,260 0,001 0,286

14,2

0,001

0,033

15

0,002 0,304 0,118

0,001 0,167 0,003 0,002

0,143 0,002 0,133

15,2

0,048

16

0,251 0,272

0,133

0,035 0,036 0,032

16,2

0,013

17

0,203 0,283

0,124

0,001 0,003 0,214 0,001

17,2

0,001

18

0,128 0,155

0,069

0,009

0,095 0,001

18,2

0,002

0,001

19

0,009 0,067

0,048

0,065

0,122

20

0,018

0,019

0,112

0,136

21

0,002

0,009

0,160

0,050

22

0,005

0,141

0,072

22,2

0,003

23

0,001

0,146

0,112

23,2

0,002

24

0,159

0,072

24,2 0,001

0,000

25 0,001

0,122

0,065

26 0,001

0,050

0,021

27 0,023

0,001

0,013

0,002

28 0,153

0,005

29 0,217

0,002

30 0,261

0,001

30,2 0,025

31 0,052

31,2 0,104

0,002

32 0,014

32,2 0,102

0,001

33 0,001

33,2 0,026

34,2 0,003

0,001

35 0,003

36 0,009

43,2

0,001

45,2 0,001

n 2200 2200 2200 2200 2200 2200 2200 2200 2200 2200 2200 2200 2200 2200 2200

Ho 0.820 0,775 0,764 0,782 0,763 0,800 0,877 0,726 0,720 0,768 0,672 0,865 0,77 0,878 0,813

He 0.839 0.788 0,778 0,798 0,793 0,793 0,877 0,735 0,752 0,797 0,686 0,874 0,808 0,881 0,814

P <0,001 0.839 0,316 0,379 0,100 0,552 0,496 0,786 0,128 0,569 0,695 0,341 0,259 0,017 0,031

PD 0,954 0,927 0,917 0,933 0,928 0,924 0,971 0,884 0,901 0,929 0,856 0,970 0,939 0,974 0,940

PE 0,636 0,554 0,533 0,566 0,532 0,599 0,749 0,494 0,460 0,552 0,386 0,763 0,545 0,751 0,623

PIC 0.820 0,762 0,743 0,769 0,762 0,761 0,869 0,691 0,713 0,766 0,639 0,860 0,782 0,869 0,792

PI 2,780 2,227 2,115 2,292 2,107 2,500 4,074 1,930 1,786 2,216 1,522 3,691 2,174 4,104 2,670

MP 0,046 0,073 0,083 0,067 0,072 0,076 0,029 0,116 0,099 0,071 0,144 0,030 0,061 0,026 0,060

n, number of alleles; Ho, heterozygosity observed; He, heterozygosity expected; P, exact test probability for Hardy–Weinberg equilibrium; PIC, polymorphism information content; DP, discrimination power; MP, matching probability; TPI, typical paternity index; PE, power of exclusion.

73

Other markes

All the loci analysed reached the Hardy-Weinberg equilibrium in the population

studied (P > 0.05), except D21S11 locus (P = 0.00007), D2S1338 (P = 0.017) and

D19S433 (P = 0,031). When the Bonferroni correction [5] was employed using the

number of loci analysed (P > 0.0033), the differences observed were not statistically

significant, except for the D21S11 locus.

In the State of Rio Grande do Norte population, the observed heterozygosity (HO)

ranges from 0.672 (TPOX) to 0.878 (D2S1338). The Power of Discrimination (PD)

varies between 0.856 (TPOX) and 0.974 (D2S1338) and the probability of exclusion

(PE) varies between 0.386 (TPOX) and 0.751 (D2S1338). The most polymorphic

genetic markers is D18S51 and D2S1338 (both with PIC value of 0.8644) and the

least polymorphic is TPOX (0.639).

The frequency distribution pattern of the 15 STR loci analyzed was compare to the

ones obtained for other Brazilian populations [6-13], and we could find some rare

alleles, as alleles 11,2 and 18 in D19S433 and allele 34,2 in FGA.

The comparison of the allelic frequency of this 15 loci studied in the population form

Rio Grande do Norte State with others Brazilian populations [6-3] show that our

population is genetically more proximal of the population of the State of Pernambuco

[7] and genetically more distant of the population from the State of Amazonas [12]

The forensic parameters regarding the 15 STR loci are useful in terms of variability,

paternity and forensic purposes for the Rio Grande do Norte population.

74

References

[1] BUTLER, J. M. Review: genetics and genomics of core STR loci used in human identity testing. J. Forensic Sci, p. 1-48, mar, 2006.

[2] GRATTAPAGLIA, D.; SCHIMIDT, A. B.; COSTA E SILVA, C.; STRINGHER, C.; FERNANDES, A. P.; FERREIRA, M. E. Brazilian population database for the 13 STR loci of the AmpFlSTR Profiler Plus and Cofiler multiplex kits. Forensic Science International, v. 118, p. 91-94, 2001.

[3] TEREBA, A. Tools for analysis of populations statistics. Profiles in DNA, v. 2, n. 3, 1999. Disponível em: <http://www.promega.com/geneticidtools>. Acesso em: jun. de 2010.

[4] EXCOFFIER, L.; LAVAL, G.; SCHNEIDER, S. Arlequin version. 3.0: An integrated software package for population genetics data analysis. Evolution Bioinform Online, v. 1, p. 47-50, 2005.

[5] DESMARAIS, D., ZHONG, Y., CHAKRABORTY, R., PERREAULT, C., BUSQUE, L. Development of a highly polymorphic STR marker for identity testing purposes at the human androgen receptor gene (HUMARA). Journal of Forensic Science. v. 43, p. 1046–1049, 1998.

[6] CHULA, F. G. L.; RODENBUSCH, R.; SCHUMACHER, S.; GRANDI, T.; MICHELON, C. T.; GASTALDO, A. Z.; COSTI, C.; CARVALHO, B.; DA SILVA, C. M. D. 15 STR loci frequencies with mutation rates in the population from Rio Grande do Sul, Southern Brazil. Forensic Science International:Genétics, v. 3, p. 35-38, 2009.

[7] DELLALIBERA, E., HAVRO, M. L. B.; SOUZA, M.; KAJIHARA, K.; MAURICIO-DA- SILVA, L.; SILVA, R. S. Genetic analysis of 13STR loci in the population from the State of Pernambuco, northeast Brazil, Forensic Science International. v. 146, p. 57-59, 2004.

[8] FRIDMAN, C; SANTOS, P. C. C.; KOHLER, P.; GARCIA, C. F.; LOPEZ, L. F.; MASSAD, E.; GATTÁS, G. J. F. Brasilian populations profile of 15 STR markers. Forensic Science International: Genetics, v. 2, p. 1-4, 2007.

[9] GÓIS, A. C. S.; SILVA, D. A.; GIL, E. H. F.; SILVA, M. T. D.; PEREIRA, R. W.; CARVALHO, E. F. Allele frequencies data and statistic parameters for 16 STR loci—D19S433, D2S1338, CSF1PO, D16S539, D7S820, D21S11, D18S51, D13S317, D5S818, FGA, Penta E, TH01, vWA, D8S1179, TPOX, D3S1358—in the Rio de Janeiro population, Brazil. Forensic Science International, v. 140, p. 131-132, 2004.

[10] OCAMPOS, M., FERNANDES, R. C., LATORRE, A. F. S., SILVA, C. M. D., KORNDOFFER, F. P., GIAMARUSTI, A. C., MENEZES, M. E. 15 STR loci frequencies in the population from Santa Catarina, Southern Brazil. Forencic Science Internatonal:Genetics. [S.l.], v. 3, p. 129-131, 2009.

[11] POIARES, L. A.; OSÓRIO, P. S.; SPANHOL, F. A.; COLTRE, S. C.; RODENBUSCH, R.; CASTELO BRANCO, C.; PACHECO, P. R.; MOTA-VIEIRA, L.; LARGURA, A.; SANDRINI, F.; DA SILVA, C. M. D. 15 STR loci frequencies in the population from Paraná, Southern Brazil. Forensic Science International:Genetics, v. 4, p. 23-24, 2009.

[12] RODRIGUES, E. M. R.; PALHA, T. J. B. F.; DOS SANTOS, S. E. B. Allele frequencies data and statistic parameters for 13 STR loci in a population of the Brazilian Amazon Region, Forensic Science International. v. 168, p. 244–247, 2007.

75

[13] SILVA, D. A., CROUSE, C. A., CHAKRABORTY, R., GÓES, A. C. S., CARVALHO, E. F. Statistical analyses of 14 short tandem repeat loci in Brazilian populations from Rio de Janeiro and Mato Grosso do Sul states for forensic and identity testing purposes.Forensic Science International, v. 139, p.173-176, 2004.

ANÁLISE DA FREQUÊNCIA ALÉLICA DE 15 LOCI STR NA ... · D19S433 e D2S1338, os genótipos...

Documents

Transcript of ANÁLISE DA FREQUÊNCIA ALÉLICA DE 15 LOCI STR NA ... · D19S433 e D2S1338, os genótipos...