Post on 22-Aug-2020
1
UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIA
CAMILA FORNEZARI RABELLO
CARACTERIZAÇÃO GENÉTICO-MOLECULAR EM Panicum maximum: IDENTIFICAÇÃO DE MARCADORES
MOLECULARES SNPs E MAPEAMENTO GENÉTICO
CAMPINAS 2017
1
CAMILA FORNEZARI RABELLO
CARACTERIZAÇÃO GENÉTICO-MOLECULAR EM Panicum
maximum: IDENTIFICAÇÃO DE MARCADORES MOLECULARES
SNPs E MAPEAMENTO GENÉTICO
Dissertação apresentada ao Instituto de Biologia da Universidade Estadual de Campinas como parte dos requisitos exigidos para a obtenção do Título de Mestra em Genética e Biologia Molecular na área de Genética Vegetal e Melhoramento.
ESTE ARQUIVO DIGITAL CORRESPONDE À VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELA ALUNA CAMILA FORNEZARI RABELLO E ORIENTADA PELA DR. ANETE PEREIRA DE SOUZA.
Orientador: ANETE PEREIRA DE SOUZA
CAMPINAS
2017
1
1
Campinas, 17 de fevereiro de 2017.
COMISSÃO EXAMINADORA
Prof.a Drª. Anete Pereira de Souza (Orientadora)
Prof. Dr. Geraldo Magela de Almeida Cançado
Prof. Dr. João Ricardo Bachega Feijó Rosa
Os membros da Comissão Examinadora acima assinaram a Ata de Defesa, que se encontra no processo de vida acadêmica do aluno.
1
Aos meus pais, Lúcia e Donizeti, com todo amor, dedico.
1
AGRADECIMENTOS
Agradeço sincera e profundamente à professora Anete Pereira de Souza pela
oportunidade de trabalhar em seu laboratório, pela confiança depositada em mim,
pela gentileza e humanidade com que sempre tratou a todos ao seu redor.
Agradeço ao Dr. Guilherme de Toledo e Silva por me permitir dar continuidade ao
seu trabalho e pelo imprescindível suporte ao longo desta caminhada.
Agradeço ao Dr. Antonio Augusto Franco Garcia e ao Rodrigo Rampazo pela
inestimável ajuda na construção dos mapas genéticos.
Agradeço aos colegas do LAGM/CBMEG, sem os quais a conclusão deste trabalho
não teria sido possível. Obrigada por compartilharem seus conhecimentos e me
ajudarem nos momentos de dificuldade.
Agradeço aos meus colegas Luciano, Camila, Aline e Benício pela contribuição
durante o desenvolvimento desta tese.
Agradeço aos meus amigos e à minha família por todo apoio e compreensão nos
momentos de ausência.
Agradeço ao meu marido, Rafael, por ser calmaria em meio à turbulência, meu porto
seguro, meu amor.
Agradeço aos meus pais pelo amor incondicional, por terem sempre primado pela
minha educação e por apoiarem minhas escolhas.
Agradeço à Deus e à Nossa Senhora Aparecida por me darem forças para
prosseguir quando tudo parecia ruir e por abrirem tantas portas em meu caminho.
1
RESUMO
A espécie Panicum maximum, também conhecida como capim-colonião, é
tida como uma das gramíneas mais importantes e difundidas do Brasil, entretanto,
embora o país possua excelentes programas de melhoramento, nossas pastagens
ainda são cultivadas predominantemente em sistemas de monocultura, o que
vulnerabiliza a cadeia produtiva. Desta forma, estudos que visem a caracterização
molecular da espécie são de suma importância para o sucesso e o aceleramento do
lançamento de novos cultivares. O presente estudo visou a identificação de
marcadores moleculares do tipo polimorfismo de nucleotídeo único (single nucleotide
polymorphism - SNP) relacionados a características de interesse para os programas
de melhoramento (fixação de nitrogênio, metabolismo do carbono, resistência e
produção de lignocelulose) e a construção de um mapa genético-molecular para a
espécie. Para tanto, foram identificados 86.312 SNPs e, a partir desse conjunto, 147
marcadores presentes em genes das vias de interesse foram selecionados e
validados via espectrometria de massas. Estes marcadores, aliados a um conjunto
de marcadores do tipo microssatélites (simple sequence repeat – SSR) previamente
desenvolvidos para a espécie, foram utilizados para a construção de mapas
genéticos utilizando os programas TetraploidMap e OneMap. Utilizando a
metodologia do programa TetraploidMap, foi obtido um mapa genético para cada um
dos parentais da população de mapeamento de Panicum maximum. O mapa do
genitor S10 contou com 113 marcadores posicionados e cobriu uma distância de
808,4 cM, distribuídos em 10 grupos de ligação. O mapa do genitor Mombaça, foi
construído a partir da ligação de 119 marcadores, cobrindo uma distância total de
897,1 cM e contando com 13 grupos de ligação. Com o auxílio do software OneMap,
por sua vez, foi obtido um mapa com 122 marcadores moleculares posicionados,
distribuídos em 32 grupos de ligação e 1.248 cM. Assim, pela primeira vez, foi
possível a construção de um mapa genético para a espécie constituído de
marcadores do tipo SNP e SSR.
Palavras-chave: Panicum maximum, SNPs, mapa genético
1
ABSTRACT
Panicum maximum, also known as Guineagrass, is one of the most important
and widespread grasses of the country, nevertheless, although Brazil has excellent
breeding programs, our pastures are still cultivated mainly in monoculture systems,
which cause a vulnerability on the productive chain. Thus, studies that aim the
molecular characterization of the species are of great importance to the success and
acceleration of the launching of new cultivars. The present study aimed the
identification of single nucleotide polymorphism (SNP) markers related to interest
traits for the breeding programs (nitrogen fixation, carbon metabolism, resistance and
lignocellulose production) and the construction of a molecular map for the species.
For that, it was identified 86.312 SNPs and, from this, 147 markers present on the
genes of the pathway of interest were selected and validated through mass
spectrometry. These markers, together with a previous developed set of markers
from the microsatellites type (simple sequence repeat – SSR), were used for the
construction of genetic maps using TetraploidMap and OneMap computational
programs. Using the methodology of the TetraploidMap, it was obtained a genetic
map for each parental of the population. The S10 parent map had 113 markers and
covered 808,4 cM, distributed in 10 linkage groups. The parent map for Mombaça,
was built from a connection of 119 markers, covering 897,1 cM and 13 linkage
groups. With the aid of the software OneMap, it was constructed a map with 122
molecular markers, distributed in 32 linkage groups and 1.248 cM. Therefore, for the
first time, it was possible to build a genetic map for the species consisting of markers
of the SNP and SSR types.
Keywords: Panicum maximum, SNPs, genetic mapping
1
SUMÁRIO
1. INTRODUÇÃO ................................................................................................................. 11
2. REVISÃO BIBLIOGRÁFICA ............................................................................................. 13
2.1 Pastagens no Brasil ................................................................................................... 13
2.2 Panicum maximum Jacq ............................................................................................ 14
2.2.1 A espécie e sua introdução no Brasil ................................................................... 14
2.2.2. Mecanismos de reprodução: reprodução sexual e apomítica ............................. 16
2.2.3 Diversidade e melhoramento genético da espécie ............................................... 18
2.3 Marcadores moleculares ............................................................................................ 20
2.3.1. Histórico ............................................................................................................. 20
2.3.2. Os marcadores SNPs ......................................................................................... 23
2.3.3 Genotipagem de SNPs ........................................................................................ 24
2.4 Mapas de ligação ....................................................................................................... 25
2.5 Mapeamento genético em poliploides ........................................................................ 29
3. OBJETIVOS..................................................................................................................... 31
3.1. Objetivo Geral ........................................................................................................... 31
3.2. Objetivos Específicos ................................................................................................ 31
CAPÍTULO I ......................................................................................................................... 32
Construção de um mapa ligação para Panicum maximum a partir de marcadores moleculares SNP e SSR .................................................................................................. 33
CAPÍTULO II ........................................................................................................................ 51
Construção de um mapa de ligação para Panicum maximum utilizando o software OneMap ........................................................................................................................... 52
4. RESULTADOS COMPLEMENTARES ............................................................................. 60
4.2.1 Seleção e genotipagem de marcadores moleculares SNPs e sua distribuição nas vias metabólicas de interesse .......................................................................................... 60
4.2.2 Análise de ploidia e dosagem alélica nos marcadores SNP .................................... 63
4.2.3 Análise dos locos SNPs com ploidia elevada .......................................................... 66
4.2.4 Informações adicionais aos mapas obtidos ............................................................. 68
4.2.4.1 Informações relacionadas aos mapas obtidos pelo TetraploidMap ................... 68
4.2.4.2 Informações relacionadas ao mapa obtido pelo OneMap ................................. 73
5. RESUMO DOS RESULTADOS ....................................................................................... 75
6. CONCLUSÕES ................................................................................................................ 76
7. PERSPECTIVAS ............................................................................................................. 77
8. REFERÊNCIAS BIBLIOGRÁFICAS ................................................................................. 78
9. ANEXOS .......................................................................................................................... 89
10
PREFÁCIO
Esta tese inicia-se com uma Introdução geral sobre o assunto que será
abordado no manuscrito e sua importância para a ciência e economia do Brasil,
seguida de uma Revisão Bibliográfica referente aos aspectos teóricos mais
relevantes do presente estudo, tais como a importância das pastagens no contexto
nacional, a história e a biologia da espécie Panicum maximum, a diversidade dos
marcadores moleculares e a relevância dos mapas de ligação no melhoramento
vegetal.
Na sequência, serão apresentados os Objetivos deste trabalho e os
Resultados obtidos, sendo que tais resultados serão divididos em dois capítulos. O
Capítulo I descreve, nos moldes de um artigo científico, a prospecção de SNPs para
a espécie, com base em transcriptoma de folhas da espécie, e a montagem de
mapas de ligação pelo programa TetraploidMap. O Capítulo II, por sua vez, detalha
os resultados de mapeamento obtidos pela utilização de uma segunda metodologia
de mapeamento, o software OneMap.
Adicionalmente, serão apresentados os Resultados Complementares
referentes aos dados obtidos nos Capítulos I e II. Para fechar a linha de raciocínio,
será apresentado um Resumo dos Resultados, as Conclusões e as Perspectivas
referentes ao trabalho desenvolvido. Por fim, será apresentada a Bibliografia
utilizada na construção desta dissertação.
11
1. INTRODUÇÃO
O setor agropecuário é historicamente um dos setores mais importantes da
economia brasileira, sendo responsável por aproximadamente um terço do produto
interno bruto (PIB) do país. Neste cenário, destacam-se a produção de bioenergia,
cuja riqueza gerada em um ano equivale ao PIB do Uruguai (UNICA, 2008), e a
pecuária, por apresentar o maior rebanho comercial do mundo, com mais de 200
milhões de cabeças de gado (IBGE, 2016).
Estima-se que apenas 3% do rebanho brasileiro seja criado em sistema de
confinamento, o que explicita a importância das pastagens para a sustentação da
atividade. Considerando a intensificação dos sistemas de produção bovina e a forte
tendência ao crescimento do mercado de sementes de forrageiras para pastagem, a
espécie Panicum maximum, pelo seu potencial produtivo, qualidade e palatabilidade,
é uma das gramíneas mais indicadas para suportar essa demanda (Jank et al.,
1997).
Embora a disponibilidade de cultivares melhorados tenha sido responsável
pela ampliação da área de cultivo da espécie nos últimos anos, nossas pastagens
ainda são cultivadas predominantemente em sistemas de monocultura, ou seja, com
predominância de um ou poucos cultivares, o que vulnerabiliza a cadeia produtiva.
Somando-se a este cenário o fato de que cerca de 50% das nossas pastagens se
encontram em estágio de degradação (Dias Filho, 2007), fica evidente a urgente
necessidade do aumento dos programas de melhoramento genético da espécie.
A maior parte dos estudos com P. maximum limitam-se a compreender os
aspectos fisiológicos da planta e características agronômicas de interesse. Raros
são os trabalhos concentrados na caracterização genética da espécie (Jank et al.,
2011). O único mapa de ligação construído para P. maximum data de 2005 e foi
desenvolvido por pesquisadores japoneses (Ebina et al., 2005). Desde então, outro
avanço significativo em termos genéticos para a espécie só foi dado em 2013,
quando um conjunto de transcritos da espécie foi analisado (Toledo-Silva et al.,
2013).
Assim, este trabalho teve como objetivo aumentar o conhecimento genético
da espécie, visando fornecer ferramentas aos programas de melhoramento vigentes
e futuros. Neste contexto, a proposta de identificação de marcadores moleculares do
tipo SNP (single nucleotide polymorfism) foi um trabalho pioneiro para a espécie. A
12
construção de um novo mapa de ligação, enriquecido, impactará positivamente na
velocidade de geração de dados e lançamento de novos cultivares, o que
certamente contribuirá direta e indiretamente para a intensificação da produção de
carne, leite, couro, lã e bioenergia no país.
13
2. REVISÃO BIBLIOGRÁFICA
2.1 Pastagens no Brasil
A formação vegetal genericamente denominada pastagem é a mais comum e
a que ocupa a maior área de extensão na Terra, fato que se explica pela sua alta
capacidade de adaptação a condições climáticas e nutricionais que vão da tundra
ártica até os arredores do deserto do Sahara (Valle et al., 2009).
No Brasil, as áreas de pastagem ocupam mais de 160 milhões de hectares, o
que, em conjunto com as áreas de pastos naturais, equivalem a 49% de toda a área
agrícola do país (ABIEC, 2016). Esta vasta extensão é composta basicamente por
espécies de leguminosas e gramíneas forrageiras, dentre as quais destacam-se
Panicum maximum (capim-colonião), Brachiaria spp., Pennisetum purpureum
(capim-elefante), Setaria sphacelata, Cynodon spp. (capim-estrela), Melinis
minutiflora (capim-gordura), Hyparrhenia rufa (capim-jaraguá), Andropogongayanus
spp., Cenchrus ciliaris (capim-buffel) e Paspalum spp. (capim-pensacola) (Jank et
al., 2005).
De modo geral, as forrageiras tem um papel importante na agricultura,
melhorando a qualidade dos solos através da fixação do nitrogênio e do carbono,
contribuindo para a retenção de água e estabilização do terreno, além de auxiliar no
controle de pragas e doenças em sistemas de rotação de culturas e atuar no
processo de fitorremediação (Salton et al., 2009; Severiano et al., 2010; Olatunji et
al., 2014). Entretanto, seus dois usos comerciais de maior destaque são a
alimentação animal e o mercado de produção de sementes.
Atualmente, o Brasil destaca-se como maior produtor, exportador e
consumidor de sementes de forrageiras tropicais (Lazia, 2012), sendo que este
comércio no país está estimado em US$ 240 milhões anuais (Andrade, 2001). Deste
montante, cultivares de P. maximum são responsáveis por aproximadamente 30%
das sementes comercializadas (Abrasem, 2004).
Já no campo da agropecuária, o Brasil se destaca como o maior produtor e
exportador de carne bovina com cerca de 200 milhões de cabeças de gado (IBGE,
2016; Fonseca et al., 2010). Visto que esta produção animal é desenvolvida quase
que exclusivamente em sistema extensivo, no qual 90% dos nutrientes exigidos
14
pelos animais são oriundos do pasto (Euclides et al., 2010), as forrageiras são
essenciais para a manutenção do país em posição de destaque.
Embora a adaptabilidade das gramíneas aos nossos ecossistemas seja
notável, o centro de origem de grande parte das espécies mais utilizadas
comercialmente é o continente africano, no qual tais plantas evoluíram sob
constante exposição a herbívoros e superpastejo, o que não ocorreu com as
espécies nativas das Américas (Valle et al., 2009).
O fato dessas forrageiras serem originárias da África, resultou em uma
escassez de trabalhos de coletas dirigidos. Para P. maximum, por exemplo, foram
relatadas apenas duas coletas direcionadas: uma por um grupo francês em 1967 e
1969 (Combes & Pernès, 1970), e a segunda por pesquisadores japoneses de 1971
a 1973 (Hojito & Horibata, 1982).
Esta ausência de conhecimento sobre a diversidade genética das espécies
contribui para que as pastagens cultivadas sejam perigosamente compostas por
poucas variedades, o que torna toda a cadeia produtiva susceptível às pressões de
pragas e doenças (Seiffert, 1984).
2.2 Panicum maximum Jacq.
2.2.1 A espécie e sua introdução no Brasil
O gênero Panicum L. é um dos maiores e mais importantes dentro da família
Poaceae, pertencendo à subfamília Panicoideae e tribo Paniceae. Este gênero
compreende cerca de 400 espécies de acordo com a circunscrição atual (Aliscioni et
al., 2003) e no Brasil temos relatada a ocorrência de 114 espécies (Guglieri et al.,
2004).
De forma geral, o gênero Panicum apresenta uma grande variabilidade
genética e morfofisiológica, com espécies de diferentes hábitos de crescimento e
exigências nutricionais e climáticas (Botrel et al., 1998), sendo encontradas em uma
faixa latitudinal bastante ampla, que vai de 40º S até 50º N, e com variação em
altitude que vai do nível do mar até próximo dos 2.000 m (Skerman & Riveros,
1992). A capacidade de utilizar eficientemente altas intensidades luminosas e
apresentar rápido desenvolvimento permite a classificação do gênero Panicum como
plantas pioneiras (Dias Filho, 1995).
Dentre elas, o capim Panicum maximum, também conhecido como capim-
colonião, é tido como uma das gramíneas mais importantes e difundidas no país,
15
sendo também a forrageira propagada por semente mais produtiva do mercado
nacional (Valle et al., 2009). A espécie pode ser descrita como uma cultura perene,
formadora de touceiras com sistema radicular profundo, altura variável entre 60 a
200 cm e formadora de panículas (Skerman & Riveros, 1992; Molinari, 1952).
Figura 1. Ilustração e fotografias de Panicum maximum. A) Ilustração das estruturas
de P. maximum (extraída de Hitchcock, 1971). B) Parte aérea da planta C) Híbridos de
população utilizada no presente estudo.
Esta espécie é nativa da África Tropical, podendo ser encontradas formas
nativas até nas áreas subtropicais da África do Sul, embora seja na região leste
africana que esteja concentrada a maior diversidade da espécie (Jank, 1995;
Bogdan, 1977; Herling et al., 2000). O capim-colonião foi introduzido nas Américas,
provavelmente no século XVIII (Parsons, 1972). Após a sua introdução, esta
forrageira se espalhou rapidamente pelas Ilhas do Caribe, América do Sul e Central
e no sudeste dos Estados Unidos (Bogdan, 1977; Herling et al., 2000).
Em relação à introdução da planta no Brasil, a versão mais difundida e aceita
é a teoria descrita por Chase (1944), segundo a qual a introdução ocorreu com a
importação de escravos africanos em navios negreiros, nos quais este capim era
utilizado como cama (Parsons, 1972).
Após um primeiro momento, a espécie foi difundida das regiões costeiras do
Sul e Sudeste, para o interior (Centro-Oeste e Norte) do país pela ação combinada
16
dos ventos, animais e pela ação humana, e se disseminou amplamente devido à sua
capacidade de aclimatação às diversas condições de clima e solo do país, chegando
até mesmo a ser considerada nativa em algumas regiões (Bogdan, 1977; Herling et
al., 2000).
O capim-colonião foi amplamente difundido no país nos anos 50 e 60, por ser
resistente à queimadas e apresentar alta produção de forragem (Vieira, 1994;
Aronovich, 1995). Posteriormente, entre as décadas de 60 a 80, a espécie
desempenhou um papel importante na expansão da fronteira agrícola para as
regiões da Amazônia, além de apresentar bons resultados também na criação de
equinos e ovinos (Jank, 2003). A partir de então, com o advento de novos bancos
ativos de germoplasma (BAG), o uso da espécie se consolidou no mercado
brasileiro como sinônimo de forragem de alta qualidade (Santos, 1997), e seu plantio
foi expandido nos últimos vinte anos em decorrência do seu alto potencial produtivo
(Da Silva, 1995), chegando, em 2008, a ocupar 20% de toda a área de pastagem
cultivada no país (Martuscello et al., 2008).
2.2.2. Mecanismos de reprodução: reprodução sexual e apomítica
Panicum maximum também é um importante modelo de estudo para
mecanismos de reprodução, uma vez que esta espécie apresenta tanto reprodução
sexual quanto reprodução por apomixia (Savidan, 2000; Hanna et al., 1973).
Embora a reprodução sexuada seja o mecanismo reprodutivo mais difundido
entre as plantas superiores, muitas espécies apresentam propagação assexuada ou
vegetativa, de forma facultativa ou obrigatória. Os mecanismos mais comuns de
reprodução assexuada são por meio de rizomas, tubérculos, bulbos ou outros
órgãos vegetativos (Bueno et al., 2002).
Um outro tipo de reprodução assexuada encontrado entre vegetais é a
apomixia, modo pelo qual há formação do embrião sem que haja a união do núcleo
espermático do pólen com a oosfera (Bashaw, 1980), ou seja, formação de semente
sem que haja fecundação (Asker & Jerlin, 1992). Trata-se de um modo de
reprodução encontrado em cerca de 15% das famílias das angiospermas, presente
principalmente nas famílias das Gramineae (Poaceae), Asteraceae e Rosaceae.
A primeira referência sobre o fenômeno da apomixia data de 1841, quando
uma planta feminina de Alchornea (Euphorbiaceae) cultivada isoladamente formou
sementes. Poucas décadas após esta observação, Mendel executou “cruzamentos”
17
com o gênero Hieracium, com o intuito de angariar mais material de suporte às suas
teorias, sem saber que estava diante de plantas apomíticas. A progênie deste
cruzamento, entretanto, apresentou características de plantas oriundas de
autofecundação, o que o levou a duvidar de seus dados com Pisum (Asker & Jerling,
1992; Nogler, 1994).
Segundo Asker & Jerling (1992), há dois tipos principais de apomixia, a
esporofítica e a gametofítica, sendo que o tipo gametofítico pode ser subdividido em
apospórico ou diplospórico.
Na apomixia gametofítica, cuja ocorrência é frequente, inclusive em gêneros
de interesse econômico como Panicum, Brachiaria e Paspalum, há formação de um
saco embrionário não reduzido (diploide) por diplosporia ou por aposporia. Na
diplosporia, a célula-mãe do megásporo entra em mitose antes de completar a
meiose, formando sacos embrionários com oito núcleos e morfologicamente
semelhantes ao saco meiótico. Já na aposporia, a meiose é completada, mas os
gametas se degeneram, e as células iniciais apospóricas (ou apósporos) entram em
mitose, formando os sacos embrionários não reduzidos.
Já na apomixia esporofítica, relatada em algumas espécies de Citrus, não há
formação de sacos embrionários e os embriões desenvolvem-se a partir das células
dos envoltórios do óvulo (Nogler, 1984).
Em P. maximum, a reprodução apomítica é muito mais comum do que a
reprodução sexual (diploides sexuais 2n = 2x = 16) e as plantas sexuadas foram
primeiramente descritas para a espécie em uma pequena população da Tanzânia
por Combes & Pernès (1970). Assim, a espécie é, em via de regra, uma
autotetraploide (2n = 4x = 32) (Nakajima et al., 1979) embora sejam existentes
exemplares diploides (2n = 16), triploides (2n = 24), pentaploides (2n = 40),
hexaploides (2n = 48), octaploides (2n = 64), nonaploides (2n = 72) e também
plantas com números cromossômicos irregulares (2n = 30, 31, 34, 36, 37, 38)
(Bogdan, 1977).
A descoberta da sexualidade no gênero, porém, foi de grande importância por
gerar inúmeras possibilidades ao melhoramento genético da espécie (Savidan,
1981), visto que variedades assexuadas tendem a ser altamente heterozigotas e
segregam amplamente quando se reproduzem por via sexual (Bueno et al., 2002).
Desta forma, a relação entre sexualidade e apomixia pode ser utilizada por
18
programas de melhoramento como mecanismo para promoção da fixação do vigor
do híbrido na população (Nogler, 1984).
Para tanto, é necessário a identificação de plantas sexuais como genitores
maternais, que podem ser cruzadas com genótipos apomíticos, doadores de pólen.
Entretanto, é mais comum a ocorrência natural de genótipos sexuais diploides. Para
contornar tal característica, é necessária a duplicação cromossômica antes ou após
o cruzamento (Dall’Agnol & Schifino-Wittmann, 2005). A técnica mais comumente
empregada para realizar esta duplicação é a teraploidização dos genitores via uso
de colchicina, recurso que vem sendo utilizado em P. maximum desde 1971, ainda
na África (Savidan, 1980).
2.2.3 Diversidade e melhoramento genético da espécie
Os primeiros exemplares de Panicum maximum introduzidos no Brasil, de
origem africana, deram origem à primeira cultivar, o chamado Colonião (Jank, 1995),
que foi responsável por grande parte da engorda de bovinos no Brasil até a criação
de BAGs, a partir de acessos coletados no centro de origem da espécie e genótipos
oriundos de programas de melhoramento genético.
O primeiro passo para a introdução de novos cultivares no país foi dado na
década de 70, com a introdução dos ecótipos K 187B, em 1976, e T58, em 1978.
Estes materiais foram provenientes de coletas realizadas por pesquisadores do
ORSTOM (Institut Français de Recherche Scientifique pour le Développment en
Coopération) no Quênia e na Tanzânia no final dos anos 60 (Combes & Pernès,
1970).
A partir de então, foram diversas as entradas de genótipos provenientes de
grupos de pesquisa estrangeiros, como é o caso do cultivar africano Aruana e os
cultivares Gatton e Hamil (Jank, 1995). O grande marco que revolucionaria a
pesquisa de novos cultivares se deu em 1982, quando o ORSTOM, disponibilizou
parte da sua coleção para a EMBRAPA (Empresa Brasileira de Pesquisa
Agropecuária). O material disponibilizado contava com 426 ecótipos apomíticos
assexuados e 417 plantas sexuais, sendo considerada uma coleção com boa
representatividade da diversidade da espécie (Jank et al., 1990; Savidan et al.,
1989).
Dentre os materiais lançados por programas de melhoramento desde então,
estão o Tobiatã (Jank, 1995), o Massai (Brâncio et al., 2002) e o híbrido Atlas,
19
resultante do cruzamento dos cultivares IAC- Tobiatã e K- 67. Além do Aruana,
Tanzânia-1 (originário do cultivar T58) e Mombaça, lançados, respectivamente, em
1989, 1990 e 1993.
Dentre estes, o Mombaça e o Tobiatã são cultivares de grande porte e folhas
largas, seguidas pelo Colonião e Tanzânia-1 em termos de tamanho da planta. Já o
cv. Massai se distingue do grupo por apresentar porte baixo e folhas mais finas, mas
é uma planta que apresenta grande velocidade de estabelecimento e de rebrota
(Savidan et al., 1990).
Em relação aos outros cultivares de Panicum, o capim Massai apresenta,
além das diferenças morfológicas citadas, maior tolerância à acidez e reduzida
fertilidade dos solos, apresentando, em contrapartida, valor nutritivo inferior
(Valentim et al., 2001; Brâncio et al., 2003). Já a espécie Panicum maximum cv.
Mombaça, lançada pelo Centro Nacional de Pesquisa de Gado de Corte da
EMBRAPA, é altamente produtivo, com elevada capacidade de manutenção foliar
durante o ano e, principalmente, durante a estação de seca, além de apresentar
excelente resposta à adubação (Muller, 2000).
Embora o número de BAGs disponíveis no mercado nacional para o plantio
tenha aumentado nas últimas décadas, as pastagens brasileiras ainda podem ser
caracterizadas como grandes monoculturas clonais, geneticamente pobres e
vulneráveis à patógenos, o que torna necessário o investimento em programas de
melhoramento genético da espécie (Valle et al., 2009; Verzignassi & Fernandes,
2001).
O melhoramento de forrageiras tem como objetivos centrais o aumento da
produtividade, o aumento da resistência aos patógenos, a produção de sementes, e
a maior adaptação aos diferentes estresses. Além disso, como essas plantas são
utilizadas para alimentação animal direta, é interessante que os programas visem
também a palatabilidade e os valores nutricionais indiretos, visando conseguir maior
eficiência na sua transformação em produção animal (Valle et al., 2008; Valle et al.,
2009).
Os poucos programas de melhoramento de forrageiras são, tradicionalmente,
realizados por melhoramento genético clássico, no qual há seleção de genótipos
através de uma série de cruzamentos, o que leva aproximadamente uma década. O
sucesso desse tipo de abordagem depende de vários fatores, dentre os quais a
escolha adequada dos genitores, o desenho de experimentos com bom alcance
20
estatístico e a escolha correta dos caracteres e épocas de avaliação (Moose &
Mumm, 2008).
Estas limitações impostas pelo processo de melhoramento tradicional podem
ser reduzidas por meio do uso de técnicas avançadas em biotecnologia, através das
quais os genes de interesse podem ser mapeados nos genitores, o que reduz o
tempo envolvido no processo de melhoramento e aumenta a chance de sucesso dos
cruzamentos (Meuwissen et al., 2001; Valle et al., 2009). Dentre tais técnicas, os
programas de melhoramento têm adotado o uso de marcadores moleculares para o
melhoramento de diversas culturas.
2.3 Marcadores moleculares
2.3.1. Histórico
Os marcadores moleculares são regiões existentes no genoma que podem
atuar como sinalizadores na busca por regiões de interesse, representando assim,
uma forma indireta de avaliar e comparar diferentes genótipos (Laborda, 2011). Os
marcadores moleculares utilizados no melhoramento genético são freqüentemente
elementos genéticos que, por co-segregarem com os genes de interesse, permitem
o estudo comparativo de genótipos e de suas progênies (Sakiyama, 1993). Estes
marcadores podem ser baseados em características morfológicas, fisiológicas,
bioquímicas ou moleculares (Sakijama, 1993). Até meados da década de 60, as
análises genéticas eram realizadas com base na utilização de marcadores
morfológicos de fácil identificação visual e, predominantemente, controlados por um
único gene (Ferreira & Grattapaglia, 1998).
A revolução neste campo de estudo se iniciou com o descobrimento de
marcadores isoenzimáticos a partir do ano de 1959 (Market & Moller, 1959), o que
permitiu um rápido aumento do número de marcadores genéticos descritos e
estendeu a aplicação da técnica para praticamente todas as espécies de plantas
(Ferreira & Grattapaglia, 1998). Embora este tipo de marcador tenha propiciado uma
grande expansão do conhecimento, é normalmente encontrado um baixo número de
variantes nas proteínas, limitando o desenvolvimento de mapas genéticos a partir
desta abordagem.
Foi apenas em meados dos anos 80, com a expansão dos métodos de
análise de DNA, que a descoberta e uso de marcadores se tornou recorrente. Então,
em menos de quarenta anos, nossa compreensão sobre os marcadores foi
21
drasticamente expandida, o que ampliou e modificou nossa visão sobre muitos
fenômenos naturais.
Embora tenham sido descobertos uma grande gama de novos marcadores,
podemos classificá-los em três categorias conceituais: variantes proteicas
(aloenzimas), polimorfismos na sequência do DNA (como RFLP e AFLPs) e
variações em repetições do DNA, como minissatélites e microssatélites (SSR)
(Schlötterer, 2004).
Já Gupta (1999), também classifica os marcadores em três classes, mas
adota como parâmetro o método utilizado para a sua detecção: marcadores
baseados na hibridização do DNA, como os polimorfismos de comprimento de
fragmentos de restrição do DNA (RFLP), os baseados na reação em cadeia da
polimerase (PCR), tais como AFLPs e microssatélites e os baseados na variação
entre sequências e na utilização de chips de DNA, como, por exemplo, os
marcadores SNP (Single Nucleotide Polymorphism).
Maheswaran (2004), por sua vez, sintetiza a história dos marcadores
moleculares na Tabela 1 e a classifica em três etapas: marcadores de primeira
geração, marcadores de segunda e marcadores de nova geração.
22
Tabela 1. Evolução dos marcadores moleculares (Maheswaran, 2004).
Primeira Geração e Marcadores Moleculares
Ano Acronimo Nomenclatura
1974 RFLP Restriction Fragment Length Polymorphism
1985 NTR variable Number Tandem Repeats
1986 ASO Allele Specific Oligonucleotides
1988 AS - PCR Allele Specific Polimerase Chain Reaction
1988 OP Oligonucleotide Polymorphism
1989 SSCP Single Stranded Conformational Polymorphism
1989 STS Sequence Tagged Site
Segunda Geração e Marcadores Moleculares
Ano Acrônimo Nomenclatura
1990 RAPD Randomly Amplified Polymorphic DNA
1990 AP - PCR Arbitrarily Primed Polymerase Chain Reaction
1990 STMS Sequence Tagged Micro Satellite Sites
1991 RLGS Restriction Landmark Genome Scanning
1992 CAPS Cleaved Amplified Polymorphic Sequence
1992 DOP - PCR Degenerate Oligonucleotide Primer - PCR
1992 SSR Simple Sequence Repeats
1993 MAAP Multiple Arbitrary Amplicon Profiling
1993 SCAR Sequence Characterized Amplified Region
Nova Geração e Marcadores Moleculares
Ano Acronimo Nomenclatura
1994 ISSR Inter Simple Sequence Repeats
1994 SAMPL Selective Amplification Of Micro Satellite Polymorphic Loci
1994 SNP Single Nucleotide Polymorphisms
1995 AFLP (SRFA) Amplified Fragment Length Polymorphism (Selective
Restriction Fragment Amplification)
1995 ASAP Allele Specific Associated Primers
1996 CFLP Cleavase Fragment Length Polymorphism
1996 ISTR Inverse Sequence-tagged Repeats
1997 DAMD-PCR Directed Amplification Of Mini Satellite DNA-PCR
1997 S - SAP Sequence-specific Amplified Polymorphism
1998 RBIP Retrotransposon Based Insertional Polymorphism
1999 IRAP Inter-retrotransposon Amplified Polymorphism
1999 REMAP Retrotransposon-Microsatellite Amplified Polymorphism
1999 MSAP Methylation Sensitive Amplification Polymorphism
2000 MITE Miniature Inverted-repeat Transposable Element
2000 TE - AFLP Three Endonuclease AFLP
2001 IMP Inter-MITE Polymorphisms
2001 SRAP Sequence-related Amplified Polymorphism
Com os avanços na caracterização de novos marcadores e das técnicas em
biologia molecular, que possibilitaram o avanço das pesquisas em larga escala, os
marcadores têm, cada vez mais, sido incorporados em programas de melhoramento
como geradores de informações valiosas aos melhoristas genéticos, tais como a
identificação e discriminação de genótipos, avaliação da variabilidade genética de
23
uma população, e a aceleração do lançamento de novos genótipos no mercado
(Borém & Caixeta, 2004).
2.3.2. Os marcadores SNPs
Os SNPs são variações em um único nucleotídeo nas sequências de bases
em fragmentos homólogos do DNA, sendo esta a mais freqüentes forma de
polimorfismo encontrada no genoma (Kwok, 1996; Kruglyak, 1997).
Para que tais variações sejam consideradas um SNP, convencionou-se que,
para um dado loco, o alelo menos frequente na população tenha uma abundância
superior a 1%. Essa frequência mínima reduz a chance de que polimorfismos
verdadeiros sejam confundidos com mutações raras e pontuais (Wang et al., 1998).
Teoricamente, os SNPs podem ser polimorfismos bialélicos, trialélicos, ou
tetralélicos, entretanto são encontrados predominantemente na forma bialélica
(Brookes, 1999). Isso é justificado pela predominância da ocorrência de transições
em comparação com as transversões, em função da alta taxa de desaminação
espontânea da 5–metilcitosina para timina em dinucleotídeos C e G (Vignal et al.,
2002; Coulondre et al., 1978).
Os SNPs ocorrem com alta freqüência em todos os organismos, sendo
relatadas taxas em genomas vegetais de 1 SNP a cada 100-300 pares de base
(Gupta et al., 2001). Devido à sua alta disseminação pelo genoma, os SNPs são
uma rica fonte de variabilidade e possivelmente são responsáveis pela maioria das
contribuições do genótipo na variação do fenótipo (Botstein & Risch, 2003).
Esses polimorfismos ocorrem tanto nas regiões gênicas codificadoras (éxons)
quanto nas não codificadoras (íntrons), embora seja muito mais comum a ocorrência
fora das regiões gênicas (Rafalski, 2002). Os SNPs que ocorrem em éxons podem
ser categorizados em duas classes: sinônimos, quando não levam à alteração da
seqüência de aminoácidos, e não-sinônimos, quando o polimorfismo altera o
aminoácido.
Os SNPs podem atuar, de forma direta ou indireta, alterando a conformação
de proteínas (Chamary et al., 2006; Gupta & Lee, 2008), a ligação de fatores de
transcrição às regiões regulatórias, influenciando no processo de splicing alternativo,
alterando o nível de expressão gênica (Kudla, 2009) e a estrutura do RNA e sua
estabilidade, refletindo, portanto, na concentração final da proteína. Além disso,
24
SNPs nas proximidades de genes codificantes de miRNA podem alterar o
processamento e a função de pequenos RNAs (Sun et al., 2009).
Nas últimas décadas, com o intenso desenvolvimento tecnológico, vem sendo
possível gerar um grande número de sequências de ácidos nucleicos, o que
possibilitou o desenvolvimento de metodologias para identificar SNPs utilizando
ferramentas de bioinformática (Wang et al., 2005). Além disso, várias metodologias
vêm sendo exploradas no melhoramento genético assistido por marcadores SNP,
como análises de PCR (reação em cadeia da polimerase) em tempo real utilizando
TaqMan, microarranjos de DNA, cromatografia líquida de alta pressão desnaturante,
espectrometria de massas e técnicas que empregam sequenciamento de nova
geração (Blondal et al., 2003; Langaee & Ronaghi, 2005; Nielsen et al., 2011).
2.3.3 Genotipagem de SNPs
Os marcadores SNPs são altamente informativos, pois possuem natureza
codominante em espécies poliploides, ou seja, não só determinam a existência do
polimorfismo em um determinado loco como também são capazes de determinar a
abundância das variações alélicas desse loco em diferentes genótipos e dentro do
mesmo genótipo. Assim, a genotipagem de loco SNPs deve envolver não apenas a
identificação do polimorfismo, mas também a estimação do número de cópias
alélicas do mesmo.
A quantificação desta dosagem é possível quando se utiliza genotipagem do
SNP de forma quantitativa, como as tecnologias empregadas pelo Illumina Golden
GateTM (Fan et al., 2003) e pelo Sequenom iPLEX MassARRAY® (Oeth et al.,
2007, 2009), que geram dois sinais para cada locos SNP.
A plataforma MassARRAY (Sequenon Inc.), baseada em espectrometria
MALDI-TOF (matrix-assisted laser desorption/ionization time-of-flight), é amplamente
reconhecida pela sua capacidade de realizar análises apuradas nas genotipagens
por marcadores SNPs (Gabriel et al., 2009).
O ensaio é composto por uma reação inicial de PCR que amplifica o DNA nas
adjacências do local de ocorrência do polimorfismo. A seguir, o produto desta reação
é tratado para a eliminação dos dNTPs livres remanescentes e submetido a uma
nova PCR, conhecida como reação iPLEX, que visa amplificar apenas uma pequena
região imediatamente antecessora ao sítio do SNP. Além disso, na reação iPLEX,
são utilizados iniciadores com massa modificada pela inserção de um nucleotídeo
25
marcado. O produto desta reação pode ser, então, submetido à espectrometria de
massas baseada no tempo de voo (MALDI-TOF) através da transferência da mesma
para um chip específico com uma matriz especial.
Esta matriz é excitada por um laser, processo conhecido como dessorção, e a
transferência de energia promove a vaporização da amostra com o DNA, que passa
então para o tubo de voo do equipamento e é acelerada até um detector, sendo o
tempo que a partícula de DNA leva para percorrer o caminho é chamado tempo de
voo. Como os iniciadores desenhados para os polimorfismos apresentarão massas
diferentes, e em razão disso, apresentarão um tempo de voo diferente, a distinção
dos alelos é facilmente identificada baseando-se na diferença de peso molecular
(Gabriel et al., 2009).
Desta forma, uma vez que os iniciadores são desenhados para SNPs
bialélicos, o equipamento gerará dois sinais, cada um correspondendo à intensidade
registrada por um dos possíveis alelos. Então, o valor esperado de cada intensidade
do sinal é proporcional à dosagem presente no alelo (Oeth et al., 2009; Akuhunov et
al., 2009). A possibilidade desta diferenciação faz dos SNPs excelentes marcadores
para estudos em espécies poliploides, fazendo com que essa técnica torne possível
observar diversas classes genotípicas, diferentemente dos marcadores SSRs
(Mollinari, 2012).
Entretanto, a função “SNP genotype call” do software TYPER, distribuído
juntamente com a plataforma Sequenom iPLEX MassARRAY, não pode ser aplicada
a poliploides, limitando consideravelmente o uso dos dados gerados na genotipagem
de SNPs destas espécies. Felizmente, tal restrição pode ser contornada aplicando
aos dados uso dos modelos gráficos Bayesianos (Serang et al. 2012).
Serang et al. (2012) converteram estes modelos complexos em uma
plataforma online denominada SuperMASSA, a qual pode ser livremente utilizada
para inferir o genótipo para os locos SNPs dos genitores e de cada indivíduo em
uma população F1 (dentre outras possibilidades). Assim, o modelo possibilita estimar
o nível de ploida e a dosagem alélica de SNPs, fornecendo novas possibilidades de
estudo para organismos autopoliploides complexos (Garcia et al., 2013).
2.4 Mapas de ligação
Os mapas de ligação, também chamados de mapas genéticos, podem ser
definidos como representações lineares da posição de genes e/ou marcadores
26
moleculares ordenados em grupos de ligação, de modo que, para um mapa
densamente saturado, o número de grupos de ligação seja igual ao número de
cromossomos da espécie.
Os mapas genéticos possibilitam a localização de genes, estudos de
associação de genes a características quantitativas (QTLs - quantitative trait locus),
cobertura e análise completa de genomas, além de informações a respeito da
arquitetura genética, ligações gênicas e auxiliam no entendimento da história
evolutiva das espécies (Garcia et al., 2006).
A pedra fundamental para o conceito de mapa de ligação proveio da
descoberta de Thomas Hunt Morgan e equipe, em 1910, quando observaram, em
Drosophila melanogaster, proporções fenotípicas não coincidentes com as propostas
pela segunda lei de Mendel, a lei da segregação independente dos genes. A partir
dessa observação, Morgan sugeriu que a distorção das proporções poderia indicar o
agrupamento de alguns genes e a ocasional permutação de alguns genes entre os
cromossomos homólogos (Coelho & Silva, 2005).
Poucos anos depois, em 1913, Sturtevant, foi o responsável pela criação do
primeiro mapa de ligação, posicionando e ordenando seis genes de D. melanogaster
e sugerindo o uso da porcentagem de recombinantes como indicador da distância
linear dos genes para a construção de mapas. Tal distância é dada usualmente em
centimorgans (cM), em homenagem a T.H. Morgan.
Devido aos poucos recursos na descoberta de marcadores moleculares da
primeira metade do século XX, os primeiros mapas genéticos, desenvolvidos para
culturas como milho, ervilha e tomate, foram baseados em marcadores morfológicos
e citológicos, o que tornava impossível a obtenção de mapas com uma boa
cobertura do genoma. Entretanto, a partir da década de 80, com a explosão de
novas metodologias baseadas em DNA, os mapas puderam se tornar amplamente
saturados e virtualmente ilimitados (Carneiro & Vieira, 2002; Ferreira & Grattapaglia,
1998).
Atualmente, mapas genéticos estão sendo desenvolvidos para centenas de
espécies com uma resolução cada vez maior, devido à grande disponibilidade de
marcadores altamente polimórficos a baixos custos. A evolução das técnicas de
detecção e genotipagem de marcadores, aliada a procedimentos estatísticos cada
vez mais complexos e específicos, tem permitido a construção de mapas de ligação
27
para a maioria das espécies vegetais de interesse agronômico (Slate, 2005;
Carneiro & Vieira, 2002).
No contexto do melhoramento de plantas, mapas de ligação detalhados são
extremamente úteis ao possibilitarem a cobertura e análise do genoma, a
decomposição de características genéticas complexas nos seus componentes
mendelianos, o mapeamento comparativo entre espécies, estudos de análises
filogenéticas, a predição de descendências em cruzamentos experimentais, a
identificação de marcas relacionadas com regiões-chave do genoma para a
expressão de características quantitativas (QTL) e a quantificação do efeito destas
regiões na característica estudada e a canalização de toda esta informação para o
uso em programas de melhoramento, além de serem o primeiro passo para a
clonagem posicional de genes responsáveis por características importantes
(Tanksley, 1993; Semagn et al., 2006; Ferreira & Grattapaglia, 1998).
Entretanto, para um mapa genético poder ser utilizado para os fins listados
acima, ele precisa ser robusto e bem construído. Para tanto, deve seguir critérios
como simplicidade, robustez, transferência, e relação custo-eficácia (Lorieux et al.,
2000). Desta forma, a metodologia de construção de um mapa genético integra uma
série de procedimentos e análises, que incluem (Carneiro & Vieira, 2002; Wu et al.,
2007; Mollinari, 2009):
1) Escolha de genitores contrastantes: o delineamento dos cruzamentos deve
ser realizado de modo a maximizar a probabilidade de detectar os polimorfismos.
Para tanto, é necessário avaliar a distância genética que separa os genitores, já que
quanto mais próximos geneticamente, menos frequente será a obtenção de
polimorfismos (Paterson et al., 1991). Deste modo, torna-se essencial a utilização de
populações segregantes com o máximo possível de desequilíbrio de ligação
(provocado, basicamente, pela ligação física entre os locos), o qual é, normalmente,
bastante elevado em populações de cruzamentos controlados (Tanksley, 1993;
Falconer & Mackay, 1996; Lynch & Walsh, 1998). Populações advindas de
diferentes tipos de cruzamentos podem ser utilizadas para a construção de mapas
de ligação, tais como as obtidas por retrocruzamentos, populações F2, linhagens
puras recombinantes, linhagens de duplo-haplóides e, no caso de espécies com
fecundação cruzada, cruzamentos entre indivíduos heterozigotos (Collard et al.,
2005; Ferreira & Grattapaglia 1998; Coelho, 2000);
28
2) Desenvolvimento de uma população segregante: a escolha da população
mais apropriada ao mapeamento está relacionada com o tipo de marcador a ser
analisado, a finalidade do mapa e as características da espécie (Tanksley, 1993). O
tamanho da população de mapeamento também é um fator relevante, embora não
haja um padrão de ordem numérica estabelecido (Bhering et al., 2008; Yarnes et al.,
2013). Mapas desenvolvidos com um pequeno número de indivíduos fornecem
grupos de ligação fragmentados e incompletos (Ferreira et al., 2006) e populações
muito grandes podem encarecer a análise desnecessariamente. Na prática, são
utilizadas populações com tamanho variando de 50 a 250 indivíduos (Rocha et al.,
2003).
3) Escolha do(s) tipo(s) de marcador(es) a ser(em) utilizados na genotipagem
da população: a escolha do tipo de marcador a ser utilizado deve levar em
consideração as vantagens e desvantagens dos marcadores, a infraestrutura
laboratorial, o tempo necessário para a realização das avaliações na população e as
ferramentas bioinformáticas disponíveis para a avaliação dos marcadores. Além
disso, é importante também considerar o padrão de segregação dos marcadores
(codominante ou dominante) (Liu, 1998). Sempre que possível, a construção dos
chamados mapas genéticos integrados, que utilizam de diferentes tipos de
marcadores moleculares, é a abordagem mais interessante, já que permite aumentar
a saturação do mapa de ligação (Maliepaard et al., 1997).
4) Verificação do padrão de segregação de cada loco marcador: um padrão
mendeliano típico é esperado na segregação dos marcadores, porém a ausência
deste padrão é muito usual e é chamado de desequilíbrio de ligação (Coelho & Silva
2002). Tal distorção é importante e pode, inclusive, aumentar o poder estatístico dos
mapeamentos de QTLs com efeitos aditivos e diminuir o poder em mapeamento de
QTLs com efeitos dominantes (Xu, 2008). O método mais importante e comum de
mapeamento utiliza a freqüência de recombinação para determinar a distância
relativa em centimorgans, entre dois marcadores ligados (Bhering et al., 2009). O
princípio do mapeamento genético é a observação de que a freqüência de quiasmas
entre dois genes ligados é proporcional à distância física entre ambos. Com base
nessa frequência é realizada uma análise para distribuição independente entre os
locos segregantes para identificar pares de características ligadas. (Ritter et
al.,1990).
29
5) Análise da ligação entre os marcadores para a formação dos grupos de
ligação: uma vez determinada a freqüência de recombinação, os marcadores podem
ser agrupados dentro dos chamados grupos de ligação, que, basicamente, são
grupos cujos locos estão localizados no mesmo cromossomo (Collard et al., 2005).
A ordem linear dos marcadores dentro de cada grupo é deduzida da distância
genética relativa a cada um dos marcadores analisados separadamente.
6) Determinação da ordem e da distância dos marcadores dentro desses
grupos de ligação: para análise da ligação e ordenamento das marcas nos grupos
de ligação são requeridos pacotes computacionais otimizados, que levam em conta
o tipo de marcador utilizado e a ploidia da espécie estudada. Para tanto, diversos
programas computacionais, baseados em diferentes metodologias de análise, foram
desenvolvidos, como “Mapmaker” (Lander et al., 1987), “JoinMap” (Van Ooijein &
Voorrips, 2001), “OneMap” (Margarido et al., 2007) e “TetraploidMap” (Hackett et al.,
2007).
Tendo em vista todas as variáveis inerentes a cada uma das etapas do
processo, cada fator pode afetar a eficiência do processo de mapeamento e, como
consequencia, é comum a obtenção de diferentes mapas gerados para populações
diferentes da mesma espécie (Liu, 1998; Paterson et al., 2000).
2.5 Mapeamento genético em poliploides
A teoria e as metodologias necessárias para obtenção de mapas genéticos
em espécies diploides são bem estabelecidas e otimizadas, o que não ocorre para
as espécies poliploides (Leach et al., 2010; Ripol et al., 1999). Tais espécies, que
correspondem a cerca de 75% dos vegetais, possuem complexos padrões de
segregação e alta diversidade de genótipos (Henry, 2008).
A construção de mapas genéticos para espécies poliploides é mais desafiadora
do que em diploides devido: (1) os modelos estatísticos e os modelos
computacionais necessários são mais complexos, visto que devem levar em
consideração os diferentes níveis de ploidia, (2) uma ampla variedade de genótipos
é esperada na população segregante, (3) há vários modos de formação de gametas
e pareamento randômico dos múltiplos cromossomos homólogos, (4) as diferentes
frequências dos gametas constituem um desafio adicional, devido à segregação dos
alelos com diferentes níveis de dosagem (Wu et al., 1992).
30
Visto que nenhum modelo foi desenvolvido até o momento afim de atender a
esta realidade, uma abordagem comum é o uso de marcadores em dose única
(MDU), como proposto por Wu et al. (1992). Deste modo, independente de qual seja
a dose de um marcador em um loco, somente se analisa a presença ou a ausência
dos alelos de cada marcador. Portanto, leva-se em conta apenas os marcadores em
dose única segregando na proporção 1:1, o que na progênie de um cruzamento
biparental, no qual o marcador está presente em um genitor e ausente em outro (Wu
et al.,1992).
Como consequência da desconsideração das informações sobre a dosagem
alélica, os marcadores codominantes passam a ter comportamento similar aos
marcadores dominantes, caso em que se aplica os SSRs e aos SNPs, levando a
perda informações (Da Silva et al., 1995).
Vários mapas foram feitos utilizando a estratégia do pseudo-testcross e
marcadores em dose única segregantes na proporção 1:1 (Daugrois et al., 1996;
Ming et al., 2001; AlJanabi et al., 2007). Garcia et al.(2006), baseando-se na
metodologia de Wu et al. (2002) propuseram a utilização dos marcadores
segregantes na proporção 3:1, possibilitando a construção de mapas genéticos
integrados em cana-de-açúcar (Oliveira et al., 2007). Essa forma trouxe vantagem
pois permitiu aumentar a saturação do mapa de ligação e estender a caracterização
da variação polimórfica em todo o genoma (Garcia et al., 2006).
Apesar do avanço implementado pelo emprego da metodologia de MDU na
análise para o mapeamento de cana-de-açúcar, por exemplo, o uso somente de
marcadores com segregações 1:1 e 3:1 torna o conhecimento genético da espécie
muito limitado. É conhecido que o uso de somente essas segregações é menos
informativo que outros tipos, como por exemplo, o uso de marcadores que segregam
nas proporções 1:2:1 ou 1:1:1:1, no caso de espécies diploides (Wu et al., 2002).
31
3. OBJETIVOS
3.1. Objetivo Geral
Contribuir para o conhecimento molecular da espécie Panicum maximum,
auxiliando assim os programas de melhoramento genético da espécie.
3.2. Objetivos Específicos
A partir do trancriptoma analisado por Toledo-Silva e colaboradores (2013),
identificar genes relacionados as vias do metabolismo no nitrogênio, fixação
de carbono, resistência a infecções e via de formação da lignocelulose;
Identificar e genotipar marcadores moleculares do tipo SNP para os genes
selecionados;
Construir um novo mapa de ligação para a espécie, em conjunto com
informações dos marcadores SSRs já genotipados anteriormente pelo nosso
grupo de pesquisa.
32
CAPÍTULO I
33
Construção de um mapa de ligação para Panicum maximum a partir de
marcadores moleculares SNPs e SSRs
Camila Fornezari Rabelloa, Guilherme Toledo-Silvad, Rodrigo Rampazob, Liana Jankc, Augusto Garciab, Anete Pereira Souzaa.
aCentro de Biologia Molecular e Engenharia Genética (CBMEG), Departamento de Genética e Biologia Molecular, Universidade Estadual de Campinas (UNICAMP), Campinas, São Paulo, Brasil bDepartamento de Genética, Escola Superior de Agricultura Luiz de Queiroz (ESALQ), Universidade de São Paulo (USP), Piracicaba, São Paulo, Brasil cEmbrapa Gado de Corte, Campo Grande, Mato Grosso do Sul, Brasil dDepartamento de Bioquímica, Universidade Federal de Santa Catarina (UFSC), Florianópolis, Santa Catarina, Brasil
Resumo
Os programas de melhoramento genético de espécies de importância
comercial têm evoluído muito pelo emprego de marcadores moleculares e mapas de
ligação. A espécie Panicum maximum é uma das mais importantes gramíneas
forrageiras do Brasil, sendo cultivada em uma área superior a 34 milhões de
hectares. Entretanto, dado o escasso número de trabalho voltados para a elucidação
dos seus aspectos genético-moleculares, um único e limitado mapa de ligação está
disponível para a espécie. Assim, o objetivo deste trabalho foi a construção de um
novo mapa de ligação para P. maximum, integrando marcadores do tipo SSR e
SNP, através de um software específico para espécies tetraploides, o TetraploiMap.
Como resultado, foram identificados 86.312 SNPs e foram construídos mapas de
ligação para dois genótipos (S10 e Mombaça). O mapa do genitor Mombaça contou
com 119 marcadores e cobriu 897,1 cM, enquanto o mapa do genitor S10 possui
113 marcadores, distribuídos em 808,4 cM. Estes resultados ampliam o
conhecimento genético da espécie e servirão como base para estudos que visem o
melhoramento genético de P. maximum assistido por marcadores moleculares.
Palavras-chave: mapeamento genético, forrageiras, TetraploidMap, SNP, SSR
34
Introdução
A espécie Panicum maximum, popularmente conhecida como capim-colonião,
é uma das gramíneas mais importantes e populares do Brasil, ocupando
aproximadamente 20% da área de pastagens cultivadas do país (Martuscello et al.,
2008), o que corresponde a 34 milhões de hectares. A espécie é ainda a
responsável por 30% do mercado nacional de sementes de plantas forrageiras
(Abrasem, 2004).
O sucesso de P. maximum decorre de suas características de adaptabilidade
e performance, tais como elevadas taxas de produtividade, baixa exigência em
relação à fertilidade do solo, resistência à secas e queimadas e alto desempenho
sob sistema intensivo de produção. Adicionalmente, a espécie oferece alta
palatabilidade, boa digestibilidade e elevadas taxas nutricionais ao gado, além de
poder ser oferecida a espécies de equinos e ovinos (Jank et al., 1997; Jank, 2003;
Aronovich, 1995, Martuscello et al., 2006).
Embora sua importância para o agronegócio brasileiro seja notável, a espécie
ainda permanece pouco estudada, possuindo, consequentemente, poucos cultivares
lançados comercialmente. Isso contribui, dentre outros fatores, para que as
pastagens sejam cultivadas em grandes áreas de monocultura clonais,
geneticamente pobres e vulneráveis à patógenos e pragas, o que torna evidente a
necessidade do investimento em programas de melhoramento genético da espécie
(Valle et al., 2009; Verzignassi & Fernandes, 2001).
Atualmente, o único programa de melhoramento de P. maximum do país é
conduzido pela Embrapa Gado de Corte (Campo Grande, Mato Grosso do Sul), que
conta com uma coleção de acessos apomíticos e sexuais introduzida no Brasil na
década de 80, por meio de um acordo com o Institut Français de Recherche
Scientifique pour le Développement en Coopération (ORSTOM). A partir daí,
trabalhou-se na caracterização dos acessos e iniciou-se o melhoramento genético
da espécie, possibilitando o lançamento dos cultivares como o P. maximum cv.
Tanzania-1 (1990), P. maximum cv. Mombaça (1993) e o P. maximum cv. Massai
(2001) (Jank et al., 2005).
Para o avanço da assertividade do programa e aceleração do lançamento de
novos cultivares, faz-se necessário o entendimento de características genéticas e
moleculares da espécie. O único mapa molecular disponível de P. maximum foi
35
publicado em 2005 por Ebina e colaboradores. Tal mapa, possui apenas marcadores
de caráter dominante e foi baseado em uma única cultivar (único parental de um
cruzamento biparental) lançada pelo programa de melhoramento genético japonês
(Ebina et al., 2005).
No contexto do melhoramento de plantas, mapas de ligação são muito úteis
ao possibilitarem a cobertura e análise do genoma, a decomposição de
características genéticas complexas nos seus componentes mendelianos, o
mapeamento comparativo entre espécies, estudos filogenéticos, a predição de
descendências em cruzamentos e a identificação de marcas relacionadas com
regiões-chave do genoma para a expressão de características quantitativas (QTL –
Quantitavive Trait Locus) (Tanksley, 1993; Semagn et al., 2006; Ferreira &
Grattapaglia 1998).
O mapeamento em espécies poliploides, como é o caso de P. maximum (2n =
4x = 32), é mais complexo e desafiador, uma vez que a dosagem e frequência
alélica dos locos marcadores precisam ser estimadas e há mais possibilidades na
formação dos gametas com, consequentemente, maior variabilidade genética entre
a população de indivíduos. A estes pontos soma-se o fato de existirem um número
limitado de ferramentas de mapeamento e análise de dados para espécies
poliploides (Wu et al., 1992).
Este trabalho teve como objetivo a construção do primeiro mapa molecular da
espécie com informações de marcadores moleculares do tipo SSR e SNP,
utilizando, para tanto, uma metodologia desenvolvida especificamente para espécies
tetraploides, implementado no software TetraploiMap. O mapa gerado nesta
pesquisa poderá ser empregado em estudos genéticos sobre o comportamento
genômico em híbridos, fornecendo informações que auxiliem o programa de
melhoramento genético da espécie, além de poder ser utilizado como base para
estudos futuros.
Materiais e métodos
População de mapeamento e material vegetal
A população de mapeamento utilizada é composta por uma progênie de 137
indivíduos (irmãos completos de F1), gerada a partir do cruzamento entre o genitor
36
sexual S10 e a cultivar apomítica Mombaça, ambos tetraploides (2n = 4x = 32) e
dotados de características de produção contrastantes. Para a viabilização do
cruzamento, o genótipo sexual foi anteriormente tetraploidizado através do uso de
colchicina. A progênie gerada a partir do cruzamento é bastante heterogênea e
alguns indivíduos foram utilizados como parentais em outros cruzamentos, o que faz
desta população uma importante fonte de variabilidade genética para o programa de
melhoramento genético da espécie.
Para cada indivíduo da população e seus parentais, foram coletadas de 3 a 4
folhas, as quais foram liofilizadas e processadas com auxílio de um moinho
laboratorial (IKA Works Inc., USA). O DNA foi extraído segundo protocolo otimizado
para a espécie (Sousa, 2010) e a integridade deste material foi avaliada através de
gel de agarose 1%. O DNA de cada indivíduo foi quantificado utilizando o aparelho
NanoDrop 8000 UV-Vis Spectrophotometer (Thermo Scientifc, USA), e teve sua
qualidade estimada a partir das razões 260/280 nm e 230/260 nm.
Mapeamento do transcriptoma e prospecção de SNPs
A partir do transcriptoma de folhas publicado para a espécie (Toledo-Silva et
al., 2013), foram selecionadas as leituras (reads) provenientes dos genótipos
Mombaça e S10. Foi então realizado o mapeamento destas leituras nos transcritos
de P. maximum através do programa CLC Genomics Workbench 4.9 (Qiagen, DEU).
Dentre os parâmetros de mapeamento utilizados, destacam-se a Lenght fraction =
0,9 e Similarity = 0,9.
A busca de SNPs foi realizada pelo emprego da ferramenta SNP detection
disponível no mesmo programa, utilizando os parâmetros: Maximum expected
variations = 4, Minimum coverage = 20, Variants = 2 (considerando apenas SNPs
bialélicos) e Minimum variant frequency = 35%.
A re-anotação dos transcritos oriundos do mapeamento do transcriptoma foi
realizada através da ferramenta Blast2GO (Conesa et al., 2005), utilizando o
algoritmo blastx contra o banco de proteínas não reduntantes (nr) do SwissProt, com
filtro de e-value em 10-6 e no mínimo 30% de pct_hit_len_aligned (porcentagem
alinhada do contig frente ao gene homologo encontrado). A partir das informações
obtidas, foram filtrados manualmente os contigs referentes a genes relacionados às
vias do metabolismo no nitrogênio, fixação de carbono, resistência biótica/abiótica e
via de formação da lignocelulose. Foram ainda selecionados um máximo de quatro
37
contigs pertencentes ao mesmo gene predito e um limite de três SNPs pertencentes
ao mesmo contig.
Uma vez que não há genoma para P. maximum, a filtragem de SNPs em
possíveis regiões intronicas foi realizado via BLAST com dados de Panicum
virgatum no banco Phytozome v9.1 (http://www.phytozome.net). Foram selecionados
os marcadores presentes em regiões com: (I) aproximadamente 150 pares de bases
(pb) em cada flanco, (II) que não apresentassem outro SNP a, pelo menos, 50 pb de
distância, (III) ausência de regiões intrônicas a uma distância mínima de 50 pb do
SNP (IV) ausência de íntrons com tamanho superior a 100 pb nas porções
flanqueadoras de ~300 pb.
Mapeamento genético utilizando o software TetraploidMap
Para a construção do mapa de ligação, foram utilizados os marcadores SNPs
identificados e marcadores do tipo SSR desenvolvidos previamente (Toledo-Silva et
al., 2013; Souza et al., 2011a; Souza et al., 2011b).
A genotipagem dos marcadores SSR foi realizada por coloração por nitrato de
prata (Creste et al., 2001) ou em genotipador Li-Cor 4300 DNA Analyzer (Schuelke,
2000) por Toledo-Silva (2013). A genotipagem dos SNPs foi realizada via
espectrometria de massas na plataforma Sequenom iPLEX MassARRAY®
(Sequenom Inc., San Diego, California, USA).
O mapa de ligação foi construído utilizando-se o programa TetraploidMap
(Hackett et al., 2007), que permite a construção de mapas a partir de marcadores
dominantes e codominantes, em populações de irmãos-completos provenientes de
cruzamento de espécies autotetraploides utilizando marcas SSR e AFLP.
Para os marcadores tipo SSR, a segregação foi verificada através da
ferramenta findgeno, disponível no TetraploidMap. Apenas as marcas com
segregação 1:1, 3:1 e 5:1 foram utilizadas. Já para os marcadores tipo SNP, foi
necessária a conversão das marcas para marcadores dominantes AFLP. A ploidia e
dosagem alélica dos SNPs foi estimada pelo software SuperMASSA (Serang et al.,
2012) e apenas SNPs com segregação 1:1 e 3:1 foram utilizados no mapeamento. O
mapa genético final foi desenhado pelo programa MapChart 2.3 (Voorrips, 2002).
38
Resultados e discussão
Identificação de marcadores moleculares SNP para Panicum maximum
Através do mapeamento do transcriptoma de folhas dos parentais S10 e
Mombaça, foi possível a identificação de 86.312 SNPs. Este número é superior ao
obtido em outros trabalhos que visaram o mapeamento de marcadores moleculares
do tipo SNP tomando como base dados de transcriptoma, como trigo e grão de bico,
para os quais foram obtidos 36 mil SNPs (Schnable et al., 2009; Jhanwar, et al.,
2012), e eucalipto, pimenta Capsicum annuum e Artemisia tridentata, com números
entre 20 e 25 mil SNPs (Novaes et al., 2008; Ashrafi et al., 2012; Bajgain et al.,
2011).
O número, porém, foi inferior ao obtido para P. maximum por Toledo-Silva e
colaboradores (2013), quando foram mapeados 106.951 SNPs para os genótipos
S10 e Mombaça. A diferença do número de marcadores prospectados, da ordem de
19,30%, reflete o emprego de diferentes programas computacionais e o uso de
parâmetros estringentes no presente estudo. A importância da escolha dos
parâmetros de busca é corroborada por outros dados, como os de Trick e
colaboradores (2009), para os quais houve redução de 45,22% do número de SNPs
mapeados pela alteração de um único parâmetro (Minimum coverage, de 4 para 8
reads).
Dentre os SNPs identificados neste estudo, 64,17% são classificados como
transições e 35,83% são transversões (Tabela 1). Esta porcentagem
significativamente maior de transições é observada para diferentes espécies e com
diferentes metodologias para busca de SNPs (Garg et al., 1999; Picoult-Newberg et
al., 1999; Deutsch et al., 2001; Toledo-Silva et al., 2013) e provavelmente se deve
ao fato deste tipo de fenômeno ocasionar mais frequentemente mutações sinônimas
a nível de proteína, o que torna evolutivamente mais provável sua fixação nas
populações.
A profundidade mínima (mínima cobertura) estabelecida como critério de
busca dos marcadores foi de 20 reads por contig, e esta foi a profundidade com o
maior número de SNPs mapeados, totalizando 2.177 SNPs, o que representa 2,5%
do total de dados. A profundidade máxima alcançada foi de 274.960 reads/ contig.
39
Para a frequência alélica dos SNPs, o valor mínimo estabelecido foi de 35% e
a frequência mais abundantemente mapeada foi de 63/37%, com incidência em
7,46% dos SNPs mapeados. O estabelecimento de uma frequência mínima de 35%,
bastante superior aos 1% de frequência mínima para uma alteração ser considerada
um SNP verdadeiro, reduz a chance do mapeamento de falsos SNPs, aumentando a
assertividade na genotipagem destes marcadores, embora, em contrapartida,
provoque a exclusão de SNPs raros, potencialmente úteis ao melhoramento
assistido por marcadores.
Tabela 1. Classificação dos SNPs mapeados para P. maximum.
Tipo dos SNPs Número de SNPs Porcentagem
Transições 55.389 64,17
A-G/G-A 27.154 31,46
C-T/T-C 28.235 32,71
Transversões 30.923 35,83
A-C/C-A 7.461 8,64
A-T/T-A 6.817 7,90
T-G/G-T 7.537 8,73
G-C/C-G 9.108 10,55
Total 86.312
Com relação à distribuição destas marcas ao longo do transcriptoma de
folhas, os 86.312 SNPs mapeados estão distribuídos em 16.356 contigs, o que gera
uma média de 5,28 SNPs/contig. Considerando o tamanho médio dos contigs na
ordem de 1.700 pares de bases (pb), há a incidência média de um SNP a cada 322
pb. Este número está muito próximo à taxa de um SNP a cada 100-300 pb descrita
para genomas vegetais por Gupta e colaboradores (2001), e encontra-se entre os
extremos de um SNP a cada 20 pb em batata e aveia até um SNP a cada 7.000 pb
em tomate (Labarte & Baldo, 2005; Nesbitt & Tanksley, 2002; Rickert et al., 2003;
Rafalsky, 2002).
Um total de 3.805 contigs apresentaram apenas um SNP (23,27% dos
dados), enquanto o contig comp411426_c0_seq1 apresentou o maior número deste
tipo de polimorfismo, com 88 SNPs. A anotação deste contig indica se tratar de uma
Heat Shock Protein, proteínas extremamente abundantes e pertencentes à família
das chaperonas, que desempenha importantes papéis celulares, tais como auxílio
no enovelamento das proteínas, reciclagem de proteínas com conformações
40
anômalas ou agregadas, translocação proteica, entre outros (Mayer & Bakau, 2005).
Os contigs com maior número de polimorfismo podem ser visualizados na Tabela 2.
Tabela 2. Classificação dos 10 contigs que apresentaram maior número de SNPs
mapeados.
Contig Número
de SNPs Anotação
comp411426_c0_seq1 88 Heat shock 70 kDa protein 15
comp411103_c0_seq1 77 Coatomer subunit beta-2
comp411096_c0_seq1 73 Calmodulin-binding transcription activator 3
comp411237_c0_seq1 73 Glutamate receptor 3.4
comp411617_c0_seq1 71 Pre-mRNA-processing-splicing factor 8
comp411585_c0_seq1 66 BAG family molecular chaperone regulator 6
comp411278_c0_seq1 60 Filament-like plant protein 4
comp411595_c0_seq1 59 FAB1B
comp407321_c0_seq1 58 Myosin-15
comp411312_c0_seq1 57 Disease resistance protein At1g58390
Dado o elevado número de contigs nos quais foram identificados os
polimorfismos e a presença de até 80 SNPs por contig, visando reduzir a
redundância dos dados e assegurar o sucesso da genotipagem dos polimorfismos
encontrados, adotou-se a estratégia de selecionar os melhores SNPs de cada contig
cuja anotação indicasse similaridade às vias do metabolismo no nitrogênio, fixação
de carbono, resistência biótica/abiótica e via de formação da lignocelulose.
Ainda, uma vez que os contigs selecionados são oriundos de uma análise de
transcriptoma, foi necessário realizar uma comparação via BLAST com um banco de
dados de Panicum virgatum para averiguar a presença de íntrons nestes contigs,
uma vez que tais regiões poderiam resultar em dificuldades para a genotipagem dos
marcadores.
O estabelecimento destes critérios resultou na seleção de 163 SNPs,
distribuídos em 81 contigs, o que gera média de 2,01 SNP/contig. Esta quantidade
está próxima aos 125 SNPs validados por Trick et al. (2012) em linhagens de trigo
tetraploide e encontra-se entre o número estudado para organismos diploides e
organismos poliploides complexos, visto que Mantello e colaboradores (2014)
trabalharam com a validação de 78 SNPs em seringueira (Hevea brasiliensis) e
41
Garcia e colaboradores (2013) procederam com a validação via Sequenom para 271
SNPs de cana-de-açúcar.
Mapeamento genético de P. maximum
Como resultado das etapas de genotipagem e estimação de ploidia e
dosagem alélica, foram habilitados para o mapeamento 209 marcadores tipo SSR e
104 marcadores SNP.
O programa TetraploidMap, entretanto, foi desenvolvido para a criação de
mapas a partir de marcas AFLP e SSR, não sendo, portanto, habilitado para
utilização de marcadores tipo SNP. Desta forma, foi necessária a conversão dos
dados dos SNPs, de natureza codominante, para marcas tipo AFLP, de caráter
dominante. Para tanto, foram utilizadas apenas SNPs com dosagem simplex (e.g.
AGGG X GGGG) e duplo-simplex (e.g. AGGG X AGGG), que segregam na progênie
na proporção 1:1 e 3:1, respectivamente. Este tipo de conversão, além de implicar
na perda de marcadores, gera também a perda da profundidade dos dados,
tornando-os menos informativos.
Além disso, o uso da função findgeno, que estima a dosagem de cada loco a
partir da segregação observada na progênie pelo emprego de qui-quadrado, não é
opcional no programa, embora seja desnecessária neste estudo, visto que o
software SuperMASSA aqui empregado faz este papel de forma mais acurada, visto
que foi desenvolvido especificamente para dados oriundos das plataformas
Sequenom e Illumina Golden GateTM. Após estas etapas de filtragem e conversão,
56 SNPs foram descartados (53,85%), permanecendo, portanto, 48 SNPs com
potencial para ligação no mapa genético.
A partir do mapeamento dos marcadores moleculares pelo emprego do
TetraploidMap, foram obtidos dois mapas moleculares parciais para Panicum
maximum, um mapa baseado em cada um dos genitores (Figuras 1 e 2).
42
Figura 1. Mapa genético de P. maximum desenvolvido a partir de dados do genitor S10.
Marcadores SSR representados em preto e marcadores SNP em vermelho, com distância
calculada em cM (centimorgan).
43
Figura 2. Mapa genético de P. maximum desenvolvido a partir de dados do genitor
Mombaça. Marcadores SSR representados em preto e marcadores SNP em vermelho, com
distância calculada em cM (centimorgan).
44
O mapa do genitor S10 conta com 113 marcadores posicionados, sendo 19
marcadores SNPs e 94 marcadores tipo SSR. O mapa cobriu uma distância de
808,4 cM, distribuídos em 10 grupos de ligação (GLs). A distância média entre os
marcadores moleculares é de 7,15 cM, sendo que a menor distâncias entre duas
marcas é da ordem de 0,03 cM, enquanto que o maior gap é de 39,9 cM. Os grupos
de ligação possuem, em média, 11 marcadores cada um e apresentam tamanho
médio de 89,83 cM.
O grupo de ligação com maior número de marcadores moleculares
posicionados é o GL7, que conta com 24 marcas, enquanto que o grupo de ligação
que cobriu a maior distância é o GL3, com 146,69 cM. O menor grupo, tanto em
termos de número de marcas quanto em tamanho, é o GL9, que conta com apenas
dois marcadores do tipo SSR, o que o torna também o único GL sem marcadores do
tipo SNP ligados. As duas marcas que compõem o GL estão intimamente ligadas, de
modo que o GL cobriu a pequena distância de 0,03 cM (Tabela 3).
Tabela 3. Detalhamento dos grupos de ligação formados no mapeamento do genitor S10.
Mapa do genitor S10
Grupo de Número de Número de
Total Tamanho (cM) ligação SNP SSR
GL1 2 11 13 65,74
GL2 2 2 4 16,34
GL3 1 20 21 146,69
GL4 1 7 8 58,91
GL5 3 10 13 96,01
GL6 2 16 18 125,32
GL7 3 21 24 122,95
GL8 1 3 4 69,85
GL9 0 2 2 0,03
GL10 4 2 6 106,62
Somatória 19 94 113 808,43
Média 1,90 9,40 11,30 89,83
O mapa do genitor Mombaça, por sua vez, foi construído a partir da ligação
de 119 marcadores, sendo eles 22 SNPs e 97 SSRs. Tal mapa apresentou uma
distância maior quando comparado ao mapa do genitor S10, cobrindo 897,1 cM. O
número de grupos de ligação também foi maior, contando com 13 GLs. A distância
45
média entre os marcadores foi de 7,54 cM, com distância mínima e máxima entre
dois marcadores na ordem de 0,07 cM e 41,6 cM, respectivamente.
Em média, os GLs possuem 9 marcadores distribuídos em 69,01 cM. Não
estão presentes marcadores do tipo SNP nos grupos GL3, GL12 e GL13. O grupo
de ligação com menor número de marcas foi o GL13, com 2 marcadores SSR,
enquanto que o GL8 apresentou o maior número de marcas, com 19 marcadores
moleculares posicionados. Com relação ao tamanho dos grupos, o GL11 apresentou
a menor distância mapeada, com 1,30 cM, e o GL11, por sua vez, apresentou o
maior tamanho coberto, com 140,66 cM (Tabela 4).
A distância média, considerando ambos os mapas, de 7,35 cM entre cada
marcador é satisfatória quando comparada aos valores de 8,95 cM relatado para
salgueiro tetraploide e 10,7 cM para cana-de-açúcar (Barcaccia et al., 2003; Costa,
2015). Entretanto, em mapas saturados, estes valores comumente se aproximam da
marca de 1-3 cM por marca, podendo chegar a valores na ordem de 0,3 cM/marca,
indicando, portanto, que mais marcadores moleculares precisam ser agregados aos
mapas obtidos de P. maximum (Trick et al., 2009; Delourme et al., 2013).
Tabela 4. Detalhamento dos grupos de ligação formados no mapeamento do genitor Mombaça.
Mapa do genitor Mombaça
Grupo de
Número de SNP Número de SSR Total Tamanho (cM) ligação
GL1 1 2 3 5,88
GL2 1 13 14 101,17
GL3 0 4 4 48,87
GL4 4 9 13 57,26
GL5 2 4 6 71,03
GL6 2 8 10 98,79
GL7 2 12 14 78,48
GL8 4 15 19 109,97
GL9 4 13 17 140,66
GL10 1 10 11 94,86
GL11 1 2 3 1,30
GL12 0 3 3 47,27
GL13 0 2 2 41,58
Somatória 22 97 119 897,13
Média 1,69 7,46 9,15 69,01
46
Com relação às taxas de ligação dos marcadores, dos 48 SNPs disponíveis,
19 (39,58%) se ligaram ao mapa do genitor S10 e 22 SNPs (45,83%) se ligaram ao
mapa do genitor Mombaça. Deste modo, considerando ambos os mapas, 31 SNPs
se ligaram (64,58%), sendo que 10 destes polimorfismos (32,26%) se ligaram a
ambos os mapas. A taxa de ligação na ordem de 64,58% está próxima à
porcentagem de 75% de integração de SNPs obtidas para milho por Liu e
colaboradores (2010) e à média de 50% de integração de marcadores tipo AFLP e
SSRs convertidos à marcadores de dose única no mapa de salgueiro (Barcaccia et
al., 2003).
Já com relação aos SSR, 150 marcas das 209 disponíveis se ligaram a algum
dos parentais, o que gera uma taxa de ligação de 71,77%, número superior à taxa
de ligação dos marcadores SNP. Ao mapa do genitor Mombaça, 97 SSR foram
ligados, enquanto que 94 SSRs se ligaram ao mapa do genitor S10. O número de
SSRs que conseguiram se ligar a ambos os mapas foi de 41 SSRs, o que
representa 27,33% (Tabelas 3 e 4).
Em ambos os mapas gerados, o número de grupos de ligação encontrados foi
diferente dos 8 GLs esperados para a espécie (2n=4x=32), uma vez que foram
identificados 10 e 13 GLs (para S10 e Mombaça, respectivamente). Este desvio,
provavelmente, dá-se em decorrência do baixo número de marcadores utilizados, o
que, consequentemente, implica em mapas de ligação pouco saturados. Assim, à
medida que o número de marcadores adicionados ao mapeamento aumenta, há a
tendência de fusão dos GLs originalmente classificados como grupos diferentes,
aproximando o número de grupos de ligação encontrados do número real da
espécie.
Quando comparamos os mapas obtidos com o único mapa de ligação
disponível para Panicum maximum (Ebina et al., 2005), diferenças expressivas são
encontradas, uma vez que o tipo de marcadores moleculares utilizados e a
metodologia de montagem do mapa empregada foram diferentes.
Embora o mapa prévio também tenha sido desenvolvido com base em uma
população segregante de F1, apenas um dos genitores foi utilizado no mapeamento
e os polimorfismos empregados foram dos tipos AFLP e RAPD, o que implica em
dificuldades na reprodução e aplicabilidade do mapa. O mapa gerado por Ebina e
colaboradores cobriu 1706,5 cM e contou com 360 marcadores distribuídos em 39
47
grupos de ligação (quando eram esperados 32 GL pela metodologia empregada,
que gera um grupo para cada um dos homólogos), gerando, portanto, uma média de
4,74 cM por marca.
Conclusões
No presente estudo, pela primeira vez, marcadores moleculares SSRs e
SNPs foram utilizados para a construção de mapa molecular para a espécie
Panicum maximum. Através do software TetraploidMap, específico para o
mapeamento de espécies tetraploides, foram obtidos dois mapas moleculares, um
para cada um dos genitores da população de mapeamento utilizada. Os mapas
foram produzidos a partir de 181 marcadores moleculares e cobriram distâncias de
808,43 e 897,13 cM. Adicionalmente, foram mapeados mais de 86 mil marcadores
moleculares do tipo SNP, sendo 147 deles validados por espectrometria de massas.
Os mapas obtidos representam um importante avanço para a compreensão
dos aspectos genético-moleculares de P. maximum e poderão ser utilizados para
futuros ensaios de identificação de QTLs e em programas de melhoramento
genético da espécie, além de fornecerem informações valiosas para a montagem do
genoma de P. maximum e estudos de compreensão da evolução da espécie.
Referências
Aronovich, S. O capim colonião e outros cultivares de Panicum maximum
(Jacq.): introdução e evolução do uso no Brasil. In: Simpósio sobre manejo da
pastagem, 12., 1995, Piracicaba. Anais... Piracicaba: Fundação de Estudos Agrários
Luiz de Queiroz, 1995. p.1-20.
Ashrafi H. et al. De novo assembly of the pepper transcriptome (Capsicum
annuum): a benchmark for in silico discovery of SNPs, SSRs and candidate genes.
BMC Genomics, v. 13, p. 571. doi: 10.1186/1471-2164-13-571, 2012.
Associação Brasileira de Sementes - ABRASEM. Disponível em:
http://www.abrasem.br (acessado 21/08/2016).
Bajgain, P. et al. Transcriptome characterization and polymorphism detection
between subspecies of big sagebrush (Artemisia tridentata). BMC Genomics, v. 12,
p. 370, 2011.
48
Barcaccia, G. et al. Linkage mapping in tetraploid willows: segregation of
molecular markers and estimation of linkage phases support an allotetraploid
structure for Salix alba x Salix fragilis interspecific hybrids. Heredity (Edinb), v. 90(2),
p. 169-180, 2003.
Conesa, A. et al. Blast2GO: a universal tool for annotation, visualization
and analysis in functional genomics research. Bioinformatics, v. 21, p. 3674–3676,
2005.
Creste, S.; Tulmann, A.; Figueira, A. Detection of single sequence repeat
polymorphisms in denaturing polyacrylamide sequencing gels by silver staining.
PlantMolecular Biology Reporter, Athens, v.19, p.299 – 306, 2001.
Delourme, R. et al. High-Density SNP-Based Genetic Map Development and
Linkage Disequilibrium Assessment in Brassica Napus L. BMC Genomics, v. 14, p.
120, 2013.
Deutsch, S. et al. A cSNP map and database for human chromosome
2. Genome Res., v. 11, p. 300–307, 2001.
Ebina M. et al. Co-segregation of AFLP and RAPD markers to apospory in
Guineagrass (Panicum maximum Jacq.). Grassland Science, v. 51, p. 71-78, 2005.
Ferreira, M. E.; Grattapaglia, D. Introducción al Uso de Marcadores
moleculares en el Análisis Genético. EMBRAPA-CENARGEN, p.220, 1998.
Garg, K.; Green, P.; Nickerson, D.A. Identification of candidate coding region
single nucleotide polymorphisms in 165 human genes using assembled expressed
sequence tags. Genome Res., v. 9, p. 1087–1092, 1999.
Gupta, P. K.; Roy, J. K.; Prasad, M. Single nucleotide polymorphisms: A
new paradigm for molecular marker technology and DNA polymorphism detection
with emphasis on their use in plants. Current Science, v. 80, n. 4, p. 4524-535, 2001
Hackett, C. A. et al. Tetraploid Map for Windows: linkage map construction and
QTL mapping in autotetraploid species. The Journal of heredity, v. 98, n. 7, p. 727–
729, 2007.
Jank L. et al. Catalog of the characterization and evaluation of the Panicum
maximum germplasm: morphological description and agronomical performance.
Embrapa Gado de Corte, v. 68, p. 53, 1997.
Jank, L. A História do Panicum maximum no Brasil. Revista Brasileira de
Sementes,v.1, p.14, 2003.
49
Jank, L.; Resende, R.M.S.; Valle, C.B. Genética em pastagem. Revista USP,
São Paulo, v.64, p.86-93, 2005.
Jhanwar, S. et al. Transcriptome sequencing of wild chickpea as a rich
resource for marker development. Plant Biotechnol J., v. 10(6), p. 690-702. doi:
10.1111/j.1467-7652.2012.00712.x., 2012.
Jhanwar, S. et al., Transcriptome sequencing of wild chickpea as a rich
resource for marker development. Plant Biotechnol J., v. 10, p.690-702. doi:
10.1111/j.1467-7652.2012.00712.x, 2012.
Labate, J.A.; A.M. Baldo. Tomato SNP discovery by EST mining and
resequencing. Mol. Breed., v.16, p. 343-349, 2005.
Mantello C.C. et al. De Novo Assembly and Transcriptome Analysis of the
Rubber Tree (Hevea brasiliensis) and SNP Markers Development for Rubber
Biosynthesis Pathways. PLoS ONE 9(7): e102665.
doi:10.1371/journal.pone.0102665, 2014.
Martuscello, J. A. et al. Características morfogênicas e estruturais de capim-
massai submetido a adubação nitrogenada e desfolhação. Revista Brasileira de
Zootecnia, v. 35, n. 3, p. 665-671, 2006.
Martuscello, J.A. et al. Repetibilidade e seleção em Panicum maximum Jacq.
Tese de doutorado, Universidade Federal de Viçosa, Viçosa, p. 100, 2008
Mayer, M.P.; Bukau, B. Hsp70 chaperones: cellular functions and molecular
mechanism. Cell Mol Life Sci, v. 62, p. 670–684, 2005.
Nesbitt, T.C.; Tanksley, S.D. Comparative sequencing in the genus
Lycopersicon: implications for the evolution of fruit size in the domestication of
cultivated tomatoes. Genetics , v. 162, p. 365-379, 2002.
Novaes, E. et al. High-throughput gene and SNP discovery in Eucalyptus
grandis, an uncharacterized genome. BMC Genomics, v. 9, p. 312, doi:
10.1186/1471-2164-9-312, 2008.
Picoult-Newberg, L. et al. Mining SNPs from EST databases. Genome Res., v.
9, p. 167–174, 1999.
Rafalski, A. Applications of single nucleotide polymorphisms in crop genetics.
Current Opinion in Plant Biology, v. 5 (2), p. 94-100, 2002.
Rickert, A. M. et al. First‐generation SNP/InDel markers tagging loci for
pathogen resistance in the potato genome. Plant Biotechnology Journal, v. 1, n. 6, p.
399–410, 2003
50
Schnable, P. S. et al. The B73 maize genome: complexity, diversity, and
dynamics. Science, v. 326, p. 1112–1115, 2009.
Schuelke, M. An economic method for the fluorescent labeling of PCR
fragments. Nature biotechnology, v. 18, n. 2, p. 233–4, doi:10.1038/72708, 2000.
Semagn, K.; Bjørnstad, Å.; Ndjiondjop, M.N. An overview of molecularmarker
methods for plant. Afr. J. Biotechnol, v. 25, p. 2540-2569, 2006.
Sousa, A. C. B. et al. Development of microsatellite markers in Guineagrass
(Panicum maximum Jacq.) and their transferability to other tropical forage grass
species. Plant Breeding, v. 130, n. 1, p. 104–108, 2011a.
Sousa, A. C. et al. Molecular Diversity and Genetic Structure of Guineagrass
(Panicum maximum Jacq.), a Tropical Pasture Grass. Tropical Plant Biology, v. 4, n.
3-4, p. 185– 202, 2011b.
Sousa, A.C.B. Estudos genéticos moleculares em forrageiras tropicais. Tese
(Doutorado em Genética e Biologia Molecular) – Instituto de Biologia, Universidade
Estadual de Campinas, Campinas, São Paulo, p. 205, 2010.
Tanksley, S.D. Mapping polygenes. Annual Review Genetics, Palo Alto, v.27,
p.205-33, 1993.
Toledo-Silva, G. Estudos genético-moleculares em Panicum maximum:
mapeamento genético-molecular e análise de transcriptoma via RNA-seq. Tese de
doutorado, Universidade Estadual de Campinas - Campinas/SP, 2013.
Toledo-Silva, G. et al. De novo transcriptome assembly for the tropical grass
Panicum maximum Jacq. PloS one, v. 8, n. 7, p. e70781, 2013.
Trick, M. et al. Single nucleotide polymorphism (SNP) discovery in the
polyploid Brassica napus using Solexa transcriptome sequencing. Plant
Biotechnology Journal, v.7, p. 334–346, doi:10.1111/j.1467-7652.2008.00396, 2009.
Valle, C.B.; Jank, L.; Resende, R.M.S. O melhoramento de forrageiras
tropicais no Brasil. Revista Ceres, v.56, n.4, p.460-472, 2009.
Verzignassi, J. R.; Fernandes, C. D. Doenças em forrageiras. Embrapa Gado
de Corte, Campo Grande, Circular Técnica 50, p.3, 2001
Voorips, R. E. MapChart: Software for the graphical presentation of linkage
maps and QTLs. Journal of Heredity, Washington, v. 63, p. 77-79, 2002.
Wu, K.et al. The detection and estimation of linkage in polyploids using single-
dose restriction fragments. Theoretical and Applied Genetics, v. 83, p. 294-300, 1992.
51
CAPÍTULO II
52
Construção de um mapa de ligação para Panicum maximum utilizando o
software OneMap
Introdução
As práticas de melhoramento vegetal têm influenciado de maneira decisiva a
adaptabilidade e produtividade das plantas cultivadas desde os primórdios da
civilização; entretanto, para a eficiente obtenção de ganhos genéticos no
melhoramento é necessário um conhecimento detalhado da constituição genética
das espécies. Com a introdução de técnicas de genética molecular no início da
década de 80, os estudos de identificação, caracterização e mapeamento genético
estão sendo realizados com maior eficiência e rapidez (Borém, 1999).
Estão disponíveis diversas metodologias para obtenção de mapas genéticos
em espécies diploides, entretanto, o mesmo não ocorre para espécies poliploides
(Leach et al., 2010; Ripol et al., 1999). Para autotetraploides, como Panicum
maximum, poucos são os mapas moleculares publicados na literatura científica,
entre eles, destacam-se os estudos com alfalfa (Brouwer & Osborn, 1999), batata
(Hackett et al., 2013; Meyer et al., 1998), rosa (Koning-Boucoiran et al., 2012;
Rajapakse et al., 2001) e, mais recentemente, mirtilo (McCallum, 2016).
O menor número de estudos em poliploides dá-se em decorrência da
complexidade genômica nestas espécies, dentre as quais a existência de dupla-
redução, pareamento randômico dos cromossomos e dificuldades para estimação da
ploidia e dosagem dos alelos nos marcadores.
Felizmente, alguns avanços neste campo têm possibilitado a realização de
novos estudos com poliploides, dentre eles destacam-se o software específico para
mapeamento de tetraploides, TetraploidMap (Hackett et al., 2007) e, mais
recentemente, a disponibilização de ferramentas que permitem estimar a dosagem
alelica dos marcadores moleculares, como o fitTetra (Voorrips et al., 2011) e o
SuperMASSA (Serang et al., 2012), o que tem permitido a construção de mapas de
ligação mais densos e informativos.
53
Ainda assim, para contornar as dificuldades do mapeamento em poliploides,
tradicionalmente a construção de mapas genéticos em populações F1 de poliploides
tem utilizado a estratégia de duplo pseudo-testcross, a qual consiste na construção
de dois mapas (um para cada parental), pelo emprego de polimorfismos em
marcadores de dosagem única, segregando na proporção 1:1, o que permite a
utilização de programas de mapeamento desenvolvidos para diploides (Grattapaglia
& Sederoff, 1994; Shepherd et al., 2003; Carlier et al., 2004).
A utilização de marcadores em dose única (MDU) para fins de mapeamento
genético em espécies complexas tiveram sua utilização proposta por Wu et al.
(1992) e expandida por Da Silva e Sorrells (1996) e Ripol et al. (1999). Entretanto, a
obtenção de um mapa integrado ainda era necessária para a aplicabilidade dos
estudos em programas de melhoramento genético através da identificação de QTLs.
Para a promoção de tal integração, porém, faz-se necessária a presença de
marcadores em heterozigose em ambos os genitores, os quais são utilizados para
estabelecer relações de ligação entre os marcadores que segregam individualmente
em cada genitor (Wu et al., 2002). Diante disto, Wu et al. (2002) desenvolveram o
algoritmo EM (Expectation Maximization), baseado em máxima verossimilhança, que
permitiu a construção de mapas genéticos integrados, uma vez que as frações de
recombinação e as fases de ligação são estimadas de forma simultânea.
Garcia et al.(2006) baseando na metodologia de Wu et al. (2002) propôs a
utilização dos marcadores segregantes na proporção 3:1 e os algoritmos propostos
por Wu et al. (2002) foram implantados em um software público, denominado
OneMap (Margarido et al., 2007). Este programa permite a construção de mapas de
ligação para populações F1 segregantes (dentre outras), possibilitando a estimação
da fração de recombinação e das fases de ligação entre os marcadores
simultaneamente, com base em máxima verossimilhança.
Assim, com o objetivo de obter um mapa de ligação integrado e com maior
qualidade para P. maximum, os marcadores moleculares SSR e SNP foram
utilizados na elaboração de mapa pelo emprego do software OneMap.
54
Metodologia
Os marcadores SSRs e SNPs genotipados e validados, como detalhado no
Capítulo I, foram utilizados como fonte de informação para a construção do mapa
genético utilizando o OneMap.
Dentre o conjunto de dados, foram selecionados os marcadores moleculares
em dose única (MDUs). Tais marcadores são identificados pela sua segregação na
proporção 1:1 quando o alelo polimórfico está presente em um genitor e ausente no
outro (ou seja, Aaaa x aaaa – simplex x nuliplex) e, também, pela segregação 3:1,
quando o alelo está presente em ambos os genitores na condição simplex (Aaaa x
Aaaa). Assim, ao analisar um marcador, independente de qual seja a dosagem, será
considerada apenas a presença ou a ausência dos alelos (marcas).
Tais marcas foram, então, categorizadas de acordo com o modelo de
nomenclaturas estabelecido por Wu et al. (2002), como resumido na Figura 3. Foram
selecionados os SNPs das categorias B3.7, D1.10 e D2.15 e os SSRs B3.7, D1.10,
D2.15 e C8.
Figura 3. Categorização dos marcadores moleculares. Adaptado de Wu et al., 2002.
Uma vez realizada esta seleção, a construção do mapa genético foi realizada
usando-se o software OneMap em sua nova versão, ainda em desenvolvimento,
(disponível em https://github.com/augusto-garcia/onemap).
O posicionamento das marcas foi realizado através de quatro passos, após a
determinação da fração de recombinação e fase de ligação entre os marcadores: (I)
55
Agrupamento das marcas utilizando a função “GROUP”, com parâmetros de LOD
score ≥ 3,0 e máxima fração de recombinação ≤ 0,4; (II) Ordenação das marcas
utilizando as funções “COMPARE” E “ORDER.SEQ”. A função “COMPARE” baseia-
se no modelo HMM e foi aplicada a grupos com até 5 marcas, enquanto que o
“ORDER.SEQ” foi utilizado em grupos maiores do 5 marcas (também com base no
HMM); (III) De posse dos grupos ordenados, foi aplicada a função “MAKE_SEQ”,
que retorna os grupos como uma sequência linear, expressa em centiMorgans (cM)
e estimada usando a função de Kosambi (1944); (IV) As funções “TRY” e “RIPPLE”
foram aplicadas nos grupos originalmente estabelecidos visando satura-los com
marcas que não foram automaticamente ligadas a nenhum grupo e encontrar a
melhor ordem para as marcas, respectivamente. A análise foi realizada marca a
marca para cada um dos grupos.
Paralelamente, as matrizes gráficas das frações de recombinações e do LOD
(Heatmaps) foram utilizadas para se determinar a ordem final das marcas nos
respectivos grupos de ligação. O mapa final foi desenhado pelo programa MapChart
3.1 (Voorrips, 2002).
Resultados e discussão
Os 104 SNPs e os 209 SSRs validados nos experimentos de genotipagem e
estimação de ploidia e dosagem alélica (previamente descritos no Capítulo I) foram
categorizados de acordo com os preceitos estabelecidos por Wu et al. (2002). Como
resultado, 53 SNPs (50,96%) e 189 SSRs (90,43%) foram categorizados como
marcas B3.7, D1.10, D2.15 e C8 (Figura 4).
Destes, 25 SNPs e 97 SSRs foram agregados ao mapa gerado, o que gera
taxas de ligação da ordem de 47,17% e 51,32%, respectivamente. Desta forma,
embora proporcionalmente mais SNPs tenham sido descartados por não
segregarem nas proporções estabelecidas para uso (3:1 e 1:1), as taxas de ligação
dos dois tipos de marcadores moleculares foram próximas. Tal porcentagem de
agregação de marcas também vai de encontro com os dados de Souza (2010) e
Garcia et al. (2006), que obtiveram 62% e 32%, respectivamente.
56
Figura 4. Número de marcadores moleculares por categoria.
O mapa obtido compreende, portanto, 122 marcas, distribuídas em 32 grupos
de ligação, gerando uma média de 3,81 marcas por GL. Diferentemente dos mapas
obtidos no TetraploidMap, o mapa desenvolvido com o OneMap apresentou o
número de GLs esperados para a espécie (Figura 6).
O mapa cobriu uma distância total de 1.248 cM, e uma distância média de 39
cM por grupo de ligação, com o tamanho do gap médio entre marcadores na ordem
10,2 cM. A menor distância entre duas marcas é de 0,001 cM, sendo 42,7 cM o
maior intervalo apresentado, valores estes similares aos apresentados pelos mapas
do TetraploidMap (Tabela 5).
O número de marcadores moleculares posicionados nos grupos de ligação
variou de 2 a 17. Quatro grupos foram constituídos apenas de marcadores tipo SNP
e 18 GLs contam apenas com marcas SSR. O GL 1 foi o grupo com mais
marcadores agregados e também com maior tamanho, cobrindo 164,50 cM,
enquanto que o GL 32 apresentou apenas 0,05 cM (sendo também um dos grupos a
apresentarem apenas 2 marcadores).
Figura 5. Heatmap obtido para o GL1 do mapa de P. maximum obtido pelo OneMap.
57
Como ponto positivo adicional ao OneMap, o programa permite uma
avaliação visual da ligação dos marcadores moleculares através de gráficos visuais,
os Heatmaps. Em tais gráficos, quanto mais homogênea a distribuição das cores,
com cores quentes próximas à diagonal, maior a probabilidade de os marcadores
estarem posicionados de forma correta no mapa de ligação. Para GLs pequenos,
como a maioria dos obtidos no mapa de P. maximum em questão, estes gráficos
não oferecem informações tão significativas, infelizmente. Como exemplo, na Figura
5 encontra-se o Heatmap do grupo GL1.
Tabela 5. Detalhamento dos grupos de ligação formados no mapeamento pelo programa
OneMap.
Mapa integrado
Grupo de Número de SNP Número de SSR Total Tamanho (cM)
ligação
GL1 0 17 17 164,50 GL2 0 7 7 41,97 GL3 1 1 2 17,33 GL4 0 3 3 36,31 GL5 1 1 2 13,27 GL6 0 5 5 52,08 GL7 3 1 4 56,28 GL8 3 0 3 22,97 GL9 0 4 4 79,92 GL10 0 7 7 88,73 GL11 2 0 2 5,32 GL12 0 2 2 12,17 GL13 0 2 2 26,46 GL14 1 6 7 126,09 GL15 4 2 6 81,42 GL16 1 3 4 48,39 GL17 2 0 2 19,38 GL18 0 2 2 7,63 GL19 0 2 2 0,17 GL20 0 2 2 24,46 GL21 0 2 2 0,78 GL22 2 0 2 21,80 GL23 0 4 4 17,71 GL24 0 3 3 34,81 GL25 0 2 2 20,24 GL26 1 3 4 31,68 GL27 1 2 3 10,80 GL28 0 2 2 19,12 GL29 1 7 8 110,14 GL30 2 1 3 45,06 GL31 0 2 2 10,95 GL32 0 2 2 0,05
Somatória 25 97 122 1247,99
Média 0,78 3,03 3,81 39,00
58
Figura 6. Mapa molecular para P. maximum gerado a partir do OneMap. Em preto,
marcadores SSR e em vermelho marcadores tipo SNP. Distância representada em cM.
59
Embora o número de marcadores moleculares posicionados nos mapas
produzidos pelo TetraploidMap (com 119 e 113 marcas cada) e pelo OneMap (122
marcadores) seja bastante próximos, a tecnologia empregada no modelo deste
último é mais atual e promissora, realizando a ligação das marcas de forma mais
assertiva e automatizada.
Garcia et al. (2006) analisaram o mesmo conjunto de dados utilizando os
softwares JoinMap (amplamente utilizado, desenvolvido para diploides e baseados
em aproximações mínimas por estimativas de multipontos de distâncias) e OneMap,
e, como resultado, observaram que o JoinMap gerou um mapa com menor
quantidade de grupos de ligação, menor densidade e comprimento, constatando,
portanto, que a metodologia proposta por Wu et al. (2002), baseada em máxima
verossimilhança e implementada no software OneMap, foi o método mais eficiente
para gerar um mapa integrado. Os dados positivos obtidos pelo OneMap frente ao
JoinMap foram confirmados também por Souza (2010).
Conclusões
Marcadores moleculares SSR e SNPs foram utilizados para a construção de
um mapa molecular para a espécie Panicum maximum através do software OneMap.
O mapa obtido é constituído de 122 marcas, sendo 25 SNPs e 97 SSRs, distribuídas
em 32 grupos de ligação, conforme esperado para a espécie. O mapa cobriu uma
distância total de 1.248 cM e a distância média entre os marcadores foi de 10,2 cM.
Comparado aos resultados obtidos com o programa TetraploiMap, a principal
vantagem do mapa gerado utilizando o OneMap reside no fato da integração das
marcas, gerando um mapa único, de alta qualidade, muito embora com baixo grau
de saturação. O OneMap mostrou ser uma ferramenta muito promissora para o
mapeamento de espécies poliploides, embora tenha sido desenvolvido para
diploides até o momento, o que o torna a ferramenta mais indicada para estudos
futuros que visem o aumento da saturação do mapa de P. maximum.
60
4. RESULTADOS COMPLEMENTARES
4.1.1 Seleção e genotipagem de marcadores moleculares SNPs e sua
distribuição nas vias metabólicas de interesse
Como previamente descrito no Capítulo I, foi realizado o mapeamento do
transcriptoma de folhas de P. maximum filtrando-se os dados dos genitores da
população de mapeamento utilizada neste trabalho (genitores S10 e Mombaça). A
partir destes dados, foi realizada a prospecção de marcadores moleculares SNP, o
que gerou um retorno de mais de 86 mil polimorfismos mapeados.
Uma vez que um dos objetivos da pesquisa é pautado na genotipagem de
SNPs via espectrometria de massas, um conjunto da totalidade de marcadores
mapeados precisou ser selecionado. Para tanto, a partir das informações obtidas,
foram filtrados os contigs (contendo os SNPs) referentes a genes relacionados às
vias do metabolismo no nitrogênio, fixação de carbono, resistência biótica/abiótica e
via de formação da lignocelulose. Os genes presentes nestas vias específicas foram
selecionados através de busca na literatura científica e pela análise das rotas
enzimáticas disponíveis na plataforma KEGG pathway
(http:\\www.genome.jp/kegg/pathway.html).
Como resultado, foi possível identificar 72 genes preditos nas vias
metabólicas de interesse. Estes genes estão distribuídos em 478 contigs distintos, o
que gera uma média de 6,64 contigs para cada gene (Tabela 6).
Tabela 6. Detalhamento do número dos genes e de contigs identificados após a seleção dos
dados contidos nas vias metabólicas de interesse.
Via metabólica Número de genes Número de contigs
Fixação de carbono 11 82
Formação de ligocelulose 16 155
Metabolismo do nitrogênio 17 72
Resistência 28 169
TOTAL 72 478
61
Uma vez realizada esta seleção, os contigs foram novamente filtrados de
modo a selecionar sequências de alta qualidade e minimizar excesso de
redundâncias nos dados. Ainda, para minimizar a chance da escolha de SNPs em
regiões intronicas, foi realizada uma comparação via BLAST com um banco de
dados de Panicum virgatum, a espécie mais próxima à P. maximum a possuir
genoma publicado.
Esta seleção gerou como resultado a identificação dos 163 SNPs mais
promissores, distribuídos em 81 contigs e 48 genes putativos, o que gera média de 2
SNPs por contig e 3,4 SNPs por gene (Tabela 7).
Tabela 7. Detalhamento do número dos genes e de contigs identificados após a seleção dos
SNPs a serem validados por genotipagem.
Via metabólica
A genotipagem dos SNPs na população de mapeamento e nos genitores foi
realizada por espectrometria MALDI-TOF (matrix-assisted laser desorption/ionization
time-of-flight), utilizando-se a plataforma MassARRAY (Sequenom Inc., USA).
Os oligonucleotídeos de captura e oligonucleotídeos de extensão de bases
únicas foram desenhados a partir dos contigs selecionados e com o auxílio do
software MassArray Assay Design (Sequenom Inc., San Diego – EUA), cujos
parâmetros evitam que sejam desenhados iniciadores que anelem entre si ou que
resultem em produtos de massa semelhante. As seguintes recomendações foram
empregadas no desenho dos iniciadores: (1) utilização da metodologia/química High
Multiplex iPLEX, (2) tamanho do amplicon variando de 70 a 300 pares de base e (3)
nível do multiplex acertado em 10 interações (10 SNPs genotipados
simultaneamente em uma reação única).
Número de
genes
Número de
contigs
Número de
SNPs
Fixação de carbono 9 23 47
Formação de lignocelulose 14 24 49
Metabolismo do nitrogênio 8 14 26
Resistência 17 20 41
TOTAL 48 81 163
62
As condições utilizadas para as reações seguiram estritamente o guia descrito
pelo fabricante (iPLEXGold Application Guide - Sequenom). Ambos os genitores da
população segregante foram genotipados 10 vezes para cada loco SNP visando
aumentar a acurácia dos dados para a comparação com a genotipagem da
progênie.
Dos 163 SNPs selecionados para a genotipagem, 147 atenderam aos
parâmetros do software MassArray Assay Design e tiveram suas sequencias de
primers desenhados com sucesso (Anexo, Tabelas I e II). Destes, 100%
apresentaram amplificação e puderam ser validados via espectrometria de massas
com sucesso.
Tabela 8. Detalhamento dos SNPs validados por espectrometria de massas.
Via metabólica
Os 147 SNPs validados encontram-se dispersos em 77 contigs e 49 genes, o
que gera uma média de 3 SNPs/gene e 1,9 SNPs/contig, com 45,5% dos contigs
possuindo dois SNPs validados (Tabela 8).
O gene putativo que teve mais SNPs validados, com um total de oito
polimorfismos genotipados, foi o 4-coumarate--CoA ligase. Tal gene é relacionado,
primariamente, à via de resistência ao estresse biótico, embora estudos recentes
indiquem sua participação no metabolismo de formação de lignocelulose, o que é
coerente, uma vez que uma das formas de imunidade em plantas é a elevação dos
níveis de lignina nos tecidos para proteção mecânica, agindo como barreira
estrutural (Ascensao & Dubery, 2003).
Número de
genes
Número de
contigs
Número de
SNPs
Fixação de carbono 14 23 46
Formação de lignocelulose 13 18 34
Metabolismo do nitrogênio 8 14 23
Resistência 14 22 44
TOTAL 49 77 147
63
4.1.2 Análise de ploidia e dosagem alélica nos marcadores SNP
Ao realizar a genotipagem de SNPs na plataforma Sequenom iPLEX
MassARRAY®, obtem-se como resultado um espectro que contem picos produzidos
pelos produtos de extensão da reação. Tais picos, indicativos dos alelos presentes
na amostra, são convertidos em dados apresentados por gráficos de dispersão
bidimensional, os quais representam as intensidades dos alelos de cada indivíduo,
de modo que a dosagem dos alelos pode ser inferida.
Para populações de organismos diploides, as amostras genotipadas formam
três clusters no gráfico de dispersão, correspondendo à presença de um alelo ou
ambos alelos (homozigoto ou heterozigoto para o polimorfismo). Assim, a dosagem
alélica dos SNPs mapeados (também referido como SNP calling) pode ser calculada
diretamente, através da função “SNP genotype call” do software TYPER (software
de análise do Sequenom iPLEX MassARRAY).
Entretanto, para poliploides são necessários cálculos mais acurados, uma vez
que haverá mais genótipos possíveis entre os heterozigotos. Para tetraploides, por
exemplo, haverá cinco genótipos possíveis: aaaa, Aaaa, AAaa, AAAa e AAAA.
Considerando A como o alelo de referência, os indivíduos podem ter entre zero
(nuliplex) e quatro cópias do polimorfismo (tetraplex), de modo que o número de
cópias do alelo A é justamente a dosagem alélica (Voorrips, 2011).
Para contornar as dificuldades do SNP calling em poliploides, Serang, Mollinari
e Garcia (2012) elaboraram um método baseado em modelo gráfico Bayesiano e
implementaram no software público SuperMASSA. Este programa permite fazer a
inferência simultânea da ploidia e dosagem alélica de um loco para cada um dos
indivíduos mapeados em uma população. Como vantagens de tal modelo estão o
fato da classificação dos genótipos de todos indivíduos ser realizada
simultaneamente, o que torna o processo ágil e fácil, bem como a possibilidade de
estimação da dosagem alélica mesmo para populações de ploidia desconhecida.
Os dados da genotipagem da população e dos parentais dos 147 SNPs
genotipados foram submetidos à estimação de dosagem alélica utilizando a função
específica para dados de populações F1 (Model F1 Cross) do SuperMASSA.
Complementarmente, foi realizado um estudo da ploidia dos marcadores
genotipados, pelo qual se estimou a probabilidade a posteriori de cada loco
apresentar um nível de ploidia par variando de quatro a oito (Ploidy range = 4:8).
64
A ferramenta que possibilita a inferência de ploidia é especialmente útil para
espécies de ploidia variável, como cana-de-açúcar, por exemplo. Para espécie com
ploidia fixa e conhecida, como é o caso do P. maximum, há a possibilidade de fixar o
ploidia no sistema. Entretanto, uma vez que os genes escolhidos pertencem a vias
muito importantes para o metabolismo e sobrevivência da planta, o que torna
provável duplicações genicas, foi estabelecida ploidia variável no programa.
Ainda, após os locos SNPs serem classificados para a ploidia mais provável, a
eles foram atribuídos duas categorias distintas, baseado nas categorias descritas
por Garcia et al.(2013): Categoria A: locos SNPs com probabilidade a posteriori
maior ou igual a 0,8; (2) Categoria B: locos SNPs com probabilidade a posteriori
menor que 0,8.
Como resultado da estimação de ploidia, dentre os 147 SNPs genotipados, 70
SNPs (47,62%) foram classificados pelo programa como tetraploides (4n); 34
marcadores foram categorizados como hexaplóides (6n - 23,13%) e 43 SNPs
(29,25%) foram classificados como como octaplóides (8n).
Já com relação à classificação destes locos, 109 SNPs (74,15%) foram
classificados na categoria A e 38 SNPs (25,85%) na categoria B. Tal número está de
acordo com o encontrado por Costa (2015), no qual 68,5% das marcas pertenciam a
categoria A, bem como o descrito pelo próprio Garcia et al. (2013), onde 77,6% dos
dados era categoria A, ambos trabalhos realizados com cana-de-açúcar.
Quanto a categorização dentro de cada grupo de ploidia, 91,4% dos SNPs
classificados como 4n pertencem a categoria A e 8,6% à categoria B. A
porcentagem de marcas da categoria A cai para 73,5% no grupo dos 6n e para
46,5% no grupo 8n (Figura 7). Essa queda, confirmada por regressão linear, nas
taxas de dados categorizados como A reflete a alta probabilidade dos dados
categorizados como 4n estarem corretos. Consequentemente, as menores taxas de
dados categorizados como A nos grupos 6n e 8n (52,38% dos dados) refletem, entre
outras possibilidades propostas por Costa (2015), a baixa qualidade das
informações, a existência de SNPs trialelicos e/ou a existência de duplicações no
genoma para o loco estudado (Figura 8). Em todas estas situações, o programa
SuperMASSA não está habilitado a compreender e reparar os desvios, gerando,
portanto, estimativas de ploidia aberrantes.
65
Figura 7. Porcentagem de SNPs com ploidia estimada pelo programa SuperMASSA como
4n, 6n e 8n e a categorização das marcas.
Figura 8. Regressão linear com base nos dados da porcentagem de SNPs das Categorias A
e B distribuídos entre cada grupo de ploidia estimada.
Dada a maior confiabilidade das marcas categorizadas como tetraploides e
hexaplóides, apenas SNPs destas categorias foram utilizados para a construção dos
mapas, totalizando 104 SNPs habilitados à serem utilizadas nos programas de
construção de mapas de ligação.
Outro dado importante é a correlação entre a categorização das marcas e a
taxa de ligação dos SNPs aos mapas construídos. Se considerarmos apenas os 44
SNPs que foram efetivamente capazes de se ligarem a um dos mapas gerados
(TetraploidMap e/ou OneMap), 39 marcas são categoria A (88,64%) e 5 marcas são
66
classificadas como categoria B (11,36%). Em termos relativos, houve discreta
tendência de maior aderência das marcas categoria A, de modo que das 89 marcas
disponíveis, 43,82% foram capazes de se ligarem a um ou mais mapas, enquanto
que das 15 marcas categoria B disponíveis, 33,33% foram agregadas aos mapas
gerados (Figura 9). Esta ligação diferencial é mais um indicativo que aponta para a
caracterização mais precisa das marcas da categoria A. Em ensaios futuros, tal
caracterização pode ajudar a excluir as marcas menos assertivas, eliminado estes
dados antes que entrem nos programas de mapeamento.
Figura 9. Porcentagem de SNPs categorizados como A e B que efetivamente se ligaram a
algum dos mapas de ligação gerados.
4.1.3 Análise dos locos SNPs com ploidia elevada
Uma vez que 52,38% dos dados tiveram seu nível de ploidia estimado pelo
SuperMASSA como ploidias superiores à esperada de 4n (tetraploide), foi realizada
uma busca visando compreender se tais dados poderiam refletir duplicações gênicas
nos transcritos sobre os quais os locos SNPs foram desenvolvidos.
Esta teoria baseia-se no fato dos SNPs genotipados terem sido prospectados
em genes putativos de vias de grande importância metabólica para as plantas,
tornando provável sua duplicação no genoma, visto que eventos de duplicação
gênica podem evitar a perda da funcionalidade e/ou expressão em caso de mutação,
como evidenciado por Wang et al. (2009) para genes da via do metabolismo C4.
Para realizar esta análise, foi efetuada uma comparação das sequências dos
transcritos contendo SNPs, utilizando o BLASTN na base de dados Phytozome
67
v.11.0. A sequência dos transcritos foi comparada com o genoma de sorgo
(Sorghum bicolor), arroz (Oryza sativa) e “Switchgrass” (Panicum virgatum), de
modo que P. virtagum foi escolhido por pertencer ao gênero Panicum e o sorgo e o
arroz por pertencerem à mesma família, Poacea, que P. maximum, além de serem
espécies utilizadas frequentemente em busca de similaridades (Dufour et al., 1997;
Costa, 2015). As análises no Phytozome foram realizadas utilizando como
parâmetros um threshold máximo de e-value de 10-6 e, no mínimo, similaridade com
50% do transcrito avaliado.
Tabela 9. Análise de evidências de duplicação gênica nos contigs detentores de SNPs
classificados como 8n, Categoria A pela análise no SuperMASSA.
SNP ID Contig N° cópias
N° cópias N° cópias em em arroz em sorgo P. virgatum
SNP3 comp390273_c0_seq1 4 4 3
SNP7 comp395427_c0_seq1 4 6 7
SNP17 comp400553_c0_seq1 1 2 1
SNP128 comp401467_c0_seq1 - - 1
SNP18 comp401774_c0_seq1 1 3 2
SNP30 comp403411_c0_seq1 2 2 2
SNP136 comp403803_c0_seq1 2 3 4
SNP36 comp404064_c0_seq1 2 4 5
SNP161 comp405771_c1_seq1 - 4 4
SNP162 comp405771_c1_seq1 - 4 4
SNP163 comp405771_c1_seq1 - 4 4
SNP58 comp406822_c0_seq1 2 1 1
SNP62 comp409117_c0_seq1 2 1 1
SNP63 comp409117_c0_seq1 2 1 1
SNP65 comp409416_c0_seq1 1 1 2
SNP145 comp410947_c0_seq1 5 4 3
SNP148 comp410983_c0_seq1 1 1 3
SNP74 comp411001_c0_seq1 4 5 4
SNP75 comp411001_c0_seq1 4 5 4
SNP147 comp411536_c1_seq1 2 2 3
Foram considerados os dados categorizados como elevada ploidia (8n),
pertencentes à categoria A, o que representa 20 SNPs, distribuídos em 16 contigs
(Tabela 9). Para 15 contigs (95%) foram encontradas evidências de duplicação
68
gênica em, pelo menos, uma das espécies comparadas (o contig remanescente
apresentava ausência de anotação para duas espécies, tornando sua informação
incompleta). A taxa de evidências de duplicação no estudo similar conduzido por
Costa (2015) com cana-de-açúcar foi de 86,84%, o que corrobora os dados obtidos.
Contudo, aplicando o mesmo ensaio aos 64 marcadores SNP com ploidia 4n
e classificados como categoria A, 78,26% apresentaram evidências de duplicação
(Anexo, Tabela III). Ainda, quando a análise é realizada baseando-se apenas na
comparação com Panicum virgatum, a taxa de evidencia de duplicação é de 61,4%
para o grupo de dados 4n e 75% para os dados 8n (ambos apenas considerando
dados categoria A).
Assim, embora os dados de ploidia 8n tenham apresentado maior evidência
de duplicação quando comparado aos dados da categoria 4n, a diferença foi discreta
e a taxa de duplicação para este último grupo foi inesperadamente alta. Desta forma,
não é possível concluir diretamente que as taxas de ploidia elevadas inferidas pelo
SuperMASSA são consequência de duplicações genômicas no presente estudo,
embora esta hipótese não deva ser completamente descartada, uma vez que não há
genoma disponível para a espécie.
4.2 Informações adicionais aos mapas obtidos
4.2.1 Informações relacionadas aos mapas obtidos pelo TetraploidMap
Como descrito no Capítulo I, mapas de ligação foram construídos utilizando o
programa TetraploidMap (Hackett et al., 2007), que permite a construção de mapas
a partir de marcadores dominantes e codominantes (multi-alélicos), em populações
de irmãos-completos provenientes do cruzamento entre espécies autotetraploides,
utilizando marcadores moleculares SSR e AFLP.
Quatro etapas foram empregadas para a construção do mapa genético
utilizando esta metodologia: (I) Inferência dos genótipos e segregações: emprego da
função findgeno, pela qual cada marcador foi analisado em relação à segregação
observada na progênie. Para as marcas SSR anteriormente mapeadas por Toledo-
Silva (2013), nos casos onde não foi possível estimar um genótipo mais provável
para o marcador codominante, os marcadores foram lidos como dominantes. Já as
marcas SNP foram convertidas em marcas AFLP (dominantes), uma vez que o
programa não consegue interpretar dados SNP. A segregação foi avaliada através
de teste de qui-quadrado. Foram selecionados apenas os marcadores dominantes
69
de segregação 1:1, 3:1 e 5:1 para SSR e 1:1 e 3:1 para os SNPs, adotando a
significância estatística de 0,001 para os marcadores 1:1 e 3:1, e 0,01 para os 5:1.
(II) Estimação da frequência de recombinação: pelo emprego da função initial run e
twopoint, em conjunto com o algoritmo ripple, as frequências de recombinação e
respectivos valores de LOD score (razão de verossimilhança em logaritmo de base
10) foram calculados. Apenas os resultados com valores de LOD >1.0 foram
considerados. (III) Clusterização: os marcadores selecionados foram submetidos à
função cluster, onde foi realizado um teste de qui-quadrado para segregação
independente dos cromossomos. (IV) Ordenação: o algoritmo simulated annealing
foi utilizado para identificar a ordem final de cada grupo de ligação, pressupondo o
menor valor dos mínimos quadrados para calcular a distância entre os marcadores
do mapa e utilizando os parâmetros padrões do sistema (Bradshaw et al., 2008;
Hackett & Luo, 2003; Hackett et al., 2007). Para identificar possíveis erros nesta
etapa de clusterização, foi realizada uma análise combinando análise de dois-pontos
(função twopoint) com função initial-run, seguidos de análise pelo algoritmo ripple.
Considerando ambos os mapas gerados, um para cada genitor, um total de
31 SNPs puderam ser integrados a pelo menos um dos mapas. Estes polimorfismos
estavam distribuídos em 26 contigs e 20 genes putativos de interesse. Desta forma,
foram utilizados, em média 1,19 SNPs por contig e 1,55 SNPs por gene (Tabela 10).
Tabela 10. Detalhamento dos SNPs que se ligaram aos mapas gerados pelo TetraploidMap.
Via metabólica
Os mapas gerados compartilharam 51 marcadores moleculares em comum,
sendo 10 SNPs e 41 SSRs. Tais marcas redundantes oferecem pouca informação
Número de
genes
Número de
contigs
Número de
SNPs
Fixação de carbono 6 7 8
Formação de ligocelulose 5 6 9
Metabolismo do nitrogênio 3 6 7
Resistência 6 7 7
TOTAL 20 26 31
70
prática para o melhoramento, sendo consideradas marcas pouco informativas. Mas,
em contrapartida, permitem a comparação entre os mapas gerados para os
genitores, estabelecendo “pontes de ligação” úteis para a elaboração de mapas
integrados futuros (Figuras 10, 11 e 12).
Desta forma, se levarmos em conta estas “pontes” para a inferência de
formação dos grupos de ligação, teremos: (I) Para o mapa do genitor S10, os grupos
de ligação 1 e 7 e os GLs 2, 3, 4 e 10 pertenceriam, na verdade, ao mesmo GL.
Assim, o mapa deste genitor passaria a ter não mais 10 GLs, mas 6 grupos de
ligação; (II) Para o genitor Mombaça, os grupos 1, 7,9 ; 6 e 8 ; 2, 3, 4, 10, 13
poderiam ser agrupados nos mesmos grupos de ligação. Tal como para o mapa do
genitor S10, o mapa Mombaça passaria a contar com 6 GLs (não mais os 13 GLs
originais).
Figura 10. Ligação entre os mapas dos genitores S10 e Mombaça através de marcadores
em comum.
71
Figura 11. Ligação entre os mapas dos genitores S10 e Mombaça através de marcadores
em comum.
72
Figura 12. Ligação entre os mapas dos genitores S10 e Mombaça através de
marcadores em comum.
73
Como análise complementar, também foi analisado o padrão de ligação dos
SNPs desenhados a partir do mesmo contig. Em teoria, espera-se que marcas
desenhadas a partir do mesmo contig se liguem ao mesmo grupo de ligação nos
mapas moleculares, atuando, portanto, como parâmetros de qualidade para o
mapeamento.
Quatro contigs (comp401757_c0_seq1, comp404729_c0_seq1,
comp405932_c0_seq1 e comp408070_c2_seq1) apresentaram dois SNPs
integrados a pelo menos um dos mapas de ligação confeccionados. Um destes
contigs, o comp404729_c0_seq1, apresentou dois SNPs (M82 e M58) ligados aos
dois mapas produzidos – S10 e Mombaça, de modo que os SNPs se ligaram ao
mesmo GL no mapa do Mombaça (GL4), mas se ligaram a grupos diferentes (GL4 e
GL10) no mapa do genitor S10. Os grupos de ligação 4 e 10 podem ser
considerados ligados pela inferência acima mencionada (utilizando as pontes
criadas pelas marcas presentes em ambos os mapas), logo o fato destes SNPs
terem sido mapeados como pertencentes ao GL 4 e GL 10 é mais um indicativo de
que estes GLs possivelmente são pertencentes a um mesmo grupo de ligação.
O contig comp401757_c0_seq1 também apresentou dois SNPs, M16 e M84,
ligados a grupos diferentes para o genitor S10 (GLs 8 e GL6). O fato destes
marcadores não estarem próximos pode ser entendido como um indicativo do
posicionamento incorreto de uma destas marcas (resultado da baixa saturação do
mapa), montagem incorreta do contig ou mesmo de duplicação no genoma. Para os
dois contigs remanescente, os SNPs se agregaram ao mesmo grupo de ligação,
como era esperado (Anexo, Tabela III).
4.2.2 Informações relacionadas ao mapa obtido pelo OneMap
Um total de 25 SNPs foram integrados ao mapa molecular gerado pelo
programa OneMap. Estes polimorfismos estão distribuídos em 20 contigs e 19 genes
putativos correlacionados às vias metabólicas previamente selecionadas. Assim,
foram utilizados, em média 1,25 SNPs por contig e 1,32 SNPs por gene (Tabela 11).
74
Tabela 11. Detalhamento dos SNPs que se ligaram ao mapa gerado pelo OneMap.
Via metabólica
Tal como para os SNPs que se ligaram aos mapas gerados no TetraploidMap,
foi realizada a análise dos padrões de ligação dos SNPs oriundos do mesmo contig
para os polimorfismos integrados ao mapa do OneMap. Cinco contigs apresentaram
mais de um marcador agregado ao mapa (comp404739_c1_seq1,
comp405932_c0_seq1, comp408070_c2_seq1, comp409416_c0_seq1 e
comp404985_c0_seq1) e apenas o contig comp404985_c0_seq1 apresentou
polimorfismos que se integraram em grupos de ligação diferentes, sendo que o M36
se integrou ao GL 8 e o M74 foi ligado ao GL 23. Diferentemente, porém, das
situações similares relatadas para os mapas do TetraploidMap, esta ligação
diferencial é mais facilmente explicada para o OneMap, já que cada grupo de ligação
representa um homólogo. Assim, os GLs 8 e 23 podem estar no mesmo grupo de
homologia.
Outro dado interessante, que demonstra a diferença entre as metodologias
empregadas pelos softwares TetraploidMap e OneMap é referente às diferenças
entre as marcas que foram agregadas aos mapas gerados. Dentre os 25 SNPs que
se ligaram ao mapa do OneMap, 13 não se ligaram aos mapas do TetraploidMap.
Por sua vez, 19 dentre os 31 SNPs que se ligaram aos mapas do TetraploidMap não
se ligaram ao mapa do OneMap. Assim, 52% dos SNPs que se integraram ao
TetraploidMap são exclusivos dos mapas gerados por esta metodologia e o mesmo
raciocínio se aplica aos 61,29% dos SNPs integrados ao mapa gerado pelo
OneMap.
Número de
genes
Número de
contigs
Número de
SNPs
Fixação de carbono 5 6 8
Formação de ligocelulose 5 5 7
Metabolismo do nitrogênio 4 4 4
Resistência 5 5 6
TOTAL 19 20 25
75
5. RESUMO DOS RESULTADOS
Através do mapeamento do transcriptoma dos parentais S10 e
Mombaça, foi possível a identificação de 86.312 SNPs, distribuídos em 16.356
contigs;
Foram identificados 72 genes putativos correlacionados às vias
metabólicas de interesse (metabolismo no nitrogênio, fixação de carbono,
resistência e via de formação da lignocelulose). Estes genes estão distribuídos
em 478 contigs distintos, o que gera uma média de 6,64 contigs para cada gene;
Foram selecionados e genotipados via espectrometria de massas 147
SNPs. Todos apresentaram amplificação e puderam ser validados. Destes 104
puderam ser utilizados na construção dos mapas genéticos;
Utilizando o programa TetraploidMap, foram obtidos dois mapas
moleculares parciais para Panicum maximum, um mapa baseado em cada um
dos genitores da população estudada. O mapa do genitor S10 contou com 113
marcadores posicionados, sendo 19 marcadores SNPs e 94 marcadores tipo
SSR. O mapa cobriu uma distância de 808,4 cM, distribuídos em 10 grupos de
ligação. Por sua vez, o mapa do genitor Mombaça foi construído a partir da
ligação de 119 marcadores, sendo eles 22 SNPs e 97 SSRs, cobrindo uma
distância total de 897,1 cM e contando com 13 grupos de ligação;
Um terceiro mapa ligação foi gerado com o programa OneMap. Este
mapa é constituído por 122 marcadores moleculares (25 SNPs e 97 SSRs),
distribuídos em 32 grupos de ligação. O mapa cobriu uma distância de 1.248 cM.
76
6. CONCLUSÕES
O presente estudo promoveu a expansão do conhecimento genético
molecular da espécie Panicum maximum, através da identificação e genotipagem de
marcadores moleculares SNP e a construção do primeiro mapa genético para a
espécie a utilizar marcadores do tipo SNP e SSR.
Conclui-se, portanto, que os objetivos propostos foram alcançados e que os
dados obtidos neste trabalho contribuirão, de forma direta e indireta, para a
aceleração e aumento da assertividade dos programas de melhoramento genético
para a espécie.
77
7. PERSPECTIVAS
O programa de melhoramento vegetal do P. maximum conduzido pela
Embrapa Gado de Corte (Campo Grande, MS) vem sendo o responsável por
avanços significativos para a espécie, especialmente no que tange o lançamento de
novos cultivares. Entretanto, para que os estudos lá conduzidos sejam mais
eficientes e rápidos, fazem-se necessários estudos que expandam o restrito
universo de compreensão da genética da espécie.
Avanços significativos nesta direção foram dados pelos resultados de Toledo-
Silva et al. (2013) e pelo presente estudo. Entretanto, o mapa molecular construído
ao longo deste trabalho ainda não está saturado, podendo, portanto, ser
aperfeiçoado. Neste sentido, como próximo passo, mais SNPs serão genotipados
pelo uso da técnica de genotipagem-por-sequenciamento (genotyping-by-
sequencing - GBS) e tais marcadores serão integrados ao mapa obtido pelo
software OneMap.
Após o aumento do nível de saturação do mapa, as análises para
identificação de QTLs para características produtivas poderão ser realizadas a partir
de dados fenotípicos coletados pela Dra. Liana Jank, da Embrapa Gado de Corte
(Campo Grande – MS), para a população utilizada no estudo.
78
8. REFERÊNCIAS BIBLIOGRÁFICAS
Associação brasileira das indústrias exportadoras de carnes. Perfil da
pecuária no Brasil (2016). Disponível em:
http://abiec.siteoficial.ws/images/upload/sumario-pt-010217.pdf (acessado
30/01/2017).
Aacensão, A. R. F. D. C.; Dubery, I. A. Soluble and wall-bound phenolics and
phenolic polymers in Musa acuminata roots exposed to elicitors from Fusarium
oxysporum f.sp. cubense. Phytochemistry, v.63, p. 679–686. 2003.
Akhunov, E.; Nicolet, C.; Dvorak, J. Single nucleotide polymorphism
genotyping in polyploidy wheat with the Illumina GoldenGate assay. Theor Appl
Genet. v. 119, p. 507–1, 2009.
Aliscioni, S.S. et al. A molecular phylogeny of Panicum (Poaceae:Paniceae).
Test of monophyly and phylogenetic placement with the Panicoideae. American
Journal of Botany, v. 90(5), p. 796-821, 2003.
Al-Janabi, S. M. et al. Identification of a major quantitative trait locus (QTL) for
yellow spot (Mycovellosiella koepkei) disease resistance in sugarcane. Molecular
Breeding, Netherlands, v. 19, n. 1, p. 1-14, jan. 2007.
Andrade, R. P. de. “Pasture seed Production Technology in Brasil”.
Proceeding Piracicaba, Fealq, p. 129-32, 2001.
Aronovich, S. O capim colonião e outros cultivares de Panicum maximum
(Jacq.): introdução e evolução do uso no Brasil. In: Simpósio sobre manejo da
pastagem, 12., 1995, Piracicaba. Anais... Piracicaba: Fundação de Estudos Agrários
Luiz de Queiroz, 1995. p.1-20.
Asker, S.E.; Jerling, L. Apomixis in plants. Boca Raton: CRC Press, p. 532,
1992.
ASSOCIAÇÃO BRASILEIRA DE SEMENTES - ABRASEM. Disponível em:
http://www.abrasem.br (acessado 21/08/2016)
Bhering, L. L. et al. Efficiency of the multilocus analysis for the construction of
genetic maps. Crop Breeding and Applied Biotechnology, v. 9, p. 308-312, 2009.
Bhering, L.L.; Cruz, C.D. Tamanho de população ideal para mapeamento
genético em famílias de irmãos completos. Pesquisa agropecuária brasileira, v. 43,
p. 379-385, 2008.
79
Blondal, T. et al. A novel MALDI-TOF based methodology for
genotyping single nucleotide polymorphism. Nucleic Acids Research, v.3, n.24,
p. 155, 2003.
Bogdan, A. V. Tropical pasture and fodder plants. [S.l.]: Longman, 1977.
Borém, A. Melhoramento de espécies cultivadas. Viçosa: UFV, p. 205-252,
1999.
Borém, A.; Caixeta, E. T. Marcadores moleculares. Viçosa – M.G., 374p.,
2006. Guglieri, A.; Zuloaga, F. O.; Longhi-Wagner, H. M. Sinopse das espécies de
Panicum L. subg. Panicum (Poaceae, Paniceae) ocorrentes no Brasil. Acta bot.
bras., 18(2), p. 359-367, 2004.
Botrel, M.A; Novaes, L.P.; Alvim, M.J. Características forrageiras de algumas
gramíneas tropicais. EMBRAPA-CNPGL, Juiz de Fora, Doc. 66, p.35, 1998.
Botstein, D.; Risch, N. Discovering genotypes underlying human phenotypes:
past successes for mendelian disease, future approaches for complex disease.
Nature Genetics, v. 33, p. 228 – 237, 2003.
Bradshaw, J. E. et al. QTL mapping of yield, agronomic and quality traits in
tetraploid potato (Solanum tuberosum subsp. tuberosum). Theor.Appl. Genet., v.
116, p.193–221, 2008.
Brâncio, P. A. et al. Avaliação de três cultivares de Panicum maximum Jacq.
sob pastejo: comportamento ingestivo de bovinos. Revista Brasileira de Zootecnia,
Viçosa, v. 32, n. 5, p.1045-1053, set./out. 2003.
Brâncio, P.A. et al. Avaliação de três cultivares de Panicum maximum
Jacq. sob pastejo. Composição química e digestibilidade da forragem. Revista
Brasileira de Zootecnia, v.31, n.4, p.1605-1613, 2002.
Brookes, A. J. The essence of SNPs. Gene, v. 243, n. 2, p. 177-186, 1999.
Brouwer, D.; Osborn, T. A molecular marker linkage map of tetraploid alfalfa
(Medicago sativa L.). Theor. Appl. Genet. V. 99, p. 1194–1200. doi:
10.1007/s001220051324, 1999.
Bshaw, E.C. Apomixis and its application in crop improvement. In: FEHR, W.
R.; HADLEY, H. H. (Ed.). Hybridization of crop plants. American Society of Agronomy
and Crop Science Society of America, p.45-63, 1980.
Bueno, L.C.S.; Mendes, A.N.G.; Carvalho, S.P. Melhoramento genético de
plantas. Lavras. Ed. UFLA, p.283, 2002.
80
Carlier, J.D. et al. Genetic maps of RAPD, AFLP and ISSR markers in Ananas
bracteatus and A. comosus using the pseudotestcross strategy. Plant Breeding, v.
123, p. 186–192, 2004.
Carneiro, M.S.; Vieira, M.L.C. Mapas genéticos em plantas. Bragantia,
Campinas, v.61,n.2, p.89-100, 2002.
Chamary, J.V.; Parmley, J.L.; Hurst, L.D. Hearing silence: non-neutral
evolutionat synonymous sites in mammals. Nat. Rev. Genet., v. 7, p. 98–108, 2006.
Chase, A. Grasses of Brazil and Venezuela. Agricultural American, v.4, p.123-
126, 1944.
Coelho, A.S.G. Considerações gerais sobre a análise de QTL. In: PINHEIRO,
J.B.;CARNEIRO, I.F. (Ed.). Análise de QTL no melhoramento de plantas. FUNAPE,
Goiania, p.1-20, 2000.
Coelho, A.S.G.; Silva, H.D. Construção de mapas genéticos e mapeamento
de QTL´s. Piracicaba, p.65, 2002 (apostila).
Coelho, A.S.G.; Silva, H.D. Métodos biométricos aplicados a análise de QTLs.
Anais do SEAGRO, Universidade Estadual de Londrina, Londrina - PR, 2005.
Collard B.C.Y. et al. An introduction to markers, quantitative trait loci (QTL)
mapping and marker-assisted selection for crop improvement: The basic concepts.
Euphytica, v. 142, p. 169-196, 2005.
Combes, D.; Pérnes, J. Variation ans les nombres chromosomiques du
Panium maximum en relation avec le mode de reproduction. Comptes Rendues
Academie Science, Paris, Sér. D., v.270, p.782-785, 1970
Costa, E.A. Construção de um mapa funcional em cana-de-açúcar e
mapeamento de QTLs de importância econômica. Dissertação de doutorado,
UNICAMP, 2015.
Coulondre, C. et al. Molecular basis of base substitution hot spots in
Escherichia coli. Nature, vol. 274, p.775–780. 1978.
Da Silva, J.A.G.; Sorrells, M.E. Linkage analysis in polyploids using molecular
markers. Boca Raton: CRC Press, cap. 13, p. 211–228, 1996.
Da Silva, S.C. Condições edafo-climáticas para aprodução de Panicum
maximum SP. In: Simpósio de manejo da pastagem, 12., 1995, Piracicaba.
Anais...Piracicaba: FEALQ, 1995. p.129-146.
Dall’Agnol, M.; Schifino-Wittmann, M.T. Apomixia, genética e melhoramento
de plantas. Rev. Bras. Agrosci., v.11, p.127-133, 2005.
81
Daugrois, J. et al. A putative major gene for rust resistance linked with a RFLP
marker in sugarcane var ‘R570’. Theoretical and Applied Genetics, Berlin, v. 92, n. 8,
p. 1059-1064, jun. 1996.
Dias-Filho M. B. Degradação das pastagens: processos, causas e estratégias
de recuperação. Embrapa Amazônia Oriental, Belém, p.190, 2007.
Dias-Filho, M.B. Colonião como planta pioneira. In: Simpósio de manejo de
pastagens – O capim colonião, 12., 1995, Piracicaba. Anais... Piracicaba:FEALQ,
1995. p.305-314.
Dufour, P. et al. Construction of a composite sorghum genome map and
comparison with sugarcane, a related complex polyploidy. Theoretical Applied
Genetic, Berlin, v. 94, n. 3-4, p. 409-418, 1997.
Ebina M. et al. Co-segregation of AFLP and RAPD markers to apospory in
Guineagrass (Panicum maximum Jacq.). Grassland Science, v. 51, p. 71-78, 2005.
Euclides, V. P. B. et al. A. Brazilian scientific progress in pastureresearch
during the first decade of XXI centure. Revista Brasileira de Zootecnia, v.39, p. 151-
168, 2010.
Falconer, D.S.; Mackay, T.F.C. Introduction to quantitative genetics. 4. ed.
New York: Longman Scientific & Technical, p. 464, 1996.
Fan, J.B. et al. Highly parallel SNP genotyping. Cold Spring Harbor
Symopsium Quantitaive Biology, v. 68, p. 69–78, 2003.
Ferreira, A. et al. Estimating the effects of population size and type on the
accuracy of genetic maps. Genetics Molecular Biology, v. 29, p.182-192, 2006.
Ferreira, M. E.; Grattapaglia, D. Introducción al Uso de Marcadores
moleculares en el Análisis Genético. EMBRAPA-CENARGEN, p.220, 1998.
Fonseca, D. M.; Ssantos, M. E. R.; Martuscello, J. A. Importância das
forrageiras no sistema de produção. In: FONSECA, D. M.; MARTUSCELLO, J. A.
(Ed.). Plantas forrageiras. ed. Viçosa: UFV, 2010. p. 13-29.
Gabriel S.; Ziaugra L.; Tabbaa D. SNP genotyping using the Sequenom
MassARRAY iPLEX platform. Current Protocols in Human Genetics, v. 60, p. 11–12,
2009.
Garcia, A. A. F. et al. Development of an integrated genetic map of a
sugarcane (Saccharum spp.) commercial cross, based on a maximum-likelihood
approach for estimation of linkage and linkage phases. Theoretical and Applied
Genetics, Berlin, v. 112, n. 2, p. 298-314, nov. 2006.
82
Garcia, A.A.F. et al. SNP genotyping allows an in-depth characterisation of the
genome of sugarcane and other complex autopolyploids. Sci Rep. 3, Article number:
3399, 2013.
Grattapaglia, D.; Sederoff, R. Genetic linkage maps of Eucalyptus grandis and
Eucalyptus urophylla using a pseudotestcross: Mapping strategy and RAPD markers.
Genetics, v. 137, p. 1121–1137, 1994.
Guglieri, A.; Zuloaga, F. O.; Longhi-Wagner, H. M. Synopsis of Panicum
subg. Panicum (Poaceae, Paniceae) in Brazil. Acta Botanica Brasilica, 18(2), p. 359-
367, 2004.
Gupta, P. K.; Roy, J. K.; Prasad, M. Single nucleotide polymorphisms: A
new paradigm for molecular marker technology and DNA polymorphism detection
with emphasis on their use in plants. Current Science, v. 80, n. 4, p. 4524-535, 2001
Gupta, P.; Lee, K.H. Silent mutations result in HlyA hypersecretion by reducing
intracellular HlyA protein aggregates. Biotechnol. Bioeng., v. 101, p. 967–974, 2008.
Gupta, P.K. et al. Molecularmarkers and their application in wheat breeding: a
review. PlantBreed, v. 118, p. 369-390, 1999.
Hackett, C. A. et al. Tetraploid Map for Windows: linkage map construction
and QTL mapping in autotetraploid species. The Journal of heredity, v. 98, n. 7, p.
727–729, 2007.
Hackett, C. A.;McLean K.; Bryan G. J. Linkage analysis and QTL mapping
using SNP dosage data in a tetraploid potato mapping population. PLoS One 8:
e63939, 2013.
Hackett, C. A.; Luo Z. W. TetraploidMap: construction of a linkage map in
autotetraploid species. J Hered, v. 94, p. 358-359, 2003.
Hanna, W.W. et al. Cytologyof obligate sexual plantsin Panicum maximum
Jacq. and their useincontrolled hybrids.CropSci, v. 13, p. 695–697, 1973.
Henry, R. J. Plant genotyping II. SNP technology. [S.l.]: CABI, v. 2, 2008.
Herling, V. R.; Braga, G. J.; Luz, P. H. de C.; Otani, L. Tobiatã, Tanzânia e
Mombaça. In:simpósio sobre manejo da pastagem, 17., 2000, Piracicaba. A planta
forrageira no sistema de produção.Anais... Piracicaba: FEALQ, 2000. p. 21-64.
Hitchcock, A. S. Manual of the grasses of the United States. 2. ed. rev. New
York: Dover, 1971
83
Hojito, S.; Horibata, T. Plant Exploration, Collection and Introduction from
Africa”, in Nekken Shiryo 58. TropicalAgriculture Research Center, Japan, p. 1-120,
1982.
IBGE.Produção da pecuária municipal (PPM) 2015. Disponível em:
http://www.ibge.gov.br (acessado 15/10/2016)
Jank L. et al. Catalog of the characterization and evaluation of the Panicum
maximum germplasm: morphological description and agronomical performance.
Embrapa Gado de Corte, v. 68, p. 53, 1997.
Jank, J. et al. Parâmetros genéticos de caracteres agronômicos em
híbridos de Panicum maximum Jacq. In: International Symposium on Forage
Breeding, 3., 2011, Bonito-MS. Embrapa Gado de Corte - CNPGC, p. 250-253, 2011.
Jank, L. A História do Panicum maximum no Brasil. Revista Brasileira de
Sementes,v.1, p.14, 2003.
Jank, L. Melhoramento e seleção de variedades de Panicum maximum. In:
Simpósio sobre manejo da pastagem, 12., 1995, Piracicaba. Anais... Piracicaba:
FEALQ, 1995. p.21-58.
Jank, L.; Resende, R.M.S.; Valle, C.B. Genética em pastagem. Revista USP,
São Paulo, v.64, p.86-93, 2005.
Jank, L.; Savidan, Y.H.; Costa, J.C.G. Registro de 25 acessos selecionados
de Panicum maximum. EMBRAPA-CNPGC, Campo Grande,Doc. 44 p.68, 1990
Koning-Boucoiran et al., 2012 The mode of inheritance in tetraploid cut rose.
Theor Appl Genet. 125(3): 591–607, 2012.
Kosambi, D.D. The estimation of map distances from recombination values.
Ann Eugen, v. 12, p. 172–175, 1944.
Kruglyak, L. The use of a genetic map of biallelic markers in linkage studies.
Natural Genetic, v.17; p.21–24. 1997
Kudla, G. et al. Coding-sequence determinants of gene expression in
Escherichia coli. Science, v. 324, p.255–258, 2009.
Kwok, P.Y. et al. Increasing the information content of STS-based
genome maps: identifying polymorphisms in mapped STSs. Genomics, v.31, p.123–
126, 1996.
Laborda, P. Marcadores moleculares microssatélites na investigação do
genoma de Drosophila mediopunctata: desenvolvimento e construção de mapa
genético de ligação. Tese de doutorado, Universidade Estadual de Campinas, 2011.
84
Lander, E. S. et al. MAPMAKER: an interactive computer package for
constructing primary genetic linkage maps of experimental and natural populations.
Genomics, v. 1, p. 174-181, 1987
Langaee, T.; Ronaghi, M. Genetic variation analyses by Pyrosequencing.
Mutation Research/Fundamental and Molecular Mechanisms of Mutagenesis,
v.573, p. 96-102, 2005.
Lazia, B. Produção de forrageiras, 2012. In: Portal agropecuário. Disponível
em: http://www.portalagropecuario.com.br/bovinos/pastagens-e-
alimentacao/producao-de-forrageiras (acessado 26/12/2016)
Leach, L. J. et al. Multilocus tetrasomic linkage analysis using hidden markov
chain model. Proceedings of the National Academy of Sciences of the United States
of America, v. 107, p. 4270–4274, 2010.
Liu, B.H. Statistical genomics: linkage, mapping, and QTL analysis. Boca
Raton: CRC Press,p.611 1998.
Lorieux, M.; Ndjiondjop, M-N; Ghesquiere, A. A first interspecific Oryza sativa
x Oryza glaberrima microsatellite-based genetic map. Theor. Appl. Genet. V. 100, p.
591-601, 2000.
Lynch, M.; Walsh, B. Genetics and analysis of quantitative traits. Sunderland:
Sinauer, p. 980, 1998.
Maheswaran, C. The evolution of molecular markers – just a matter of
fashion? Nature reviews genetics, v. 5, p. 63-69, 2004.
Maliepaard, C.; Jansen, J.; van Ooijen, J. W. Linkage analysis in a full-sib
family of an outbreeding plant species: Overview and consequences for applications,
Genet. Res., p. 70, 1997.
Margarido, G.R.A.; Grcia, A.A.F.; Souza, A.P. OneMap: software for genetic
mapping in outcrossing species. Hereditas, Lund, v. 144, p. 78-79, 2007.
Market, C.L.; Moller, F. Multiple forms of enzymes tissue, ontogenic and
species specific patterns. Proceeding of the National Academy of Sciences, v.
45, p. 753-762. 1959
Martuscello, J.A. et al. Repetibilidade e seleção em Panicum maximum Jacq.
Tese de doutorado, Universidade Federal de Viçosa, Viçosa, p. 100, 2008
Mayer MP, Bukau B. Hsp70 chaperones: cellular functions and molecular
mechanism. Cell Mol Life Sci 62: 670–684, 2005
85
McCallum, S. et al. Construction of a SNP and SSR linkage map in
autotetraploid blueberry using genotyping by sequencing. Molecular Breeding , v. 36,
p. 1-24, 2016.
Meyer, R. C. Linkage analysis in tetraploid potato and association of markers
with quantitative resistance to late blight (Phytophthora infestans). Molecular &
general genetics, v. 259, n. 2, p. 150–60, 1998.
Ming, R. et al. Qtl analysis in a complex autopolyploid: genetic control of sugar
content in sugarcane. Genome Research, New York, v. 11, n. 12, p. 2075-2084, dez.
2001.
Molinari, O. G. Grasslands and grasses of Puerto Rico. Rio Piedras:
University of Puerto Rico, p. 167, 1952.
Mollinari, M. Desenvolvimento de um modelo para construção de mapas
genéticos em autopoliploides, com aplicações em cana-de-açucar. Tese de
doutorado, Universidade do Estado de São Paulo, 2012.
MollinariI, M. Comparação de algoritmos usados na construção de mapas
genéticos. Dissertação de mestrado em Genética e Melhoramento de Plantas,
Escola Superior de Agricultura “Luiz de Queiroz”, Universidade de São Paulo,
Piracicaba, p. 73, 2009.
Moose S. P.; Mumm R. H. Molecular plant breeding as the foundation for 21st
century crop improvement. Plant Physiol., v. 147, p. 969–977, 2008.
Müller, M. S. Desempenho de Panicum maximum (cv. Mombaça) em
pastejo rotacionado, sob sistema de irrigação por pivô central, na região do cerrado.
Dissertação de mestrado em Fitotecnia, Escola Superior de Agricultura “Luiz de
Queiroz”, Universidade de São Paulo, Piracicaba, p. 101, 2000.
Nakajima, K. et al. Isolation of diploid and tetraploid sexual plants in guinea
grass (Panicum maximum Jacq.). Japanese Journal of Breeding, v. 29, 1979.
Nielsen, R. et al. Genotype and SNP calling from next generation sequencing
data. Nat. Ver. Genet., v. 12, p.443–451, 2011.
Nogler, G.A. Gametophytic apomixis. In: Embryology of Angiosperms (ed.
Johri, BM). Springer-Verlag, Berlin,p. 475–518, 1984.
Oeth, P. et al. Qualitative and quantitative genotyping using single base primer
extension coupled with matrix-assisted laser desorption/ionization time-of-flight mass
spectrometry (MassARRAY). Methods Mol. Biol., v. 578, p. 307– 343, 2009.
86
Oeth, P.et al. iPLEX™ Assay: Increased Plexing Efficiency and Flexibilityand
Flexibility Terminators. Sequenom, San Diego, p. 12 2007.
Oliveira, K. M. et al. Functional integrated genetic linkage map based on EST-
markers for a sugarcane (Saccharum spp.) commercial cross. Molecular Breeding,
Netherlands, v. 20, n. 3, p. 189-208, abr. 2007.
Parsons, J. J. Spread of african pasture grasses to the American Tropics.
Journal of Range Management, Denver, v. 25, n. 1, p. 12-17,1972.
Paterson A.H. et al. Comparativegenomics of plant chromosomes. Plant Cell,
v.12, p. 1523-1539, 2000.
Paterson, A.H.; Tanksley, S.D.; Sorrels, M.E. DNA markers in plant
improvement. Advances in Agronomy, San Diego, v.46, p.39-89, 1991.
Rafalski, A. Applications of single nucleotide polymorphisms in crop genetics.
Current Opinion in Plant Biology, v. 5 (2), p. 94-100, 2002.
Rajapakse, S. et al. Two genetic linkage maps of tetraploid roses. Theor. Appl.
Genet., v. 103, p. 575–583, 2001.
Ripol, M. I. et al. Statistical aspects of genetic mapping in autopolyploids.
Gene, v. 235, p. 31–34, 1999.
Ritter, E.; Gebhardt, C.; Salamani, F. Estimation of recombination frequencies
and constructiono f RFLP linkage maps in plants from crosses between
heterozygous parents. Genetics, v.125, p.645-654, 1990.
Rocha, R.B. et al. O mapeamento genético no melhoramento de plantas.
Revista Biotecnologia Ciência e Desenvolvimento, Brasília, v. 30, p. 27-32, 2003.
Sakiyama, N.S. Marcadores moleculares e as hortaliças. Horticultura
brasileira. v.11, n.2, p.204-206. 1993
Salton, J. C.; Costa, A. R.; Silva, W. M. Uso de forrageiras perenes no período
de entressafra para melhoria da qualidade do solo na Região Centro-Oeste do
Brasil. In: Congresso Latinoamericano de la Ciencia del Suelo, 18, San Jose, Costa
Rica. Suelo... raíz de nuestro futuro. San Jose: Sociedad Latinoamericana de la
Ciencia del Suelo, 2009.
Santos, P.M. Estudos de algumas características agronômicas de Panicum
maximum (Jacq.) cvs. Tanzânia e Mombaça para estabelecer seu manejo.
Dissertação (Mestrado), Piracicaba, 1997, 62p. , ESALQ, 1997.
87
Savidan Y. Genetics and utilization of apomixis for the improvement of
guinea grass (Panicum maximum Jacq.) In: Proc XIV Intl Grassl Congr, Lexington,
p. 182–184, 1981.
Savidan, Y. Apomix: genetics and breeding. Plant Breeding Review, v. 18, p.
13-86, 2000.
Savidan, Y. Chromosomal and embryological analyses in sexual x apomictic
hybrids of Panicum Maximun jacq. Theoretical and Applied Genetics, v. 57, p. 153-
156, 1980.
Savidan, Y. H. et al. Breeding Panicum maximum in Brazil. Genetic
resources, modes or reproduction and breeding procedures. Euphytica, v. 41, p. 107-
112, 1989.
Savidan, Y. H.; Jank, L.; Costa, J. C. G. Registro de 25 acessos selecionados
de Panicum maximim. Campo Grande: EMBRAPA-CNPGC, Doc. 44, p. 68, 1990.
Schlötterer, C. The evolution of molecular markers--just a matter of fashion?.
Nature reviews Genetics, v. 5, p. 63-69, 2004.
Seiffert N.F. Gramíneas forrageiras do gênero Brachiaria. EMBRAPA-
CNPGC, Campo Grande, Circular Técnica 1, p. 83, 1984.
Semagn, K.; Bjørnstad, Å.; Ndjiondjop, M.N. An overview of molecularmarker
methods for plant. Afr. J. Biotechnol, v. 25, p. 2540-2569, 2006.
Serang, O.; Mollinari, M.; Garcia A.A.F. Efficient Exact Maximum a Posteriori
Computation for Bayesian SNP Genotyping in Polyploids. PLoS ONE 7(2): e30906.
doi:10.1371/journal.pone.0030906, 2012.
Severiano, E.C. et al. Potencial de descompactação de um argissolo
promovido pelo capim-tifton 85. Revista Bras. eng. agric. amb., v. 14, p.39-45, 2010.
Shepherd, M. et al. Genetic maps for Pinus elliottii varhondurensis using AFLP
and microsatellite markers. Theoretical and Applied Genetics, v. 106, p. 1409–1419,
2003.
Skerman, P.J.; Riveros, F. Gramíneas tropicales. Rome: FAO Producción y
Protección Vegetal, v. 23, p. 849, 1992.
Slate, J. Quantitative trait locus mapping in natural populations: progress,
caveats and future directions. Molecular ecology, v. 14, n. 2, p. 363–79, 2005.
Sousa, A.C.B. Estudos genéticos moleculares em forrageiras tropicais. Tese
(Doutorado em Genética e Biologia Molecular) – Instituto de Biologia, Universidade
Estadual de Campinas, Campinas, São Paulo, p. 205, 2010.
88
Sturtevant, A.H. The linear arrangement of six sex-linked factors in Drosophila,
as shown by their mode of association. J. Exper. Zool., v. 14, p. 43-59, 1913.
Sun, G. et al. SNPs in human miRNA genes affect biogenesis and function.
RNA 15, p.1640–1651, 2009.
Tanksley, S.D. Mapping polygenes. Annual Review Genetics, Palo Alto, v.27,
p.205-33, 1993.
Toledo-Silva, G. et al. De novo transcriptome assembly for the tropical grass
Panicum maximum Jacq. PloS one, v. 8, n. 7, p. e70781, 2013.
UNICA – União da Agroindústria Canavieira de São Paulo. Disponível em:
http://www.portalunica.com.br (acessado 02/11/2016).
Valentim, J. F. et al. Capim-massai (Panicum maximum Jacq): nova
forrageira para a diversificação das pastagens do Acre. Embrapa Acre, Circular
Técnica 41, 2001.
Valle, C.B. et al. Melhoramento genético de Brachiaria. In: Resende, RMS,
ValleCBdo & Jank L (Eds.) Melhoramento de Forrageiras Tropicais,1ª ed., Campo
Grande, Embrapa. p. 13-53, 2008.
Valle, C.B.; Jank, L.; Resende, R.M.S. O melhoramento de forrageiras
tropicais no Brasil. Revista Ceres, v.56, n.4, p.460-472, 2009.
Van Ooijen, J. W.; R. E. Voorrips. Joinmap 3.0, software for the calculation of
genetic linkage maps. Plant Research International, Wageningen, The Netherlands,
2001.
Verzignassi, J. R.; Fernandes, C. D. Doenças em forrageiras. Embrapa Gado
de Corte, Campo Grande, Circular Técnica 50, p.3, 2001
Vieira, A. Gramíneas forrageiras. Revista dos Criadores, São Paulo, n 777,
p.26-37. 1994.
Vignal, A. et al. A review on SNP and other types of molecular markers and
their use in animal genetics. Genetics Selection Evolution, Paris, v.34, p.275-305.
2002.
Voorips, R. E. MapChart: Software for the graphical presentation of linkage
maps and QTLs. Journal of Heredity, Washington, v. 63, p. 77-79, 2002.
Voorrips R,; Gort, G.; Vosman, B. Genotype calling in tetraploid species from
bi-allelic marker data using mixture models. BMC Bioinformatics, v. 12, p. 172, 2011.
89
Wang, D.G.; et al. Large-scale identification, mapping, and genotyping of
single-nucleotide polymorphisms in the human genome, Science , v. 280, p. 1077–
1082, 1998.
Wang, J. et al. High-throughput SNP genotyping by single-tube PCR with Tm-
shift primers. Biotechniques, v. 39, p. 885-893, 2005
Wang, Z.; Gerstein, M.; Snyder, M. RNA-Seq: a revolutionary tool for
transcriptomics. Nature reviews genetics, v. 10, n. 1, p. 57-63, 2009.
Wu, C. et al. Genetic Analysis of Grain filling rate in different growth stages of
superior and inferior grains in rice. Scientia Agricultura Sinica, v. 40, n. 6, p.1135-
1141, 2007.
Wu, K.et al. The detection and estimation of linkage in polyploids using single-
dose restriction fragments. Theoretical and Applied Genetics, v. 83, p. 294-300,
1992.
Wu, R. L. et al. Simulataneous maximum likelihood estimation of linkage and
linkage phrases in outcrossing species. Theoretical Population Biology, v. 61, p. 349
- 363, 2002a.
Xu, L.M. et al. Identification and mapping of quantitative trait loci for cold
tolerance at the booting stage in a japonica rice near-isogenic line. Plant Science,
v.174, p. 340–347, 2008.
Yarnes, S.C. et al. Identification of QTLs for capsaicinoids, fruit quality, and
plant architecture-related traits in an interspecific Capsicum RIL population. Genome,
v. 56, p. 61–74, 2013.
9. ANEXOS
90
Tabela I: Sequencias dos primers utilizados na genotipagem dos marcadores SNP.
SNP Contig Forward Primer Reverse Primer Extended Primer
SNP1 comp372439_c0_seq1 ACGTTGGATGTCGATATCTGCACGATCTTC ACGTTGGATGGTTGCTTTTGAGAGTGCGAG GCACGATCTTCTGTTATCA
SNP2 comp390273_c0_seq1 ACGTTGGATGAAACTGCTTGAAAGGCGTGG ACGTTGGATGTGAAAAGGTCATCACGGGTC GAAAGGCGTGGATGTTGTTG
SNP3 comp390273_c0_seq1 ACGTTGGATGCTGGAATCACAATTCTGCCG ACGTTGGATGTTGTCAGCTCCTCAGTTTCC GTGAAGGTGACAGATGG
SNP4 comp393980_c0_seq1 ACGTTGGATGAGCGCCGCGGGCGGCACGA ACGTTGGATGTCTCCACTCTGTTCACCAAG CGCGGGCGGCACGACGAGGC
SNP5 comp394414_c0_seq1 ACGTTGGATGAGTTGCAGGTGATGAAGACG ACGTTGGATGTACACGCAGGTTGTGTGGC CGCGGGCGCATCCGATGGC
SNP7 comp395427_c0_seq1 ACGTTGGATGTTGCTGGACCAGGACTACG ACGTTGGATGGCCAAGCTCCCGAAGCTCA CAGGCCTCGGGATCCGTG
SNP8 comp395427_c0_seq1 ACGTTGGATGTTATTCAGTGGGCCCCACAG ACGTTGGATGTGCTCTCCAGTGTCGAGTTC CCGGGCAGTGGGTGGGTT
SNP9 comp396609_c0_seq1 ACGTTGGATGTTCCACTTTGTCGAGGACTG ACGTTGGATGTCATCGAAGGGAACATAGGG GTCGGTCAGAACCTTCTTCTT
SNP10 comp397475_c0_seq1 ACGTTGGATGCACGCTCGCCTCCCACCTG ACGTTGGATGCAATTGGATCCCCTCAGAAG AGACCTCCTCCATCTGA
SNP11 comp398252_c0_seq1 ACGTTGGATGGTGGAACTACAACTACGGGC ACGTTGGATGGTCTTGAACGCGATCACGG GCCCGTCGAAGCCGATGCTCTG
SNP12 comp398252_c0_seq1 ACGTTGGATGATACTACCAGCAGTACTGCC ACGTTGGATGAAGCATGCATCCATGAACCC GTACTGCCAGCAGCTCGG
SNP13 comp399176_c0_seq1 ACGTTGGATGATCCAGACCTGTACCCAAAG ACGTTGGATGATGCCTCTGACAGAAAACTC CACTGGACGTCCACCTCAT
SNP14 comp399176_c0_seq1 ACGTTGGATGGGCATCTCTAATTTTCTGTC ACGTTGGATGTGGGATCAGTTTGGCTGTAG TAAGGCCATCCATGGCGTCCCT
SNP15 comp399877_c0_seq1 ACGTTGGATGCTGATCACTCTACTGTACTG ACGTTGGATGGACAAAGTCTACAAGTGAGC ATGAACTGTAACTTCTTTTTTG
SNP16 comp400352_c0_seq1 ACGTTGGATGATGGTCATCATCAGCGACAG ACGTTGGATGAACCTGACCTCCAAGCTCCT GCGAGTCCTTGCCGGCGCT
SNP17 comp400553_c0_seq1 ACGTTGGATGACAAGATCGACTTCCGCGAG ACGTTGGATGAACGAAGACGAAGTCGAAGC AGGTCGTCGAGGACGGG
SNP18 comp401774_c0_seq1 ACGTTGGATGGGAGTTGGTAGGACGATTAC ACGTTGGATGCGCCCAATACTTATCAGCAG GTAGGACGATTACCAAACTTCT
SNP19 comp401774_c0_seq1 ACGTTGGATGTGATGTTGTGGAAGATGCGG ACGTTGGATGACTACGACTCGAGCGAGTG GAGTGGGACTGGCTGCG
SNP20 comp401774_c0_seq1 ACGTTGGATGTTGCTGAGACTGAGGAGGAC ACGTTGGATGTCTTCCAGGAGAGGAGAGG AGAGGCGAGGACATCCGACCC
SNP21 comp401816_c0_seq1 ACGTTGGATGTCCAGCTCTCCTTCAACTAC ACGTTGGATGACCAGGTCCGGGTTGTTCAG GCGGGGCGAGCCATCGG
SNP22 comp401816_c0_seq1 ACGTTGGATGTGAACAACCCGGACCTGGTG ACGTTGGATGTTGTTGTCCCTCGCCGTCAT ACAGCGCCGTCTTGAACGA
SNP23 comp402699_c4_seq1 ACGTTGGATGATCACCACCCTGAACGTCTG ACGTTGGATGATGATCTCCTTGGACAGGTG CCAGGCCTACACCCTGAAGCGGAT
SNP24 comp402699_c4_seq1 ACGTTGGATGTGCAGAACACGGGTTAAGAC ACGTTGGATGGATGCAGCTAAAATTCGCAA TACAAAAGGCCTAAAGCAAATGAT
SNP25 comp402881_c1_seq1 ACGTTGGATGGAGCTGAAACTCCTTCGGCA ACGTTGGATGGTAAACATCCTTGAAGCTCC TGAAGCTCCTTCTATGCAC
SNP26 comp402896_c0_seq1 ACGTTGGATGTTGTCACAGGTGCTGAGTTC ACGTTGGATGGTGACTTTCCTTGCTATCCC GGCAAAAGATCTTGGTTTGTTG
91
SNP27 comp402968_c0_seq1 ACGTTGGATGATGTCCCCTTCCTCCACGAA ACGTTGGATGAGGGTCCCCCCACCGACAA TTGCCGTCGCCGAGGAT
SNP28 comp403104_c0_seq1 ACGTTGGATGGCCTTGTCACCATTTATCCC ACGTTGGATGAGACGATCCGGATTGATGAC TGATGACGCAGACGAGGTGGC
SNP29 comp403104_c0_seq1 ACGTTGGATGTCTGGCAGTTCTTGCAGAAG ACGTTGGATGCGTTGCAACAGCATGGATAC TCTTGCAGAAGTGGCGTGGCTG
SNP30 comp403411_c0_seq1 ACGTTGGATGGCGATAATGCTGCTGGATTC ACGTTGGATGAGTCCAAGGTCGAGAACAAG AAGGGCCAGAAATCAGA
SNP31 comp403411_c0_seq1 ACGTTGGATGAAGCAGAACCAGATTCAGGC ACGTTGGATGCATGTACCCTTGGAGTGTAG TGGAACAATCTCCCTGTGATGG
SNP32 comp403411_c0_seq1 ACGTTGGATGTGGAGACACAAGAGCTTCAG ACGTTGGATGTTACTGATGGCCCCTGATTG GACTTTGATATGTCCACTC
SNP33 comp403445_c0_seq1 ACGTTGGATGGACCGATGTAAGATGGAAGC ACGTTGGATGGAGTACGTCTCATGTTCCTC TAAGATGGAAGCCCTTAAAC
SNP34 comp403445_c0_seq1 ACGTTGGATGAGGGGAAAATGGAGGAAATC ACGTTGGATGTGTCCTAGTGTTGTCTTGCC GTCTTGCCTAATCCTCC
SNP35 comp403445_c0_seq1 ACGTTGGATGAGAGTTTGACGCTACTCCAG ACGTTGGATGTGCTAATGGCAGACCGTTAC CGCTACTCCAGCAAATCTTATT
SNP36 comp404064_c0_seq1 ACGTTGGATGAAGCTCATCGTCACCGAGG ACGTTGGATGAAACTTCCCGTCGACGGTG ACCACCGGAATTCCCCTC
SNP37 comp404064_c0_seq1 ACGTTGGATGAGGTGATCGATGCCGAGGAG ACGTTGGATGTAGTGCCAGACGAGTACGG GTACGGCAGCGCGACGAC
SNP38 comp404064_c0_seq1 ACGTTGGATGCACATCTACTCGCTCAACTC ACGTTGGATGCCAGGTCGAACTTGCGCAT CGAACTTGCGCATGATCAC
SNP41 comp404787_c0_seq1 ACGTTGGATGTCTTTTGAAGGCCTGGATGG ACGTTGGATGAATGTCCAGATGTCCTTGCC CCTGGATGGCGGAGCTGG
SNP42 comp404787_c0_seq1 ACGTTGGATGAAGTACCCGTCTGAGAAGAG ACGTTGGATGTCGACAGACAGAGAACGATG TTTGTCAACAGCCTCCGGTGAG
SNP43 comp404787_c0_seq1 ACGTTGGATGGTTACGTGTCCATCGGTTGC ACGTTGGATGTCCTTGGCCTTGGCGTCCT CCGGCCTTCGCGCTCGTGCTG
SNP44 comp404734_c0_seq1 ACGTTGGATGGAAGGATGGCTTCTACATCG ACGTTGGATGTGTTTGGCAGGCTCATGAAG AGGCTCATGAAGTTCTTGGT
SNP45 comp404734_c0_seq1 ACGTTGGATGGTCGCATGGAGAAGTTCTAC ACGTTGGATGGAAGATACCCTTGCAGACAC AAGTTCTACTGGGCTCC
SNP46 comp404734_c0_seq1 ACGTTGGATGAGCCCAAGATGACCATCGAG ACGTTGGATGTACTTGTCAGCAAGCTGCAC TGACCATCGAGAAGCTC
SNP48 comp404985_c0_seq1 ACGTTGGATGGTTCTGCTCCGATCAACTTG ACGTTGGATGCATGAAGATCTCCACGGAAC AGCGCCCAACGCAGCAC
SNP49 comp404985_c0_seq1 ACGTTGGATGTGGTGGCGCAACGAGCAGTT ACGTTGGATGTTGAGCAGGCCCTGGAACAC CGCAACGAGCAGTTCTGGGT
SNP50 comp405097_c0_seq1 ACGTTGGATGGATTACACCGATGACATCTC ACGTTGGATGAGACGCCTCCACATTTGAAG ACATTTGAAGTAAGTCACCTGGA
SNP51 comp405097_c0_seq1 ACGTTGGATGGCATGTCTGGCTTACACTTC ACGTTGGATGCGGTCAATGAATGGCATCAC TGGTCTGACCTCTGCCG
SNP52 comp405374_c1_seq1 ACGTTGGATGAGATATCCTTCAAGCACCTG ACGTTGGATGTGAGGAGATACTACAACGAC TCCTTCAAGCACCTGATCCATC
SNP53 comp405374_c1_seq1 ACGTTGGATGACCTTGTTGTTGTTGCTGGG ACGTTGGATGGCATCTTCTCTATCTCTGCG GGGTATAATGATGTAAAGAAGTC
SNP54 comp405932_c0_seq1 ACGTTGGATGCATCGGTGATAAGCAACAGC ACGTTGGATGTGCATCTCTGATAGACCCTG TGAATTGTTGGAGTACATATC
SNP55 comp405932_c0_seq1 ACGTTGGATGAATGGGTTACTCTGTCTGCG ACGTTGGATGGCCATTGAGGAAGCAAAGTG TTCCCCACCTTATACTGTGT
SNP56 comp405932_c0_seq1 ACGTTGGATGTAGCCATCAATTTCCCGGTC ACGTTGGATGGAAACTAGACCGACAGAAGC GTCTATGAAGCGCTCTTCCTC
92
SNP57 comp406822_c0_seq1 ACGTTGGATGACGAAGTGCTGCGCGACGAT ACGTTGGATGAGAAGGTGTTCGTCACCGAC CGGCGCTGTATCTTTCC
SNP58 comp406822_c0_seq1 ACGTTGGATGTGCAGCTGCGGATGAAGCG ACGTTGGATGTGCCCACCATCCACCAGAT TCCTCGGGCTTGGAGGCGTG
SNP59 comp406822_c0_seq1 ACGTTGGATGGGACGCCTTGTCCTCTTCTT ACGTTGGATGTTCTCCTTGCTGGTGTGGG GAGCCGTTGCTGTCGGCTTT
SNP60 comp407770_c0_seq1 ACGTTGGATGGCCGTCAGATCTCACATTTG ACGTTGGATGAGTAGGCCCAAAGTAATCCC AGTAATCCCCATGCTTTGTAAGTC
SNP61 comp407770_c0_seq1 ACGTTGGATGGCCTACTGAGGATGGAAAAC ACGTTGGATGTGTGGATCCCTTCTTTCAGC ACTGAGGATGGAAAACCTTCTC
SNP62 comp409117_c0_seq1 ACGTTGGATGAGGAGAGCAGCTGTGCGAA ACGTTGGATGATCCAGAAATGGTACCTCGG CCCACCACCGTCCGGAG
SNP63 comp409117_c0_seq1 ACGTTGGATGAGGTGATCCTTCACTAGGAC ACGTTGGATGGGACATCGAGATCCACTTCC AGATGCCGATGGCGTTGTACTT
SNP64 comp410102_c0_seq1 ACGTTGGATGAGACTTGTGTTTCCCCCGTC ACGTTGGATGAATCAGTAGTTCCAGCCACC AAGAGCTAATCATCTTCTGGAG
SNP65 comp409416_c0_seq1 ACGTTGGATGAGAAGATCTGGCTGGTGGAC ACGTTGGATGCATGGCTGCTTGAAGTGCTG AAGGGCCTGATCGTGGA
SNP66 comp409416_c0_seq1 ACGTTGGATGTCGCACTCGGAGTGCACAG ACGTTGGATGACTTCGACGGGGTCGAAGG CGGAGTGCACAGCCGAGGA
SNP67 comp409416_c0_seq1 ACGTTGGATGAAGGTTGCCGCCAAGGCCTA ACGTTGGATGTCTGCGCGTACTTGACGAGA GCCTACGAGCTCGGACTCGC
SNP68 comp410518_c1_seq1 ACGTTGGATGAAAAGAATTCCAGCAGCCCG ACGTTGGATGATCAGCTTCTTCTGGATCGC TCCAGTACCTGTTCCTGGG
SNP69 comp410882_c0_seq1 ACGTTGGATGAGTAAAACCCTCAACCTGCG ACGTTGGATGCATAAAACGTGAACATCACTG TAAAACGTGAACATCACTGTTGATA
SNP70 comp410926_c0_seq1 ACGTTGGATGCGAGAGAAATTCTCCTGTTG ACGTTGGATGCCTCCCTAAGATCATACACC TGACCATGAGCACCCAC
SNP71 comp410926_c0_seq1 ACGTTGGATGTATGATCTTAGGGAGGCTGG ACGTTGGATGGGAACCTTGCAACCCATTAG TGAGACTTCGGTAACGGTA
SNP72 comp411092_c0_seq1 ACGTTGGATGAGGGCACATGTGTGGAGGAT ACGTTGGATGGTCAGTTTCCTCTCCCATTG TTCCTCTCCCATTGAATTAATTT
SNP73 comp411092_c0_seq1 ACGTTGGATGCCTCTGGAAGTGTTCTCGTG ACGTTGGATGTAGAAAAAAGAGCCCGGGTG CATTTTCATCATCCGCAA
SNP74 comp411001_c0_seq1 ACGTTGGATGCGAAGACCATCTCGAGCAG ACGTTGGATGCCATGAAGAAGGACATCAAG AAGAAGGGCCACTCGTTGTACAT
SNP75 comp411001_c0_seq1 ACGTTGGATGATCCTCTTCAGCGTGTAGGC ACGTTGGATGAGATCCTTGAAGCTAGTCCC CCTACATCACGACGCTGAA
SNP76 comp410205_c1_seq1 ACGTTGGATGACTTCATCAGCGGCTACACC ACGTTGGATGCGAAGCAGGCCGAGAAGGT GCAGGCCGAGAAGGTGGCCGT
SNP78 comp410899_c0_seq1 ACGTTGGATGTTCTTGTTTGGCTGTGCTCG ACGTTGGATGTTTGTATGTAAAGGGAGACC TATGTAAAGGGAGACCCAAGGG
SNP80 comp410205_c0_seq1 ACGTTGGATGAGTTGAGGAACTGGTCGTTG ACGTTGGATGCCAGTTCGTGATCAACAGGG TGATCAACAGGGAGCGGGC
SNP81 comp410205_c0_seq1 ACGTTGGATGGATGGACTGCAGCTGCTGTT ACGTTGGATGATCAAGGATGGCGCCACCTC TGGCGCCACCTCGGCCTTCGC
SNP82 comp409444_c1_seq1 ACGTTGGATGCCCACTACAGTAACTGGAAG ACGTTGGATGACCCATTATCTTGAAGCCTG CTGGAAGGAACAGCTGA
SNP83 comp409444_c1_seq1 ACGTTGGATGGATAATTCACCAATTCGCCG ACGTTGGATGCCCTGTTGGACTCAAACTAC GAACTATCTGCTGGCCAC
SNP84 comp409137_c0_seq1 ACGTTGGATGCCTCCAGATATTAGCAAAGC ACGTTGGATGTTGAGGCTTCAAGCAATGGG CAATGGGAGATTAAGTGGTT
SNP85 comp408903_c0_seq1 ACGTTGGATGTATTGATCCCACATCTGGAG ACGTTGGATGCATGGTTATAGATCTCTCCG ATCTCTCCGTTCACCGT
93
SNP86 comp409281_c1_seq1 ACGTTGGATGGAGCCCCGGCAGCTTGAAC ACGTTGGATGTCTACTACCACAACGTCCAC GCTTGAACCGGGCGGTG
SNP87 comp408198_c0_seq1 ACGTTGGATGTAATGAGCCCGGGCATTATC ACGTTGGATGGTTCTCGTTAGGATATCCAG GTTAGGATATCCAGTGATTG
SNP88 comp408198_c0_seq1 ACGTTGGATGGAGCGTCCAACCATTTCAAG ACGTTGGATGTTTCTTCATGCTTGCCGAGG ATCATGGCAAACCTTGGGTTCCG
SNP89 comp408198_c0_seq1 ACGTTGGATGACTATTTCGCTTGCAGGTTC ACGTTGGATGCAAGACCTGCAATCTACGAG CTTGCAGGTTCAACCTCGTC
SNP90 comp408696_c0_seq1 ACGTTGGATGTTACAAACAGCTCGCAAGCC ACGTTGGATGTGCTGAAATAGAACCCCCAG CTGATATTTTCTTCCCCCT
SNP91 comp408696_c0_seq1 ACGTTGGATGACCTTAAGCACAGCCAATCC ACGTTGGATGGATTGCAAGTGTGCTGTCTC ACAGCCAATCCACCAGC
SNP94 comp408091_c0_seq1 ACGTTGGATGTCATGGTGGACCGGATGCTC ACGTTGGATGAATACTTGCCGTCCTTGTCC TCCTTGTCCTCCATCTG
SNP95 comp408070_c2_seq1 ACGTTGGATGCTCGTCCGTGAAACATAGTC ACGTTGGATGTTTCTCTGCAGCTTGGCAAC CTTAACCCCATGACACTTA
SNP96 comp408070_c2_seq1 ACGTTGGATGTTGCCAAGCTGCAGAGAAAC ACGTTGGATGAATCAGTGGCAAGCAGGAAG CAGGAAGTGATGATTGGGTATT
SNP97 comp407698_c0_seq1 ACGTTGGATGAACCTTATGGCGACCCATCC ACGTTGGATGTATGACTCGTCCAAGGACCC CACGCCGACGGTGTTCCTCTG
SNP98 comp407698_c0_seq1 ACGTTGGATGTGATGGGCTTGATGTAGACG ACGTTGGATGTCAACGACGAGCTCTTCTTC TCTTCTTCTCCATCGCC
SNP99 comp407348_c0_seq1 ACGTTGGATGACTGTGTAGTTTGCTCCAAC ACGTTGGATGTGCTCGAATTCTGGTCACTG GGTCACTGACCAGAAGAT
SNP100 comp407348_c0_seq1 ACGTTGGATGAAGTAACGCTCAACATACCC ACGTTGGATGAAATGACTCGGCTGGTGATG ACAACTGCATCTGTTCT
SNP101 comp407348_c0_seq1 ACGTTGGATGGGACCAACCTTGTCAATAGC ACGTTGGATGGTTGCTGCTATATCAGCTGG ACCAACCTTGTCAATAGCTTCGGC
SNP102 comp407273_c0_seq1 ACGTTGGATGTTGCCGTTAACCTTGAGCAG ACGTTGGATGGCCTCGACTACATCATTGAC ACATCATTGACACTGTCTC
SNP103 comp406670_c0_seq1 ACGTTGGATGCGACAATGGAGAGGGATTTG ACGTTGGATGGCGATAGCTCTCTGATTTGC GAGGGATTTGAGAAATTGAA
SNP105 comp406375_c0_seq1 ACGTTGGATGAGCAGTACTGCCTGTTGCTC ACGTTGGATGGTGAACCCAAAATCTTCAGC GCTCCACCAGTATTAGATGA
SNP106 comp406375_c0_seq1 ACGTTGGATGCTAGTTGAGAGTATCGTTGG ACGTTGGATGTGGGATGTGCATCAATGCTG ATCGTTGGACATGCACGAT
SNP107 comp404729_c0_seq1 ACGTTGGATGACCCAGATGACCCGAAGAAC ACGTTGGATGAGATGGCGTCGTAGTCGAG GAAGAACGCGCACCTCA
SNP108 comp404729_c0_seq1 ACGTTGGATGTGAACCCTGTGCTGGTGGTG ACGTTGGATGAGACCCGTCCAGGTACTTGA GTGAACGCCAGCATCGC
SNP109 comp404739_c1_seq1 ACGTTGGATGACTGTTTCTTGAGCAAGGAC ACGTTGGATGAAATGCGAGCATCACTCCAC GCAAGGACCAAGCGTCTTCTCC
SNP110 comp404739_c1_seq1 ACGTTGGATGATCTTTCCATGAAGCGTCCC ACGTTGGATGTGCAGACCCTAACCAACATC ATCACGAGAAGAAATTTGCT
SNP111 comp402928_c0_seq1 ACGTTGGATGGAGCTGATTAAGTACAAAGG ACGTTGGATGCCAGAATTTCCGGATGAGAC TACAAAGGTTTTCAGATTGC
SNP112 comp402928_c0_seq1 ACGTTGGATGCCTAGCTACAAAGGCCTAAC ACGTTGGATGTAGCTGCAGAAGAGCCATTG CCATTGCATGTTCATTTAGT
SNP113 comp402778_c0_seq1 ACGTTGGATGCTTAAGGAGAGGAAACGCAG ACGTTGGATGTGCACATGCTTGACATTCCG GAGAGGAAACGCAGCATCAAC
SNP114 comp402778_c0_seq1 ACGTTGGATGGGAATGTCAAGCATGTGCAG ACGTTGGATGTGCGCTTGTTCCCATGATTG GGGAATTATGCTTGGTGCAGA
SNP115 comp402778_c0_seq1 ACGTTGGATGTCCCCGTTAAGCCATTCATC ACGTTGGATGAACCATGCGACAGTGAAGAC CACGAACAGGCTTCTCTCC
94
SNP117 comp396219_c0_seq1 ACGTTGGATGATGTACACTCCTGTCTACCG ACGTTGGATGGCAGTACCCTGCATTGATAG GATAGGTTTTTATTACTGCAAAATT
SNP119 comp399509_c0_seq1 ACGTTGGATGCTCAGATCATCGAAGAGTGG ACGTTGGATGGAAAGAGTACACAGCTGTCC TGTTGTGAAAAAGGGCA
SNP120 comp399252_c0_seq1 ACGTTGGATGAGAAGCGAGAGCAAGCGATG ACGTTGGATGAAGTTGTAGGGTGAGAGGAC GATGGAGGAGCAAGGCGG
SNP121 comp399252_c0_seq1 ACGTTGGATGCTACTTCGTCGGGTCCTGC ACGTTGGATGTCGATGCCGTTGGAGGTGAG CAGTAGTTCTCGTTCCCTTT
SNP123 comp402013_c0_seq1 ACGTTGGATGAACGCCTCCTTGAACTTCTC ACGTTGGATGACTGCGTGAAGTACTGGAAG CCTTGAACTTCTCCACGGCG
SNP124 comp400737_c0_seq1 ACGTTGGATGGTCCAAGAGCAACTCTCAAG ACGTTGGATGTCTGATTCTGAGGCCTTCTG CTGAGGCCTTCTGAAGAAGA
SNP125 comp400737_c0_seq1 ACGTTGGATGGTGAAGGTAGGCACCAAAC ACGTTGGATGTCGGTGGTGGACAACAATAC CATTGCTGTGATCCGTAAATTC
SNP126 comp400839_c0_seq1 ACGTTGGATGCCAAGTCAACAGGCAACAAC ACGTTGGATGAATGCTCAGAAGGCTGTTGC CTGTTGCCCACTGAACGCTTCCT
SNP127 comp400839_c0_seq1 ACGTTGGATGATGTTGTCCGGAAGGATCAG ACGTTGGATGTGCTGAGGAAGAAGTATGCG GAAGTATGCGCACAAAGA
SNP128 comp401467_c0_seq1 ACGTTGGATGAGTCAGGTGTGGGTTTTGGC ACGTTGGATGGCAAAGTTATCATGTACCAC GCCGACCTGATCAACCA
SNP129 comp401467_c0_seq1 ACGTTGGATGGAGCTTTGTTTAATTTGGGC ACGTTGGATGAGACCAGCAAGAACAAAGTC AACGAAAAAAGGTTTCCGCA
SNP130 comp401757_c0_seq1 ACGTTGGATGACAGCAGGACCCAACATTTC ACGTTGGATGCAGGGAGTTTTCCATGTTGC ACATTTCTCGCTCTGGATC
SNP131 comp401757_c0_seq1 ACGTTGGATGCTCTCCTTGTTCATGAAGGG ACGTTGGATGTGCGCACCTCATTTCATCAG AGTAAGTCCAGCAGGTC
SNP132 comp401757_c0_seq1 ACGTTGGATGGGAGTGGCAACATGGAAAAC ACGTTGGATGAGCTTTTCAAGGCCGATCTC CATGGCAGCTGCCATCGCGGG
SNP135 comp403803_c0_seq1 ACGTTGGATGCAAAGGTGTACCAATATCTC ACGTTGGATGCGGAGACCGATGTTAACGAG AATATCTCTAGTACTTGCCAGCA
SNP136 comp403803_c0_seq1 ACGTTGGATGGCTCGATGGTGCCGGTGAA ACGTTGGATGCATCACGCTCGTGTTCACC CTCTCCGTGCAGGGCCCGAT
SNP138 comp409769_c0_seq1 ACGTTGGATGACCCACAGAAGCAGGAAGG ACGTTGGATGCCAGCTCGAACATGTCCGC CACGTGCAGGCCCACGTA
SNP139 comp409769_c0_seq1 ACGTTGGATGACGGTCAGGATGCACTGGA ACGTTGGATGTTGGTGAGGCATCCCATGAA TGGTGAGGCATCCCATGAACCCGAT
SNP140 comp410320_c0_seq1 ACGTTGGATGTCACCATCTTCGAGAAGGTC ACGTTGGATGGCGGGTAACCCTTGCCTTT AAGGTCAAATCCATGCC
SNP141 comp410320_c0_seq1 ACGTTGGATGAAAGGCAAGGGTTACCCGC ACGTTGGATGGGACTTGGATTTGAACTGC GCGTCGTCAAGTTCGACCCGAT
SNP142 comp410320_c0_seq1 ACGTTGGATGTACTTCGCCGAGTCCCTGAT ACGTTGGATGATGGCAGCATGTATCGCTAC CGCTACAACTTTGTCGTCG
SNP143 comp410947_c0_seq1 ACGTTGGATGTCGCCATGGGCGTCGGTGAG ACGTTGGATGCCGTTCATCATGCTGTTCAT CACGCGCTCGCGGGCCGACTC
SNP145 comp410947_c0_seq1 ACGTTGGATGTGATGAAGCCGAAGCAGGAC ACGTTGGATGAGCGGATGACTTCGATCTGG CTGCGGCGAGGTGCGGAG
SNP146 comp411536_c1_seq1 ACGTTGGATGCGAGCGCCAGCGTGTCGTC ACGTTGGATGAGGAGGGGTGGAAGTACAG TACAGCGTCGGCTTCGT
SNP147 comp411536_c1_seq1 ACGTTGGATGGAGGTGGGAGAGCACGGAC ACGTTGGATGTCCTCGACACCTACCGGAT TCGGAGTTGTAGCCGGT
SNP148 comp410983_c0_seq1 ACGTTGGATGACAACTGCTTTAGGCCAACG ACGTTGGATGGGTTGGAAGGAGAAGAATAC AAGGAGAAGAATACTTGGCCATT
SNP149 comp410983_c0_seq1 ACGTTGGATGATCTCCCCCTTATCCTTTGC ACGTTGGATGGTCGGCTTGGTCTGTGAAAA GTGGTCTGTTCAGACGA
95
SNP150 comp410983_c0_seq1 ACGTTGGATGTAGTCCACCGTTTCCAACTC ACGTTGGATGTTGCTGAAGACCTGGCTGAG ACCTGGCTGAGGGGTGCGA
SNP151 comp410620_c1_seq1 ACGTTGGATGTCTAGCATTGGGTGTCAGAG ACGTTGGATGTCCAGCCTGCTCTCTTTCAC CTGCTCTCTTTCACCCAGCTGT
SNP152 comp410620_c1_seq1 ACGTTGGATGAGGTAGAGTGGCGGATTAGC ACGTTGGATGAATGCTGGGAGTACAATGGG ACGAATGCGGCTTTGAC
SNP153 comp409569_c0_seq1 ACGTTGGATGATGCTTCAAGGGTTCTGCTC ACGTTGGATGTTCAACTGAACCAAGAGCCC GCTCCAATTAACCTTTCTGA
SNP154 comp409569_c0_seq1 ACGTTGGATGAAGTACTGGCAGGGATTGAC ACGTTGGATGCAGCAAAATCACCCTCATCG GTCGCCTTTGATGTAAC
SNP155 comp409569_c0_seq1 ACGTTGGATGCTTCTCAATCTGGGTGATCC ACGTTGGATGTTGGTGTGCGGTTCTGTTTC TTCTGTTTCCCCATGAGACCCTT
SNP156 comp408754_c0_seq1 ACGTTGGATGTCACGTTCCGTGGCCCCTC ACGTTGGATGGTCAGCTCCGATGATCACC GACGAGCGAGTCGAGGTG
SNP157 comp408754_c0_seq1 ACGTTGGATGTTCGAGCTCGTGTCGGCGT ACGTTGGATGTTGAGCAAGTGGAACGTGAG GCGTCGCAGACGATCCT
SNP158 comp408754_c0_seq1 ACGTTGGATGGAGCGAAGGTGATCTCTCTG ACGTTGGATGGCAAACAATGGCGAACTGTC GGCGAACTGTCGGATCATAGG
SNP159 comp406804_c0_seq1 ACGTTGGATGCTGTTGTTGTGCCTGTACTC ACGTTGGATGGGGAGATGACGGTTGATCAG CGGTTGATCAGGCCGTG
SNP160 comp406804_c0_seq1 ACGTTGGATGGACCCGACGTACCTGTAGTA ACGTTGGATGTGCAAAGCGGAGAAGGGCGT CGACGTACCTGTAGTACGCGTG
SNP161 comp405771_c1_seq1 ACGTTGGATGGTTCCACTCCTTGAGGCAC ACGTTGGATGAGGAGCTGAACAAGGTGCTA AGGGCAAGCATATAGAC
SNP162 comp405771_c1_seq1 ACGTTGGATGTCTTCATGAGCGGGTAGTTG ACGTTGGATGAAGGACCTGCTCCAGGAGAT GTGTTCGCCTACGCCGACGACCC
SNP163 comp405771_c1_seq1 ACGTTGGATGACAACGCGATCAGGAACGTC ACGTTGGATGTGGGCCTCATCTCCTCCAG TCAGGAACGTCGATGTCAT
96
Tabela II: vias e genes dos 147 snps genotipados
SNP Contig Via Gene putativo
SNP13 comp399176_c0_seq1 C4 Alanine-glyoxylate aminotransferase 2 homolog 1
SNP14 comp399176_c0_seq1 C4 Alanine-glyoxylate aminotransferase 2 homolog 1
SNP90 comp408696_c0_seq1 C4 Alanine-glyoxylate aminotransferase 2 homolog 1
SNP91 comp408696_c0_seq1 C4 Alanine-glyoxylate aminotransferase 2 homolog 1
SNP159 comp406804_c0_seq1 C4 Bifunctional monodehydroascorbate reductase/carbonic anhydrase
SNP160 comp406804_c0_seq1 C4 Bifunctional monodehydroascorbate reductase/carbonic anhydrase
SNP9 comp396609_c0_seq1 C4 Carbonic anhydrase
SNP30 comp403411_c0_seq1 C4 Cyclic dof factor 2
SNP31 comp403411_c0_seq1 C4 Cyclic dof factor 2
SNP32 comp403411_c0_seq1 C4 Cyclic dof factor 2
SNP128 comp401467_c0_seq1 C4 Dof zinc finger protein MNB1A
SNP129 comp401467_c0_seq1 C4 Dof zinc finger protein MNB1A
SNP126 comp400839_c0_seq1 C4 Gamma carbonic anhydrase 2
SNP127 comp400839_c0_seq1 C4 Gamma carbonic anhydrase 2
SNP10 comp397475_c0_seq1 C4 Malate dehydrogenase
SNP113 comp402778_c0_seq1 C4 Malate dehydrogenase
SNP114 comp402778_c0_seq1 C4 Malate dehydrogenase
SNP115 comp402778_c0_seq1 C4 Malate dehydrogenase
SNP2 comp390273_c0_seq1 C4 Malate dehydrogenase
SNP3 comp390273_c0_seq1 C4 Malate dehydrogenase
SNP1 comp372439_c0_seq1 C4 NAD-dependent malic enzyme 59 kDa isoform
SNP148 comp410983_c0_seq1 C4 NAD-dependent malic enzyme 59 kDa isoform
SNP149 comp410983_c0_seq1 C4 NAD-dependent malic enzyme 59 kDa isoform
SNP150 comp410983_c0_seq1 C4 NAD-dependent malic enzyme 59 kDa isoform
SNP117 comp396219_c0_seq1 C4 NADP-dependent malic enzyme chloroplastic
SNP65 comp409416_c0_seq1 C4 NADP-dependent malic enzyme chloroplastic
SNP66 comp409416_c0_seq1 C4 NADP-dependent malic enzyme chloroplastic
SNP67 comp409416_c0_seq1 C4 NADP-dependent malic enzyme chloroplastic
SNP76 comp410205_c1_seq1 C4 Phosphoenolpyruvate carboxykinase
SNP80 comp410205_c0_seq1 C4 Phosphoenolpyruvate carboxykinase
SNP81 comp410205_c0_seq1 C4 Phosphoenolpyruvate carboxykinase
SNP23 comp402699_c4_seq1 C4 Phosphoenolpyruvate carboxylase
SNP24 comp402699_c4_seq1 C4 Phosphoenolpyruvate carboxylase
SNP74 comp411001_c0_seq1 C4 Phosphoenolpyruvate carboxylase
SNP75 comp411001_c0_seq1 C4 Phosphoenolpyruvate carboxylase
SNP95 comp408070_c2_seq1 C4 Phosphoenolpyruvate carboxylase
SNP96 comp408070_c2_seq1 C4 Phosphoenolpyruvate carboxylase
SNP28 comp403104_c0_seq1 C4 Cyclic dof factor 3
SNP29 comp403104_c0_seq1 C4 Cyclic dof factor 3
SNP44 comp404734_c0_seq1 C4 Ribulose bisphosphate carboxylase/oxygenase activase
97
SNP45 comp404734_c0_seq1 C4 Ribulose bisphosphate carboxylase/oxygenase activase
SNP46 comp404734_c0_seq1 C4 Ribulose bisphosphate carboxylase/oxygenase activase
SNP100 comp407348_c0_seq1 C4 RuBisCO large subunit-binding protein subunit alpha
SNP101 comp407348_c0_seq1 C4 RuBisCO large subunit-binding protein subunit alpha
SNP26 comp402896_c0_seq1 C4 RuBisCO large subunit-binding protein subunit alpha
SNP99 comp407348_c0_seq1 C4 RuBisCO large subunit-binding protein subunit alpha
SNP102 comp407273_c0_seq1 Lignocelulose Cinnamyl alcohol dehydrogenase
SNP120 comp399252_c0_seq1 Lignocelulose Cinnamyl alcohol dehydrogenase
SNP121 comp399252_c0_seq1 Lignocelulose Cinnamyl alcohol dehydrogenase
SNP94 comp408091_c0_seq1 Lignocelulose Caffeic acid 3-O-methyltransferase
SNP17 comp400553_c0_seq1 Lignocelulose Caffeoyl-CoA O-methyltransferase 1
SNP153 comp409569_c0_seq1 Lignocelulose Cellulose synthase A
SNP154 comp409569_c0_seq1 Lignocelulose Cellulose synthase A
SNP155 comp409569_c0_seq1 Lignocelulose Cellulose synthase A
SNP48 comp404985_c0_seq1 Lignocelulose Cellulose synthase A
SNP49 comp404985_c0_seq1 Lignocelulose Cellulose synthase A
SNP54 comp405932_c0_seq1 Lignocelulose Cellulose synthase-like protein E2
SNP55 comp405932_c0_seq1 Lignocelulose Cellulose synthase-like protein E2
SNP56 comp405932_c0_seq1 Lignocelulose Cellulose synthase-like protein E2
SNP107 comp404729_c0_seq1 Lignocelulose Cinnamoyl-CoA reductase 1
SNP108 comp404729_c0_seq1 Lignocelulose Cinnamoyl-CoA reductase 1
SNP130 comp401757_c0_seq1 Lignocelulose Cinnamoyl-CoA reductase 1
SNP131 comp401757_c0_seq1 Lignocelulose Cinnamoyl-CoA reductase 1
SNP132 comp401757_c0_seq1 Lignocelulose Cinnamoyl-CoA reductase 1
SNP135 comp403803_c0_seq1 Lignocelulose Dirigent protein 11
SNP136 comp403803_c0_seq1 Lignocelulose Dirigent protein 11
SNP52 comp405374_c1_seq1 Lignocelulose Sucrose synthase 4
SNP53 comp405374_c1_seq1 Lignocelulose Sucrose synthase 4
SNP84 comp409137_c0_seq1 Lignocelulose Sucrose synthase 4
SNP50 comp405097_c0_seq1 Lignocelulose Shikimate O-hydroxycinnamoyltransferase
SNP51 comp405097_c0_seq1 Lignocelulose Shikimate O-hydroxycinnamoyltransferase
SNP16 comp400352_c0_seq1 Lignocelulose Dirigent protein 19
SNP97 comp407698_c0_seq1 Lignocelulose Laccase-10
SNP98 comp407698_c0_seq1 Lignocelulose Laccase-10
SNP143 comp410947_c0_seq1 Lignocelulose Phenylalanine ammonia-lyase
SNP145 comp410947_c0_seq1 Lignocelulose Phenylalanine ammonia-lyase
SNP161 comp405771_c1_seq1 Lignocelulose Phenylalanine ammonia-lyase
SNP162 comp405771_c1_seq1 Lignocelulose Phenylalanine ammonia-lyase
SNP163 comp405771_c1_seq1 Lignocelulose Phenylalanine ammonia-lyase
SNP86 comp409281_c1_seq1 Lignocelulose Limonoid UDP-glucosyltransferase
SNP72 comp411092_c0_seq1 Nitrogênio Asparagine synthetase domain-containing protein 1
SNP73 comp411092_c0_seq1 Nitrogênio Asparagine synthetase domain-containing protein 1
SNP85 comp408903_c0_seq1 Nitrogênio Asparagine synthetase domain-containing protein 1
98
SNP138 comp409769_c0_seq1 Nitrogênio Ferredoxin-nitrite reductase
SNP139 comp409769_c0_seq1 Nitrogênio Ferredoxin-nitrite reductase
SNP103 comp406670_c0_seq1 Nitrogênio Glucose-6-phosphate isomerase 1
SNP124 comp400737_c0_seq1 Nitrogênio Glucose-6-phosphate isomerase 1
SNP125 comp400737_c0_seq1 Nitrogênio Glucose-6-phosphate isomerase 1
SNP78 comp410899_c0_seq1 Nitrogênio Glucose-6-phosphate isomerase 1
SNP82 comp409444_c1_seq1 Nitrogênio Glucose-6-phosphate isomerase 1
SNP83 comp409444_c1_seq1 Nitrogênio Glucose-6-phosphate isomerase 1
SNP119 comp399509_c0_seq1 Nitrogênio 5'-adenylylsulfate reductase
SNP15 comp399877_c0_seq1 Nitrogênio 5'-adenylylsulfate reductase
SNP41 comp404787_c0_seq1 Nitrogênio 5'-adenylylsulfate reductase
SNP42 comp404787_c0_seq1 Nitrogênio 5'-adenylylsulfate reductase
SNP43 comp404787_c0_seq1 Nitrogênio 5'-adenylylsulfate reductase
SNP87 comp408198_c0_seq1 Nitrogênio Glutamate synthase 1
SNP88 comp408198_c0_seq1 Nitrogênio Glutamate synthase 1
SNP89 comp408198_c0_seq1 Nitrogênio Glutamate synthase 1
SNP146 comp411536_c1_seq1 Nitrogênio Nitrate reductase
SNP147 comp411536_c1_seq1 Nitrogênio Nitrate reductase
SNP68 comp410518_c1_seq1 Nitrogênio Nitrate transporter 1.2
SNP4 comp393980_c0_seq1 Nitrogênio Nitrate transporter At1g22540
SNP64 comp410102_c0_seq1 Resistência Putative disease resistance RPP13-like protein 1
SNP69 comp410882_c0_seq1 Resistência Putative disease resistance RPP13-like protein 1
SNP11 comp398252_c0_seq1 Resistência Endochitinase A
SNP12 comp398252_c0_seq1 Resistência Endochitinase A
SNP21 comp401816_c0_seq1 Resistência Chitinase 2
SNP22 comp401816_c0_seq1 Resistência Chitinase 2
SNP7 comp395427_c0_seq1 Resistência DIMBOA UDP-glucosyltransferase
SNP8 comp395427_c0_seq1 Resistência DIMBOA UDP-glucosyltransferase
SNP151 comp410620_c1_seq1 Resistência Acyclic sesquiterpene synthase
SNP152 comp410620_c1_seq1 Resistência Acyclic sesquiterpene synthase
SNP156 comp408754_c0_seq1 Resistência Chalcone synthase 3
SNP157 comp408754_c0_seq1 Resistência Chalcone synthase 3
SNP158 comp408754_c0_seq1 Resistência Chalcone synthase 3
SNP123 comp402013_c0_seq1 Resistência Chalcone-flavonone isomerase
SNP62 comp409117_c0_seq1 Resistência Chalcone-flavonone isomerase
SNP63 comp409117_c0_seq1 Resistência Chalcone-flavonone isomerase
SNP27 comp402968_c0_seq1 Resistência Isoflavone reductase homolog IRL
SNP25 comp402881_c1_seq1 Resistência Mitogen-activated protein kinase 4
SNP105 comp406375_c0_seq1 Resistência Omega-6 fatty acid desaturase
SNP106 comp406375_c0_seq1 Resistência Omega-6 fatty acid desaturase
SNP18 comp401774_c0_seq1 Resistência Omega-6 fatty acid desaturase
SNP19 comp401774_c0_seq1 Resistência Omega-6 fatty acid desaturase
SNP20 comp401774_c0_seq1 Resistência Omega-6 fatty acid desaturase
99
SNP5 comp394414_c0_seq1 Resistência Pathogenesis-related protein 1
SNP60 comp407770_c0_seq1 Resistência Pathogenesis-related protein 1
SNP61 comp407770_c0_seq1 Resistência Pathogenesis-related protein 1
SNP111 comp402928_c0_seq1 Resistência 4-coumarate-CoA ligase 3
SNP112 comp402928_c0_seq1 Resistência 4-coumarate-CoA ligase 3
SNP36 comp404064_c0_seq1 Resistência 4-coumarate-CoA ligase 3
SNP37 comp404064_c0_seq1 Resistência 4-coumarate-CoA ligase 3
SNP38 comp404064_c0_seq1 Resistência 4-coumarate-CoA ligase 3
SNP57 comp406822_c0_seq1 Resistência 4-coumarate-CoA ligase 3
SNP58 comp406822_c0_seq1 Resistência 4-coumarate-CoA ligase 3
SNP59 comp406822_c0_seq1 Resistência 4-coumarate-CoA ligase 3
SNP140 comp410320_c0_seq1 Resistência 1-deoxy-D-xylulose-5-phosphate synthase 2
SNP141 comp410320_c0_seq1 Resistência 1-deoxy-D-xylulose-5-phosphate synthase 2
SNP142 comp410320_c0_seq1 Resistência 1-deoxy-D-xylulose-5-phosphate synthase 2
SNP109 comp404739_c1_seq1 Resistência Putative disease resistance protein RGA4
SNP110 comp404739_c1_seq1 Resistência Putative disease resistance protein RGA4
SNP33 comp403445_c0_seq1 Resistência Putative disease resistance protein RGA4
SNP34 comp403445_c0_seq1 Resistência Putative disease resistance protein RGA4
SNP35 comp403445_c0_seq1 Resistência Putative disease resistance protein RGA4
SNP70 comp410926_c0_seq1 Resistência Putative disease resistance protein RGA4
SNP71 comp410926_c0_seq1 Resistência Putative disease resistance protein RGA4
Tabela III. SNPs que aderiram a algum dos mapas produzidos, sua ploidia e categorização
inferidas pelo SuperMASSA e análise de número de cópias em espécies relacionadas.
SNP ID
Contig N° de cópias arroz
N° de cópias sorgo
N° de cópias P. virgatum
Ploidia estimada
Categoria
camila19 comp401774_c0_seq1 1 3 2 4 A
camila24 comp402699_c4_seq1 4 5 4 6 A
camila28 comp403104_c0_seq1 1 2 1 4 A
camila31 comp403411_c0_seq1 2 2 2 8 B
camila34 comp403445_c0_seq1 1 1 1 6 A
camila37 comp404064_c0_seq1 2 4 5 4 A
camila41 comp404787_c0_seq1 1 1 1 4 A
camila43 comp404787_c0_seq1 1 1 1 6 A
camila46 comp404734_c0_seq1 - - 2 4 A
camila48 comp404985_c0_seq1 9 7 6 6 A
camila49 comp404985_c0_seq1 9 7 6 4 A
camila52 comp405374_c1_seq1 3 2 2 4 A
camila54 comp405932_c0_seq1 3 2 1 4 A
camila56 comp405932_c0_seq1 3 2 1 4 A
camila59 comp406822_c0_seq1 2 1 1 4 A
camila60 comp407770_c0_seq1 1 1 1 6 A
100
camila64 comp410102_c0_seq1 1 1 - 4 A
camila66 comp409416_c0_seq1 1 1 2 6 A
camila67 comp409416_c0_seq1 1 1 2 4 A
camila73 comp411092_c0_seq1 1 1 1 4 A
camila76 comp410205_c1_seq1 1 1 1 6 A
camila83 comp409444_c1_seq1 3 2 4 4 A
camila86 comp409281_c1_seq1 2 4 4 6 A
camila95 comp408070_c2_seq1 4 4 3 4 A
camila96 comp408070_c2_seq1 4 4 3 4 A
camila102 comp407273_c0_seq1 - 2 - 4 A
camila103 comp406670_c0_seq1 2 2 4 4 A
camila107 comp404729_c0_seq1 5 8 5 6 B
camila108 comp404729_c0_seq1 5 8 5 4 A
camila109 comp404739_c1_seq1 - 1 2 4 A
camila110 comp404739_c1_seq1 - 1 2 4 B
camila119 comp399509_c0_seq1 1 1 1 4 A
camila125 comp400737_c0_seq1 2 3 3 4 A
camila130 comp401757_c0_seq1 1 1 - 4 B
camila131 comp401757_c0_seq1 1 1 - 6 A
camila139 comp409769_c0_seq1 2 1 1 6 A
camila141 comp410320_c0_seq1 2 1 1 4 A
camila142 comp410320_c0_seq1 2 1 1 6 A
camila143 comp410947_c0_seq1 5 4 3 4 A
camila146 comp411536_c1_seq1 2 2 3 4 A
camila150 comp410983_c0_seq1 1 1 3 4 A
camila156 comp408754_c0_seq1 8 5 5 6 B
camila159 comp406804_c0_seq1 4 3 4 4 A
camila160 comp406804_c0_seq1 4 3 4 4 A
101
Documento I. Declaração de que a dissertação não infringe os dispositivos da lei nº
9610/98, nem o direito autoral de qualquer editora.
102
Documento II. Declaração de que o trabalho não versou sobre pesquisa envolvendo seres
humanos, animais, patrimônio genético ou temas afetos a biossegurança.