Post on 01-Dec-2018
Samuel Samuel MazzinghyMazzinghy AlvarengaAlvarenga
FepagroFepagro emem focofoco
HistóricoHistórico recenterecente dada AgropecuáriaAgropecuária
�� Era científica: a partir de ~ 1.700Era científica: a partir de ~ 1.700
• Rotação de culturas e métodos de cultivo
intensivo
• Drenagem
• Uso do calcário no solo
• Utilização de arado, máquinas semeadoras
e colheitadeiras
• Máquinas a vapor substituindo a força animal
• Desenvolvimento de pesticidas e fertilizantes
• Aperfeiçoamento de máquinas agrícolas
HistóricoHistórico recenterecente dada AgropecuáriaAgropecuária
• Melhoramento vegetal e da pecuária
• Tecnologia do DNA
• Cultura de tecidos
• Desenvolvimento de vacinas animais
�� Era científica: a partir de ~ 1.700Era científica: a partir de ~ 1.700
NovasNovas tecnologiastecnologias
�� A era A era genômicagenômica: novas possibilidades para a agropecuária: novas possibilidades para a agropecuária
Estrutura do DNAEstrutura do DNA
Necessidade de Necessidade de
mais informaçõesmais informações
Sequenciamento Sequenciamento
de DNAde DNA
Dados Dados genômicosgenômicos em larga escalaem larga escala
GENÔMICA GENÔMICA FUNCIONALFUNCIONAL
GENÔMICA GENÔMICA ESTRUTURALESTRUTURAL
GENÔMICA GENÔMICA COMPARATIVACOMPARATIVA
GENÔMICAGENÔMICA
AA ciênciaciência genômicagenômica
�� As áreas da As áreas da genômicagenômica
Genômica: Estudo de todo conteúdo genético de um organismo
DNA
Proteínas
Fenótipo
Resistente Suscetível
�� GenômicaGenômica funcionalfuncional
AA ciênciaciência genômicagenômica
• Funções dos genes
• Padrão de expressão dos genes
- Condições bióticas
- Condições abióticas
- Estágios de desenvolvimento
�� GenômicaGenômica estruturalestrutural
AA ciênciaciência genômicagenômica
• Organização e estrutura dos genes
• Mapeamento genético
• Mapeamento físico
�� GenômicaGenômica comparativacomparativa
AA ciênciaciência genômicagenômica
• Micro, macrossintenia e colinearidade
• Regiões duplicadas
• Evolução
1995: Primeiro genoma completo 1995: Primeiro genoma completo
(organismo vivo)(organismo vivo)
Haemophilus influenzae, Haemophilus influenzae, 1830 Kb 1830 Kb
AA eraera genômicagenômica
Bactéria causadora de doenças como meningite e pneumonia
19971997: : Saccharomyces cerevisiae, Saccharomyces cerevisiae, 12069 Kb. 12069 Kb. NatureNature 387,5387,5--105105 19971997--
0505--29 29
19971997:: EscherichiaEscherichia colicoli, 4639 Kb. , 4639 Kb. ScienceScience 277,1453277,1453--14741474 19971997--0909--05 05
19981998:: Caenorhabditis Caenorhabditis eleganselegans, , 100272 Kb. 100272 Kb. ScienceScience 282,2012282,2012--20182018
19981998--1212--1111
20002000:: DrosophilaDrosophila melanogastermelanogaster, , 137000 Kb. 137000 Kb. ScienceScience 287,2185287,2185--9595 20002000--
0303--2424
20002000:: Arabidopsis Arabidopsis thalianathaliana, , 115428 Kb. 115428 Kb. NatureNature 408,796408,796--815815 20002000--1212--1414
20012001:: Homo sapiens, Homo sapiens, 3200000 Kb. 3200000 Kb. NatureNature 409,860409,860--921921 20012001--0202--1515
AA eraera genômicagenômica
AA eraera genômicagenômica
�� Tecnologias de sequenciamento em massaTecnologias de sequenciamento em massa
Plataforma Metodologia de
Sequenciamento
Geração
(tecnologia)
Throughput por
corrida
Tamanho dos reads
(pb)
3130xL-3730xL - ABI/Life Technologies Sanger, CE Primeira 1-2 Mb 900-1200
Genome Sequencer FLX System -
Roche/454
Pirosequenciamento Segunda 500 Mb 250-500
800 (?)
HiSeq 2000 Illumina/Solexa Síntese Segunda 3 Gb 150
5500xl SOLiD - ABI/SOLiD Ligação Segunda 4 Gb 25-35
HeliScope - Helicos SMS Terceira ~ 25 Gb 25-30
PacBio RS - Pacific Biosciences SMRT Terceira 40 Mb ~ 1000
Pesonal Genome Machine (PGM) - Ion
Torrent/Life Technologies
Síntese Terceira 10 Mb 100-200
In house lab built instrumentation -
Complete Genomics
cPAL Terceira Promessa de 80
genomas por dia
10
gridION - Oxford Nanopore Nanoporos Quarta Não quantificado Não quantificado
�� GenBankGenBank emem 15 de 15 de AgostoAgosto de 2012 (de 2012 (últimaúltima versãoversão))
143 bilhões de bases
156,4 milhõesde sequências
AA eraera genômicagenômica
�� NúmerosNúmeros do do GenBankGenBank
1.738.524.500 bases (2.293.823 sequências) depositadas entre junho
e agosto/2012
AA eraera genômicagenômica
1,00E+00
1,00E+01
1,00E+02
1,00E+03
1,00E+04
1,00E+05
1,00E+06
1,00E+07
1,00E+08
1,00E+09
1,00E+10
1,00E+11
1,00E+12
82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 00 01 02 03 04 05 06 07 08 09 10 11 12
N.
de
se
qu
ên
cia
s e
ba
ses
de
po
sita
da
s
Ano
Depósito de sequências no GenBank
Sequências Pares de Base Exponencial (Sequências) Exponencial (Pares de Base)
�� CrescimentoCrescimento dada quantidadequantidade de dados de dados genômicosgenômicos
AA eraera genômicagenômica
�� Número de genomas publicados atualmenteNúmero de genomas publicados atualmente
Projetos completos: 3.705
Projetos incompletos: 14.551
�� Dados Dados atualizadosatualizados emem 31 de 31 de agostoagosto de 2012 de 2012
AA eraera genômicagenômica
A era A era genômicagenômica trouxe um tipo de dado e uma quantidade de trouxe um tipo de dado e uma quantidade de informação que só é possível ser analisada com o auxílio de informação que só é possível ser analisada com o auxílio de
ferramentas deferramentas de bioinformáticabioinformática
AA BioinformáticaBioinformática nana GenômicaGenômica
AA BioinformáticaBioinformática nana GenômicaGenômica
• Recursos computacionais para realizar análises de dados biológicos
�� Bioinformática: Bioinformática:
QuímicaQuímica
FísicaFísica
GenéticaGenética
EstatísticaEstatística
BiologiaBiologia
InformáticaInformática
BioquímicaBioquímica
Biologia Biologia MolecularMolecular
MatemáticaMatemática
EngenhariaEngenharia
• Envolve o conhecimento de várias áreas
AA BioinformáticaBioinformática nana GenômicaGenômica
�� É preciso MONTAR o genomaÉ preciso MONTAR o genoma
AA BioinformáticaBioinformática nana GenômicaGenômica
�� É preciso ANOTAR o genomaÉ preciso ANOTAR o genoma
“Sopa de letras”: sequências “Sopa de letras”: sequências obtidas pelos projetosobtidas pelos projetos
Bancos de dados: acervo de Bancos de dados: acervo de sequências conhecidassequências conhecidas
SequênciaSequência vinculada a um vinculada a um significado biológicosignificado biológico
�� É preciso ANALISAR o genomaÉ preciso ANALISAR o genoma
• Mapeamento
• Evolução
• Sequenciamento
• Análise Estatística
• Redes Gênicas
• Estrutura de DNA, RNA
AA BioinformáticaBioinformática nana GenômicaGenômica
• Modelagem Molecular• Comparação de Estruturas• Expressão Gênica• Redes Metabólicas• Bancos de Dados• Filogenia• Análise de sequências• Etc...
• Informação evolutiva: genes homólogos, frequências dos alelos, ...
• Informação genômica: localização no cromossomo, introns, regiões reguladoras, ...
• Informação estrutural: estruturas da proteína correspondente, tipos de folds, domínios estruturais, ...
�� Informações relevantesInformações relevantes
• Informação de expressão: expressão específica a um dado tecido, fenótipos, doenças, ...
• Informação funcional: função molecular/enzimática, papel em diferentes rotas, papel em doenças, ...
• Etc...
AA BioinformáticaBioinformática nana GenômicaGenômica
� Clonagem de genes específicos por mapeamento (genômica estrutural)
BioinformáticaBioinformática ee AgropecuáriaAgropecuária GenômicaGenômica
� Genômica comparativa entre organismos modelos e espécies de interesse agropecuário
� O melhoramento de culturas importantes pode se beneficiar de informações obtidas a partir de espécies modelo
� Ampliação da base de conhecimento sobre o processo evolutivo da espécie (genômica comparativa)
� Alimentação de bancos de dados genômicos para estudos futuros
BioinformáticaBioinformática ee AgropecuáriaAgropecuária GenômicaGenômica
� Desenvolvimento de marcadores moleculares para genes de interesse
� Descoberta/identificação de novos genes de valores agropecuários (genômica funcional)
BioinformáticaBioinformática ee AgropecuáriaAgropecuária GenômicaGenômica
� Genômica funcional da relação parasita-hospedeiro
• Seleção de genes candidatos adequados para manipulação para melhorar a resistência e/ou diminuir a suscetibilidade do hospedeiro
• Predição de ganhos genéticos
• Melhor entendimento sobre a rede biológica hospedeiro-parasita
• Novas abordagens para a promoção da resistência do hospedeiro a parasitas agronômicos
• Ampliação do conhecimento a respeito do modo de infecção do parasita
• Desenvolvimento de novas formas de controle de parasitas (pesticidas e vacinas mais específicos, sem “efeitos colaterais” e mais eficientes)
BioinformáticaBioinformática ee AgropecuáriaAgropecuária GenômicaGenômica
� Microorganismos
• Identificação de genes envolvidos com promoção do crescimento vegetal
• Desenvolvimento de novos compostos para a agricultura
• Abordagem METAGENÔMICA
Análise em larga escala de genomas de microorganismosno seu habitat natural (solos, rios, ar), uma vez que 99%dos microorganismos são de difícil cultivo (ou impossíveisde serem cultivados) e praticamente desconhecidos
• Expansão da compreensão sobre os processos metabólicos presentes no ambiente
�� Sumarizando... Agropecuária + Sumarizando... Agropecuária + GenômicaGenômica + + BioinfoBioinfo::
• Informação em larga escala (um gene raramente trabalha sozinho...)
• Análise detalhada do genoma (regiões conservadas, mutações, inferências
evolutivas, etc...)
• Sequenciamento de genes/genoma (rapidez, acessibilidade crescente e geração de
dados em grande quantidade)
• Atribuição de função aos genes (bancos de dados cada vez maiores e mais
informativos)
BioinformáticaBioinformática ee AgropecuáriaAgropecuária GenômicaGenômica
• Transferência/aproveitamento de informações por comparação (um
organismo se beneficia de informações atribuídas a outros organismos relacionados e vice-versa)
• Ganho de tempo em pesquisas/testes laboratoriais e em campo (aceleração na obtenção de resultados)
PerspectivasPerspectivas
Genoma
Proteoma
Metaboloma
Interactoma
ReactomaOutras “ômicas”