!"#$%#!&'
!'
Potencial da bioinformática nas análises genômicas
Guilherme Targino Valente FCA-UNESP
As 5 questões
O que seria bioinformática?
Quem são os bioinformatas?
Quais são as habilidades básicas?
O que faz um bioinformática?
Qual o objetivo da bioinformática?
!"#$%#!&'
('
O que seria bioinformática? - Área que estuda aspectos e fenômenos biológicos com o uso
de ferramentas computacionais. - Ciência de estocagem, extração, organização, análises e
interpretação de dados utilizando informação biológicas.
- Biólogos e outros profissionais de áreas afins; - Cientistas/engenheiros da computação; - Matemáticos; - Físicos;
Quem são os bioinformatas?
Quais são as habilidades básicas? - Biologia; - Princípios de programação;
Duas vertentes básicas
Desenvolvimento Aplicação
Desenvolvimento Aplicação
!"#$%#!&'
*'
15/07/2014 80,370,243 proteínas
DNA – Ácido desoxirribonucléico
Avery, MacLeod e McCarty (1944): DNA, material genético
~1930: avanços no conhecimento da estrutura do ácido nucléico A nucleina se tornou o ácido nucléico desoxirribose e, posteriormente, ácido desoxirribonucléico.
Watson e Crick (1953): Estrutura do DNA
Os ácidos nucléicos e sua história
1989 - Primeiro gene sequenciado
1995 - Primeiro genoma sequenciado (Haemophilus influenza)
2001 - Primeiro rascunho do genoma humano
2005 - NGS
2013 – 1 genoma por ~ R$ 2000,00
!"#$%#!&'
%'
O que faz um bioinformática?
- Reconstrói as informações; - Compila dados; - Constrói ferramentas e novos métodos de análises; - Organiza as informações; - Extrair padrões e informações biológicamente úteis; - Modela estruturas e sistemas;
Qual o objetivo da bioinformática?
- Omics - Genoma; - Transcriptoma; - Proteoma; - Metaboloma; - Metagenômica; - smRNAs; - Lipidomicas; - Fluxomica; - Interactomas (biol. sist.);
- Proteínas - Estruturas; - Dinâmicas;
- Banco de dados - Criação; - Manutenção; - Análise;
!"#$%#!&'
"'
- Análise de sequencias
Encontrar padrões e diferenças em: - estudos evolutivos; - estudos biotecnológicos; - estudos clínicos;
A mais antiga atuação da computação sobre a genômica.
Softwares de alinhamento Início
Alinhadores de reads e genomas
- Anotação de genomas
Processo de identificar as funções de cada “peça” de um genoma
1995 – Owen White. Primeiro programa
UMD Hemophilus influenzae
!"#$%#!&'
,'
- Análise de expressão gênica
Identificar níveis de expressão dos RNAs
- Microarray; - ESTs sequencing; - Serial analysis of gene expression (SAGE); - Massively parallel signature sequencing (MPSS); - RNA-Seq
- Análise de expressão protéica
Identificar níveis de expressão das proteínas - Protein microarray (HT); - Espectometria de massa;
!"#$%#!&'
!$'
- Predição de estruturas protéicas
Determinar a estrutura de proteínas recém identificadas: processo vital para entender sua função
- Biologica evolutiva; - Desenvolvimento de fármacos; - Compreensão das funções básicas;
- Determinar estrutura; - Docking; - Mutações in silico; - Dinâmica molecular;
- Genômica comparativa
Identificar homologia entre genomas em termos estruturais e funcionais.
- Como mutações afetam o genoma; - Como os genomas tem evoluído e quais os processos principais da
evolução dos genomas (duplicações, traposição, transferência horizontal; deleção, inserção, ploidia);
- Encontrar marcadores moleculares; - Estudos de rearranjos cromossômicos; - Busca do estabelecimento da relação genótipo-fenótipo
!"#$%#!&'
!!'
- Modelagem de sistemas biológicos
Integração e análises biológicas em divesas escalas e contextos
- Integração de informações; - Origem e funcionamento do sistema; - Modelagem do sistema; - Realização de predições; - Analisar o sistema espaço-temporalmente;
Histórico
Década de 80-90 – Projeto Genoma Humano
Termo cunhado em 1979 por Paulien Hogeweg. “the study of informatic processes in biotic systems”
!"#$%#!&'
!('
Bioinformática no Brasil 14 anos de história.
João Meidanis e João Setúbal UNICAMP - SP
1999 – Genoma Xylella fastidiosa
!"#$%#!&'
!)'
SP/MG - UNICAMP Campinas; - EMBRAPA Campinas; - CNPEM Campinas; - USP São Paulo; - USP Ribeirão; - USP Piracicaba; - IB-UNESP Botucatu; - UNESP Jaboticabal; - Hospital Sírio Libanês; - Hospital do Câncer; - Fio Cruz BH; - UFMG BH; - UFV Viçosa - FCA-UNESP Botucatu
RJ - LNCC Petrópolis; - UFRJ Rio de Janeiro;
SC/RS/PR - UFRGS Porto Alegre; - UFSC Florianópolis; - UFTPR Cornélio Procópio; - UFPR Curitiba
PA/RN - UFPA Belém
Associação Brasileira de Bioinformática e Biologia Computacional
X-meeting
!"#$%#!&'
!&'
http://elements.eaglegenomics.com/
… do início até hoje.
Inúmeros programas e métodos foram e vem sendo desenvolvidos
http://nar.oxfordjournals.org/
A tabela periódica dos programas
http://bioinformatics.oxfordjournals.org/
- Omics - Genoma; - Transcriptoma; - Proteoma; - Metaboloma; - Metagenômica; - smRNAs; - Lipidomicas; - Fluxomica; - Interactomas (biol. sist.);
- Proteínas - Estruturas; - Dinâmicas;
- Banco de dados - Criação; - Manutenção; - Análise;
Bioinformática na genômica
!"#$%#!&'
!+'
Omics
Identificar, quantificar e caracterizar todos os componentes
de um sistema biológico – Extremamente ligada a biologia de
sistemas.
Omics Sulfixo “omes”
- Século 20
- Biomes;
- Popularização durante os primeiros projetos genomas;
- Caracterizar globalmente biomoléculas – entender funções biológicas;
DNA Fenótipo
- Outras Omics
!"#$%#!&'
!%'
Omics – ácidos nucléicos - Genomica;
- Sequenciamento de todo DNA
- Transcriptoma;
- Sequenciamento de todo o RNA
- smRNA;
- Sequenciamento de todos os RNAs não codantes
- Metagenômica;
- Sequenciamento do material genético de uma microbiota
- Epigenomica;
- Sequenciamento das regiões regulatórias e modificações
na cromatina;
Omics – outras biomoléculas - Proteomica;
- Sequenciamento de todas as proteínas
- Metaboloma;
- Todo o peril de metabólitos de uma amostra (visão
fisiológica)
- Lipidomica;
- Todo o perfil lipídico de uma amostra
- Fluxomica;
- Dinâmica das moléculas dentro do sistema
- Glicomica;
- Todo o perfil de açúcar de uma amostra
!"#$%#!&'
!"'
Omics – in silico - Interactoma;
- Integrar dados de todas as outras omics
Omics
- Genômica; - Transcriptoma; - Proteomica; - Epigenomica; - Metagenômica; - Metaboloma; - smRNA; - Lipidomica; - Fluxomica; - Glicomica; - Interactoma;
High-dimensional biology approach
!"#$%#!&'
!,'
Omics
- Genômica; - Transcriptoma; - smRNA; - Epigenoma; - Metagenômica; - Proteoma; - Metaboloma; - Fluxomica; - Lipidomica; - Glicomica; - Interactoma;
Next generation sequencing
Técnicas diversas
Técnicas computacionais
Genômica Determinar a estrutura do genoma de uma determinada espécie.
Haemophilus influenzae – 1995, primeiro genoma sequenciado
1.830.140 bp – 1740 genes
Método de Sanger
!"#$%#!&'
($'
Genômica Projetos em andamento
Transcriptoma Amplamente aplicado;
- “Facilidade” maior de obtenção de resultados;
- Análises funcionais;
- Pode possibilitar o estudo de todos os tipos de RNAs;
- Não necessita de um genoma sequenciado;
- “Reduz” a necessidade de sequenciamento de genomas: ideal
para genomas complexos;
- Pode ser aplicado a qualque organismo, tecido e tipos celulares;
!"#$%#!&'
(!'
Transcriptoma
-./0123'!' -./0123'('
Filtragem
- Por tamanho; - Presença de cauda poli-A; - smRNAs; - microRNAs
Todos os RNAs
NGS
Epigenoma Sequenciamento das modificações epigenéticas ou regiões regulatórias.
CHIP-Seq – Chromatin immunopreciptation sequencing Variação do ChIP-on-Chip
!"#$%#!&'
(('
Determinar sítios de ligação de uma proteína
Purificação e montagem da biblioteca
NGS
CHIP-Seq – Chromatin immunopreciptation sequencing
FAIRE-Seq (Formaldehyde-Assisted Isolation of Regulatory Elements)
NGS
!"#$%#!&'
(&'
Metagenômica Sequenciamento do material genético de uma microbiota
Metagenômica Sequenciamento do material genético de uma microbiota
!"#$%#!&'
(*'
Metagenômica Sequenciamento do material genético de uma microbiota
Depois do sequenciamento
Montagem Alinhamento
Binning – organizar as sequencias em grupos que possam representar genomas individuais ou de um grupo
Anotação – identificar os tipos de sequencias
Thomas et al. 2012
!"#$%#!&'
(+'
Metagenômica Sequenciamento do material genético de uma microbiota
- Tem propiciado avanços na ecologia, evolução e diversidade microbiana;
- Descobrimento de novas enzimas;
45131236072891/.3' 451392/15/.3'
Metagenômica
- Microbioma da pele: rico em protobacterias. Microbiota semelhante a da pele do
rato;
- Microbioma do intestino: maioria das bacterias são de dois grupos (Bacteriods e
Firmicutes). As suas proporções estão ligadas a obesidade;
!"#$%#!&'
(%'
Metagenômica
http://www.nature.com/nature/focus/humanmicrobiota/#current
Especial da Nature
sobre microbioma
humano
Proteomica
1994 - Mark Wilkins (University of New South Wales – Austrália) cunhou o termo proteoma. Congresso “2D Electrophoresis: from protein maps to genomes” na Itália.
1- Ponto isoelétrico (carga) 2- Peso molecular
!"#$%#!&'
("'
Proteomica
Cromatografia líquida e espectometria de massa
- Perfil de expr. protéico; - Quantifica a expressão; - Análise global; - Rápido; - Baixo custo; - Identificar mod. pós-trad.
Proteomica
Metal affinity complexationThe coordinated binding between immobilized metal ions and charged peptides. Immobilized metals such as Fe3+ or Ga3+, or metal oxides such as TiO2 or ZrO2, are commonly used to enrich phosphorylated peptides from non-phosphorylated peptides.
As modified peptides only constitute a minority of all peptides, it is usually necessary to enrich them for proteome-wide modification analysis48. Ideally, this enrichment captures all modified peptides of interest and no others. In practice, modified peptides have a certain ‘enrichment factor’ with respect to the starting peptide mixture, which can range from over 100-fold for phosphorylation to only several fold for methylated peptides. In phosphoproteomics, metal affinity complexa-tion of the phosphogroup is the most common principle, but there are many other strategies49. PTM enrichment methods can also be more or less ‘specific’. This term refers to the proportion of modified peptides in the enriched population and can range from close to 100% for some fractions in phosphopeptide purification to about 5% for Lys-acetylated peptides captured by anti-bodies50. In our experience, enrichment of PTM-bearing peptides by affinity purification is preferable to chemical derivatization of PTMs. Chemical modifications are invariably accompanied by side reactions that need to be distinguished from in vivo modifications (see for example REF. 24). TABLE 1 contains a list of the most frequently studied PTMs and how they are analysed by MS.
Sequence-specific identification of PTMs. In terms of data quality, there are two distinct tasks in PTM char-acterization: confident identification of the peptide sequence bearing the PTM and unambiguous localiza-tion of the PTM to the correct amino acid. For example, it may be possible to identify a phosphorylated pep-tide with high confidence (> 99%) but the data may not be sufficient to distinguish which of two adjacent Ser residues is phosphorylated. Therefore, proteomic PTM data sets should contain both a peptide identifica-tion score and a PTM localization score51–53, which is unfortunately not always the case. It is important that the FDRs of PTM determination are rigorously deter-mined, especially when PTM studies are meant to serve as resources for the community. Unambiguous localiza-tion of PTMs benefits from high mass accuracy in the
fragmentation spectra, which increases the confidence of both peptide identification and PTM localization (BOX 1; FIG. 3).
Comprehensiveness of PTM analysis by MS. One of the surprises of systems-wide PTM analysis has been the large number of sites that are routinely discovered. Phosphoproteome studies have identified more than 20,000 phosphorylation sites in a single project54 and there may be more than 100,000 sites in the phospho-proteome of human cells. The numbers for other modifications, such as acetylation, ubiquitylation, methylation and gylcosylation, are also large, and no modification has been mapped to completion yet. Quantitative analysis is therefore essential to focus on the subset of regulated sites that are likely to be func-tionally important in the biological process of interest. Determining the occupancy of the site of modification is also becoming possible for many sites54 and this may further help in pinpointing the sites that probably have functional roles.
In large-scale phosphoproteomics experiments, cover age of the well-known functional sites in the pathway under investigation can validate the quality of the data. Although some phosphorylation sites are in sequence contexts that are difficult to probe by MS (for example, in very short tryptic peptides), in general this goal seems to be within reach of current technology.
Non-phospho PTMs in signalling. Although most MS-based studies so far have focused on analysis of phosphorylation-dependent events, MS can in principle examine any other PTM involved in cell signalling. For example, an antibody-based enrichment approach and the ‘heavy methyl’ SILAC variant, in which heavy labelled Met serves as a donor for the methyl group, pro-vide a tool to investigate in vivo methylation of Lys and Arg55. Enrichment of peptides containing acetylated Lys residues revealed a surprisingly large number of acetyla-tion sites on mitochondrial proteins56. Recently, high
Table 1 | PTMs currently amenable to large-scale MS analysis
PTM Mass shift (!m; Da)*
Enrichment methods
Largest MS study‡
Organism Remarks
Phosphorylation 79.96633 IMAC, TiO2 and
antibodies20,443 sites54 Homo sapiens
(HeLa cell line)Fe3+-based IMAC and TiO
2 are most commonly used for
enrichment of phosphoSer, phosphoThr and phosphoTyr-containing peptides
Acetylation 42.01056 Pan anti-acetyl-Lys antibodies
3,600 sites50 Homo sapiens (A459, Jurkat and MV4-11 cell lines)
Trypsin often cannot cleave acetylated peptides; thus, acetyl-Lys is located internally on modified peptides, which aids in the site-specific localization of PTMs
Ubiquitylation (diGly tag)
114.04292 Tagged ubiquitin 110 sites59 Saccharomyces cerevisiae
Cells express a tagged version of ubiquitin (the tag is used to isolate ubiquitin-conjugated proteins); tryptic peptides contain diGly-conjugated uncleaved Lys
Methylation 14.01565 Anti-methyl-Lys or anti-methyl-Arg antibodies
59 sites55 Homo sapiens (HeLa S3 cell lines)
Currently available pan anti-methyl-Lys and anti-methyl-Arg antibodies typically have low specificity
-GlcNac 203.07937 Lectin 141 sites124 Homo sapiens (HeLa cell lines)
Very labile PTM; may benefit from fragmentation methods such as ETD and ECD
ECD, electron capture dissociation; ETD, electron transfer dissociation; IMAC, immobilized metal affinity chromatography; MS, mass spectrometry; o-GlcNac, o-linked !-N-acetylglucosamine; PTM, post-translational modification. *The " masses given here are monoisotopic masses of the PTM. ‡Reference to the largest proteomics study for each PTM to date.
REVIEWS
432 | JUNE 2010 | VOLUME 11 www.nature.com/reviews/molcellbio
REVIEWS
© 20 Macmillan Publishers Limited. All rights reserved10
Bionfo - Identificação das proteínas; - Quantificação; - Análise de enriquecimento;
!"#$%#!&'
)$'
Metaboloma
ANRV410-PP61-20 ARI 26 March 2010 19:22
Key
Inositol-1PInositol-1PGluconateGluconate
myo-Inositolmyo-InositolTrehaloseTrehaloseGalacturonateGalacturonate
GDPGDP
HistidineHistidine
GuanosineGuanosineRiboseRibose
CytidineCytidine
CytosineCytosine
UMPUMPMannoseMannose
G6PG6P
FRUFRU
GLUGLUMaltoseMaltose
SucroseSucrose
AnthranilateAnthranilate
TrpTrp
QuinateQuinate SalicylateSalicylate
ShikimateShikimate
Tetracosaoic acidTetracosaoic acidLeuLeu
PyridoxaminePyridoxamineGlycerateGlycerate
ErythritolErythritol CystineCystine
SerSer
b-Cyanoalanineb-Cyanoalanine
GlyGly
XylitolXylitol
GlycerolGlycerolGlcNAcGlcNAc
G3PG3PGlycolic acidGlycolic acid
AMPAMP
AdenosineAdenosine
Linoleic acidLinoleic acid
IAAIAA
AllantoinAllantoin
Apigenin-Hex-RhaApigenin-Hex-Rha
JasmonateJasmonate
Chrysoeriol-Hex-RhaChrysoeriol-Hex-Rha
Tricin-Hex-RhaTricin-Hex-Rha
TyrTyr
PhePhe
IAA-AspIAA-Asp
Schaftoside isomer #1Schaftoside isomer #1
58:1TAG58:1TAG
Chrysoeriol-C-Hex-C-Pen isomer #1Chrysoeriol-C-Hex-C-Pen isomer #1
Sinapic acidSinapic acid
Schaftoside isomer #2Schaftoside isomer #2
SinapoylglucoseSinapoylglucose
60:2TAG60:2TAG60:3TAG60:3TAG
58:2TAG58:2TAG
Chrysoeriol-C-Hex-C-Pen isomer #2Chrysoeriol-C-Hex-C-Pen isomer #2
56:3TAG56:3TAG
54:6TAG54:6TAG
54:1TAG54:1TAG
54:2TAG54:2TAG
54:4TAG54:4TAG54:3TAG54:3TAG
56:2TAG56:2TAG
54:5TAG54:5TAG
52:3TAG52:3TAG
52:1TAG52:1TAG50:2TAG50:2TAG
52:5TAG52:5TAG
16:0LysoPC16:0LysoPC
18:2LysoPC18:2LysoPC 52:4TAG52:4TAG18:1LysoPC18:1LysoPC
Ca!eic acidCa!eic acid
FPFP
IAA-Asp-HexIAA-Asp-Hex
p-Coumaric acidp-Coumaric acid
NicotianamineNicotianamine
GlutarateGlutarate
Nicotinic acid derivative #2Nicotinic acid derivative #2
Nicotinic acid-HexNicotinic acid-Hex
IleIle
Nicotinic acid derivative #3Nicotinic acid derivative #3
NicotinateNicotinate
Nicotinic acid derivative #1Nicotinic acid derivative #1PantothenatePantothenate
Homo-SerHomo-Ser
PutrescinePutrescine
AspAsp
b-Alanineb-Alanine CholesterolCholesterolGlnGlnOryzanol-25methylcycloartenolOryzanol-25methylcycloartenol
GluGlu
SuccinateSuccinate StigmasterolStigmasterol
5-Oxoproline5-Oxoproline
CampesterolCampesterol
SqualeneSqualene2-Ketoglutarate2-Ketoglutarate Oryzanol-cycloartenolOryzanol-cycloartenol
isocitrateisocitrate Oryzanol-campestanolOryzanol-campestanol
alpha-Tocopherolalpha-TocopherolCitCit
PhytolPhytolMalonateMalonate
cis-Aconitatecis-Aconitate
LactateLactate
ValVal
Oleic acidOleic acidPalmitic acidPalmitic acid
TetradecanoateTetradecanoate
GABAGABAL-OrnithineL-Ornithine ProPro HydroxyprolineHydroxyproline
DiaminopimelateDiaminopimelateLysLys
NADNAD
ThrThr
MetMet CholineCholine
MalMal
FumFum
AsnAsn
AlaAla
BetaineBetaine
Inositol-1PGluconate
myo-InositolTrehaloseGalacturonate
GDP
Histidine
GuanosineRibose
Cytidine
Cytosine
UMPMannose
G6P
FRU
GLUMaltose
Sucrose
Anthranilate
Trp
Quinate Salicylate
Shikimate
Tetracosaoic acidLeu
PyridoxamineGlycerate
Erythritol Cystine
Ser
"-Cyanoalanine
Gly
Xylitol
GlycerolGlcNAc
G3PGlycolic acid
AMP
Adenosine
Linoleic acid
IAA
Allantoin
Apigenin-Hex-Rha
Jasmonate
Chrysoeriol-Hex-Rha
Tricin-Hex-Rha
Tyr
Phe
IAA-Asp
Schaftoside isomer #1
58:1TAG
Chrysoeriol-C-Hex-C-Pen isomer #1
Sinapic acid
Schaftoside isomer #2
Sinapoylglucose
60:2TAG60:3TAG
58:2TAG
Chrysoeriol-C-Hex-C-Pen isomer #2
56:3TAG
54:6TAG
54:1TAG
54:2TAG
54:4TAG54:3TAG
56:2TAG
54:5TAG
52:3TAG
52:1TAG50:2TAG
52:5TAG
16:0LysoPC
18:2LysoPC 52:4TAG18:1LysoPC
Ca!eic acid
FP
IAA-Asp-Hex
p-Coumaric acidApigenin-C,C-pentosideApigenin-C,C-pentosideApigenin-C,C-pentoside
Nicotianamine
Glutarate
Nicotinic acid derivative #2
Nicotinic acid-Hex
Ile
Nicotinic acid derivative #3
Nicotinate
Nicotinic acid derivative #1Pantothenate
Homo-Ser
Putrescine
Asp
"-Alanine CholesterolGlnOryzanol-25methylcycloartenol
Glu
Succinate Stigmasterol
5-Oxoproline
Campesterol
Squalene2-Ketoglutarate Oryzanol-cycloartenol
isocitrate Oryzanol-campestanol
alpha-TocopherolCit
PhytolMalonate
cis-Aconitate
Lactate
Val
Oleic acidPalmitic acid
Tetradecanoate
GABAL-Ornithine Pro Hydroxyproline
DiaminopimelateLys
NAD
Thr
Met Choline
Mal
Fum
Asn
Ala
Betaine
LC-MSGC-MS CE-MS
a Plant materials
Retrieval
Sample extraction and pretreatment
Functional genomics and systems biology
LC-PDA LC-MSLC-MS(Lipid)(Lipid)LC-MS(Lipid) FT-IR NMR
Data processing and peak annotation
Data acquisition
b Metabolome data
Metabolome pipelines
LC-MSGC-MS
CE-MSLipid
GC andCE-MS
466 Saito · Matsuda
Ann
u. R
ev. P
lant
Bio
l. 20
10.6
1:46
3-48
9. D
ownl
oade
d fr
om w
ww
.ann
ualre
view
s.org
by U
nive
rsid
ade
Esta
dual
de
Cam
pina
s (U
nica
mp)
on
08/2
8/13
. For
per
sona
l use
onl
y.
GC-MS – gas chromatography mass spectrometry
LC-MS – liquid chromatography
mass spectrometry CE-MS – Capillary electrophoresis
mass spectrometry FT-IR – Fourier transform infrared
spectometry NMR – nuclear magnetic resonance LC-PDA – LC-photodiode array
Fluxoma Camada entre proteoma e metaboloma;
Avalia os aspectos dinâmicos do metabolismo;
Permite melhor entendimento dos modos de regulação do metabolismo do sistema;
ANRV410-PP61-20 ARI 26 March 2010 19:22
Key
Inositol-1PInositol-1PGluconateGluconate
myo-Inositolmyo-InositolTrehaloseTrehaloseGalacturonateGalacturonate
GDPGDP
HistidineHistidine
GuanosineGuanosineRiboseRibose
CytidineCytidine
CytosineCytosine
UMPUMPMannoseMannose
G6PG6P
FRUFRU
GLUGLUMaltoseMaltose
SucroseSucrose
AnthranilateAnthranilate
TrpTrp
QuinateQuinate SalicylateSalicylate
ShikimateShikimate
Tetracosaoic acidTetracosaoic acidLeuLeu
PyridoxaminePyridoxamineGlycerateGlycerate
ErythritolErythritol CystineCystine
SerSer
b-Cyanoalanineb-Cyanoalanine
GlyGly
XylitolXylitol
GlycerolGlycerolGlcNAcGlcNAc
G3PG3PGlycolic acidGlycolic acid
AMPAMP
AdenosineAdenosine
Linoleic acidLinoleic acid
IAAIAA
AllantoinAllantoin
Apigenin-Hex-RhaApigenin-Hex-Rha
JasmonateJasmonate
Chrysoeriol-Hex-RhaChrysoeriol-Hex-Rha
Tricin-Hex-RhaTricin-Hex-Rha
TyrTyr
PhePhe
IAA-AspIAA-Asp
Schaftoside isomer #1Schaftoside isomer #1
58:1TAG58:1TAG
Chrysoeriol-C-Hex-C-Pen isomer #1Chrysoeriol-C-Hex-C-Pen isomer #1
Sinapic acidSinapic acid
Schaftoside isomer #2Schaftoside isomer #2
SinapoylglucoseSinapoylglucose
60:2TAG60:2TAG60:3TAG60:3TAG
58:2TAG58:2TAG
Chrysoeriol-C-Hex-C-Pen isomer #2Chrysoeriol-C-Hex-C-Pen isomer #2
56:3TAG56:3TAG
54:6TAG54:6TAG
54:1TAG54:1TAG
54:2TAG54:2TAG
54:4TAG54:4TAG54:3TAG54:3TAG
56:2TAG56:2TAG
54:5TAG54:5TAG
52:3TAG52:3TAG
52:1TAG52:1TAG50:2TAG50:2TAG
52:5TAG52:5TAG
16:0LysoPC16:0LysoPC
18:2LysoPC18:2LysoPC 52:4TAG52:4TAG18:1LysoPC18:1LysoPC
Ca!eic acidCa!eic acid
FPFP
IAA-Asp-HexIAA-Asp-Hex
p-Coumaric acidp-Coumaric acid
NicotianamineNicotianamine
GlutarateGlutarate
Nicotinic acid derivative #2Nicotinic acid derivative #2
Nicotinic acid-HexNicotinic acid-Hex
IleIle
Nicotinic acid derivative #3Nicotinic acid derivative #3
NicotinateNicotinate
Nicotinic acid derivative #1Nicotinic acid derivative #1PantothenatePantothenate
Homo-SerHomo-Ser
PutrescinePutrescine
AspAsp
b-Alanineb-Alanine CholesterolCholesterolGlnGlnOryzanol-25methylcycloartenolOryzanol-25methylcycloartenol
GluGlu
SuccinateSuccinate StigmasterolStigmasterol
5-Oxoproline5-Oxoproline
CampesterolCampesterol
SqualeneSqualene2-Ketoglutarate2-Ketoglutarate Oryzanol-cycloartenolOryzanol-cycloartenol
isocitrateisocitrate Oryzanol-campestanolOryzanol-campestanol
alpha-Tocopherolalpha-TocopherolCitCit
PhytolPhytolMalonateMalonate
cis-Aconitatecis-Aconitate
LactateLactate
ValVal
Oleic acidOleic acidPalmitic acidPalmitic acid
TetradecanoateTetradecanoate
GABAGABAL-OrnithineL-Ornithine ProPro HydroxyprolineHydroxyproline
DiaminopimelateDiaminopimelateLysLys
NADNAD
ThrThr
MetMet CholineCholine
MalMal
FumFum
AsnAsn
AlaAla
BetaineBetaine
Inositol-1PGluconate
myo-InositolTrehaloseGalacturonate
GDP
Histidine
GuanosineRibose
Cytidine
Cytosine
UMPMannose
G6P
FRU
GLUMaltose
Sucrose
Anthranilate
Trp
Quinate Salicylate
Shikimate
Tetracosaoic acidLeu
PyridoxamineGlycerate
Erythritol Cystine
Ser
"-Cyanoalanine
Gly
Xylitol
GlycerolGlcNAc
G3PGlycolic acid
AMP
Adenosine
Linoleic acid
IAA
Allantoin
Apigenin-Hex-Rha
Jasmonate
Chrysoeriol-Hex-Rha
Tricin-Hex-Rha
Tyr
Phe
IAA-Asp
Schaftoside isomer #1
58:1TAG
Chrysoeriol-C-Hex-C-Pen isomer #1
Sinapic acid
Schaftoside isomer #2
Sinapoylglucose
60:2TAG60:3TAG
58:2TAG
Chrysoeriol-C-Hex-C-Pen isomer #2
56:3TAG
54:6TAG
54:1TAG
54:2TAG
54:4TAG54:3TAG
56:2TAG
54:5TAG
52:3TAG
52:1TAG50:2TAG
52:5TAG
16:0LysoPC
18:2LysoPC 52:4TAG18:1LysoPC
Ca!eic acid
FP
IAA-Asp-Hex
p-Coumaric acidApigenin-C,C-pentosideApigenin-C,C-pentosideApigenin-C,C-pentoside
Nicotianamine
Glutarate
Nicotinic acid derivative #2
Nicotinic acid-Hex
Ile
Nicotinic acid derivative #3
Nicotinate
Nicotinic acid derivative #1Pantothenate
Homo-Ser
Putrescine
Asp
"-Alanine CholesterolGlnOryzanol-25methylcycloartenol
Glu
Succinate Stigmasterol
5-Oxoproline
Campesterol
Squalene2-Ketoglutarate Oryzanol-cycloartenol
isocitrate Oryzanol-campestanol
alpha-TocopherolCit
PhytolMalonate
cis-Aconitate
Lactate
Val
Oleic acidPalmitic acid
Tetradecanoate
GABAL-Ornithine Pro Hydroxyproline
DiaminopimelateLys
NAD
Thr
Met Choline
Mal
Fum
Asn
Ala
Betaine
LC-MSGC-MS CE-MS
a Plant materials
Retrieval
Sample extraction and pretreatment
Functional genomics and systems biology
LC-PDA LC-MSLC-MS(Lipid)(Lipid)LC-MS(Lipid) FT-IR NMR
Data processing and peak annotation
Data acquisition
b Metabolome data
Metabolome pipelines
LC-MSGC-MS
CE-MSLipid
GC andCE-MS
466 Saito · Matsuda
Ann
u. R
ev. P
lant
Bio
l. 20
10.6
1:46
3-48
9. D
ownl
oade
d fr
om w
ww
.ann
ualre
view
s.org
by U
nive
rsid
ade
Esta
dual
de
Cam
pina
s (U
nica
mp)
on
08/2
8/13
. For
per
sona
l use
onl
y.
!"#$%#!&'
)!'
Novas fronteiras Expressão e conteúdo protéico são diferentes!!! Variações estocásticas são comuns!!!
Cluster 363 células de C. elegans de acordo com a similaridade de expressão. B.w.m Body wall muscle Blast – Blast cells
Wang e Bodovits 2010
!"#$%#!&'
)('
Wang e Bodovits 2010
As análises de OMICs podem conter viés!!
Novas fronteiras – Single cell
- Analisar células individuais podem dar maior acurácia para a análise do sistema;
- Células troncos - melhorar o entendimento da via auto-renovação ou transformação;
- Câncer – melhorar a compreensão da iniciação, progressão, metástase e respostas terapêuticas.
!"#$%#!&'
)*'
Abióticos Bióticos
VIDA
Estudos multi-escala
Sistema biológico – composto de multiplas “entidades”
:6;<3<5'!'
:6;<3<5'('
:6;<3<5')'
:6;<3<5'&'
:6;<3<5'*'
:6;<3<5'+'
:6;<3<5'%'
:6;<3<5'"'
:6;<3<5','
:6;<3<5'!$'
!"#$%#!&'
)+'
As sete pontes de Königsberg (ex-capital da Prussia) – Leonard Euler 1736 Encontrar um caminho pela cidade que cruze cada ponte somente uma vez
Teoria de grafos (redes)
Analisando a determinação sexual de vertebrados com base em redes de interação entre proteínas
! "!
Figura 1 – Exemplo de grafo. Nesse exemplo, os nós e as linhas (arestas) podem ser
encarados como proteínas e suas relações, respectivamente (Junker, 2008).
As redes de regulação reportam o controle da expressão gênica. A expressão final
de um gene pode ser modulada por diversas variáveis tais como, fatores de transcrição,
modificações pós-traducionais ou por associação dessas proteínas com outras biomoléculas.
Nesses modelos, a rede é demonstrada por um grafo direcionado (Junker, 2008;
Pavlopoulos et al., 2011) tal como V2!V3, significando que a molécula “V2” interage com
“V3” e não o oposto. Em termos práticos, V2!V3 simbolizariam a interação unidirecional
entre um fator de transcrição e o promotor de um gene, respectivamente (Figura 2).
As redes de transdução de sinais são representadas por grafos direcionados multi-
arestas que representam as interações uni ou bi-direcionais entre proteínas, outras
moléculas orgânicas ou inorgânicas. Em suma, essas redes reportam como o sinal
extracelular pode ser transmitido para o ambiente intra-orgânico ou como os sinais são
conduzidos dentro de uma célula ou organismo (Junker, 2008; Pavlopoulos et al. 2011)
(Figura 2).
As interações entre proteínas são geralmente reportadas como grafos não-
direcionados uma vez que não importa a direção que a interação ocorre (Figura 2) (Junker,
2008). O presente trabalho é baseado nesse tipo de rede, sendo os capítulos 1 e 2
dedicados a esse tipo de interação.
4N
ET
WO
RK
SIN
BIO
LO
GY
FIG
UR
E1.1
Exam
pleof
abiologicalnetw
ork.The
largeststronglyconnected
component
(seeC
hapter2)
ofthe
human
proteininteraction
network
isshow
n.T
henetw
orkis
basedon
thecom
pletedata
setforinteraction
ofhum
anproteins
downloaded
fromthe
Database
ofInteracting
Proteins(D
IP,[35])inJanuary
2005.
advanceshave
made
itpossibleto
elicitentirenetw
orks,oratleastlargeproportions
ofthem.
The
nextsection
containsa
conciseoverview
ofbasic
biologyand
isespecially
aimed
atreadersw
how
ouldlike
torefresh
theirknow
ledgeof
biology.Section1.3
introducesthe
conceptofsystems
biology.InSection
1.4,anoverview
isgiven
aboutw
hatfindingshave
beenm
adeaboutdifferentbiologicalnetw
orksw
ithm
odernnet-
work
analysism
ethods.
1.2B
IOL
OG
Y101
1.2.1B
iochemistry
andM
olecularB
iology
The
information
abouttheassem
blyofan
organismisstored
inthe
desoxyribonucleicacid
(DN
A,see
Fig.1.2).DN
Aisa
coiledladder(helix)consisting
oftwo
sugarphos-phate
backbonesenclosing
pairsof
thenucleotide
basesadenine,cytosine,guanine,
andthym
ine(A
,C,G
,T).T
henucleotide
Apairsonly
with
T,whereasC
pairsonlyw
ith
Nós ou vértices – fatores abióticos ou
bióticos
Linhas ou arestas – relação entre os
fatores
!"#$%#!&'
)%'
Redes intra celulares - Redes metabólicas; - Redes transcricionais; - Redes de sinalização celular; - Redes de interação entre proteínas; - Redes de co-expressão; - Estrutura protéica
Outras redes biológicas
- Sinapse; - Redes ecológicas; - Árvores filogenéticas; - Droga e alvo;
Tipos de redes biológicas
Interações metabólicas (metabolomas)
Relação entre metabólitos
Modelagem do metabolismo
- Resposta ao ambiente; - Crescimento; - Reprodução; - …
!"#$%#!&'
)"'
Redes de regulação (transcriptoma, smRNAs e epigenoma)
DNA ! RNA ! Proteína " "
Diferenciação celular
Redes de regulação (transcriptoma, smRNAs e epigenoma)
RNA-Seq Co-expressão
microRNAs
Integração de dados!
Predição de alvos Correlação negativa
inter. entre genes
Degradoma (plantas)
inter. entre miRNA e mRNA
FAIRE-Seq Chip-Seq
Mol. regu.-DNA
!"#$%#!&'
),'
Centralidade – a posição de um nó na rede em relação aos outros. Indica sua importância.
Análises de redes
Comparações – Alinhamento de redes
Isorank algorithm
Network BLAST (Trey Ideker)
Análises de redes
!"#$%#!&'
&$'
Integração de dados – Extração de modelos
Modelo de uma célula completa de Mycoplasma genitalium
Integração de dados – Extração de modelos
Modelo integrativo da célula
Dividiram a funcionalidade da célula em módulos
Agruparam os sub-módulos
Cada módulo foi modelado matematicamente
Integrar os modelos dos 28 sub-módulos
!"#$%#!&'
&)'
Banco de dados (database) – é um conjunto de dados organizados em uma determinada estrutura que possibilite ao usuário encontrar facilmente a informação desejada
Até 2008 – mais de 1.000 bancos de dados
!"#$%#!&'
&&'
>?@'
Genes, genomas, proteínas, elementos transponíveis, miRNAs, interações prot-prot, interações tf-promotor;
? O que torna um banco de dados uma ferramenta
extraordinária
!"#$%#!&'
&*'
!"#$%&%$'()*+"(,+-. /)$--01$*-.,$.12%*(-.3+%4(-.
564("*,(,$.
7+48(%9':(4$"#+.,$.*"3+%4(;<$-.
=$%%(4$"#(-. ,$. ("2'*-$-. >?'(-#@. ('*":(4$"#+-@. ?6-)(. ,$. ('1+-@.("2'*-$-.,$.4+93-@.$#)AB.
C*"D-.8(%(.+6#%+-.E$?.-*#$-.)+4.+6#%(-.3$%%(4$"#(-.+6.*"3+%4(;<$-.
F(-#(.?*?'*+G%(H(.$.*"3+%4(;<$-.-+?%$.+.I6$.-$.?6-)(.
Top Related