Softwares de Análises Estatísticas em Biologia Sistêmica
description
Transcript of Softwares de Análises Estatísticas em Biologia Sistêmica
Software para Anlises Estatsticas em Biologia Sistmica
Softwares de Anlises Estatsticas em Biologia SistmicaProf. Dr. der Maiquel SimoEmail: [email protected]
Rio Grande, Setembro de 2012
V Conferncia Sul em Modelagem Computacional Roteiro1- Teoria1.1 Introduo;1.2 Informao Gentica;1.3 Formao do Cncer;1.4 Expresso de Protenas;
2- Prtica2.1 Normalizao;2.2 Atividade Relativa - Diversidade Relativa;2.3 Mudana de Expresso;2.4 Mapas Funcionais.
1.1 IntroduoBiologia Sistmica: Integrao entre os fenmenos e as teorias que envolvem os sistemas biolgicos. - Informao;- Abordagem sistmica;
O objetivo do mini curso ser mostrar a funcionalidade de alguns softwares de anlises estatsticas usados pela biologia sistmica para investigar a expresso de vias e genes relacionados a doenas humanas.
1- Dados de expresso do GEO e genes da Ontologia Ontocancro;
2- Software R, com pacotes do Bioconductor;
3- Software ViaComplex;
4- Mapas Funcionais Banco de Dados String. 1.2 Informao GenticaUmcromossomo uma longa sequncia deDNA, que contm vriosgenes, e outras sequncias de nucleotdeos com funes especficas nasclulasdosseres vivos.
(String)Um conjunto de protenas desempenha uma funo especfica.
Ex: - Protenas que do cor aos olhos;- Envolvidas na morte celular;- Na proliferao celular...
1.4 EXPRESSO DE PROTENAS
GENOMAPROTEOMA
TRANSCRIPTOMAinteraoprot-geneMETABOLOMA
CitratesynthaseMalatedehydrogenaseFumaraseSuccinatedehydrogenaseINTERATOMAinteraoprot-protExpresso de protenas: Todos as clulas tem a mesma quantidade de genes e as clulas com funes diferentes produzem protenas especializadas naquela funo.
COMO MEDIR A EXPRESSO DE PROTENAS?
7MICROARRANJOSRNA-Seq
23
23 Bancos de Dadoshttp://www.ncbi.nlm.nih.gov/geo/
Bancos de Dados
Adrenocortical Carcinomas , AdenomasGSE10927
PASTA 1- ARQUIVOS .CEL (GSE10927)
Glndulas suprarrenais: Estimulam a converso de protenas e gorduras em glicose, ao mesmo tempo que diminuem a captao de glicose pelas clulas, aumentando, assim, a utilizao de gorduras.2.1 Normalizao
Software R com pacotes do Bioconductor
ARQUIVOS .CELGrfico de bigodes, indica a disperso entre as amostras. A linha preta a mediana, a caixa representa os elementos entre o 10 e o 30 quadrante.
ABRINDO O ARQUIVO GSE10927_RMA.XLS
MATRIZ NORMALIZADA- Cada elemento representa uma sonda de um gene;- Cada linha corresponde ao valor de expresso do mesmo gene;- Cada Coluna corresponde a uma amostra (microarranjo) de um determinado tecido.
AGRUPAR OS TECIDOS
1- Criar 2 colunas em branco, separando as amostras;2- Fazer a mdia entre as amostras;3- Expandir o clculo para todos os genes.
4- Criar nova planilha e colar as sondas com as mdias;
5- Para gerar o arquivo de expresso usado no software ViaComplex devemos baixar o arquivo da plataforma referente a srie que estamos analisando:6- Deste arquivo 2 colunas so extradas:- A primeira corresponde ao IDENTIFICADOR da SONDA;- A segunda corresponde ao SMBOLO APROVADO DO GENE.
OBS: Passo j realizado. 7- Com a plataforma devemos formar as combinaes de expresso a serem analisadas:ADENOMA x NORMAL e CNCER x NORMAL
Observaes Importantes: No arquivo TXT de expresso no pode aparecer o caractere / ou espaos em branco nas clulas de clculo.# Devemos sempre cuidar o espao existente no final do arquivo.
ADENOMA x NORMAL e CNCER x NORMALSALVAR CADA UM DESTES ARQUIVOS COMO:texto (separado por tabulao)
PASTA 2 - Criar arquivos para o SOFTWARE VIACOMPLEXBANCOS DE DADOS DE VIAS E GENES:NCI PATHAWAY, REACTOME, BIOCARTA e ONTOLOGIA ONTOCANCRO
http://ontocancro.inf.ufsm.br/
PASTA 3 - VIAS E GENES - ONTOLOGIA ONTOCANCRO
23Diversidade Entropia de ShannonFrequncia da diversidade do gene i
Diversidade relativa
2.2 Atividade Relativa - Diversidade RelativaCncer NormalAtividade relativa
25
26
27
282.3 Mudana de ExpressoCncer, adenoma Normal
No de vezes que a expresso varia entre os genes de uma via (conjunto de genes com uma determinada funo)Para encontrar a mudana de expresso entre os genes de uma via:
1- Encontrar as vias de interesse:
http://ontocancro.inf.ufsm.br/
PASTA 5 - Fold Change
Software R com pacotes do BioconductorMudana de Expresso Para efetuarmos os clculos da mudana de expresso so necessrios alguns arquivos importantes:1- Vias de interesse;2- Arquivo RData, salvo durante a Normalizao dos dados;3-Script.
Objetivo: Atravs da atividade relativa iremos analisar a expresso das amostras de tecidos pr cancerosos do clon em uma rede de protenas envolvida na manuteno do genoma. Para isso precisaremos construir uma rede de interao.2.4 Mapas funcionais
http://ontocancro.inf.ufsm.br/
http://string-db.org/Banco de Dados String
Contm vrias informaes do genoma:Inclu mais de 5 milhes de protenas de 1133 Organismos
Passo 6 - Software STRINGArquivo Medusa
Resultado
Artigos publicados com os Softwares