Aula teorica minicurso modelagem de proteinas por homologia

Post on 23-Jun-2015

3.078 views 2 download

Transcript of Aula teorica minicurso modelagem de proteinas por homologia

Introdução à Modelagem de Proteínas por Homologia

Belém-PANovembro de 2012

MSc. Ronaldo Correia

Genética e Biologia Molecular - Bioinformática

Laboratório de Planejamento e Desenvolvimento de Fármacos – LPDF - UFPa

Objetivos

Oferecer noções básicas sobre Proteínas;

Apresentar técnicas de modelagem de Proteínas;

Discutir a importância dessas técnicas para o proteoma e planejamento de fármacos.

Introdução

Bioinformática

Proteínas

Métodos experimentai

s

Métodos Teóricos

Seres protéicos

A vida está intimamente ligada às proteínas. Estas moléculas especiais realizam as mais variadas funções no nosso organismo tais como:

Transporte de nutrientes e metabólitos, catálise de reações biológicas;

Apesar da complexidade de suas funções, as proteínas são relativamente simples;

Repetições de 20 unidades básicas, os aminoácidos.

Proteínas x Meio Ambiente

Metano: 25 x maior potencial efeito estufa que CO2

As arqueias metanogênicas são responsáveis por 74% do metano liberado em nossa atmosfera.

Metil coenzima redutase (MCR): catálise da metanogênese.

LIMA, 2012

LIMA, 2012

Proteínas x Meio Ambiente

AminoácidoUm aminoácido consiste em um caborno

“central” com uma ligação a grupo amino (-NH2), outra a um grupo carboxila (-COOH), a terceira a um átomo de hidrogênio e a quarta a uma cadeia lateral variável

Carbono α

Aminoácidos Single- & three-letter amino acid codes

G Glycine Gly P Proline ProA Alanine Ala V Valine ValL Leucine Leu I Isoleucine IleM Methionine Met C Cysteine CysF Phenylalanine Phe Y Tyrosine TyrW Tryptophan Trp H Histidine HisK Lysine Lys R Arginine ArgQ Glutamine Gln N Asparagine AsnE Glutamic Acid Glu D Aspartic Acid AspS Serine Ser T Threonine Thr

Classificação dos aminoácidosOs aminoácidos podem ser classificados de

acordo com o grupo R como:

Alifáticos (não polares) – sem polos,sem carga;

Não carregados, polares – mas com eminência;

Carregados positivamente;

Carregados Negativamente.

Sem O2 para fazer ligações.

O2 presente (possui pólos) para fazer ligações com carbono e hidrogênio.

Ligação PeptídicaOs peptídeos são biomoléculas formadas

pela ligação de dois ou mais aminoácidos através de ligações do tipo amida. Os peptídeos são resultantes do processamento de proteínas e podem variar de 2 ou mais aminoácidos.

2 aminoácidos: Dipeptídeo3 aminoácidos: Tripeptídeo4 a 10 aminoácidos: Oligopeptídeo10 a 100 aminoácidos: Polipeptídeomais de 100 aminoácidos: Proteína

Insulina

51 amino ácidos

Glucagon

29 amino ácidos

oxitocina ou ocitocina.9 aminoácidos

Vasopressina (ADH)9 aminoácidos

Conformação do Esqueleto

Interações não covalentesLigação de Hidrogênio

Ponte de H formada entre duas moléculas de água

Eletronegatividade

Low Barrier Hydrogen Bond (LBHB)Ligação de Hidrogênio

Interação Hidrofóbica

Gotas de óleo na água

Ponte de Dissulfeto

Grupo sulfidril

Resíduo %Cysteine 17.5Serine 11.7

Glutamic acid 11.1Threonine 6.9

Glycine 6.5Leucine 6.1Valine 5.9

Arginine 5.6Aspartic acid 5.0

Alanine 4.8Proline 3.6

Isoleucine 2.7Tyrosine 1.9

Phenylalanine 1.4Histidine 0.8

Covalent Bond ~ 50 - 100kcal/molIonic Bond ~ 5 - 80kcal/molHydrogen Bond ~ 3 - 6kcal/molHydrophobic Interaction ~ 0.5 -

3kcal/mol (not a bond per se)Van der Waals Interaction ~ 1kcal/mol

ProteínasDefinição: são macromoléculas

complexas, compostas de aminoácidos, e necessárias para os processos químicos que ocorrem nos organismos vivos

Nos animais, as proteínas correspondem a cerca de 80% do peso dos músculos desidratados, cerca de 70% da pele e 90% do sangue seco.

Estrutura Primária

amino terminal ou "N-terminal" (NH3+)

carboxi terminal ("C-terminal") (COO-)

>2ANL:A|PDBID|CHAIN|SEQUENCESENDVIELDDVANLMFYGEGEVGDNHQKFMLIFDTGSANLWVPS KCNSIGCSTKHLYDSSKSKSYEKDGTKVEITYGSGVRGFFSKDLVTLGYLSLPYKFIEVTDTDDLEPLYTAAEFDGILGLGWKDLSIGSIDPIVVELKNQNKIDQALFTFYLPVHDKHSGYLTIGGIEEKFYEGELTYEKLNHDLFWQVDLDVNFGKTSMEKANVIVDSGTSTITAPTSFINKFFKDLNVIKVPFLPFYITTCNNKDMPTLEFKSANNTYTLEPEYYMEPLLDIDDTLCMLYILPVDIDKNTFILGDPFMRKYFTVFDYDKESIGFAVAKN

FASTA

Estrutura Secundária

A estrutura secundária é uma função dos ângulos formados pelas ligações peptídicas que ligam os aminoácidos

A conformação espacial é mantida graças as interações intermoleculares (ligação hidrogênio) entre os hidrogênios dos grupos amino e os átomos de oxigênio dos outros amino ácidos.

-Hélice

É a forma mais comum de estrutura secundária regular;

Caracteriza-se por uma hélice em espiral formada por volta de 3 a 6 aminoácidos;

As cadeias laterais dos aminoácidos se distribuem para fora da hélice

A principal força de estabilização da a - Hélice é a ponte de hidrogênio.

-Folhas Envolve 2 ou mais segmentos

polipeptídicos da mesma molécula ou de moléculas diferentes, arranjados em paralelo ou no sentido anti-paralelo

Os segmentos em folha da proteína adquirem um aspecto de uma folha de papel dobrada em pregas.

As pontes de hidrogênio mais uma vez são a força de estabilização principal desta estrutura

Qual seria Beta Folha?

Estrutura Terciária A estrutura terciária relaciona-se com os

loopings e dobraduras da cadeia protéica sobre ela mesma.

É a conformação espacial da proteína, como um todo, e não de determinados segmentos particulares da cadeia protéica.

A forma das proteínas está relacionada com sua estrutura terciária.

Estrutura Terciária

2CBJ

-Hélice

-Folhas

Loop

Estrutura Quaternária

Hemoglobina

Previsão de Estrutura de Proteínas

Experimental

Raios X

RMN

Cerca de 10 a 14 mil estruturas em repositórios públicos

Teórico

102.000 mil estruturas primárias

Homologia

Ab initio

Por que modelar proteínas?

Dificuldade em se obter estruturas experimentais;

Custo elevado

Por que modelar proteínas?

Informações Obtidas Através da Estrutura 3DOrganização estrutural

Estudos sobre o comportamento dos resíduos

Propriedades eletrostáticas dos sítios ativos de enzimas

Informações Obtidas Através da Estrutura 3DInformações funcionais

Estudos sobre a natureza da ligação

Localização da região de ligação

Seleção de alvos moleculares para o desenvolvimento de drogas e vacinas

Modelagem por HomologiaA ferramenta mais bem sucedida de predição de

estruturas tridimensionais de proteínas é a modelagem por homologia, também conhecida como modelagem comparativa.

As proteínas agrupam-se em um número limitado de famílias tridimensionais. Estima-se que existam cerca de 5.000 famílias protéicas.

Conseqüentemente, quando se conhece a estrutura de pelo menos um representante de uma família, é geralmente possível modelar, por homologia, os demais membros da família.

Mioglobina

Em função do número de mutações envolvidas, as seqüências de aminoácidos de proteínas homólogas podem ser, idênticas, semelhantes ou dissemelhantes.

Modelagem por Homologia Esta abordagem baseia-se em alguns padrões gerais que

têm sido observados, em nível molecular, no processo de evolução biológica:

Homologia entre seqüências de aminoácidos implica em semelhança estrutural e funcional;

Proteínas homólogas apresentam regiões internas conservadas (principalmente constituídas de elementos de estrutura secundária: -Hélice e -Folhas;

As principais diferenças estruturais entre proteínas homólogas ocorrem nas regiões externas, constituídas principalmente por alças ("loops"), que ligam os elementos de estruturas secundárias.

Modelagem por HomologiaA modelagem de uma proteína (proteína-

problema) pelo método da homologia baseia-se no conceito de evolução molecular.

Isto é, parte-se do princípio de que a semelhança entre as estruturas primárias desta proteína e de proteínas homólogas de estruturas tridimensionais conhecidas (proteínas-molde) implica em similaridade estrutural entre elas.

MODELAGEM MOLECULAR POR HOMOLOGIA ESTRUTURAL

• Geralmente, o processo de obtenção de um modelo protéico virtual através da execução da estratégia da modelagem molecular por homologia estrutural envolve quatro etapas principais.

Identificação dos moldes

Alinhamento de sequências

Construção da cadeia principal das regiões conservada

Modelagem das alças

Modelo primitivo

Otimização e validação

OK? FIMsimnão

Alinhamento das seqüências

Construção dos modelos

Validação dos Modelos

Busca por proteínas Homólogas

Identificação e seleção de proteínas-molde

(a) conhece-se a família protéica a que pertence a proteína-problema;

(b) não se sabe a que família a proteína-problema pertence.

Se o grau de identidade entre as estruturas primárias das proteínas-molde e da proteína–problema for igual ou superior a cerca de

25%, quando o número de resíduos é superior a 80, existe grande probabilidade de que estas proteínas tenham estruturas tridimensionais semelhantes.

Alinhamento das seqüências de resíduos de aminoácidos

Construção do modeloModelagem das regiões estruturalmente

conservadas;

Modelagem das regiões de alças (loop);

Modelagem das cadeias laterais;

Otimização do modelo gerado.

Validação do modeloA qualidade estereoquímica do modelo é de

importância fundamental. O programa mais utilizado na avaliação dos parâmetros estereoquímicos, o PROCHECK.

O gráfico de Ramachandran é particularmente útil porque ele define os resíduos que se encontram nas regiões energicamente mais favoráveis e desfavoráveis e orienta a avaliação da qualidade de modelos teóricos ou experimentais de proteínas.

Ramachandran

RMSDO parâmetro mais comum que expressa a diferença entre duas estruturas protéicas é o RMSD, ou desvio médio quadrático, em posições atômicas entre as duas estruturas.

Isoformas (classificação):

Calpaínas

Isoforma Domínios EF-Hand

Tecido Doença

Calpaína 1 e 2 (µ,m)

+ Ubíquas AVE, IAM

Calpaína 3 + Músculo-esquelético

Distrofia muscular

Calpaína 6 - Útero e placenta

SOP

Calpaína 9 + Aparelho digestivo

Câncer

Calpaína 10 - Ubíqua Diabetes

SILVA, 2012

SILVA, 2012

SILVA, 2012

www.bioinform

Alpha Helix for Linus Pauling (2004)Escultura de Julian Voss-Andreae3 m de altura, revestida de aço.

Portland, EUA

Fonte: http://en.wikipedia.org

OBRIGADO

B. Rost (2001) Protein secondary structure prediction continues to rise. Journal of Structural Biology, 134, pp. 204-218 (Columbia University).

Bystroff, C., Thorsson, V. & Baker, D. (2000). HMMSTR: a hidden Markov model for local sequence-structure correlations in proteins. J. Mol. Biol., 301, 173-190 (University of Washington)

Cuff, J. A., Clamp, M. E., Siddiqui, A. S., Finlay, M. & Barton, G. J. (1998). JPred: a consensus secondary structure prediction server. Bioinformatics, 14, 892-893 (JPred – Oxford/Cambridge)

Cuff, J. A. & Barton, G. J. (2000). Application of multiple sequence alignment profiles to improve protein secondary structure prediction. Proteins, 40, 502-511 (JPred2)

Rost, B. (1996). PHD: predicting one-dimensional protein structure by profile based neural networks. Meth. Enzymol., 266, 525-539. (PHD – Heidelberg – Germany)

Referências

Referências Donald Voet; Judith G. Voet; Charlotte W. Pratt, Funadmentos de

BIOQUÌMICA A vida em nível molecular 2ª ed., 2006. Lehninger Principles of Biochemistry Princípios de Bioquímica ( Lehninger ) - 4ª edição - LEHNINGER,

ALBERT L. , COX, NELSON, KAY YARBOROUGH. Przybylski, D. & Rost, B. (2000). PSI-BLAST for structure prediction: plug-in

and win. Columbia University (PHDPsi) Rost WWW, B. (2000). Better secondary structure prediction through more

data. Columbia University, WWW document (http://cubic.bioc.columbia.edu/predictprotein) (PROF)

Altschul, S., Madden, T., Shaffer, A., Zhang, J., Zhang, Z. et al. (1997). Gapped Blast and PSI-Blast: a new generation of protein database search programs. Nucl. Acids Res., 25, 3389-3402. (PSI-BLAST – USA)

Jones, D. T. (1999). Protein secondary structure prediction based on position-specific scoring matrices. J. Mol. Biol., 292, 195-202 (PSIPRED – Warwick)