ABC do Folding de Proteínas Globulares
description
Transcript of ABC do Folding de Proteínas Globulares
ABC do Folding de Proteínas Globulares
Um dos grandes desafios atuais da Biologia
Estrutural.
Física Biológica
Departamento de Física e Química
FFRP – USP
A. Caliri
Porque o Problema do Folding é importante?
2)- Já se conhece a constituição básica de cerca de 300.000 proteínas (tarefa rápida e cada vez mais barata), mas somente 10% delas tem sua estrutura 3-D determinadas experimentalmente por difração de R-X e NMR (processos lentos e caros).
. . . ARQUIVO MORTO !!!
1)- Admite-se que a estrutura 3-D de muitas moléculas biológicas seja determinante para o funcionamento pleno.
1TSK – Toxina de escorpião
35 aminoácidos; 518 átomos
Do que se trata, afinal, o Problema do Folding ?
Em resumo: Previsão da estrutura tridimensional de uma (macro)molécula biológica, dado que sua constituição atômica básica seja conhecida.
Especificando para uma Proteína
Estrutura Primária(Seqüência de aminoácidos) Estrutura 3-D
REPRESENTAÇÃO ESQUEMÁTICA
Como e do que as proteínas são
formadas?
elementos básicos, singelos
In vivo
Leo / 2001
Como uma proteína é fabricada?
A maquinaria biológica envolvida no encadeamento de aminoácidos
A MaquinariaBiológica
O código genético
Cada terno de bases nitrogenadas(U, C, A e G), chamado códon, corresponde a um aminoácido.
Tabala dos tripletes
Um gene Uma proteína?Porém, as proteínas a serem produzidas dependem das circunstâncias.
Potencialmente temos que (possibilidades combinatoriais):
2 genes 2 + 1 = 3 proteínas; 3 genes 3 + 3 + 1 = 7 proteínas; ...
n genes { n + n (n - 1) / 2! + n (n - 1) (n - 2) / 3! + ... + n + 1} proteínas
Seq A + Seq B Seq AB; sempre ??
Brain
MAS ... de fato, através da análise, e do método tem-se abarcado, e de certa forma resolvido, muitos problemas antes tidos mesmo como impensáveis. Apesar de que nem todos os problemas sejam suscetíveis à análise: a soma das partes nem sempre resulta no todo.
Problemas biológicos são, em geral muito complexos; pelo menos a primeira vista.
Porem, hoje contamos com uma ferramenta adicional: O COMPUTADOR ELETRÔNICO
(... depois, o ótico, o quântico, ...)
ABC do Folding de Proteínas Globulares
MÉTODO INTUITIVO PARA ABARCAR PROBLEMAS COMPLEXOS
1)- Iniciar com o caso mais simples do problema em foco. Exemplo: Se o objeto de estudo é uma aeronave, escolhemos inicialmente um ultra-leve, ao invés de um Jumbo.
2)- Focar especificidades do problema (todo problema é redutível até um certo grau). Exemplo: O tópico “aerodinâmica” pode ser focado especificamente num determindo tópico; todos os outros aspectos do problema (a eletrônica por exemplo) pode ser isolado.
3)- Simplificar o problema, evitando detalhes desnecessários (mas nem sempre é fácil: arte!) Exemplo:
Poder das pontas (eletrostática):
Fração de 3% de uma única
molécula de DNA constituinte de
um dos 46 cromossomos presentes na
célula humana.
Como simplificar o problema do folding de proteínas, no sentido de melhorar o entendimento do processo?
... seguimos os três passos enunciados: consideramos o caso das proteínas pequenas de s20 a s100 aminoácidos; focamos tópicos específicos do problema; e procuramos simplificar o problema.
Um tipo de abordagem:
Usar Modelos Computacionais simplificados
O tópico é:Saber relacionar a seqüência de aminoácidos da proteína com
sua Estrutura 3-D.
Será que conseguimos criar um sistema
simplificado para o qual posso encontrar a solução
para o tópico isolado acima?
Diversas representações simplificadas de uma mesma proteína
20 aminoácidos (especificidades estereoquímicas)
Moléculas do solvente
Cadeia com 27 unidades
Esquema do processo de folding
Representação Esquemática de uma cadeia
Representação Esquemática do processo de folding
Representação Esquemática de uma cadeia
Representação Esquemática do processo de folding
SINTAXE:
Dada uma estrutura nativa, qual a seqüência de aminoácidos?
r(0): R
r(3): C
r(1,1): A
r(1,2): H
r(2,1): B
r(2,2): G
r(2,3): F
r(2,4): I
r(2,5): E
r(2,6): D
},{
},{),,(,, )()},{(ji
lkjijiji chlkE
AD
D AA
BC
F
DAC
C
C
B
B
CC
B
B
B F
CCB
A
A
R
Design para a estrutura nativa: ADADA DAFCB CBCBC BCBCB CBCFA RA
Uma das questões atuais :
Taxa de Folding kf(“velocidade” com que as proteínas se enovelam)
Existe correlação entre parâmetros topológicos da nativa e log kf de pequenas proteínas e quando a cinética do folding pode
serdescrita como a cinética de sistemas de dois estados: N e U)
Plaxco, Simons, Baker J.Mol.Biol, 287, 985,1998
Kaya, Chan Proteins, 52, 524, 2003
32/41
RESULTADOS EXPERIMENTAIS E TEÓRICOS
Maritan, Micheletti, BanavarPRL 84, 3009,
2000
Silva, dos Reis, Caliri
To apper in JCP - 2005
Taxa de Folding kf
O MODELO
Modelo utilizado não é nativa-dirigido: possui um alfabeto de dez letras e provê uma regra (sintaxe) para o design da seqüência.
Para Estrutura Nativa são efetuadas 15 simulações independentes, com janela de tempo pré-estabelecida: tw = 3107 passos MC (sucesso: se ti < tw)
Taxa de Folding: representada pelo inverso do tempo médio < ti > requerido para a primeira passagem pela nativa. Alternativamente, utilizou-se a média geométrica dos tempos {ti} para encontrar a nativa.
PROTEÍNAS PEQUENAS: distribuição dos tempos { ti } de enovelamento
Para um conjunto {ti} grande suficiente,
< ti > pode ser aproximado pela média aritmética
O logaritmo comum da taxa de enovelamento é então log kf = < ti >-1
N
iitNt
1
/1
)/exp()( 0tttP
0
0)( tdtttPt
1)( dttP
ttk f log/1log)log(
Propriedade matemática útil
)ln()()ln()ln(0
tdttPtt
)log(.)log()log( ett
Utilidade? a função logarítmica aplicada no conjunto de simulações reduz o efeito das flutuações para amostragens pequenas
15
1
1log.15
1log
iif tkDaí então:
[*STTS*] [*TTTT*] [*TT*]
[*STS*] Snail Staple
Caracterização Topológica das estruturas nativas
Padrões estruturais
29/41 0,238095 0,494709
Caracterização Topológica das estruturas nativasORDEM DE CONTATO RELATIVO: separação média entre os monômeros contatantes, normalizado pelo tamanho da cadeia.
L
l
Nji
c
,.1
2827
.2
n
n = 90, 91, ..., 187n 185
31/41
Determinantes da taxa de enovelamento e “estruturas tipo-secundárias” Simulação com as especificidades estéricas
RESULTADOS
33/41
0,2381 0,2725 0,3333
0,3175 0,3280 0,4153
* Determinantes da taxa de enovelamento`: “estruturas tipo-secundárias”
34/41
RESULTADOS
0,2434 0,2593 0,2619
0,3333 0,4127 0,4524
* Determinantes da taxa de enovelamento: “estruturas tipo-secundárias”
31/41
Determinantes da taxa de enovelamento: “estruturas tipo-secundárias” Simulação com as especificidades estéricas
RESULTADOS
35/41
0,2460 0,3307 0,4841
* Determinantes da taxa de enovelamento e “estruturas tipo-secundárias”
31/41
Determinantes da taxa de enovelamento e “estruturas tipo-secundárias” Simulação com as especificidades estéricas
36/41
0,2381 0,2593 0,3175
0,4048 0,4286 0,4788
* Determinantes da taxa de enovelamento e “estruturas tipo-secundárias”
37/41
* Determinantes da taxa de enovelamento e “estruturas tipo-secundárias”
0,2381 0,2460
CONCLUSÕES
O que seira conteúdo de estruturas tipo-secundária?
Bio-ExATA
December 8, 1999Web posted at: 10:05 a.m. EST (1505 GMT)by Nancy
Weil
If the project succeeds, the computer will be able to handle more than 1 quadrillion operations per second, or one petaflop, which is a million billion floating point operations per second. ...
The first science project earmarked for Blue Gene is to model folding of human proteins. Better understanding of how proteins fold is likely to give medical researchers clues into diseases and possibly into cures, as they learn how it is that particular diseases attack cells. (kilo, mega, giga, tera, .... peta-flop)
Big Blue's SMASHing Blue Gene
(IDG) -- IBM has unveiled plans for "Blue Gene," a $100 million research project to build a supercomputer with 500 times the computing power of today's machines.
The new IBM computer, nicknamed "Blue Gene", will be capable of more than one quadrillion operations a second.
BigBlue
BlueGene
Blue Gene/L
A Metáfora da Linguagem(advertência ...)
Macaco do Léo
A procura pelo entendimento dos mecanismos da Natureza pode ser comparada a seguinte situação análoga:
Imagine um computador cuja interface de comunicação com o ser humano seja apenas o seu Sistema Operacional (Windows, digamos) e mais alguns aplicativos (Office, Fortran,C ...). [S.O. Linguagem.]
Problema: Descobrir como funciona o Hardware em todos os seus níveis: processador, os tipos de memórias, o mouse, o monitor, ... o transistor. [Hardware Natureza]
Leo/2001