Biologia Estrutural - Laboratory of BioMolecular Systems · alguma informação estrutural, visto...

32
Biologia Estrutural Solução do Problema da Fase Prof. Dr. Walter Filgueira de Azevedo Jr. wfdaj.sites.uol.com.br © 2006 Dr. Walter F. de Azevedo Jr.

Transcript of Biologia Estrutural - Laboratory of BioMolecular Systems · alguma informação estrutural, visto...

Biologia EstruturalSolução do Problema da Fase

Prof. Dr. Walter Filgueira de Azevedo Jr.

wfdaj.sites.uol.com.br © 2006 Dr. Walter F. de Azevedo Jr.

wfdaj.sites.uol.com.br © 2006 Dr. Walter F. de Azevedo Jr.

IntroduçãoProblema da faseFunção de PattersonAplicação da função de PattersonMétodo da Substituição Isomórfica Múltipla (MIR)Substituição molecularOutros métodosReferências

Resumo

CristalizaçãoColeta de dados

LNLSDifração de raios X

Resolução da estrutura

cristalográficaAnálise

wfdaj.sites.uol.com.br © 2006 Dr. Walter F. de Azevedo Jr.

Problema da Fase

Vimos que ao realizarmos a coleta de dados difração de raios X, obtemos informações sobre as intensidades difratadas para cada reflexão I(hkl), sendo que a intensidade é proporcional ao módulo do fator de estrutura, como segue:

I(hkl) α |F(hkl)|2

wfdaj.sites.uol.com.br © 2006 Dr. Walter F. de Azevedo Jr.

Problema da Fase

Mas a informação sobre a fase de cada reflexão é perdida no processo de registro da informação. Para o cálculo da função densidade eletrônica é necessário o termo de fase. A obtenção da fase para os fatores de estrutura é chamada solução do problema da fase.

Os dois principais métodos para a solução do problema da fase para cristais de macromoléculas biológicas serão discutidos na presente aula.

wfdaj.sites.uol.com.br © 2006 Dr. Walter F. de Azevedo Jr.

ρ(xyz) = (1/V)Σ Σ Σ |F(hkl)| exp {-2πi [(hx + ky+ lz) - α’(hkl)]} h k l

wfdaj.sites.uol.com.br © 2006 Dr. Walter F. de Azevedo Jr.

Função de Patterson

A função de Patterson é dada pela somatória de Fourier dos módulos dos fatores de estrutura, como indicado na equação abaixo:

A função de Patterson é calculada para cada coordenada fracionária uvw. Fisicamente esta função é um mapa de vetores entre átomos, há um pico na função de Patterson para cada vetor interatômico. A grande vantagem da função de Patterson, é que a mesma não necessita de informação sobre a fase dos fatores de estrutura, e fornece alguma informação estrutural, visto que a partir da interpretação do mapa de Patterson (a representação gráfica da função de Patterson) podemos obter informação sobre posição dos átomos.

P(uvw) = Σ Σ Σ |F(hkl)|2 cos {2π[(hu + kv+ lw)} h k l

wfdaj.sites.uol.com.br © 2006 Dr. Walter F. de Azevedo Jr.

Função de Patterson

Consideremos uma cela unitária bidimensional, com apenas 2 átomos, como representado na figura da esquerda. A função de Patterson é uma representação dos vetores interatômicos, ou seja, apresentará valores diferentes de zero somente para valores de uvw que indiquem distâncias interatômicas, assim a representação gráfica da função de Patterson, da cela unitária bidimensional é representada à direita.

u

uu

uu

uu

uu

wfdaj.sites.uol.com.br © 2006 Dr. Walter F. de Azevedo Jr.

Função de Patterson

Vamos considerar agora um exemplo numérico. Seja uma cela unitária tridimensional com dois átomos, com as seguintes coordenadas fracionárias: Átomo 1: 0,20, 0,31, 0,33 e Átomo 2: 0,15, 0,18, 0,22. Haverá um máximo da função de Patterson para o vetor interatômico, como segue:

Átomo 1: 0,20, 0,31, 0,33 Átomo 2: 0,15, 0,18, 0,22

Pico do mapa de Patterson:

u = x1 – x2 = 0,20 – 0,15 = 0,05

v = y1 – y2 = 0,31 – 0,18 = 0,13

w = z1 – z2 = 0,33 – 0,22 = 0,11

wfdaj.sites.uol.com.br © 2006 Dr. Walter F. de Azevedo Jr.

Aplicação da Função de Patterson

A função de Patterson permite a localização de átomos pesados em estrutura de cristais. Consideremos como exemplo um cristal de organometálico, onde temos um átomo de platina, como na estrutura do composto trans-dicloro[(trietilfosfina)(2-metilsulfinil)piridina)] platina (II), onde o átomo de platina está ligado a dois átomos de cloro e dois enxofres. O pico mais alto do mapa de Patterson dará indicação do vetor interatômico Pt-Pt, como só temos um átomo de platina, a distância será entre duas platinas relacionadas por simetria. Esta estrutura foi relatada por De Azevedo et al. 1995, o cristal é do grupo espacial P21/c, onde temos átomos nas seguinte posições:

1) x, y, z2) -x, -y, -z3) -x, y+1/2, -z+1/24) x, -y+1/2, z+1/2

Pt

ClCl

S S

CH 2 CH 2

OO

CH 2 CH 2

CH 2

CH 3

CH 2

H 3 C

wfdaj.sites.uol.com.br © 2006 Dr. Walter F. de Azevedo Jr.

Aplicação da Função de Patterson

As distâncias entre os átomos, relacionados por simetria será dada por:

Relação Diferença Coordenadas interatômicasA 1-2 ou 3-4 ±2x ±2y ±2zB 1-4 ou 2-3 0 ±2y± ½ ± ½C 1-3 ou 2-4 ±2x ½ ±2z± ½

Pt

ClCl

S S

CH 2 CH 2

OO

CH 2 CH 2

CH 2

CH 3

CH 2

H 3 C

Fonte: De Azevedo, W. F., Mascarenhas, Y. P., Sousa, G. F. and Filgueiras, C. A. L.

Acta Crystallogr. Sect.C - Cryst. Struct. Commun., 51, 619-621, 1995.

wfdaj.sites.uol.com.br © 2006 Dr. Walter F. de Azevedo Jr.

Aplicação da Função de Patterson

A partir dos dados de difração de raios X calculamos os picos do mapa de Patterson, que estão listados a seguir:

Número do pico x y z1 0,000 0,100 0,5002 0,238 0,500 0,7063 0,239 0,400 0,206...

Pt

ClCl

S S

CH 2 CH 2

OO

CH 2 CH 2

CH 2

CH 3

CH 2

H 3 C

Fonte: De Azevedo, W. F., Mascarenhas, Y. P., Sousa, G. F. and Filgueiras, C. A. L.

Acta Crystallogr. Sect.C - Cryst. Struct. Commun., 51, 619-621, 1995.

wfdaj.sites.uol.com.br © 2006 Dr. Walter F. de Azevedo Jr.

Aplicação da Função de Patterson

Considerando-se o pico 2, localizamos as coordenadas fracionárias x e z a partir da relação C, como segue:2 x = 0,238 → x = 0,119-2 z + 0,500 = 0,706 → z = 0,603

Número do pico x y z1 0,000 0,100 0,5002 0,238 0,500 0,7063 0,239 0,400 0,206...

Pt

ClCl

S S

CH 2 CH 2

OO

CH 2 CH 2

CH 2

CH 3

CH 2

H 3 C

Fonte: De Azevedo, W. F., Mascarenhas, Y. P., Sousa, G. F. and Filgueiras, C. A. L.

Acta Crystallogr. Sect.C - Cryst. Struct. Commun., 51, 619-621, 1995.

wfdaj.sites.uol.com.br © 2006 Dr. Walter F. de Azevedo Jr.

Aplicação da Função de Patterson

Considerando-se agora o pico 1, localizamos a coordenada fracionária y partir da relação B, como segue:-2 y + 0,500 = 0,100 → y = 0,200

Número do pico x y z1 0,000 0,100 0,5002 0,238 0,500 0,7063 0,239 0,400 0,206...

Pt

ClCl

S S

CH 2 CH 2

OO

CH 2 CH 2

CH 2

CH 3

CH 2

H 3 C

Fonte: De Azevedo, W. F., Mascarenhas, Y. P., Sousa, G. F. and Filgueiras, C. A. L.

Acta Crystallogr. Sect.C - Cryst. Struct. Commun., 51, 619-621, 1995.

wfdaj.sites.uol.com.br © 2006 Dr. Walter F. de Azevedo Jr.

Aplicação da Função de Patterson

A função de Patterson permite a localização de átomos pesados em estrutura de cristais de pequenas moléculas. Para macromoléculas biológicas sua aplicação restringe-se à determinação da posição de átomos pesados inseridos em cristais de proteínas, como será discutido no método de substituição isomórfica.

wfdaj.sites.uol.com.br © 2006 Dr. Walter F. de Azevedo Jr.

Método da Substituição Isomórfica Múltipla (MIR)

A primeira estrutura de proteína resolvida foi a mioglobina em 1959. Essa estrutura foi resolvida por Kendrew e Perutz. Para a resolução da estrutura cristalográfica da mioglobina foi usado o método de substituição isomórfica múltipla. Este método usa uma abordagem reducionista para a solução do problema da fase. Podemos pensar no cristal de proteína como um “mar”, quase homogêneo, de densidade eletrônica. Num mapa como este, a inclusão de densidades eletrônicas maiores destacariam-se, no mar de densidade eletrônica. Tal efeito é obtido com a inclusão de metais pesados no cristal. Tal inclusão, permite a obtenção de informações iniciais sobre a fase, que permitem a solução do problema da fase. Num experimento típico de substituição isomórfica, coletamos dados de difração de raios X de um cristal nativo, sem metal pesado adicionado ao retículo cristalino, e outros conjuntos de dados com metais pesados adicionados ao retículo cristalino, chamados derivados isomorfos. Assim, temos pelo menos dois conjuntos de dados de difração de raios X: um nativo e outro com metal pesado.

wfdaj.sites.uol.com.br © 2006 Dr. Walter F. de Azevedo Jr.

Método da Substituição Isomórfica Múltipla (MIR)

Chamaremos de FP o fator de estrutura do cristal nativo, sendo que este fator de estrutura apresenta fase αP. O fator de estrutura FPH é o fator de estrutura do derivado com metal pesado, que apresenta fase αPH. Vetorialmente temos que o fator de estrutura FPH é dado por:

FPH = FP + FH

Como ilustrado no diagrama.

Eixo real

FPH

FH

FP

Eixo imaginário

AB

O

wfdaj.sites.uol.com.br © 2006 Dr. Walter F. de Azevedo Jr.

Método da Substituição Isomórfica Múltipla (MIR)

Analisando-se o triângulo OAB temos: αP - αPH + [180o – ( αP - αH )] + γ = 180o

γ = αPH - αH . Pela lei dos cossenos temos:

|FPH|2 = |FP|2 + |FH|2 - 2|FP| |FH|cos[180o – (αP - αH)]

|FPH|2 = |FP|2 + |FH|2 + 2|FP| |FH|cos[(αP - αH)]

(|FPH|2 - |FP|2 - |FH|2 )

2|FP| |FH|

(|FPH|2 - |FP|2 - |FH|2 )

2|FP| |FH|Eixo real

FPH

FH

FP

AB

O

αPHαP

γαP - αH

αH

αPH - αH

[ ]αP - αH = arcos

cos[(αP - αH)] =

wfdaj.sites.uol.com.br © 2006 Dr. Walter F. de Azevedo Jr.

Método da Substituição Isomórfica Múltipla (MIR)

Assumindo-se que medimos FPH e FP e que sabemos a posição dos átomos pesados na cela unitária do cristal, ou seja, podemos determinar FH e αH, temos que as fases dos fatores de estrutura da proteína αP são dados por:

(|FPH|2 - |FP|2 - |FH|2 ) 2|FP| |FH|

Ou seja:

αP = αH ± α’

Há dois valores possíveispara αP

Eixo real

FPH

FH

FP

AB

O

αPHαP

γαP - αH

αH

αPH - αH[ ]αP = αH + arcos

wfdaj.sites.uol.com.br © 2006 Dr. Walter F. de Azevedo Jr.

Método da Substituição Isomórfica Múltipla (MIR)

A ambiguidade na determinação da fase αP pode ser ilustrada graficamente seguindo-se um diagrama proposto por Harker em 1956. Como mostrado na figura abaixo.

A construção de Harker é obtida da seguinte forma. Inicialmente traçamos o vetor –FH a partir da origem O. O final do vetor –FH

determina a origem de A, de onde traçamos uma circunferência de raio FPH, desenhamos uma segunda circunferência de raio FP

com centro em O. Há geralmente dois pontos de intersecção entre as duas circunferências, indicando a ambiguidade na determinação da fase αP.

FPH

-FH

FP

Eixo real

A

D

Eixo imaginário

C

O

wfdaj.sites.uol.com.br © 2006 Dr. Walter F. de Azevedo Jr.

Método da Substituição Isomórfica Múltipla (MIR)

Os vetores OB e OC indicam dois valores possíveis para o fator de estrutura da proteína nativa (FP). Destacamos, que inicialmente só sabemos os módulos FP, FPH e a fase (αH) e o módulo do fator de estrutura para o átomo pesado. Vimos anteriormente que: FPH = FP

+ FH (soma vetorial), como o objetivo é a determinação do vetor FP, assim isolando-se FP, temos: FP = FPH – FH, esta é a razão de representarmos graficamente o –FH na construção de Harker.

FPH

-FH

FP

Eixo real

A

D

Eixo imaginário

C

O

wfdaj.sites.uol.com.br © 2006 Dr. Walter F. de Azevedo Jr.

Método da Substituição Isomórfica Múltipla (MIR)

A informação do átomo pesado é obtida pelo método de Patterson. Para acabarmos a ambiguidade necessitamos de informação adicional, que pode ser obtida com a coleta de dados de raios X de um terceiro conjunto, com átomos pesados inseridos no retículo cristalino.

FP = FPH – FH

FPH

-FH

FP

Eixo real

A

D

Eixo imaginário

C

O

wfdaj.sites.uol.com.br © 2006 Dr. Walter F. de Azevedo Jr.

Método da Substituição Isomórfica Múltipla (MIR)

A inclusão da informação, de um segundo derivado de átomo pesado, acaba com a ambiguidade na determinação do termo de fase. A circunferência referente ao FPH2

cruza a circunferência do FP em dois pontos (E e F), sendo que E coincide com C. Contudo, vale destacar, que o diagrama de Harker ilustra uma situação idealizada. Conjuntos de dados de difração de raios X reais apresentam erros, e tais erros podem ser interpretados como um circunferência com o traço espesso, que gera uma certa indeterminação no valor exato da fase, muitas vezes faz-se necessário a coleta de vários derivados isomorfos, para a determinação da fase.

-FH2

FPH2

FPH

-FH

FP

Eixo real

O

A

D

Eixo imaginário

C≡E

F

wfdaj.sites.uol.com.br © 2006 Dr. Walter F. de Azevedo Jr.

Substituição Molecular

O crescimento do número de estruturas de proteínas resolvidas gerou uma vasta base de dados estruturais, armazenadas no PDB (protein data bank) (www.rcsb.org/pdb). Partindo-se do pressuposto que proteínas que compartilham alta identidade na estrutura primária, apresentam o mesmo enovelamento, Rossmann propôs em 1962 um método onde as informações sobre a fase de uma proteína, com estrutura 3D desconhecida, mas que apresentasse estrutura primária similar com outra resolvida, poderia usar as informações estruturais da proteína resolvida como informação inicial. Tal método é chamado de substituição molecular.

wfdaj.sites.uol.com.br © 2006 Dr. Walter F. de Azevedo Jr.

Substituição Molecular

O fluxograma a seguir ilustra o principais passos na resolução de uma estrutura de proteína a partir do método de substituição molecular. Para o uso do método da substituição molecular, recomenda-se realizar uma procura no PDB usando-se a sequência de aminoácidos da estrutura a ser determinada e selecionar, entras as estruturas resolvidas, a que apresentar mais alta identidade. Há outros fatores a serem considerados tais como: Resolução dos dados de difração do modelo, presença ou não de ligantes e estado oligomérico.

wfdaj.sites.uol.com.br © 2006 Dr. Walter F. de Azevedo Jr.

Substituição Molecular

Arquivo PDB de proteína similar. Dados de difração de raios Xda nova proteína (Fobs)

Cálculo do fator de Estrutura (Fcalc)

Rotação e translação domodelo

Cálculo do Coeficientede Correlção

Listagem da rotação, translação e CC

wfdaj.sites.uol.com.br © 2006 Dr. Walter F. de Azevedo Jr.

Substituição Molecular

A procura de rotação e translação é uma busca com 6 graus de liberdades, se realizarmos as duas buscas concomitantemente teremos um alto custo computacional. Consideremos que temos 10 posições para cada ângulo e 10 posições para cada eixo de translação. Teremos neste caso 106 cálculos, dividindo-se em busca de rotação primeiro e em seguida a busca de translação teremos 103 cálculos para rotação e 103

cálculos para translação, ou seja, 2000 cálculos, uma redução considerável. Suponha que cada cálculo demore 1 s de CPU, para o cálculo dividindo-se a busca em rotação e translação teremos 2000 s, pouco mais de meia hora, para a procura concomitante teremos 1.000.000 de segundos 277,77 horas (mais de 11 dias!!!).

REMARK Written by O version 5.10.2REMARK Sun Feb 25 14:05:51 1996REMARK Walter F. de Azevedo Jr.CRYST1 72.307 73.069 54.284 90.00 90.00 90.00ORIGX1 1.000000 0.000000 0.000000 0.00000ORIGX2 0.000000 1.000000 0.000000 0.00000ORIGX3 0.000000 0.000000 1.000000 0.00000SCALE1 0.013830 0.000000 0.000000 0.00000SCALE2 0.000000 0.013686 0.000000 0.00000SCALE3 0.000000 0.000000 0.018422 0.00000ATOM 1 CB MET 1 103.933 112.272 94.785 1.00 50.37 6ATOM 2 CG MET 1 104.548 112.540 96.126 1.00 55.72 6ATOM 3 SD MET 1 106.336 112.671 95.934 1.00 62.79 16ATOM 4 CE MET 1 106.542 114.250 95.159 1.00 54.71 6ATOM 5 C MET 1 103.199 114.420 93.762 1.00 47.20 6ATOM 6 O MET 1 102.995 114.577 92.561 1.00 51.55 8ATOM 7 HT1 MET 1 102.092 112.026 92.841 1.00 0.00 1ATOM 8 HT2 MET 1 100.857 112.905 93.606 1.00 0.00 1ATOM 9 N MET 1 101.710 112.330 93.759 1.00 48.54 7ATOM 10 HT3 MET 1 101.467 111.494 94.328 1.00 0.00 1ATOM 11 CA MET 1 102.732 113.140 94.479 1.00 47.79 6ATOM 12 N GLU 2 103.906 115.275 94.503 1.00 44.44 7ATOM 13 H GLU 2 104.333 114.933 95.316 1.00 0.00 1ATOM 14 CA GLU 2 104.085 116.695 94.178 1.00 40.49 6ATOM 15 CB GLU 2 104.531 117.459 95.428 1.00 43.49 6ATOM 16 CG GLU 2 103.464 117.597 96.515 1.00 52.62 6

wfdaj.sites.uol.com.br

|Fcalc (hkl)| = { [Σ fj cos (2π (hxj + kyj + lzj) ]2

+ [Σ fj sen (2π (hxj + kyj + lzj) ]2 }1/2

j=1

N

j=1

N

{Xj + Yj + Zj

© 2006 Dr. Walter F. de Azevedo Jr.

A partir das coordenadas atômicas podemos determinar os fatores de estrutura, usando-se a equação ao lado.

Substituição Molecular

wfdaj.sites.uol.com.br © 2006 Dr. Walter F. de Azevedo Jr.

Substituição Molecular

Modelo alfa(o) beta(o) gama(o) Tx Ty Tz CC1 0 0 0 0 0 0 0,122 10 0 0 0 0 0 0,05.......

O coeficiente de correlação é um indicador estatístico, que assume valores próximos a 1 quando há correlação, e valores próximos a 0 quando não há correlação. Para seu usoem cristalografia, este é calculado usando-se os fatores de estrutura calculados (Fcalc) e os fatores de estrutura observados (Fobs). Os Fcalc são obtidos diretamente das coordenadas atômicas do modelo de busca, e os Fobs do experimento de difração de raios X. As coordenadas atômicas do modelo de busca são submetidas a rotações e translações. Para cada nova posição é calculado o Fcalc e um novo coeficiente de correlação. Esta informação é armazenada, assim no final temos uma listagem com as seguintes informações.

wfdaj.sites.uol.com.br © 2006 Dr. Walter F. de Azevedo Jr.

Substituição Molecular

O coeficiente de correlação é dado pela seguinte equação:

CC = Σ ab – (Σ a Σ b)/N

{ [ Σ a2 – (Σ a)2/N ]1/2 } { [ Σ b2 – (Σ b)2/N ]1/2 }

Onde a = |Fobs| e b = |Fcalc|

wfdaj.sites.uol.com.br © 2006 Dr. Walter F. de Azevedo Jr.

Substituição Molecular

Para solução da estrutura, usando-se o método da substituição molecular, faz-se necessário somente um conjunto de dados de difração de raios X. Tal vantagem possibilita que a estrutura seja obtida de forma mais rápida que quando aplicamos o método de substituição isomórfica, contudo, nem sempre é possível aplicar-se o método de substituição molecular, mesmo quando há alta identidade entre a estrutura e o modelo de busca, as principais causas de insucesso do método de subsituição molecular são as seguintes:

3) Diferenças devido ao empacotamento cristalino4) Diferenças devido ao estado oligomérico5) Baixa qualidade estrutural do modelo de busca6) Baixa qualidade dos dados de difração de raios X

wfdaj.sites.uol.com.br © 2006 Dr. Walter F. de Azevedo Jr.

Outros Métodos

Há ainda dois outros método usados na solução do problema da fase:

3) Métodos diretos4) Dispersão anômala

Drenth, J. (1994). Principles of Protein X-ray Crystallography. New York: Springer-Verlag.

Rhodes, G. (2000). Crystallography Made Crystal Clear. 2nd ed.San Diego: Academic Press.

Stout, G. H. & Jensen, L. H. (1989). X-Ray Structure Determination. A Practical Guide. 2nd ed. New York: John Wiley & Sons.

Referências

wfdaj.sites.uol.com.br © 2006 Dr. Walter F. de Azevedo Jr.