JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre...

114
UNIVERSIDADE DE SÃO PAULO INSTITUTO DE FÍSICA DE SÃO CARLOS JOÃO VICTOR DE SOUZA CUNHA Aplicação de Monte Carlo para a geração de ensembles e análise termodinâmica da interação biomolecular. São Carlos 2016

Transcript of JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre...

Page 1: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

UNIVERSIDADE DE SÃO PAULO INSTITUTO DE FÍSICA DE SÃO CARLOS

JOÃO VICTOR DE SOUZA CUNHA

Aplicação de Monte Carlo para a geração de ensembles e análise

termodinâmica da interação biomolecular.

São Carlos

2016

Page 2: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade
Page 3: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

JOÃO VICTOR DE SOUZA CUNHA

Aplicação de Monte Carlo para a geração de ensembles e análise

termodinâmica da interação biomolecular.

Dissertação apresentada ao Programa de

Pós-Graduação em Física do Instituto de

Física de São Carlos, da Universidade de

São Paulo, para obtenção do título de

Mestre em Ciências.

Área de Concentração: Física aplicada

Opção: Biomolecular.

Orientador: Prof. Dr. Alessandro Silva

Nascimento

Versão Corrigida

(versão original disponível na Unidade que aloja o Programa)

São Carlos

2016

Page 4: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade
Page 5: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

Dedico do fundo do meu coração o meu trabalho à

mulher mais forte a qual tive o privilégio de

conhecer e a qual chamo com muito

orgulho de mãe

Page 6: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade
Page 7: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

AGRADECIMENTOS

Penso nos agradecimentos como algo que representa um pouco do agradecimento

que gostaria de falar para pessoas as quais me ajudaram, mas não tive coragem de

dizer.

Em primeiro lugar, agradeço a minha mãe, Adriana, a qual não se eu tentar dizer o

quanto amo e o tudo o que ela representa para mim, toda a dissertação ficaria um

texto minúsculo em comparação a minha dedicatória para ela. Te amo mãe.

Agradeço a minha irmã, a qual a saudade não cabe no peito durante todos esses

anos morando longe, e a qual o abraço e a atenção são insubstituíveis.

Obrigado, Prof. Dr. Alessandro, o qual não só me ajudou, me apoiou, me ensinou

toneladas de conhecimento (não sei se conhecimento pode ser medido em

quilogramas), mas também me ofereceu oportunidades e discussões cientificas

impressionantes sobre termodinâmica e ciência.

Agora, sendo menos formal, digo um imenso valeu para o Prof. Milton Taidi Sonoda,

o Grande Dragão oriental das técnicas lendárias de Bash, Fortran e dinâmicas, e

seu eterno azar nos dados do Catan. Se não fosse você segurando minhas barras

cientificas, o caminho teria sido bem mais tortuoso. Saudades eternas.

E o que falar dos meus amigos da sala 9? Muitas noites de comida, jogos e piadas

nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian.

Galera, um dia nos ganharemos todos os jogos!

Falando nisso, gostaria de dizer o quanto, durante esses dois anos, o quanto eu

enchi a paciência do Erick, mas espero que ele entenda que sempre foi uma forma

de mostrar quão bom amigo e confidente ele foi durante esse período,

#ChiclayoForever.

Quero também agradecer alguns amigos muito especiais, os quais foram chave na

minha graduação e até hoje são grandes companheiros meus: Lucas, Marcelo,

Leon, Hingryd, Jhonas e Ruan. Muitos cafés, muitos domingos no ICMC, muitas

noites de relatório, muitas Lan nights. Obrigado por escutar meus choros das

Page 8: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

disciplinas, que acho que foram em todas, e Marcelo, valeu pela companhia durante

todos esses anos, companheirão dos companheirões..

Assim, se eu tentar citar o nome de todos os meus amigos os quais carrego no

peito, eu vou gastar um espaço substancial e esquecer alguém. Então, eu digo

obrigado pessoalmente (um dia (se eu lembrar)).

Gostaria de agradecer em especial uma pessoa, que é a minha amiga há anos, se

tornou uma das minhas melhores amigas há um tempo e a cada dia que passa, e

que cada dia mais cresce para mim como pessoa e como companheira – é para

você Paola, minha melhor amiga, minha brother.

Agora, mudando um pouco de longitude e latitude, vamos dar uma voltinha no sul da

Califórnia e agradecer amigos eternos: A dupla de ninjas Mike e Brian, que mesmo

sem me conhecer, se tornaram grandes companheiros, nas nossas noites de

salgadinho e cerveja. Obrigado também a “gangue” brasileira dos meus amigos Ana,

Lorene, André, Ítalo, Thiago, Aline, Hamanda e Priscila, os quais formaram minha

“home far from home”. Em especial, agradeço uma grande amiga que está do outro

lado do atlântico, mas que os momentos que passamos juntos sempre carregarei,

obrigado France.

Agradeço profundamente (Mais profundamente que a Fossa das Marianas) o Prof.

Dr. Michael K. Gilson, meu supervisor na UCSD, que além da força e da

oportunidade oferecida, me ensinou muito do que sei hoje.

Antes de terminar, gostaria de agradecer a Dra. Joci Neuby, minha orientadora de

IC, que mesmo que eu tenha mudado de área (por culpa da minha falta de

coordenação motora) tenho comigo os ensinamentos de competência, seriedade e

assiduidade com o trabalho, sendo que mesmo eu não pondo minhas mãos num

AKTA de novo, esses ensinamentos eu carrego para qualquer área.

Agradeço ao pessoal do serviço de pós-graduação, Sílvio e Ricardo, pela atenção e

dedicação.

Agradeço ao IFSC pela infraestrutura.

Agradeço à FAPESP pela bolsa de mestrado concedida e à CAPES e ao CNPq pelo

auxílio financeiro para o desenvolvimento deste projeto.

Page 9: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

“Apertem os cintos, pois iniciaremos

os procedimentos para decolagem “

(Instruções de Voo)

Page 10: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade
Page 11: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

RESUMO

CUNHA, J. V. S. Aplicação de Monte Carlo para a geração de ensembles e análise termodinâmica da interação biomolecular. 2016. 112 p. Dissertação (Mestrado em Ciências) – Instituto de Física de São Carlos, Universidade de São Paulo, São Carlos, 2016.

As interações moleculares, em especial as de caráter não-covalente, são

processos-chave em vários aspectos da biologia celular e molecular, desde

a comunicação entre as células ou da velocidade e especificidade das

reações enzimáticas. Portanto, há a necessidade de estudar e criar

métodos preditivos para calcular a afinidade entre moléculas nos

processos de interação, os quais encontram uma gama de aplicações,

incluindo a descoberta de novos fármacos. No geral, entre esses valores

de afinidade, o mais importante é a energia livre de ligação, que

normalmente é determinada por modos computacionalmente rápidos,

porém sem uma forte base teórica, ou por cálculos muito complexos,

utilizando dinâmica molecular, onde mesmo com um grande poder de

determinação da afinidade, é muito custoso computacionalmente. O

objetivo deste trabalho é avaliar um modelo menos custoso

computacionalmente e que promova um aprofundamento na avaliação de

resultados obtidos a partir de simulações de docking molecular. Para esta

finalidade, o método de Monte Carlo é empregado para a amostragem de

orientações e conformações do ligante do sítio ativo macromolecular. A

avaliação desta metodologia demonstrou que é possível calcular

grandezas entrópicas e entálpicas e analisar a capacidade interativa entre

complexos proteína-ligante de forma satisfatória para o complexo lisozima

do bacteriófago T4.

Palavras chave: Energia livre. Interações biomoleculares. Monte Carlo metropolis.

Page 12: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade
Page 13: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

ABSTRACT

CUNHA, J. V. S. Monte Carlo applications for creation of new ensembles and thermodynamic analysis of the biomolecular interaction. 2016. 112 p. Dissertação (Mestrado em Ciências) – Instituto de Física de São Carlos, Universidade de São Paulo, São Carlos, 2016.

The molecular interactions, especially the ones with a non-covalent

nature, are key processes in general aspects of cellular and molecular

biology, including cellular communication and velocity and specificity of

enzymatic reactions. So, there is a strong need for studies and

development of methods for the calculation of the affinity on interaction

processes, since these have a wide range of applications like rational drug

design. The free energy of binding is the most important measure among

the affinity measurements. It can be calculated by quick computational

means, but lacking on strong theoretical basis or by complex calculations

using molecular dynamics, where one can compute accurate results but at

the price of an increased computer power. The aim of this project is to

evaluate a computationally inexpensive model which can improve the

results from molecular docking simulations. For this end, the Monte Carlo

method is implemented to sample different ligand configurations inside

the macromolecular binding site. The evaluation of this methodology

showed that is possible to calculate entropy and enthalpy, along analyzing

the interactive capacity between receptor-ligands complexes in a

satisfactory way for the bacteriophage T4.

Keywords Free energy. Biomolecular interactions. Monte Carlo metropolis.

Page 14: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade
Page 15: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

LISTA DE FIGURAS

Figura 1 – Mortes decorrentes por doenças infecciosas a cada 100,000 habitantes

nos Estados Unidos. ..................................................................................................... 23

Figura 2 – Número de novas entidades moleculares e de pedidos de licença para o

FDA por ano: Pode ser visto que existe uma diminuição razoável no

número de novas entidades moleculares (moléculas sem precedentes

nos fármacos já aceitos). ............................................................................................. 24

Figura 3 – Receita total e gastos com PDI no período entre 2012 e 2015. ................................ 25

Figura 4 – Etapas da descoberta de novos fármacos. ................................................................ 26

Figura 5 – Custo médio e tempo médio gastos para finalização e a aprovação do

fármaco. ......................................................................................................................... 27

Figura 6 – Sítios de ligação dos complexos 185L e 3HTB: A esquerda pode ser

visto o sítio de ligação da estrutura 185L, com ligante indol, o qual não

contem a mutação M102Q.A direita é mostrado o sítio de ligação do

3HTB, com o ligante 2-propilfenol, complexo que conta com a mutação

M102Q. ............................................................................................................................ 46

Figura 7 – Ligantes dos mutantes da lisozima T4 e suas respectivas energias

livres. .............................................................................................................................. 47

Figura 8 – Fluxograma representativo do funcionamento do método Monte Carlo no

software LiBELa. Fonte : Elaborada pelo autor. ........................................................ 50

Figura 9 – Estruturas Representativas do complexo 186L em diferentes

temperaturas e seus respectivos RMSDs, em ciano a estrutura

cristalográfica e em azul a estrutura a 100K e vermelho a estrutura a

300K. ............................................................................................................................... 56

Figura 10 – Gráfico da distribuição de RMSD para o complexo 186L para 100K ....................... 57

Figura 11 – Gráfico da distribuição de RMSD para o complexo 186L para 200K. ...................... 57

Figura 12 – Gráfico da distribuição de RMSD para o complexo 186L para 300K. ...................... 58

Figura 13 – Gráfico da distribuição de RMSD para o complexo 3DMX para 100K. .................... 59

Figura 14 – Gráfico da distribuição de RMSD para o complexo 3DMX para 200K. .................... 59

Figura 15 – Gráfico da distribuição de RMSD para o complexo 3DMX para 300K. .................... 60

Figura 16 – Estrutura do Benzeno no complexo 3DMX; em vermelho (3,2 Å) e em

azul (3,5Å) diferentes passos representativos em diferentes regiões do

espaço de fase, porém com RMSD ~ 3.3 A. Em Destaque o mesmo

carbono em diversas configurações........................................................................... 61

Figura 17 – Efeito da temperatura no complexo 185L. A tirosina 88 tem sua cadeia

lateral ocluída ................................................................................................................ 62

Figura 18 – Gráfico da distribuição de RMSD para o complexo 185L para 100K. ...................... 63

Figura 19 – Gráfico da distribuição de RMSD para o complexo 185L para 200K. ...................... 63

Page 16: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

Figura 20 – Gráfico da distribuição de RMSD para o complexo 185L para 300K. ..................... 64

Figura 21 – Conjuntos representativos para as simulações em diferentes

temperaturas para o complexo 3HTB. Em destaque em bolas e palitos a

hidroxila do ligante e em bastões a estrutura cristalográfica. ................................ 66

Figura 22 – Gráfico da distribuição de RMSD para o complexo 3HTB para 100K. .................... 67

Figura 23 – Gráfico da distribuição de RMSD para o complexo 3HTB para 200k. .................... 67

Figura 24 – Gráfico da distribuição de RMSD para o complexo 3HTB para 300K. .................... 68

Figura 25 – Conjuntos representativos para as simulações em diferentes

temperaturas para o complexo 3HT8. Em destaque em bolas e palitos a

hidroxila do ligante e em bastões a estrutura cristalográfica. ................................ 69

Figura 26 – Gráfico da distribuição de RMSD para o complexo 3HT8 para 100K. .................... 70

Figura 27 – Gráfico da distribuição de RMSD para o complexo 3HT8 para 200K. .................... 71

Figura 28 – Gráfico da distribuição de RMSD para o complexo 3HT8 para 300K. .................... 71

Figura 29 – Diferença entre potenciais e seus respectivos modelos amortecidos. Em

azul o modelo AMBER, sem amortecimento, e em vermelho o modelo

amortecido AMBER. ..................................................................................................... 72

Figura 30 – Amostragem nos modelos AMBER e AMBER amortecido a 100K: O

modelo AMBER amortecido (softcore) permite que o ligante saia do sítio

de interação, sendo barrada somente pela caixa de simulação, ao

contrário do modelo AMBER (Hardcore), que não possibilita a saída do

ligante da região de interação ..................................................................................... 73

Figura 31 – Gráfico de barras para análise da Covariação dos valores de energias

médias de Monte Carlo. ............................................................................................... 75

Figura 32 – Gráfico de barras para análise da Covariação dos valores de energias

médias de Monte Carlo com filtragem. ...................................................................... 75

Figura 33 – Gráfico de barras para análise da Covariação dos valores de energias

médias de Monte Carlo. ............................................................................................ 77

Figura 34 – Gráfico de barras para análise da Covariação dos valores de energias

médias de Monte Carlo com filtragem. ...................................................................... 78

Figura 35 – Gráfico de barras com valores de Entropia -TΔS para os complexos em

questão. ......................................................................................................................... 80

Figura 36 – Gráfico de dispersão para experimental Vs. calculado para

MM/PBSA+ACCENT...................................................................................................... 83

Figura 37 – Convergência dos sistemas para o modelo sf3 com a energia livre

calculada a partir da energia média para temperaturas de 300 K no

modelo AMBER. ............................................................................................................ 86

Figura 38 – Gráfico de dispersão de valores experimentais Vs. calculados para

AMBER amortecido a 100K. ........................................................................................ 88

Figura 39 – Gráfico de dispersão de valores experimentais Vs. calculados para

AMBER amortecido a 100K filtrados. ......................................................................... 88

Page 17: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

Figura 40 – Gráfico de dispersão de valores experimentais Vs. calculados para

AMBER a 100K. .............................................................................................................. 90

Figura 41 – Gráfico de dispersão de valores experimentais Vs. calculados para

AMBER a 100K filtrados. .............................................................................................. 90

Figura 42 – Gráfico de dispersão de valores experimentais Vs. calculados para

AMBER amortecido + Solv a 100K. ............................................................................. 92

Figura 43 – Gráfico de dispersão de valores experimentais Vs. calculados para

AMBER amortecido + Solv a 100K filtrados. .............................................................. 92

Figura 44 – Gráfico de dispersão de valores experimentais Vs. calculados para

AMBER amortecido + Solv a 100K. ............................................................................. 94

Figura 45 – Gráfico de dispersão de valores experimentais Vs. calculados para

AMBER + Solv a 100K filtrados.................................................................................... 94

Figura 46 – Estrutura superposta do n-Butilbenzeno para 100K nos estados ligados

e desligados. ................................................................................................................ 101

Figura 47 – Assinatura termodinâmica experimental das moléculas descritas. ...................... 102

Figura 48 – Assinatura termodinâmica das moléculas descritas utilizando os dados

calculados. ................................................................................................................... 102

Page 18: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade
Page 19: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

LISTA DE TABELAS

Tabela 1 – Valores de Energia de Interação para ambos modelos energéticos .......................... 74

Tabela 2 – Valores de Energia de Interação para ambos modelos energéticos + SV. ................ 77

Tabela 3 – Valores de Entropia (-TΔS) para todos os 4 modelos energéticos a 100K ................ 79

Tabela 4 – Dados de entropia para Docagem Exaustiva (DE) e método Monte Carlo (MC) ....... 81

Tabela 5 – Dados termodinâmicos de dinâmica molecular. .......................................................... 83

Tabela 6 – Dados termodinâmicos para AMBER amortecido a 100K ........................................... 87

Tabela 7 – Dados termodinâmicos para AMBER a 100K ............................................................... 89

Tabela 8 – Dados termodinâmicos para AMBER amortecido +Solv a 100K ................................ 91

Tabela 9 – Dados termodinâmicos para AMBER+Solv a 100K ...................................................... 93

Tabela 10 – Dados de dinâmica, Monte Carlo e experimentais para o conjunto Lisozima. ......... 96

Page 20: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade
Page 21: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

LISTA DE ABREVIATURAS E SIGLAS

AMBER Assisted Model Building with Energy Refinement

DM Dinâmica Molecular

FEP Free Energy Perturbation

GAFF Generalized AMBER force field

LIE Linear Interaction Energy

MC Monte Carlo

MCM Monte Carlo Metropolis

MM/GBSA Molecular Mechanics/ Generalized Born Surface Area

MM/PBSA Molecular Mechanics/ Poisson Boltzmann Surface Area

SV Stouten-Verkhifker

TI Thermodynamic Intergration

Page 22: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade
Page 23: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

SUMÁRIO

CAPÍTULO 1 ............................................................................................................. 23

1 INTRODUÇÃO ........................................................................................... 23

1.1 Indústria farmacêutica e descobrimento de novos fármacos. ............. 23

1.2 Métodos computacionais para descobrimento e desenvolvimento de fármacos. ................................................................................................... 28

1.2.1 Docking molecular ................................................................................... 28

1.2.2 Dinâmica molecular .................................................................................. 30

1.2.3 Outros Métodos ........................................................................................ 33

1.3 Termodinâmica das Interações Moleculares ......................................... 36

1.3.1 Energias livres de Gibbs e Helmholtz. .................................................... 36

1.3.2 Modelos Energéticos ............................................................................... 38

1.4 Calculo de Entropia e aproximação de primeiro ordem........................ 40

1.5 Amostragem por Monte Carlo ................................................................. 41

CAPÍTULO 2 ............................................................................................................. 43

2 OBJETIVOS ............................................................................................... 43

2.1 Objetivos Gerais ....................................................................................... 43

2.2 Objetivos Específicos .............................................................................. 43

CAPÍTULO 3 ............................................................................................................. 45

3 MATERIAIS E MÉTODOS ......................................................................... 45

3.1 Determinação dos grupos teste .............................................................. 45

3.2 Simulações de Dinâmica Molecular e Simulações de Monte Carlo ..... 48

3.3 Cálculos de Energia livre do complexo de estruturas da lisozima T4. 51

CAPÍTULO 4 ............................................................................................................. 55

4 RESULTADOS ........................................................................................... 55

4.1 Conjunto T4 – Efeito da Temperatura na Amostragem ......................... 55

4.1.1 Sítio L99A .................................................................................................. 55

4.1.2 Sítio L99A/M102Q ..................................................................................... 64

4.2 Conjunto T4 – Modelos energéticos – AMBER e AMBER amortecido. 72

4.2.1 Efeitos na amostragem ............................................................................ 72

4.2.2 Conjunto T4 – Modelos Energéticos – Efeitos da Solvatação Implícita SV. .............................................................................................................. 76

4.2.3 Conjunto T4 – Modelos Energéticos – Aproximação de primeira ordem para Entropia. ........................................................................................... 79

4.2.4 Conjunto T4 – Correlação com dados experimentais e dados de Dinâmica molecular. ................................................................................. 82

4.2.4.1 Dinâmica Molecular para o conjunto T4 ................................................. 82

Page 24: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

4.2.4.2 Energia Livre por Monte Carlo ................................................................ 85

CAPÍTULO 5 ............................................................................................................. 97

5 DISCUSSÃO .............................................................................................. 97

5.1 Entalpia de ligação................................................................................... 97

5.2 Entropia de ligação .................................................................................. 99

5.3 Assinaturas termodinâmicas dos sistemas ........................................ 102

CAPITULO 6 ........................................................................................................... 105

6 CONCLUSÕES ........................................................................................ 105

6.1 Conclusões ............................................................................................. 105

REFERÊNCIAS.........................................................................................105

Page 25: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

23

CAPÍTULO 1

1 INTRODUÇÃO

1.1 Indústria farmacêutica e descobrimento de novos fármacos.

Um componente importante para a melhoria da qualidade de vida na

sociedade moderna é a possibilidade do tratamento medicamentoso de doenças

outrora fatais. O impacto da farmacoterapia é evidente, por exemplo, no tratamento

de doenças infecciosas. Estima-se que em média 200 a cada 100.000 habitantes

dos Estados Unidos tiveram suas vidas salvas após a introdução da penicilina no

mercado durante a primeira metade do século passado, como mostrado na Figura

1.1

Figura 1 – Mortes decorrentes por doenças infecciosas a cada 100,000 habitantes nos Estados Unidos.

Fonte: Adaptada de ACHIEVEMENTS...1

Page 26: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

24

Dados recentes do FDA (Food and Drug Administration, órgão controlador da

aprovação de fármacos nos EUA),2 mostram que o número de novas entidades

moleculares que foram registradas na FDA vem se reduzindo nos últimos anos,

como pode ser visto Figura 2, mesmo que o número de aplicações para licenças

comerciais se mantenham constantes. Em outras palavras, mais fármacos vêm

sendo registrados, contendo princípios ativos já conhecidos e poucas moléculas

inovadoras tem sido registradas. Isto se deve a diversos fatores, dentre os quais o

aumento na exigência pelas agências de regulação como o FDA após episódios de

efeitos indesejáveis com fármacos que eram considerados grandes promessas,

como o celecoxib e o rofecoxib, por exemplo,3 os quais causaram insuficiência renal

em diversos casos.

Figura 2 – Número de novas entidades moleculares e de pedidos de licença para o FDA por ano: Pode ser visto que existe uma diminuição razoável no número de novas entidades moleculares (moléculas sem precedentes nos fármacos já aceitos).

Fonte: Adaptada de ALLISON.2

Somado a isso, temos os custos de PDI (Pesquisa, desenvolvimento e

Inovação) cada ano tomando mais parte da receita das empresas, com a receita

Page 27: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

25

sistematicamente sendo diminuída pelo aumentos dos gastos empresariais. Como

pode ser visto no exemplo da Figura 4, temos que é importante que que os custos

de PDI sejam diminuídos.

Figura 3 – Receita total e gastos com PDI no período entre 2012 e 2015.

Fonte: Adaptada de MARKET.4

Desta forma, o processo de desenvolvimento de novos fármacos cada vez

torna-se mais longo e oneroso. O espectro do desenvolvimento de novas moléculas

bioativas até o estágio de venda pode ser dividido nas etapas demonstradas na

Figura 4. Para que todas essas etapas sejam finalizadas, é necessário um período

de 10 a 20 anos entre pesquisa e desenvolvimento. Focando na etapa de pesquisa

básica e descoberta, é imprescindível o desenvolvimento de ferramentas que

possam agilizar e otimizar este processo.5

Page 28: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

26

Figura 4 - Etapas da descoberta de novos fármacos.

Fonte: MEDICINANET.6

Como pode ser visto na Figura 5, além do tempo gasto, a questão financeira é

um fator relevante no processo de desenvolvimento de fármacos. Os custos

considerando todas as etapas atingem, em média, a escala de centenas de milhões

de dólares.2 Neste contexto, os métodos computacionais são de grande valia, ao

permitir o teste de hipóteses e a redução no número de experimentos necessários

em tempos curtos e com baixos custos.7

Page 29: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

27

Figura 5 – Custo médio e tempo médio gastos para finalização e a aprovação do fármaco.

Fonte: Adaptada de JONES....8

Uma infinidade de métodos computacionais pode ser encontrada para a

descoberta e o desenvolvimento de novos fármacos. Em geral, na etapa da

descoberta de moléculas bioativas, os métodos computacionais mais aplicados

podem ser divididos em duas categorias: os métodos baseados na estrutura do

receptor e os métodos baseados na estrutura do ligante.5

Dentre os métodos baseados na estrutura do receptor, os de docagem

molecular (docking molecular) se destacam. Estes métodos têm várias finalidades,

entre elas, a previsão da melhor configuração molecular para um ligante de

interesse, em relação a estrutura do seu receptor biológico. Esta análise pode ser

feita para grandes bibliotecas de compostos orgânicos, para que haja uma seleção

das moléculas candidatas a ligantes com melhor interação.5,9

Dentre os métodos baseados no ligante, têm grande importância os métodos

de QSAR (Quantitative Strutucture-Activity Relationship), que utilizam dados

experimentais, por exemplo valores de inibição enzimática para uma série de

ligantes, para compreender a relação entre a estrutura e atividade, possibilitando a

otimização da compostos com atividade biológica.10-11

Page 30: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

28

Aumentando um pouco o custo computacional por molécula, podemos incluir

ainda a técnica de dinâmica molecular (DM), entre os métodos com aplicação na

etapa inicial de desenvolvimento de moléculas bioativas. Esta técnica é utilizada em

diversas áreas, mas com uma clara aplicação em biologia molecular e bioquímica5,12-

13

Com esse propósito, a DM se encaixa perfeitamente na descoberta de

fármacos, pois empenham um papel significativo nos estudos estruturais de

biomoléculas, onde já se tem sua aplicação no desenvolvimento racional de

fármacos.7 Na seção seguinte descreveremos mais detalhadamente os métodos de

docagem molecular (ou docking molecular) e a técnica de dinâmica molecular, que

estão associados ao desenvolvimento deste trabalho.

1.2 Métodos computacionais para descobrimento e

desenvolvimento de fármacos.

1.2.1 Docking molecular

A ferramenta de docking molecular se tornou de uma importância significativa

na descoberta racional de fármacos. Existem fármacos já em venda os quais foram

utilizados métodos de docagem molecular em suas descoberta, como por exemplo:

Carfilzomib, um inibidor seletivo de proteossoma, o qual é utilizado em tratamento de

mielomas e o epalresat, que é utilizado para o tratamento da diabete melitus.14

A sua aplicação tem diversas finalidades, mas nos ateremos a duas:

primeiramente, a determinação da melhor configuração molecular do ligante em

relação ao seu receptor, baseado em um critério de pontuação (ou scoring).

Adicionalmente, a ferramenta pode ser utilizada para a triagem virtual de um alto

número de compostos, para que sejam selecionados aqueles com interação mais

favorável com o receptor em questão.9

Ambas aplicações tem como base os modelos estruturais do receptor,9

determinados pela posição dos átomos no espaço tridimensional. Esses dados

Page 31: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

29

estruturais, em sua maioria, são obtidos a partir da determinação experimental da

estrutura terciária por cristalografia de raio-x15 ou ressonância magnética nuclear.16

As estruturas são depositadas e disponibilizadas através do banco de dados PDB.17

Para a avaliação da interação entre ligante e receptor, é necessário que seja

definida uma função que calcule as energias do sistema. Obviamente, esta função

de avaliação energética deve ser dependente das posições dos átomos que

compõem o sistema, bem como de parâmetros dependentes de cada tipo atômico.5

Dentre estes parâmetros, podemos citar tipicamente a definição da carga atômica,

os raios atômicos, e etc. Este conjunto de parâmetros é denominado campo de

força5. Diversos campos de força têm sido desenvolvidos18 e aprimorados, uma vez

que a determinação precisa destes parâmetros é a chave para uma simulação bem

sucedida. Dentre os campos de força mais empregados para a simulação de

sistemas biológicos podemos citar o AMBER,19-20 CHARMM,21 OPLS,22 e o

GROMOS.23

Pelo alto número de moléculas testadas, os métodos de docking em geral

assumem aproximações para tornar mais rápidos os cálculos. Podemos citar a

imposição de rigidez no receptor e a pré- geração de diferentes confôrmeros

(mesma molécula, porém com valores torcionais internos diferentes) para os ligantes

como algumas destas aproximações. Com isto, as moléculas têm sua interação com

o receptor calculada por modelos energéticos utilizando os campos de força,

determinando quantitativamente a interação de uma macromolécula com possíveis

ligantes.

Vale destacar que não são todos os métodos de docking molecular que

avaliam as interações moleculares através de campos de força. Essas avaliações

também podem ser feitas através de métodos baseados em conhecimento, 24 por

exemplo, os quais utilizam potenciais estáticos baseados nas estruturas moleculares

já solucionadas. 25

Page 32: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

30

1.2.2 Dinâmica molecular

As simulações de dinâmica molecular (DM) têm como base a solução das

equações do movimento de Newton para cada átomo. Como são conhecidos os

potenciais energéticos do sistema (novamente através do uso de campos de força,

por exemplo), podemos calcular também a força exercida em cada átomo, sabendo

que:

(1.1)

Uma das finalidades das simulações de dinâmica molecular é gerar conjuntos

de configurações moleculares em um dado estado termodinâmico (número de

partículas fixo, temperatura controlada e pressão controlada, por exemplo) para

posterior análise.

No caso de um sistema composto por um receptor macromolecular e um

ligante, típico no processo de desenvolvimento de moléculas bioativas, a principal

grandeza associada à interação é a variação da energia livre no sistema, a qual não

é simples de se calcular. Nesse cenário, temos alguns métodos já conhecidos e

amplamente utilizados para a avaliação desta quantidade termodinâmica: métodos

‘end point’, como MM/GBSA(do inglês Molecular Mechanics/ Generalized Born

Surface Area), MM/PBSA(Molecular Mechanics/ Poisson Boltzmann Surface Area),

26–28 e LIE 29-30(Linear Interaction Energy), além dos métodos de alquimia química,

como integração termodinâmica (TI)31 e perturbação da energia livre (FEP).32

O método MM/GBSA calcula as médias das energias de interação a partir das

energias dos estados finais (ligado e não-ligado) e assume a variação da energia

livre de solvatação como parte da solução da equação:32

⟨ ⟩ ⟨ ⟩ ⟨ ⟩ ⟨ ⟩ ⟨ ⟩ (1.2)

onde, ⟨ ⟩ é a energia total do sistema complexado (ligante+receptor) , ⟨ ⟩ é a

energia total do ligante livre, ⟨ ⟩ é a energia total do receptor livre, ⟨ ⟩, é a

Page 33: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

31

contribuição entrópica entre os estados, estimada usualmente com base em modos

normais de vibração, ⟨ ⟩ é um termo que toma em conta a dessolvatação do

receptor e do ligante no processo de ligação28 e T é a temperatura do sistema.

Para o cálculo eficaz das energias livres por esse método, é comumente

utilizada a aproximação do modelo de Born generalizado (Generalized Born), que

lineariza a equação de Poisson-Boltzmann, tornando mais rápida a avaliação da

energia de solvatação. Usando a relação de Still,26:

(

)∑

(1.3)

(1.4)

(1.5)

(1.6)

Onde é a permissividade elétrica no vácuo, é a constante dielétrica do

meio, são as cargas eletrostáticas do átomo i, é a distância entre as partículas

i e j e é um valor com dimensão de distância chamado raio efetivo de Born, o

qual caracteriza o grau de penetração do átomo na superfície do receptor. Existem

diversos modos de definir , porém, como exemplo, citamos a utilizada por Still e

colaboradores.26 Os raios atômicos de Born para o modelo GB são tipicamente pré-

determinados pelo campo de força, e cruciais para a precisão do modelo.33

No método de LIE (Linear Interaction Energy),29-30 assume-se que a resposta

do sistema para qualquer perturbação é linear, ou seja, a variação da energia livre

depende linearmente das variações das energias de interação:

(⟨

⟩) ⟨

⟩ (1.7)

Onde

são as componentes de energia eletrostáticas para o

complexo, ligante livre e receptor livre respectivamente, e

são os

Page 34: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

32

componentes de van der Waals para a energia do complexo, ligante livre e receptor

livre. α e β são parâmetros empíricos.

Para a avaliação da energia livre através da FEP, devemos partir da equação

de Zwanzig,34 que descreve a diferença da energia livre entre dois estados

genericamente definidos como A e B, onde a diferença entre as energias potenciais

desses estados é definido por :

⟨ ⟩ (1.8)

onde β=1/kT e ⟨ ⟩ se refere a uma média do conjunto dos fatores de Boltzmann da

variação energética amostrado usando como potencial de

referência. Para que a equação 1.8 seja útil, i.e., a fim de que haja convergência no

cálculo de ΔG, configurações do potencial VA devem ter uma probabilidade razoável

de ocorrer também em VB, ou, em outras palavras, deve haver regiões termicamente

acessíveis aos potenciais com algum grau de sobreposição.35 Como este nem

sempre é o caso, uma abordagem de múltiplos passos pode ser empregada para

traçar um caminho entre os estados A e B a partir de funções de energia potencial

intermediárias construídas como combinações lineares dos estados inicial (A) e final

(B):

(1.9)

onde λm varia de 0 a 1 em um número discreto de pontos. Desta forma, é possível

avaliar a energia livre total associada à transição de A → B a partir da soma dos

estados intermediários ao longo da variável λ. Isto é possível porque a energia livre

é uma função de estado, i.e., definida somente pelos estados inicial e final35:

∑ ⟨ ⟩ (1.10)

Essa equação define o método de FEP, o qual necessita de múltiplas simulações

com variações sistemáticas nos valores de λ, para várias simulações subsequentes.

Se assumirmos que temos que

Page 35: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

33

∑ ⟨ ⟩ (1.11)

Assim, podemos definir que

(1.12)

∑ ⟨

(1.13)

Para passos pequenos de λ, a função pode ser linearizada retendo apenas os

primeiros termos da expansão de Taylor do expoente e do logaritmo, levando a:

∑⟨

⟩ (1.14)

Quando λ →0, a podemos escrever como uma integral de λ:

∫ ⟨

(1.15)

Essa equação é o cerne do método de integração termodinâmica, ou TI.36

Os dois métodos são bastante similares em algumas características, como por

exemplo, envolver múltiplas simulações em diferentes janelas de Δλ. No entanto, há

diferenças importantes também. Na TI, médias conformacionais sobre um valor de λ

não são usadas para calcular energias envolvendo um valor diferente de λ e

somente a derivada da energia da média conformacional é armazenada.31

1.2.3 Outros Métodos

Dentro do universo dos estudos da interação entre micro e macro moléculas,

métodos de rigor e custo computacional intermediários entre a docking e a DM têm

sido propostos mais recentemente na literatura como, por exemplo, a docagem

exaustiva (Exhaustive Docking),37 mineração de mínimos (Mining Minima),38 e

desfocagem do ligante (Ligand Blurring).39

Na docagem exaustiva37 objetiva-se o mapeamento sistemático do sítio de

ligação pelo ligante, empregando diferentes confôrmeros. Assim, efetua-se um

Page 36: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

34

passo de translação e um passo de rotação, sempre com valores pré-definidos, e

com isso, o espaço de fase acessado por passo é bem definido. Utilizando esse

método, a integral para a função de partição Q pode ser discretizada e calculada

como37:

[∑ ]

(1.16)

onde k é a constante de Boltzmann, β=1/kT, , e são respectivamente as

energias do complexo, da proteína livre e do ligante livre, Δr é a variação

translacional no espaço de fase, Δθ é a variação rotacional no espaço de fase.

Desta forma, a energia livre de ligação pode ser calculada diretamente pelo conjunto

de coordenadas gerado após a docagem exaustiva do ligante no receptor e da

avaliação das energias do ligante livre (o receptor é mantido fixo, e, portanto, tem

energia constante). O trabalho de Purisima e colaboradores37 define uma função de

partição para calcular as grandezas termodinâmicas de interesse. Com esta função,

os autores mostraram que, mesmo utilizando uma amostragem não-termodinâmica,

é possível calcular energias livres com correlações altas em relação ao experimental

próximas ao esperado. Adicionalmente, a partir das energias médias amostradas e

das energias livres, foi possível calcular as variações entrópicas (ΔSlig) para os

complexos estudados.

Já no método desfocagem do ligante39 foi usado um modo de integração por

Monte Carlo da função de partição dos sistemas complexados e livres, após uma

amostragem sistemática para o ligante. A variação na energia livre devida à ligação

foi obtida pela relação39:

⟨ ⟩

⟨ ⟩⟨ ⟩

(1.17)

onde os colchetes denotam o valor médio calculado para os fatores de Boltzmann

amostrados. Ucisik e colaborados foram capazes de mostrar que é possível obter

correlação satisfatórias com os dados experimentais em conjunto com uma função

Page 37: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

35

que quantifica os erros estatísticos. Vale destacar, contudo, que o método não foi

capaz de estimar a energia livre de ligação absoluta, embora captasse corretamente

a tendência da interação.

Já a mineração de mínimos38 busca a minimização da estrutura do ligante e

do receptor, e, nessa conformação de mínima energia, amostra graus de liberdade

torcionais para o ligante em questão, calculando a energia livre a partir de38:

(

) (1.18)

onde Vm é o volume total de torção interna (2π) para M graus de torção, é o grau

de simetria do ligante, e é o ângulo torcional do diedro em questão. Os resultados

com o método Mining Minima38 mostrados pelo grupo do Prof. Michael K. Gilson,

onde agora está na Universidade da Califórnia em San Diego, mostram que o

procedimento de mineração de mínimos configuracionais permite que o cálculo

direto da energia livre conformacional seja feita de forma rápida , tendo ótimos

resultados de convergência e estando de acordo com os dados experimentais

quando aplicados aos ligantes da HIV-1 protease.

Nosso grupo já vem trabalhando ativamente no desenvolvimento de uma

ferramenta de docking, denominada LiBELa,40 que combina características

estruturais do ligante e do receptor durante o processo de ligação de uma olecula

com seu receptor alvo. Nesta dissertação avaliamos a extensão desta ferramenta

para uma estimativa mais precisa da interação molecular para ser empregada após

o docking de compostos promissores.

Uma vez que as grandezas avaliadas são parâmetros termodinâmicos da

interação entre receptor e ligante, uma rápida revisão sobre a termodinâmica da

interação molecular será apresentada na seção seguinte.

Page 38: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

36

1.3 Termodinâmica das Interações Moleculares

1.3.1 Energias livres de Gibbs e Helmholtz.

Assumindo um ligante (L), que liga-se a um receptor macromolecular (P)

tornando-se um complexo receptor-ligante (PL), o equilíbrio entre as espécies é

descrito por 41:

(1.19)

e a afinidade de ligação Ka pode ser definida no equilíbrio como:

[ ]

[ ][ ]

(1.20)

onde [ ], [ ] [ ] são as concentrações no equilíbrio de complexo, receptor e

ligante.

As mudanças na energia livre de Gibbs no sistema ( ) relacionadas a

ligação são relacionadas à constante de afinidade por:

(1.21)

Onde Kd é a constante de dissociação, onde é igual a 1/ka.

A energia livre do sistema depende de suas características. Além da energia

livre de Gibbs G, a qual é caracterizada para um sistema conhecido por NPT, onde o

número de partículas, a pressão e a temperatura são mantidos constantes, temos

também a energia livre de Helmholtz A, que é caracterizada a partir de sistemas

NVT, onde o volume é mantido constante, ao invés da pressão. A relação entre as

variações dessas grandezas é:

(1.22)

onde P é a pressão e V é volume. Da termodinâmica básica, temos ainda que:

(1.23)

Page 39: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

37

onde é a variação energia interna do sistema e S é a variação da entropia do

sistema.

Se a diferença P∆V para variações entre estados é pequena, a energia livre

de Gibbs (∆G) é igual a energia livre de Helmoltz ∆A:

(1.24)

(1.25)

Podemos assumir que U (energia interna do sistema), que é uma quantidade

macroscópica, pode ser dada pela média sobre os estados microscópicos:

⟨ ⟩ ∑

(1.26)

onde é a probabilidade associada ao estado j, e a entropia S, a qual também uma

grandeza macroscópica onde, em um ensemble NVT, pode ser definida pelas

probabilidades dos estados microscópicos, podendo ser calculada por:

(1.27)

Desta forma, a relação para a energia livre de Helmholtz pode ser dada por

⟨ ⟩ (1.28)

Em outras palavras, estimar a variação da energia livre resume-se aos

problemas de avaliar a variação da energia média entre os sistemas ligado e não-

ligado e a variação da entropia entre estes mesmos estados. Contudo, estas

grandezas não são facilmente determinadas a partir de dados computacionais. A

variação da energia média pode ser calculada a partir da determinação por campo

de força para um conjunto de configurações moleculares geradas através de

Page 40: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

38

dinâmica molecular ou simulações de Monte Carlo. Já a variação de entropia é uma

quantidade de difícil quantificação para sistemas biomoleculares.42

Nas próximas seções descreveremos abordagens possíveis para a avaliação

destas grandezas termodinâmicas e que foram empregadas nesta dissertação.

1.3.2 Modelos Energéticos

As interações entre um ligante e um receptor podem ser quantificadas a partir

de campos de força. A equação 1.29 abaixo mostra a relação do campo de força

AMBER para a energia potencial de um sistema atômico clássico

(1.29)

onde kb é a constante de mola para ligações, ka é a constante de mola para os

ângulos, kt é a constante de mola para torções, e são os valores do

comprimento de ligação de equilíbrio e o ângulo de ligação de equilíbrio, é a fase

do ângulo torcional e n é o índice de periodicidade.

As interações não covalentes entre receptor e ligante em geral, são

avaliadas através de energias de campo de força empregando um potencial

eletrostático de Coulomb e um potencial Lennard-Jones 12-6,43 de acordo com os

parâmetros disponíveis para os campos de força AMBER FF14SB44 e GAFF18.

(1.30)

(1.31)

Page 41: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

39

(1.32)

Onde C é uma constante para conversão de unidade, q é a carga atômica, rij

é a distância entre os átomos i e j, A e B são os parâmetros de Lennard-Jones para

os átomos i e j, e , a constante dielétrica do meio.

Um modo alternativo de calcular as energias de interação não-covalentes é o

amortecimento dos potenciais citados anteriormente (Lennard-Jones e Coulomb),

onde uma constante delta é somada à distância interatômica, resultando em

potenciais com a forma 45:

(1.33)

(1.34)

O amortecimento dos potenciais pode ser visto como um modo de flexibilizar

as interações e acessar estados que não seriam acessados por causa da rigidez do

receptor. De certa forma, esta abordagem compensa a falta de flexibilidade do

receptor.45

Em sistemas biológicos, os complexos proteína-ligante estão tipicamente

imersos em solvente aquoso. Desta forma, a avaliação energética da interação

ligante-receptor deve tomar em conta o efeito do solvente. Um modelo proposto por

Stouten e colaboradores46 e modificado por Verkhivker e colaboradores47 propõe um

modo de contabilizar essa interação. Este modelo será denominado modelo SV.

O modelo SV assume, fenomenologicamente, uma dependência da energia

de solvatação com o quadrado carga atômica ( ), em uma aproximação linear. Este

parâmetro implícito é então multiplicado por uma função que representa

o volume ocluído de solvente em torno do átomo i, similar ao modelo de Debye-

Huckel,48 em uma aproximação empírica do efeito de mutua dessolvatacão do

Page 42: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

40

sistema. A dependência da distância é multiplicada por uma função envelope

Gaussiana, resultando em:

∑ ∑( )

(1.35)

(1.36)

(

)

(1.36)

onde aj é o raio do átomo j, σ é uma constante, tomada como 3.5 Å. Desta forma, a

energia total do sistema é estimada como:

(1.38)

onde são as energias de interação, energias de

dessolvatação e as energias internas do ligante, respectivamente.

1.4 Calculo de Entropia e aproximação de primeira ordem

Para o cálculo da entropia, componente chave da energia livre, utiliza-se um

ensemble NVT, o qual permite que a entropia S de um estado seja calculada por:49

(1.39)

onde k é a constante de Boltzmann, T é a temperatura do sistema, é

a função probabilidade do sistema para a determinada configuração no

espaço configuracional. Tendo em vista que determinar a probabilidade dos estados

correlacionados é algo de extrema dificuldade, é plausível a utilização de uma

aproximação de primeira ordem, a qual assume que os graus de liberdade geram

distribuições não correlacionadas, similarmente à abordagem proposta por Killian e

colaboradores 49:

Page 43: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

41

(1.40)

Assim, reorganizando a equação 1.39 em conjunção com a equação 1.40, temos

que:

(1.41)

Assim, abrindo o logaritmo dentro da integral, temos que a equação 1.41 se forma

em:

∑∫

(1.42)

A qual pode ser vista como:

(1.43)

Nesta aproximação, a entropia total do sistema (S) é dada pela soma das

entropias associadas a cada grau de liberdade i (Si). Esta abordagem permite o

cálculo facilitado da entropia, pois a determinação das funções de probabilidade

referentes a um só grau de liberdade é inúmeras vezes de mais fácil determinação

que a função dependente de todos os graus em conjunto.

1.5 Amostragem por Monte Carlo

O fundamento básico de uma simulação por Monte Carlo é a geração de

diversas configurações de um sistema, aplicando a ele mudanças aleatórias para

posições das espécies presentes, respeitando suas conformações restritivas.5 O

método mais utilizado é o Monte Carlo em cadeia de Markov (Markov Chain Monte

Carlo), também conhecido como o MCMC. Nele, a taxa de transição entre o estado i

Page 44: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

42

e i+1 depende somente da configuração desses 2 estados, facilitando a

implementação, sem afetar o resultado final da simulação.

Em nosso caso, a transição entre os estados é definido pelo critério de

Metropolis (equação 1.44), onde essa taxa depende somente das energias e

as quais, só dependem das posições atômicas 43.

Para < = 1

Para >

(1.44)

No método em discussão nesse trabalho, a amostragem por Monte Carlo

ocorre somente para o ligante, pois somente para ele é gerado uma nova

configuração molecular, que por sua vez será analisada pelo critério de Metropolis.

Assim, somente as variações na energia interna do ligante somada as energias de

interação são contabilizadas para os complexos.

Page 45: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

43

CAPÍTULO 2

2 OBJETIVOS

2.1 Objetivos Gerais

Esse projeto teve como objetivo a aplicação de métodos computacionais para

a estimativa rápida da variação da energia livre de ligação em sistemas proteína-

ligante, com possibilidade de decomposição da entropia em seus respectivos graus

de liberdade. Estes estudos permitem a avaliação da assinatura termodinâmica da

interação proteína-ligante, separando ligantes de interação entropicamente e

entalpicamente dirigidos.

2.2 Objetivos Específicos

Para o desenvolvimento do projeto foram considerados os seguintes objetivos

específicos:

1. Implementação de simulações de Monte Carlo para a avaliação energética de

um ensemble de conformações do ligante no sítio ativo do receptor.

2. Análise das interações para a avaliação da energia média do sistema;

3. Cálculo da variação de entropia pela interação (ΔSlig) através da proposta de

aproximação de primeira ordem.

4. Cálculos de variação de energia livre de interação para um conjunto teste de

complexos receptor-ligante e comparação com os dados experimentais.

5. Comparação dos resultados obtidos com as estimativas obtidas por

MM/GBSA.

Page 46: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

44

Page 47: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

45

a www.bindingdb.org

CAPÍTULO 3

3 MATERIAIS E MÉTODOS

3.1 Determinação dos grupos teste

Para avaliar a simulação de Monte Carlo como uma ferramenta de

refinamento da energia de interação entre ligante e receptor, um conjunto de

estruturas da lisozima do bacteriófago T4 foi selecionado.50-51 Neste conjunto de 14

estruturas, diferentes ligantes foram cocristalizados em complexo com a enzima e a

energia livre de ligação está disponível na literatura científica.50–54

Esse conjunto de estruturas foi selecionado por já ser concebido como padrão

para testes de novos métodos para contabilizar a energia livre, assim, mesmo não

sendo de interesse farmacológico, se apresenta como um conjunto teste difícil,

porque é composto por moléculas pequenas em um sítio de ligação com

pouquíssimas caraterísticas polares.55

Esse sitio de ligação é criado pela mutação L99A (Leucina 99 para Alanina),

que forma uma cavidade enterrada e hidrofóbica onde moléculas pequenas e

apolares são capazes de interagir com afinidades que variam entre 10 μM até 20

mM. Junto com os complexos com somente essa mutação, adicionou-se complexos

com uma mutação polar M102Q (metionina 102 para uma glutamina), a qual cria

uma interação polar no sítio ativo, como pode ser visto na Figura 6.

Os dados experimentais de energia livre foram retirados do banco de dados

BindingDBa 56, tendo as estruturas modeladas a partir de seus dados cristalográficos.

Os códigos PDB das moléculas utilizadas são 183L, 184L, 185L, 186L, 187L, 188L,

1LGW, 1NHB, 1LI2, 1LI3, 1LI6, 3DMX, 3HTB e 3HT8.50–54 As entradas 183L, 184L,

185L, 186L, 187L,188L, 1NHB e 3DMX carregam somente a mutação L99A, no

passo que 1LGW, 1LI2. 1LI3. 1LI6. 3HTB e 3HT8 trazem consigo a mutação em par

L99A/M102Q Os ligantes estão mostrados na Figura 7.

Page 48: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

46

Figura 6 - Sítios de ligação dos complexos 185L e 3HTB: A esquerda pode ser visto o sítio de ligação da estrutura 185L, com ligante indol, o qual não contem a mutação M102Q.A direita é mostrado o sítio de ligação do 3HTB, com o ligante 2-propilfenol, complexo que conta com a mutação M102Q.

Fonte: Elaborada pelo autor.

Page 49: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

47

Figura 7 - Ligantes dos mutantes da lisozima T4 e suas respectivas energias livres.

Fonte: Elaborada pelo autor.

Page 50: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

48

3.2 Simulações de Dinâmica Molecular e Simulações de Monte

Carlo

Inicialmente, para os modelos utilizados para a DM, foi utilizado o software

REDUCE,57 parte do pacote AMBERTOOLS 14,19 para a adição de hidrogênios nas

estruturas cristalográficas. Em seguida, a parametrização dos ligantes foi feita

utilizando o software ANTECHAMBER,58 também parte do pacote AMBERTOOLS,

tendo como campo de força o GAFF,59 com modelo de cargas atômicas AM1-BCC.

60 Os complexos foram montados e parametrizados usando programa tLeap, e a

estrutura do receptor foi parametrizada usando o campo de força AMBER FF14SB,44

posteriormente o complexo foi imerso em uma caixa octaédrica mantendo uma

distância 10.0Å entre a extremidade da proteína e a parede da caixa, preenchida

com moléculas de água do tipo TIP3P. A neutralidade do sistema foi mantida pela

adição de íons cloreto (Cl-).

Para uma análise mais profunda dos protonações, principalmente em relação

as histidinas do sistema, foi utilizado o servidor H++.61

Para estudo da entropia calculada com a aproximação de primeira ordem no

sistema lisozima T4 em DM, foi efetuada uma simulação para cada um dos 14

complexos e uma simulação para cada um dos ligantes descomplexados. Para cada

simulação, foram seguidos protocolos contendo: minimização, termalização,

equilíbrio e produção.

Para minimização, foram feitos 10000 passos de minimização, com valor de

corte eletrostático de 10.0 Å, condições periódicas de contorno e restrições

harmônicas para o sistema inteiro. Em seguida, houve a termalização, em um

ensemble NVT, para que a temperatura fosse elevada a 300 K, utilizando valor de

corte eletrostático de 10.0Å, condições periódicas, controle de temperatura de

Langevin 43 com frequência de colisão de 2 ps-1, restrições nas vibrações das

ligações de hidrogênio (SHAKE62), 1000000 de passos de simulações, efetuados em

intervalos de 0.002 ps, totalizando 2 ns de simulação.

Para a simulação de equilíbrio, utilizou-se um ensemble NPT para equilíbrio

do volume e consequentemente, da densidade do sistema. Com pressão de 1 bar,

Page 51: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

49

tempo de relaxamento da pressão de 2 ps-1, valor de corte eletrostático de 10.0Å,

controle de temperatura de Langevin, com frequência de colisão de 2 ps-1, com

5000000 de passos, em intervalos de 0.002 ps, totalizando 10 ns de equilíbrio.

Para a simulação produtiva, foi usado um ensemble NPT com características

similares a simulação de equilíbrio, porém agora com 50000000 de passos, em

intervalos de 0.002 ps, totalizando 100 ns de geração de ensemble.

Para as simulações de Monte Carlo, utilizou-se o software LiBELa,40

desenvolvido em nosso grupo, utilizando a linguagem C++, o qual tem foco em

docking molecular, e foi adicionada uma nova classe à qual trabalha com o método

de Monte Carlo Metropolis (MCM).

O método MCM utiliza um malha tridimensional (grid) de potenciais

energéticos,63,64 provindo de uma estrutura de um receptor proteico, o qual é

considerado rígido. Utilizando esse grid, os passos de Monte Carlo são feitos da

seguinte maneira: a cada passo, efetua-se uma translação do centro de massa

seguido por uma rotação de corpo rígido em um espaço de 3 ângulos de Euler com

valores aleatórios tendo a média do passo definida pelo usuário. Em seguida,

utilizando a biblioteca C++ OpenBabel,65 são encontradas todas as ligações

torcionáveis entre átomos pesados e a cada uma é dada uma torção aleatória,

resultando em um novo confôrmeros.

A nova energia do sistema, que é composta pela energia interna dada pelo

OpenBabel somada a energia de interação, é testada perante o critério de

Metropolis (equação 1.43). Os passos aceitos geram assim o ensemble

termodinâmico. Todos esses passos estão representados no fluxograma contido na

Figura 8.

Para a parametrização das estruturas para MC, foi utilizado a ferramenta

DockPrep do software UCSF-Chimera,66 o qual adiciona os hidrogênios, parametriza

o receptor utilizando o campo de força FF14SB e os ligantes com o campo de força

GAFF com correções de carga AM1-BCC.60

Page 52: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

50

Figura 8 – Fluxograma representativo do funcionamento do método Monte Carlo no software LiBELa.

Fonte : Elaborada pelo autor.

Todas as simulações foram feitas com temperaturas sequenciais de 100 K ,

200 K e 300 K, com 1 milhão de passos de equilíbrio, com 10 milhões de passos

aceitos de produção, para todos os modelos energéticos (AMBER e AMBER

amortecido e AMBER+Solv e AMBER amortecido+Solv 44) utilizando caixas cubicas

de simulação de 4,0 Å de dimensão lateral.

Para o ligante livre é feito somente a amostragem torcional utilizando o critério

de Metropolis, assumindo sua posição e orientação no espaço rotacional são

isotrópicas, ou seja, podem estar em qualquer posição sob qualquer ângulo de

Euler.

Os cálculos foram feitos utilizando um núcleo por simulação, sendo os

núcleos pertencentes a um processador Xeon E5640 2.67GHz.

Page 53: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

51

3.3 Cálculos de Energia livre do complexo de estruturas da

lisozima T4.

Para os cálculos de energia livre usando DM, utilizou-se o programa

MM/PBSA.py,67 o qual faz parte do pacote AMBER, usando o método de Born

generalizado27 com os parâmetros atômicos dados pelo campo de força AMBER

FF14SB, e concentração de sal de 0.001 molar, para todos os passos gerados pelo

AMBER, a entropia é calculada utilizando o software ACCENT. 49

O ACCENT calcula as entropias somente referentes aos graus de liberdade

internos (torções, ângulos e vibrações de ligação) não levando em consideração as

translações e rotações de corpo rígido da molécula. Os parâmetros selecionados

para o ACCENT são todos os valores padrões do programa já dados pelo manual do

software.

Para as simulações MC, o cálculo de energia livre se divide em duas etapas.

Primeiramente, se calcula a variação da energia interna entre os estados ligados e

desligados, calculando a média de Monte Carlo para o estado ligado e o estado

desligado.

Como um modo secundário de cálculo da energia média, avaliou-se a energia

de cada passo aceito multiplicado pelo fator de Boltzmann:

⟨ ⟩ ∑

(3.1)

O segundo modo de cálculo de energia é interessante ao utilizar uma

filtragem de energias ao pesar mais favoravelmente as regiões de mínimos.

Page 54: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

52

Todas as simulações foram efetuadas com os quatro modelos energéticos,

(AMBER amortecido, AMBER, AMBER amortecido + Solv, AMBER + Solv) com

constantes de amortecimento eletrostático de 1,75 Å e de amortecimento de

Lennard-Jones ( de 2,75 Å, e para os parâmetros de solvatação utilizou-se com

valores-padrão de α = 0.2 kcal/ (mol·e−2) e β = −0.005 kcal/mol.

Agora, para o cálculo de entropia baseado no trabalho de Killian e

colaboradores,49 com a aproximação de primeira ordem, foi utilizada a relação

mostrada na equação 3.2, para os graus de liberdade de translação, rotação em

Euler e graus torcionais internos, somando assim um total de 6+n graus de

liberdade, onde n é o número de ligações torcionáveis entre átomos pesados (não-

hidrogênio) em um certo ligante.

∑ ∫

∑ ∫

∑ ∫

(3.2)

As integrais da equação 3.2 são resolvidas numericamente, pelo método de

contagem de colunas: após a amostragem por Monte Carlo ser finalizada, os valores

das variáveis dependentes (ângulos diédricos, posições do centro de massa ou

ângulos de Euler) são dívidas em regiões com uma largura predefinida. Os pontos

os quais se encontram dentro da respectiva região são contabilizados, criando um

histograma, com isso, somando a área do histograma criado, a integral é resolvida.

68,69 A dimensão das colunas foram de 0,2 Å para translação, 1 grau para rotação e

1 grau para ângulos diédricos.

Para a molécula livre, é importante ressaltar que os limites de integração para

a translação são definidos a partir da concentração padrão de testes de 1 molar,

assim, nos dando uma caixa de volume 1667 ų de volume, que resulta em uma

Page 55: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

53

caixa cubica de aproximadamente 12 Å de dimensão lateral, sendo utilizada para o

estado desligado na simulação do ligante.

Para as integrais de redirecionamento no espaço de Euler, os limites são de 0

a 2π para α, 0 a π para β e 0 a 2π para γ, totalizando um espaço rotacional de 8π².

Como o ligante livre pode estar em qualquer lugar da caixa em qualquer

orientação, se assumiu, para os graus rototranslacionais, uma densidade de

probabilidade uniforme. Esta distribuição de probabilidade uniforme maximiza a

entropia para translação e rotação.41

Para os graus de liberdade torcionais no sistema desligado, é feita uma

amostragem a parte, utilizando o critério de Metropolis para as variações das

energias internas diédricas.

Os erros associados foram calculados utilizando 24 simulações para cada

complexo para cada modelo energético, tendo suas grandezas termodinâmicas

(energias médias, entropias e energias livres) calculadas para cada um dos

ensembles gerados, e os desvios padrões associados a essas medidas foram

aceitos como erro.

Para as análises de correlação entre dados experimentais e calculados foi

realizada uma análise através de bootstrapping de troca gaussiana70: esse método

gera para cada ponto (x,y) no gráfico de energias experimentais versus energias

calculadas um novo ponto (x,yg), onde yg é um valor gerado aleatoriamente a partir

uma distribuição gaussiana tendo o valor de y experimental como valor médio dessa

distribuição e o erro associado à energia experimental ( kcal/mol)

associado a variância dos valores amostrados.

Com isso, foi gerado 1 milhão de conjuntos por substituição gaussiana e

calculado a média da correlação para cada um dos conjuntos em relação aos dados

calculados, onde encontramos um intervalo de confiança associado as correlações.

Page 56: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

54

Page 57: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

55

CAPÍTULO 4

4 RESULTADOS

Inicialmente, foram realizadas simulações de MC para os 14 sistemas citados.

As 10 mil configurações selecionadas a cada 1000 passos aceitos dos ligantes

foram salvas em arquivos do tipo SYBYL MOL2 e visualizadas nos programas

VMD71 e UCSF Chimera.66 A inspeção visual destas simulações demonstrou

comportamentos muito diversos em função da temperatura utilizada na simulação,

como é esperado. Desta forma ficou clara a necessidade de se realizar um estudo

detalhado do efeito da temperatura de Monte Carlo na amostragem com posterior

finalidade de avaliar a interação molecular.

4.1 Conjunto T4 – Efeito da Temperatura na Amostragem

Primeiramente, foi realizado um estudo sistemático para um melhor

entendimento do efeito da temperatura sobre os ensembles gerados. No aspecto de

simulações de Monte Carlo, a interpretação da temperatura deve ser feita de forma

cuidadosa. Neste contexto, a temperatura se refere à probabilidade que um sistema

tem de acessar determinados estados energéticos. Somado a isso, é importante

destacar que as temperaturas das simulações MC não são equivalentes às

temperaturas nominais de um experimento de determinação de energias de

interação.

4.1.1 Sítio L99A

Os complexos 183L; 184L; 185L; 186L; 187L; 188L; 1NHB; 3DMX são os quais

contém somente a mutação L99A. Essa mutação cria um bolsão hidrofóbico e

enterrado na proteína, não exposto, portanto, ao solvente

Page 58: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

56

Em relação os complexos citados, para que possamos discutir a questão da

amostragem em função da temperatura, foram selecionados 3 dentre 8 complexos

os quais apresentam características estruturais interessantes: 3DMX (benzeno);

186L (N-Butilbenzeno) e 185L (Indol).

No caso 186L, temos uma estrutura a qual o ligante é mais flexível (3 ligações

torcionáveis para átomos pesados) e longo em relação aos outros ligantes. Assim,

vemos um completo redirecionamento da molécula ao se aumentar a temperatura,

representado na Figura 9, porém não se espera que existam estados intermediários

entre essas duas configurações, dadas as restrições estereoquímicas causadas pela

cauda de quatro carbonos do ligante.

Figura 9 - Estruturas Representativas do complexo 186L em diferentes temperaturas e seus respectivos RMSDs, em ciano a estrutura cristalográfica e em azul a estrutura a 100K e vermelho a estrutura a 300K.

Fonte: Elaborada pelo autor.

Observando os gráficos de RMSD x Energia (Figuras 10, 11, e 12), vemos

que não há ocupação de estados intermediários no intervalo de RMSD dentro de

3,5Å a 4,5Å em relação a estrutura cristalográfica, e a estrutura do ligante explica a

não existência desses estados, pois existe uma barreira estereoquímica para que

haja um completo redirecionamento.

Page 59: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

57

Figura 10 - Gráfico da distribuição de RMSD para o complexo 186L para 100K

Fonte: Elaborada pelo autor.

Figura 11 - Gráfico da distribuição de RMSD para o complexo 186L para 200K.

Fonte: Elaborada pelo autor.

Page 60: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

58

Figura 12 - Gráfico da distribuição de RMSD para o complexo 186L para 300K.

Fonte: Elaborada pelo autor.

Para o benzeno no complexo 3DMX, temos que levar em consideração a

existência de uma simetria interna. Como pode ser visto na Figura 13, a região de

maior acesso a baixas temperaturas é em torno de 3 Å para valores de RMSD em

relação a estrutura cristalográfica. O fato mais interessante é que essa região

continua sendo a mais ocupada mesmo com um aumento da temperatura (Figura

13,14 e 15).

Page 61: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

59

Figura 13- Gráfico da distribuição de RMSD para o complexo 3DMX para 100K.

Fonte: Elaborada pelo autor.

Figura 14 - Gráfico da distribuição de RMSD para o complexo 3DMX para 200K.

Fonte: Elaborada pelo autor.

Page 62: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

60

Figura 15 - Gráfico da distribuição de RMSD para o complexo 3DMX para 300K.

Fonte: Elaborada pelo autor.

Esse efeito se dá por causa da simetria citada: no espaço configuracional, a

molécula está em diferentes coordenadas rototranslacionais, como é mostrado na

Figura 16, onde moléculas com RMSDs (vermelho em 3,2Å e azul em 3,5Å)

pertencentes a região com maior amostragem tem diferentes posições absolutas.

Page 63: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

61

Figura 16 - Estrutura do Benzeno no complexo 3DMX; em vermelho (3,2 Å) e em azul (3,5Å) diferentes passos representativos em diferentes regiões do espaço de fase, porém com RMSD ~ 3.3 A. Em Destaque o mesmo carbono em diversas configurações.

Fonte: Elaborada pelo autor.

.

O sistema 185L tem uma peculiaridade: a molécula Indol tem um nitrogênio

que gera no ligante uma região levemente polarizada em relação ao resto da sua

estrutura. Assim, o átomo de nitrogênio, a baixa temperaturas, interage fracamente

com a cadeia principal da proteína, em especial com o nitrogênio do resíduo TYR88.

Page 64: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

62

Figura 17 -Efeito da temperatura no complexo 185L. A tirosina 88 tem sua cadeia lateral ocluída. Fonte: Elaborada pelo autor.

Para que essa interação seja feita, é necessário um redirecionamento da

molécula, em relação a estrutura cristalográfica, direcionando o grupo polar em

direção do resíduo, causando uma região de alta ocupação no espaço de RMSD

(em relação a sua estrutura cristalográfica) na região com de valores em torno de

4.6 Å, como pode visto na Figura 10. Mas como essa interação é fraca, ao se

aumentar a temperatura, ela e desestabilizada, o qual é refletido nos gráficos da

Figura 18 e 19.

Esse fato nos mostra que para o caso 185L, a amostragem ocorre em uma

região longe dos dados experimentais cristalográficos, que mostram que a

simulação MC falha ao mapear o sitio de ligação para essa molécula para essa

temperatura, se compararmos a estrutura mapeada a estrutura cristalográfica.

Page 65: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

63

Figura 18 - Gráfico da distribuição de RMSD para o complexo 185L para 100K.

Fonte: Elaborada pelo autor.

Figura 19 - Gráfico da distribuição de RMSD para o complexo 185L para 200K.

Fonte: Elaborada pelo autor.

Page 66: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

64

Figura 20 - Gráfico da distribuição de RMSD para o complexo 185L para 300K.

Fonte: Elaborada pelo autor.

No entanto, analisando somente o conjunto L99A, vemos que a temperatura

afeta a amostragem significativamente, porém ainda não temos indícios sobre qual

temperatura de Monte Carlo seria similar a temperatura utilizada em um

experimento, por isso partiremos para a análise do conjunto L99A/M102Q.

4.1.2 Sítio L99A/M102Q

Similarmente, foram analisados os complexos com a mutação polar, (1LI2;

1LI3; 1LI6; 1LGW; 3HT8 e 3HTB). Em contraste com as simulações do grupo L99A,

espera-se que as interações do ligante com o resíduo GLU102 se mantenham para

a simulação, como mostram os dados experimentais de cristalografia.52

Discutiremos dois casos nessa seção: casos 3HTB e 3HT8, por conta das

similaridades estruturais entre eles.

Page 67: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

65

O complexo 3HTB contém um 2-propilfenol. O grupo propila proporciona uma

cadeia carbônica mais longa e, perante nosso critério, torcionável por duas ligações

entre átomos pesados. Como já dito anteriormente, a cadeia longa gera restrições

estereoquímicas, no espaço redirecionável, com isso, temperaturas mais altas são

necessárias para conseguir passar barreiras estérica-energéticas. Isso resulta o fato

que somente em temperaturas mais baixas (100K e 200K) a interação ligante-

glutamina 102 existe, como pode ser visto na Figura 21.

Porém, no sítio de ligação em questão, é esperado que a simulação respeite

essa interação.52 Como podemos ver nos gráficos de RMSD versus energia (Figuras

22, 23 e 24) temperaturas mais altas não amostram a interação polar como

temperaturas mais baixas e este fator nos mostra um indicio de que a temperatura

de Monte Carlo deve ser mais baixa que a temperatura usual de 298 K.

Page 68: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

66

Figura 21 – Conjuntos representativos para as simulações em diferentes temperaturas para o complexo 3HTB. Em destaque em bolas e palitos a hidroxila do ligante e em bastões a estrutura cristalográfica.

Fonte: Elaborada pelo autor.

Page 69: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

67

Figura 22- Gráfico da distribuição de RMSD para o complexo 3HTB para 100K.

Fonte: Elaborada pelo autor.

Figura 23- Gráfico da distribuição de RMSD para o complexo 3HTB para 200k.

Fonte: Elaborada pelo autor.

Page 70: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

68

Figura 24 - Gráfico da distribuição de RMSD para o complexo 3HTB para 300K.

Fonte: Elaborada pelo autor.

No complexo 3HT8, o ligante em questão é o 5-cloro-3-metilfenol. Esse ligante

tem uma cadeia carbônica menor que o 2-propilfenol do complexo 3HTB, portanto, é

plausível que as barreiras energéticas sejam menores para o redirecionamento da

molécula. Como pode ser visto na Figura 25, em baixas temperaturas, a ligante

amostra apenas regiões próximas da sua configuração cristalográfica. Contanto, ao

ter a temperatura aumentada, o ligante começa a popular estados com menor

interação com a glutamina 102 já a 200K.

Page 71: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

69

.

Figura 25 - Conjuntos representativos para as simulações em diferentes temperaturas para o complexo 3HT8. Em destaque em bolas e palitos a hidroxila do ligante e em bastões a estrutura cristalográfica.

Fonte: Elaborada pelo autor.

Page 72: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

70

Comparando os dois complexos discutidos podemos dizer que mesmo ambos

tendo a mesma estrutura de receptor, as superfícies de energia são contrastantes:

no complexo 3HT8 regiões com alto RMSD já são acessadas a 200K (Figura 26, 27

e 28), diferentemente do complexo 3HTB. Esse efeito também pode ser visto

analisando em a diferença da estrutura do ligante nas Figuras 21 e 25 para os

complexos 3HTB e 3HT8 respectivamente. Isso gera características na superfície de

energia que permitem a maior liberdade para o complexo 3HT8, assim, atingindo

valores de RMSD mais altos com uma temperatura mais baixa.

Figura 26 - Gráfico da distribuição de RMSD para o complexo 3HT8 para 100K.

Fonte: Elaborada pelo autor.

Page 73: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

71

Figura 27 - Gráfico da distribuição de RMSD para o complexo 3HT8 para 200K.

Fonte: Elaborada pelo autor.

Figura 28 - Gráfico da distribuição de RMSD para o complexo 3HT8 para 300K.

Fonte: Elaborada pelo autor.

Page 74: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

72

A interação da região polar dos ligantes com a cadeia lateral da glutamina 102

desses complexos representa uma região de mínimo de interação, porém com

espaço de fase restrito, pois as orientações requeridas por essa interação

restringem a rototranslação do ligante.

Em concordância com esta análise para o conjunto L99A/M102Q, os cálculos

de energias, entropia e energia livre de interação serão todos feitos a 100 K em

comparação com a temperatura experimental de 298 K.

4.2 Conjunto T4 – Modelos energéticos – AMBER e AMBER

amortecido.

4.2.1 Efeitos na amostragem

Antes que possamos observar os efeitos do amortecimento dos modelos

energéticos na amostragem para as moléculas, é necessário que sejam

compreendidas as diferenças entre os modelos energéticos utilizados.

Como pode ser visto na Figura 29, ao se aproximar dos valores de alta

proximidade interatômica, os valores em modulo são amenizados. Espera-se que

esse amortecimento melhore a acomodação do ligante no bolsão, admitindo regiões

que outrora não eram permitidas.

Figura 29 - Diferença entre potenciais e seus respectivos modelos amortecidos. Em azul o modelo AMBER, sem amortecimento, e em vermelho o modelo amortecido AMBER.

Fonte: Elaborada pelo autor.

Page 75: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

73

O amortecimento do potencial tem como objetivo a diminuição da intensidade

dos valores de energia das regiões de proximidade interatômica (próxima ao zero no

gráfico) de forma que a haja um choque molecular de melhor encaixe e a energia

não varie abruptamente.

Esse fato causa dois efeitos: primeiramente, as energias com distancias

baixas tem seus valores diminuídos e consequentemente, as interações tem seus

valores em módulo diminuídas, afetando as energias amostradas; em segundo

lugar, como a interação atômica para valores próximos ao zero é amortecida, o

ligante amostra regiões fora do sitio ativo, como mostrado na Figura 30, onde temos

como exemplo o complexo 183L utilizando o modelo AMBER e o AMBER

amortecido a 100 K. No modelo AMBER, o ligante é restringido pelo sitio de

interação, e no modelo AMBER amortecido, ele é restringido pela caixa de

simulação.

Figura 30 - Amostragem nos modelos AMBER e AMBER amortecido a 100K: O modelo AMBER amortecido (softcore) permite que o ligante saia do sítio de interação, sendo barrada somente pela caixa de simulação, ao contrário do modelo AMBER (Hardcore), que não possibilita a saída do ligante da região de interação

Fonte: Elaborada pelo autor.

Isso nos acarreta um novo paradigma, pois a amostragem muda

significativamente, ao passo que novos estados são amostrados e novas energias

contabilizadas.

Page 76: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

74

As energias de estados onde a estrutura do receptor – ligante estão

superpostas ainda assim são consideradas pois mimetizam a flexibilidade do

receptor, mesmo que sejam amostradas em uma frequência menor.

Segundo a Tabela 1, vemos as diferenças de energias com o potencial

AMBER e o AMBER amortecido, para os valores médios e para os valores médios

filtrados pelo fator de Boltzmann, sendo essas grandezas todas calculadas a 100 K.

Em comparação com entre os modelos energéticos, os valores filtrados tem

em média, grandezas mais favoráveis que os valores não filtrados, como já seria

imaginado. Entre a existência do amortecimento ou não, vemos que o

amortecimento causa uma elevação na energia de interação.

Tabela 1 - Valores de Energia de Interação para ambos modelos energéticos

AMBER amortecido (kcal/mol)

AMBER (kcal/mol)

AMBER amortecido filtrado (kcal/mol)

AMBER filtrado (kcal/mol)

183L -5,1 ±0,1 -13,2 ±0,1 -15,1 ±0,1 -5,6 ±0,1

184L -18,0 ±0,1 -25,8 ±0,1 -32,2 ±0,1 -31,7 ±0,1

185L -7,9 ±0,4 -24,1 ±0,4 -15,6 ±0,4 -15,7 ±0,4

186L -19,1 ±0,3 -31,6 ±0,3 -28,3 ±0,3 -27,7 ±0,3

187L -3,1 ±0,5 -9,5 ±0,5 -15,3 ±0,5 -6,4 ±0,5

188L -3,5 ±0,2 -9,6 ±0,2 -13,7 ±0,2 -6,7 ±0,2

1LGW -2,7 ±0,4 -10,3 ±0,4 -12,7 ±0,4 -7,7 ±0,4

1LI2 -2,3 ±0,3 -9,5 ±0,3 -21,0 ±0,3 -12,8 ±0,3

1LI3 -4,5 ±0,5 -15,7 ±0,5 -20,3 ±0,5 -10,4 ±0,5

1LI6 -2,5 ±0,3 -13,3 ±0,3 -15,9 ±0,3 -6,3 ±0,3

1NHB -13,0 ±0,4 -21,4 ±0,4 -22,2 ±0,4 -21,4 ±0,4

3DMX 0,1 ±0,4 -7,7 ±0,4 -15,1 ±0,4 -6,4 ±0,4

3TH8 -3,6 ±0,4 -14,5 ±0,4 -25,6 ±0,4 -20,9 ±0,4

3HTB -18,0 ±0,5 -32,5 ±0,5 -20,0 ±0,5 -19,1 ±0,5 Fonte: Elaborada pelo autor.

Page 77: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

75

Figura 31 - Gráfico de barras para análise da Covariação dos valores de energias médias de Monte Carlo.

Fonte: Elaborada pelo autor.

Figura 32 - Gráfico de barras para análise da Covariação dos valores de energias médias de Monte Carlo com filtragem.

Fonte: Elaborada pelo autor.

Observando as Figuras 31 e 32, vemos que para os dados de valores médios,

o modelo AMBER é significativamente mais negativo que os valores calculados com

-35

-30

-25

-20

-15

-10

-5

0

5

1 2 3 4 5 6 7 8 9 10 11 12 13 14

Relação AMBER -AMBER Amortecido- Valor Médio

AMBER amortecido AMBER

-35

-30

-25

-20

-15

-10

-5

0

1 2 3 4 5 6 7 8 9 10 11 12 13 14

Relação AMBER -AMBER Amortecido- Filtragem

AMBER Amortecido AMBER

Page 78: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

76

o modelo amortecido, e em relação aos valores de energia com filtragem, é

observado que são mais baixos para os modelos AMBER amortecido.

Isso é reflexo da amostragem expandida que o amortecimento causa: para os

valores médios, a espaço configuracional contabilizado é maior, assim, mínimos

globais são menos amostrados, tendo sua energia menos contabilizada no valor

final, causando um aumento no valor de energia média para o modelo AMBER

amortecido em relação a energia calculada com filtragem, o qual pesa para o

mínimo global.

Portanto, a filtragem é pouco dependente dos valores fora dos mínimos, pois

o peso exponencial exclui valores com energias mais altas. Isso explica o fato dos

valores filtrados serem geralmente mais baixos que os da média por MC.

4.2.2 Conjunto T4 – Modelos Energéticos – Efeitos da Solvatação

Implícita SV.

Para a que seja possível uma análise dos valores de energia de solvatação

para ambos os modos (AMBER amortecido e AMBER), foram feitos testes

comparativos entre os quatro modelos energéticos.

Observado os valores calculados para as energias (novamente com filtragem

e valor médio) descritos nas Tabelas 2, para T = 100K. Ao compararmos esses

valores com a Tabela 1, vemos que a adição do modelo SV aumenta os valores das

energias de interação.

Page 79: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

77

Tabela 2 - Valores de Energia de Interação para ambos modelos energéticos mais o a função empírica SV.

AMBER

amortecido SV

(kcal/mol)

AMBER SV

(kcal/mol)

AMBER

amortecido

Filtragem SV

(kcal/mol)

AMBER Filtragem

SV

(kcal/mol)

183L -2,3 ±0,2 -10,0 ±0,2 -14,8 ±0,2 -5,5 ±0,2

184L -15,3 ±0,2 -22,1 ±0,2 -30,7 ±0,2 -29,9 ±0,2

185L -4,2 ±0,4 -20,0 ±0,4 -15,2 ±0,4 2,0 ±0,4

186L -16,2 ±0,3 -27,7 ±0,3 -26,7 ±0,3 -25,8 ±0,3

187L -0,6 ±0,5 -6,8 ±0,5 -15,3 ±0,5 -6,2 ±0,5

188L -1,2 ±0,2 -6,8 ±0,2 -13,3 ±0,2 -6,5 ±0,2

1LGW 4,2 ±0,4 -3,5 ±0,4 -12,7 ±0,4 -7,3 ±0,4

1LI2 2,5 ±0,3 -3,9 ±0,3 -20,5 ±0,3 -12,8 ±0,3

1LI3 0,4 ±0,6 -9,9 ±0,6 -20,5 ±0,6 -10,5 ±0,6

1LI6 0,4 ±0,3 -10,0 ±0,3 -15,9 ±0,3 -6,3 ±0,3

1NHB -10,6 ±0,4 -18,3 ±0,4 -20,7 ±0,4 -19,8 ±0,4

3DMX 2,6 ±0,6 -4,7 ±0,6 -14,9 ±0,6 -6,3 ±0,6

3TH8 1,5 ±0,5 -5,5 ±0,5 -0,1 ±0,5 -20,9 ±0,5

3HTB -12,4 ±0,4 -26,0 ±0,4 -16,8 ±0,4 -15,9 ±0,4

Fonte: Elaborado pelo autor.

Figura 33 - Gráfico de barras para análise da Covariação dos valores de energias médias de Monte Carlo.

Fonte: Elaborada pelo autor.

-35

-30

-25

-20

-15

-10

-5

0

5

10

1 2 3 4 5 6 7 8 9 10 11 12 13 14

Comparação dos valores de Energia de Interação - Valor Médio MC

AMBER amortecido + Solv AMBER + Solv AMBER amortecido AMBER

Page 80: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

78

Figura 34 - Gráfico de barras para análise da Covariação dos valores de energias médias de Monte Carlo com filtragem.

Fonte: Elaborada pelo autor.

Em uma análise dos gráficos nas Figuras 33 e 34, pode ser visto,

primeiramente, que para os valores de energia média de Monte Carlo, a solvatação

tem energias mais desfavoráveis em relação aos modelos não solvatados, em todos

os casos. Isso já era esperado, pois a dessolvatacão do ligante e do sítio requer

energia, aumentando o valor da variação de energia de interação.

Em segundo lugar, as energias calculadas com filtragem tem uma

característica singular: na maioria dos casos, não há uma diferença significativa das

energias de interação filtradas com a adição do modelo SV. A diferença maior se

decorre do amortecimento dos potenciais em relação aos não amortecidos.

-40

-35

-30

-25

-20

-15

-10

-5

0

1 2 3 4 5 6 7 8 9 10 11 12 13 14

Comparação dos valores de Energia de Interaçao - Filtragem

AMBER amortecido + SV AMBER + SV AMBER amortecido AMBER

Page 81: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

79

4.2.3 Conjunto T4 – Modelos Energéticos – Aproximação de

primeira ordem para Entropia.

Para que haja o cálculo da energia livre, necessitamos também averiguar os

cálculos de entropia para os modelos energéticos. Na Tabela 3 pode ser visto os

valores da variação de entropia (-TΔS) para cada um dos complexos estudados

nesse trabalho.

Necessita-se ressaltar que o modelo SV não leva em consideração mudanças

na configuração interna do ligante para a simulação do ligante não complexado, pois

ela depende explicitamente das distancias interatômicas entre o receptor e a

micromolécula de interesse. Esse fator nos mostra que a amostragem do ligante livre

não depende do modelo energético selecionado.

Tabela 3 - Valores de Entropia (-TΔS) para todos os 4 modelos energéticos a 100K

AMBER amortecido+SV (kcal/mol)

AMBER+SV (kcal/mol)

AMBER amortecido (kcal/mol)

AMBER (kcal/mol)

183L 5,1 ±0,2 4,9 ±0,2 5,1 ±0,2 4,8 ±0,2

184L 3,2 ±0,4 1,4 ±0,4 3,3 ±0,4 3,2 ±0,4

185L 5,1 ±0,3 4,9 ±0,3 5,1 ±0,3 4,9 ±0,3

186L 3,2 ±0,2 3.2 ±0,2 3,1 ±0,2 3,3 ±0,2

187L 5,1 ±0,3 4,8 ±0,3 5,1 ±0,3 4,9 ±0,3

188L 5,1 ±0,5 4,9 ±0,5 5,1 ±0,5 4,9 ±0,5

1LGW 5,2 ±0,4 4,9 ±0,4 5,1 ±0,4 4,8 ±0,4

1LI2 5,1 ±0,2 4,8 ±0,2 5,2 ±0,2 4,8 ±0,2

1LI3 5,1 ±0,4 5,0 ±0,4 5,1 ±0,4 4,9 ±0,4

1LI6 5,1 ±0,2 5,0 ±0,2 5,1 ±0,2 5,0 ±0,2

1NHB 3,0 ±0,4 3,1 ±0,4 3,1 ±0,4 3,1 ±0,4

3DMX 5,1 ±0,3 4,9 ±0,3 5,1 ±0,3 4,9 ±0,3

3HT8 5,1 ±0,3 4,8 ±0,3 5,1 ±0,3 4,8 ±0,3

3HTB 3,2 ±0,3 3.0 ±0,3 3,3 ±0,3 2,0 ±0,3

Fonte: Elaborada pelo autor.

Page 82: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

80

Figura 35 - Gráfico de barras com valores de Entropia -TΔS para os complexos em questão.

Fonte: Elaborada pelo autor.

Os valores de entropia se mantem relativamente similares para todos os

complexos, dentro das regiões de erro. Isso já seria esperado para questões para os

ligantes com características estruturas semelhantes. Os valores de entropia com

variações mais baixas são os ligantes com ligações torcionáveis, mostrando que ao

interagir com o receptor, as regiões acessíveis para o espaço torcional pode

aumentar pois, suas energias internas desfavoráveis são compensadas por novas

energias de interação favoráveis.

Para que possamos explicar a semelhança dos valores de entropia em

comparação ao amortecimento ou não do modelo energético, devemos ter em

mente que as caixas de simulação são reduzidas a volumes cúbicos de 64 Å3 de

dimensão, em passo que para a simulação do ligante fora do complexo é associado

uma caixa de probabilidade uniforme de 1667 Å3,. Assim, mesmo que os modelos

AMBER amortecido permitam o ligante amostrar mais regiões, essa amostragem

ainda é pequena em relação ao espaço configuracional de translação.

0,0

1,0

2,0

3,0

4,0

5,0

6,0

1 2 3 4 5 6 7 8 9 10 11 12 13 14

Valores de Entropia -TΔS (kcal/mol)

AMBER amortecido+Solv AMBER amortecido AMBER +Solv AMBER

Page 83: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

81

Em relação a rotação no espaço de Euler para os modelos amortecidos, temos

que lembrar que mesmo que a molécula consiga amostrar mais do complexo, ela

ainda é restrita a uma superfície de energia, e ainda existem restrições

estereoquímicas, que resultam em uma distribuição não-uniforme de probabilidades

no espaço configuracional, refletindo em valores de variação entrópica similares aos

dos modelos energéticos não amortecidos.

Em comparação com o trabalho de Purisima e colaboradores,37 os valores de

entropia são maiores para a amostragem sistemática em relação aos calculados

nesse trabalho. Como parte do conjunto de moléculas usado na docagem exaustiva

é similar ao utilizado nesse trabalho, é possível uma comparação em relação a

entropia.

Tabela 4 - Dados de entropia para Docagem Exaustiva (DE) e método Monte Carlo (MC)

Molécula Exp -TΔS (kcal/mol)

(DE) -TΔS (kcal/mol)

MC -TΔS (kcal/mol)

Exp -TΔS/T (kcal/mol)

(DE) -TΔS/T (kcal/mol)

MC -TΔS/T (kcal/mol)

3DMX 1,1 10,3 4,9 0,00373 0,034 0,049

183L 2,8 12,1 4,8 0,009333 0,04 0,048

184L 0,6 13,7 3,2 0,001967 0,046 0,032

185L 6,3 12,1 4,9 0,0211 0,041 0,049

186L 1,4 13,6 3,3 0,004533 0,046 0,033

187L 2,4 11,5 4,9 0,0079 0,038 0,049

188L 3 11,7 4,9 0,009867 0,039 0,049

Correl. Pearson -0,57 0,70 -0,49 0,70

Fonte: Elaborada pelo autor.

A docagem sistemática não atinge valores de correlação da entropia razoáveis

(-0,57), em contraste, a simulação MC tem valores de correlação de 0,7. Isso é

reflexo da amostragem feita pelo método MC que não é efetuada no trabalho de

Purisima e colaboradores (docagem sistemática).

Como a docagem sistemática não gera um ensemble termodinâmico

propriamente dito, a temperatura é imposta a 300 K, e essa imposição não afeta

diretamente a amostragem. No nosso caso, mesmo que a temperatura MC seja

definida a 100 K, ela mimetiza temperaturas experimentais de 300 K.

Page 84: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

82

Esses resultados é um indicio que a amostragem sistemática não é capaz de

analisar as entropias do sistema de forma favorável para esse conjunto de

complexos.

Ao se calcular os valores de -TΔS/T, vemos que entropia tem valores bem

similares para a maioria dos casos entre a docagem sistemática e o método MC. A

correlação com os dados experimentais de -TΔS/T continua similar, como já era de

se esperar.

4.2.4 Conjunto T4 – Correlação com dados experimentais e

dados de Dinâmica molecular.

Tendo as energias e as entropias analisadas, agora iremos introduzir os

cálculos de energia livre utilizando MC e Dinâmica molecular com MM/GBSA mais

ACCENT, comparando-os com dados experimentais de energia livre dos sistemas

em questão

4.2.4.1 Dinâmica Molecular para o conjunto T4

Inicialmente, foi feito uma análise comparativa com os dados de dinâmica

molecular, utilizando MM/GBSA para as energias de interação e o software ACCENT

para a entropia. O software ACCENT, utiliza a aproximação de primeira ordem

desenvolvido por Killian e colaboradores,49 para os graus de liberdade internos do

ligante (torções diédricas, angulares moleculares e vibrações de ligações).

Page 85: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

83

Tabela 5 – Dados termodinâmicos de dinâmica molecular.

Experimental

(kcal/mol)

ΔE (kcal/mol) ACCENT

-TΔS (kcal/mol)

Calculado

ΔG (kcal/mol)

183L -5,5 -19,0 0,0 -19,0 ±1,6

184L -6,5 -31,5 6,0 -25,5 ±1,8

185L -4,9 -17,8 0,0 -17,8 ±1,7

186L -6,7 -29,6 3,7 -25,9 ±1,8

187L -4,6 -23,8 4,5 -19,2 ±1,6

188L -4,6 -23,7 4,6 -19,1 ±1,6

1LI2 -5,2 -15,5 0,7 -14,8 ±1,5

1LI3 -5,8 -20,3 2,3 -18,0 ±1,8

1LI6 -5,5 -19,7 4,0 -15,6 ±1,4

1LGW -5,5 -20,1 1,9 -18,2 ±1,5

1NHB -5,7 -24,3 3,9 -20,4 ±1,5

3DMX -5,2 -14,4 0,0 -14,4 ±1,3

3HTB -7,0 -27,2 4,7 -22,5 ±1,9

3HT8 -5,4 -22,4 2,5 -19,9 ±1,7

Correl. Pearson 0,67 -0,38 0,63

Fonte: Elaborada pelo autor.

Figura 36 - Gráfico de dispersão para experimental Vs. calculado para MM/PBSA+ACCENT.

Fonte: Elaborada pelo autor.

-35,0

-30,0

-25,0

-20,0

-15,0

-10,0

-5,0

0,0

-7,5 -7,0 -6,5 -6,0 -5,5 -5,0 -4,5 -4,0

Cal

cula

do

Δ

G (

kCal

/Mo

l)

Experimental ΔG (kCal/Mol)

Energias Livres MMGBSA+ACCENT

Page 86: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

84

Após a conclusão das simulações de DM de 100 ns, foi efetuado o cálculo da

energia de interação através do método de MM/GBSA, utilizando os parâmetros de

raio de Born do próprio campo de forca AMBER FF14SB. Esses dados somados

com a entropia calculada a partir do ACCENT resultam na energia livre de ligação.

As correlações Pearson com os dados experimentais são mostradas na última

linha da Tabela 5, e já encontradas na literatura para os valores de MM/GBSA, com

grandezas similares.55

A tabela 5 também mostra os valores de entropia pela aproximação de

primeira ordem calculados pelo ACCENT. As moléculas que tem valor zero de

variação entrópica são as quais o ACCENT não conseguiu determinar as torções

significativas e as considerou internamente rígidas. Em comparação com as

entropias já citadas, os valores são significativamente mais baixos, pois não levam

em consideração uma parte importante: os graus de liberdade translacionais e

rotacionais.

Comparando as entropias entre o método MM/GBSA e o método MC, vemos

que eles têm similaridades em grandezas absolutas para os sistemas os quais o

ACCENT foi capaz de calcular. Porém, a comparação é feita a partir dos dados de

entropia interna do ligante calculada pelo ACCENT em uma dinâmica molecular em

300 K e a entropia total do ligante calculada por MC a 100 K, que mimetizam

experimento a 300 K. Isso é um indicio que pelo fato do ACCENT não calcular as

variações entrópicas em relação aos graus rototranslacionais o cálculo da entropia é

afetado negativamente, tendo valores diferentes do experimental

Para as energias de interação, vemos que as grandezas absolutas são

semelhantes, com correlações satisfatórias com a energia livre experimental,

semelhantemente aos dados de MC. Isso já era esperado pelo simples fato que os

modelos energéticos têm a mesma natureza.

Page 87: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

85

4.2.4.2 Energia Livre por Monte Carlo

Para que possamos discutir as energias livres, é necessário que seja

estudado sua convergência. Para Monte-Carlo é preciso que o sistema tenha

estabilizado e se equilibrado para que as grandezas termodinâmicas sejam medidas

satisfatoriamente.

Claramente é visto na Figura 37 que a rápida convergência dos sistemas em

sua maioria para um número de passos menor que dois milhões, mostrando que

para esses sistemas é necessário um pequeno número de passos para que haja

convergência. Em geral, é observado convergência para o sistema após dois

milhões de passos de Monte Carlo aceitos, isto é aproximadamente um quinto dos

passos efetuados para as simulações nesse trabalho.

Page 88: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

86

Figura 37 - Convergência dos sistemas para o modelo sf3 com a energia livre calculada a partir da energia média para temperaturas de 300 K no modelo AMBER.

Fonte: Elaborada pelo autor.

Page 89: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

87

As tabelas abaixo contêm os dados finais de simulação para os sistemas

descritos no trabalho. Na última linha das tabelas, como denotado, temos os valores

de correlação de Pearson calculados a partir do método de bootstrapping com seus

respectivos intervalos de confiança.

Na tabela 6, temos os dados termodinâmicos para o modelo AMBER

amortecido a 100K. Analisando os dados com foco nas correlações, temos que o

cálculo das energias livres usando a média da energia nos da correlação com o

experimental de 0,81. Essa alta correlação é claramente refletida na linearidade do

gráfico da Figura 38.

Rapidamente podemos notar a diferença de correlação entre as energias

livres calculadas com filtradas utilizando o fator de Boltzmann (denotado na tabela

com E2) e as energias de média de Monte Carlo. As energias filtradas, como

discutido anteriormente, pesam o valor mínimo para a interação.

Tabela 6 - Dados termodinâmicos para AMBER amortecido a 100K

Exp.

(kcal/mol)

-TΔS

(kcal/mol)

ΔE

(kcal/mol)

ΔE

(kcal/mol)

filtrado

ΔG

(kcal/mol)

ΔG

(kcal/mol)

filtrado

183L -5,5 5,1 ±0,2 -5,1 ±0,2 -15,1 ±0,2 0,0 ±0,2 -10,0 ±0,2

184L -6,5 3,3 ±0,4 -18,0 ±0,2 -32,2 ±0,2 -14,7 ±0,4 -28,9 ±0,4

185L -4,9 5,1 ±0,3 -7,9 ±0,4 -15,6 ±0,4 -2,7 ±0,4 -10,4 ±0,4

186L -6,7 3,1 ±0,2 -19,1 ±0,3 -28,3 ±0,3 -16,0 ±0,3 -25,2 ±0,3

187L -4,6 5,1 ±0,3 -3,1 ±0,5 -15,3 ±0,5 2,0 ±0,5 -10,2 ±0,5

188L -4,6 5,1 ±0,5 -3,5 ±0,2 -13,7 ±0,2 1,6 ±0,2 -8,6 ±0,2

1LGW -5,5 5,1 ±0,4 -2,7 ±0,4 -12,7 ±0,4 2,4 ±0,4 -7,6 ±0,4

1LI2 -5,2 5,2 ±0,2 -2,3 ±0,3 -21,0 ±0,3 2,8 ±0,3 -15,8 ±0,3

1LI3 -5,8 5,1 ±0,4 -4,5 ±0,6 -20,3 ±0,6 0,6 ±0,6 -15,2 ±0,6

1LI6 -5,5 5,1 ±0,2 -2,5 ±0,3 -15,9 ±0,3 2,6 ±0,3 -10,8 ±0,3

1NHB -5,7 3,1 ±0,4 -13,0 ±0,4 -22,2 ±0,4 -9,9 ±0,4 -19,1 ±0,4

3DMX -5,2 5,1 ±0,3 0,1 ±0,6 -15,1 ±0,6 5,2 ±0,6 -10,0 ±0,6

3HT8 -5,4 5,1 ±0,3 -3,6 ±0,5 -25,6 ±0,5 1,5 ±0,5 -20,5 ±0,5

3HTB -7,0 3,3 ±0,3 -18,0 ±0,4 -20,0 ±0,4 -14,7 ±0,4 -16,7 ±0,4

Correl.

Pearson

0,78 ±0,02 0,81 ±0,02 0,64 ±0,02 0,81 ±0,02 0,69 ±0,03

Fonte: Elaborada pelo autor.

Page 90: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

88

Figura 38- Gráfico de dispersão de valores experimentais Vs. calculados para AMBER amortecido a 100K.

Fonte: Elaborada pelo autor.

Figura 39 - Gráfico de dispersão de valores experimentais Vs. calculados para AMBER amortecido a 100K filtrados.

Fonte: Elaborada pelo autor.

-20,0

-15,0

-10,0

-5,0

0,0

5,0

10,0

-7,5 -7,0 -6,5 -6,0 -5,5 -5,0 -4,5 -4,0

ΔG

Cal

cula

do

(kc

al/m

ol)

ΔG Experimental(kcal/mol)

AMBER amortecido 100K ExperimentalXCalculado

-35,0

-30,0

-25,0

-20,0

-15,0

-10,0

-5,0

0,0

-7,5 -7,0 -6,5 -6,0 -5,5 -5,0 -4,5 -4,0

ΔG

Cal

cula

do

(kca

l/m

ol)

ΔG Experimental(kcal/mol)

AMBER amortecido 100K ExperimentalXCalculado Filtrado

Page 91: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

89

Na tabela 7 temos os dados para o modelo AMBER sem solvatação e não

amortecido, e novamente, as correlações calculadas a partir do método de

bootstrapping são mais altas para as energias livres com a energia de interação

contabilizada pela média de Monte Carlo.

É importante ressaltar que ao se adicionar a entropia na contabilização da

energia média, a correlação que é de 0.79 melhora para 0.81, que mesmo não

sendo uma melhoria alta, representa que a entropia do modo que é calculada

(aproximação de primeira ordem com amostragem de Monte Carlo) melhora a

análise para identificação dos melhores ligantes.

O efeito de melhoria pós adição de entropia também ocorre se utilizarmos as

energias filtradas: a correlação varia de 0,67 para 0,70.

Tabela 7-Dados termodinâmicos para AMBER a 100K

Fonte: Elaborada pelo autor.

Exp. -TΔS (kcal/mol) ΔE (kcal/mol) ΔE (kcal/mol) filtrado ΔG (kcal/mol) ΔG (kcal/mol) filtrado

183L -5,5 4,8 ±0,2 -13,2 ±0,1 -5,6 ±0,1 -8,4 ±0,2 -0,8 ±0,2

184L -6,5 3,2 ±0,4 -25,8 ±0,1 -31,7 ±0,1 -22,6 ±0,4 -28,4 ±0,4

185L -4,9 4,9 ±0,3 -24,1 ±0,4 -15,7 ±0,4 -19,2 ±0,4 -10,8 ±0,4

186L -6,7 3,3 ±0,2 -31,6 ±0,3 -27,7 ±0,3 -28,4 ±0,3 -24,5 ±0,3

187L -4,6 4,9 ±0,3 -9,5 ±0,5 -6,4 ±0,5 -4,6 ±0,5 -1,5 ±0,5

188L -4,6 4,9 ±0,5 -9,6 ±0,2 -6,7 ±0,2 -4,7 ±0,2 -1,9 ±0,2

1LGW -5,5 4,8 ±0,4 -10,3 ±0,4 -7,7 ±0,4 -5,5 ±0,4 -2,9 ±0,4

1LI2 -5,2 4,8 ±0,2 -9,5 ±0,3 -12,8 ±0,3 -4,6 ±0,3 -8,0 ±0,3

1LI3 -5,8 4,9 ±0,4 -15,7 ±0,5 -10,4 ±0,5 -10,8 ±0,6 -5,5 ±0,6

1LI6 -5,5 5,0 ±0,2 -13,3 ±0,3 -6,3 ±0,3 -8,3 ±0,3 -1,4 ±0,3

1NHB -5,7 3,1 ±0,4 -21,4 ±0,4 -21,4 ±0,4 -18,3 ±0,4 -18,3 ±0,4

3DMX -5,2 4,9 ±0,3 -7,7 ±0,4 -6,4 ±0,4 -2,8 ±0,6 -1,6 ±0,6

3HT8 -5,4 4,8 ±0,3 -14,5 ±0,4 -20,9 ±0,4 -9,8 ±0,5 -16,1 ±0,5

3HTB -7,0 2,0 ±0,3 -32,5 ±0,5 -19,1 ±0,5 -30,5 ±0,4 -17,1 ±0,4

Correl.

Pearson

0,83 ±0,01 0,79 ±0,01 0,67 ±0,01 0,81 ±0,01 0,70 ±0,04

Page 92: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

90

Figura 40 - Gráfico de dispersão de valores experimentais Vs. calculados para AMBER a 100K.

Fonte: Elaborada pelo autor.

Figura 41 - Gráfico de dispersão de valores experimentais Vs. calculados para AMBER a 100K filtrados.

Fonte: Elaborada pelo autor.

-35,0

-30,0

-25,0

-20,0

-15,0

-10,0

-5,0

0,0

-7,5 -7,0 -6,5 -6,0 -5,5 -5,0 -4,5 -4,0

ΔG

Cal

cula

do

(kca

l/m

ol)

ΔG Experimental(kcal/mol)

AMBER 100K ExperimentalXCalculado

-30,0

-25,0

-20,0

-15,0

-10,0

-5,0

0,0

-7,5 -7,0 -6,5 -6,0 -5,5 -5,0 -4,5 -4,0

ΔG

Cal

cula

do

(kca

l/m

ol)

ΔG Experimental(kcal/mol)

AMBER 100K ExperimentalXCalculado Filtrado

Page 93: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

91

Agora para a Tabela 8, vemos os efeitos da solvatação implícita SV na

comparação experimental para o modelo AMBER amortecido. A mudança que a

solvatação causa nos valores de energia diminuem a correlação, em relação ao

mesmo modelo sem solvatação.

É interessante que essa diminuição seja discutida se observando as

características estruturais do conjunto teste, os quais são micromoléculas em geral

apolares ou com pequenas regiões polares. Como o modelo de solvatação SV é um

modelo de solvatação implícita, um estudo sobre os parâmetros empíricos é

necessário para esse complexo, é compreensível que o modelo SV não seja cabível

para essa análise utilizando os parâmetros empíricos padrões do LiBELa, porém, a

tendência entre os ligantes ainda é mantida (Figuras 42 e 43).

Tabela 8 - Dados termodinâmicos para AMBER amortecido +Solv a 100K

Exp. -TΔS (kcal/mol) ΔE (kcal/mol) ΔE (kcal/mol) filtrado ΔG (kcal/mol) ΔG (kcal/mol) filtrado

183L -5,5 5,1 ±0,2 -2,3 ±0,1 -14,8 ±0,1 2,7 ±0,2 -9,8 ±0,2

184L -6,5 3,2 ±0,4 -15,3 ±0,1 -30,7 ±0,1 -12,0 ±0,4 -27,5 ±0,4

185L -4,9 5,1 ±0,3 -4,2 ±0,4 -15,2 ±0,4 1,0 ±0,4 -10,1 ±0,4

186L -6,7 3,2 ±0,2 -16,2 ±0,3 -26,7 ±0,3 -13,0 ±0,3 -23,4 ±0,3

187L -4,6 5,1 ±0,3 -0,6 ±0,5 -15,3 ±0,5 4,4 ±0,5 -10,3 ±0,5

188L -4,6 5,1 ±0,5 -1,2 ±0,2 -13,3 ±0,2 3,9 ±0,2 -8,3 ±0,2

1LGW -5,5 5,2 ±0,4 4,2 ±0,4 -12,7 ±0,4 9,4 ±0,4 -7,5 ±0,4

1LI2 -5,2 5,1 ±0,2 2,5 ±0,3 -20,5 ±0,3 7,6 ±0,3 -15,3 ±0,3

1LI3 -5,8 5,1 ±0,4 0,4 ±0,5 -20,5 ±0,5 5,5 ±0,6 -15,3 ±0,6

1LI6 -5,5 5,1 ±0,2 0,4 ±0,3 -15,9 ±0,3 5,5 ±0,3 -10,8 ±0,3

1NHB -5,7 3,0 ±0,4 -10,6 ±0,4 -20,7 ±0,4 -7,6 ±0,4 -17,6 ±0,4

3DMX -5,2 5,1 ±0,3 2,6 ±0,4 -14,9 ±0,4 7,7 ±0,6 -9,8 ±0,6

3HT8 -5,4 5,1 ±0,3 1,5 ±0,4 -0,1 ±0,4 6,7 ±0,5 5,0 ±0,5

3HTB -7,0 3,2 ±0,3 -12,4 ±0,5 -16,8 ±0,5 -9,2 ±0,4 -13,6 ±0,4

Correl.

Pearson

0,78 ±0,01 0,73 ±0,01 0,50 ±0,01 0,74 ±0,01 0,56 ±0,04

Fonte: Elaborada pelo autor.

Page 94: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

92

Figura 42 - Gráfico de dispersão de valores experimentais Vs. calculados para AMBER amortecido + Solv a 100K.

Fonte: Elaborada pelo autor.

Figura 43 - Gráfico de dispersão de valores experimentais Vs. calculados para AMBER amortecido + Solv a 100K filtrados.

Fonte: Elaborada pelo autor.

-15,0

-10,0

-5,0

0,0

5,0

10,0

15,0

-7,5 -7,0 -6,5 -6,0 -5,5 -5,0 -4,5 -4,0

ΔG

Cal

cula

do

(kca

l/m

ol)

ΔG Experimental(kcal/mol)

AMBER amortecido + Solv 100K ExperimentalXCalculado

-30,0

-25,0

-20,0

-15,0

-10,0

-5,0

0,0

5,0

10,0

-7,5 -7,0 -6,5 -6,0 -5,5 -5,0 -4,5 -4,0

ΔG

Cal

cula

do

(kca

l/m

ol)

ΔG Experimental(kcal/mol)

AMBER amortecido + Solv 100K ExperimentalXCalculado Filtrado

Page 95: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

93

Para o último teste, temos a tabela 9 com o modelo AMBER não amortecido,

mas a função de solvatação SV. Em comparação com os resultados da tabela 7,

com o AMBER amortecido, vemos uma melhoria significativa, especialmente para as

energias livres com as energias de interação filtradas.

Assim, é possível compreender que o amortecimento do modelo de interação

não melhora significativamente os resultados.

Tabela 9 -Dados termodinâmicos para AMBER+Solv a 100K

Exp. -TΔS (kcal/mol) ΔE (kcal/mol) ΔE (kcal/mol) filtrado ΔG (kcal/mol) ΔG (kcal/mol) filtrado

183L -5,5 4,9 ±0,2 -10,0 ±0,1 -5,5 ±0,1 -5,1 ±0,2 -0,6 ±0,2

184L -6,5 1,4 ±0,4 -22,1 ±0,1 -29,9 ±0,1 -20,7 ±0,4 -28,6 ±0,4

185L -4,9 4,9 ±0,3 -20,0 ±0,4 -13,7 ±0,4 -15,1 ±0,4 -8,8 ±0,4

186L -6,7 3 ±0,2 -27,7 ±0,3 -25,8 ±0,3 -24,7 ±0,3 -22,8 ±0,3

187L -4,6 4,8 ±0,3 -6,8 ±0,5 -6,2 ±0,5 -1,9 ±0,5 -1,3 ±0,5

188L -4,6 4,9 ±0,5 -6,8 ±0,2 -6,5 ±0,2 -1,9 ±0,2 -1,6 ±0,2

1LGW -5,5 4,9 ±0,4 -3,5 ±0,4 -7,3 ±0,4 1,4 ±0,4 -2,4 ±0,4

1LI2 -5,2 4,8 ±0,2 -3,9 ±0,3 -12,8 ±0,3 0,9 ±0,3 -8,0 ±0,3

1LI3 -5,8 5,0 ±0,4 -9,9 ±0,5 -10,5 ±0,5 -4,9 ±0,6 -5,5 ±0,6

1LI6 -5,5 5,0 ±0,2 -10,0 ±0,3 -6,3 ±0,3 -5,0 ±0,3 -1,3 ±0,3

1NHB -5,7 3,1 ±0,4 -18,3 ±0,4 -19,8 ±0,4 -15,3 ±0,4 -16,7 ±0,4

3DMX -5,2 4,9 ±0,3 -4,7 ±0,4 -6,3 ±0,4 0,2 ±0,6 -1,4 ±0,6

3HT8 -5,4 4,8 ±0,3 -5,5 ±0,4 -20,9 ±0,4 -0,7 ±0,5 -16,1 ±0,5

3HTB -7,0 3.2 ±0,3 -26,0 ±0,5 -15,9 ±0,5 -22,8 ±0,4 -12,7 ±0,4

Correl.

Pearson

0,73 ±0,01 0,73 ±0,01 0,64 ±0,01 0,76 ±0,01 0,66 ±0,04

Fonte: Elaborada pelo autor.

Page 96: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

94

Figura 44 - Gráfico de dispersão de valores experimentais Vs. calculados para AMBER amortecido + Solv a 100K.

Fonte: Elaborada pelo autor.

Figura 45 - Gráfico de dispersão de valores experimentais Vs. calculados para AMBER + Solv a 100K filtrados.

Fonte: Elaborada pelo autor.

-30,0

-25,0

-20,0

-15,0

-10,0

-5,0

0,0

5,0

-7,5 -7,0 -6,5 -6,0 -5,5 -5,0 -4,5 -4,0

ΔG

Cal

cula

do

(kca

l/m

ol)

ΔG Experimental(kcal/mol)

AMBER+Solv 100K ExperimentalXCalculado

-35,0

-30,0

-25,0

-20,0

-15,0

-10,0

-5,0

0,0

-7,5 -7,0 -6,5 -6,0 -5,5 -5,0 -4,5 -4,0

ΔG

Cal

cula

do

(kca

l/m

ol)

ΔG Experimental(kcal/mol)

AMBER+Solv 100K ExperimentalXCalculado Filtrado

Page 97: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

95

Como pode ser visto na tabela 10, os dados comparativos entre os métodos

de interação onde claramente há um aumento sistemático com o aumento da

complexidade. Ao se analisar somente a energia de interação da estrutura

cristalográfica, vemos a correlação Pearson de 0,52 e no caso da energia livre

calculada com a aproximação de primeira ordem, vemos um aumento substancial

para 0,82.

Tabela 10 – Dados comparativos entre diferentes métodos de estudos interativos.

Experimental ΔG

(Kcal/Mol)

Energia De Interação Da

Estrutura Cristalográfica

(Kcal/Mol)

Energia De Interação Docada

(Kcal/Mol)

Energia Média De Monte

Carlo (Kcal/Mol)

ΔG

Calculado (Kcal/Mol)

183L -5,5 -19,8 -21,6 -13,2 -8,4

184L -6,5 -27,7 -22,5 -25,8 -22,6

185L -4,9 -27,7 -25,4 -24,1 -19,2

186L -6,7 -21,7 -24,5 -31,6 -28,4

187L -4,6 -16,1 -18,8 -9,5 -4,6

188L -4,6 -16,6 -18,4 -9,6 -4,7

1LGW -5,5 -24,5 -25,2 -10,3 -5,5

1LI2 -5,2 -11,8 -25,0 -9,5 -4,6

1LI3 -5,8 -21,8 -26,1 -15,7 -10,8

1LI6 -5,5 -16,1 -21,6 -13,3 -8,3

1NHB -5,7 -17,0 -18,9 -21,4 -18,3

3DMX -5,2 -14,2 -16,4 -7,7 -2,8

3HT8 -5,4 -21,3 -27,4 -14,5 -9,8

3HTB -7,0 -24,2 -28,8 -32,5 -30,5

Correlação Pearson 0,52 0,54 0,79 0,82

Fonte: Elaborada pelo autor.

Como pode ser visto na tabela 11, os dados experimentais de entalpia são altamente

favoráveis, que para um conjunto de moléculas apolares, não é esperado. Isso nos traz o

fato que a ligação da molécula no conjunto L99A ocorre entalpicamente, ao contrário do que

se esperaria51, pois, pela s características apolares, . Essa característica é demonstrada nos

dados obtidos no método MC e também nos dados de MM/GBSA, pois temos valores

altamente favoráveis para as energias de interação em ambos os casos.

Page 98: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

96

Tabela 11 - Dados de dinâmica, Monte Carlo e experimentais para o conjunto Lisozima. A energia mostrada nessa tabela para MC, denotada como ΔE é a média de Monte Carlo

Exp ΔG (kcal/mol)

Exp ΔH (kcal/mol)

Exp -TΔS

(kcal/mol)

MM/GBSA ΔG

(kcal/mol)

ACCENT -TΔS

(kcal/mol)

MM/GBSA + ACCENT ΔE(kcal/m

ol)

MC ΔE(kcal/m

ol)

MC -TΔSG (kcal/mol)

MC ΔG (kcal/mol)

183L -5,5 -8,3 2,8 -19 - -19 -13,2 4,8 -8,4

184L -6,5 -7,09 0,59 -25,5 6 -31,5 -25,8 3,2 -22,6 185L -4,9 -11,23 6,33 -17,8 - -17,8 -24,1 4,9 -19,2

186L -6,7 -8,06 1,36 -25,9 3,7 -29,6 -31,6 3,3 -28,4 187L -4,6 -6,97 2,37 -19,2 4,5 -23,8 -9,5 4,9 -4,6

188L -4,6 -8,45 3,85 -19,1 4,6 -23,7 -9,6 4,9 -4,7 1LGW -5,5 - - -18,2 1,9 -20,1 -10,3 4,8 -5,5

1LI2 -5,2 - - -14,8 0,7 -15,5 -9,5 4,8 -4,6 1LI3 -5,8 - - -18 2,3 -20,3 -15,7 4,9 -10,8

1LI6 -5,5 - - -15,6 4 -19,7 -13,3 5 -8,3 1NHB -5,7 - - -20,4 3,9 -24,3 -21,4 3,1 -18,3

3DMX -5,2 -6,32 1,12 -14,4 - -14,4 -7,7 4,9 -2,8 3HT8 -5,4 - - -22,5 4,7 -27,2 -14,5 4,8 -9,8

3HTB -7 - - -19,9 2,5 -22,4 -32,5 2 -30,5

Fonte: Elaborada pelo autor.

Page 99: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

97

CAPÍTULO 5

5 DISCUSSÃO

Sabendo que é crucial para o entendimento da termodinâmica dos sistemas a

compreensão das variações entrópicas e entálpicas, é interessante analisar o

relacionamento dessas grandezas com a energia livre e as suas respectivas

assinaturas termodinâmicas.

5.1 Entalpia de ligação

É interessante observar o comportamento da entalpia nas simulações de

MC, frente aos dados experimentais existentes. Como mostrado em resumo na

tabela 10, os valores das energias médias de interação calculadas por ambos os

métodos (MC e MM/GBSA) são geralmente mais favoráveis que os valores

experimentais de entalpia, calculados e discutidos por Morton e colaboradores,51

para o conjunto L99A.

Pelas características dos ligantes (estruturas apolares) era de se esperar

que as variações de entropia no sistema fossem o fator chave para o cálculo do

valor das energias livres. Porém, como demonstrado nos resultados experimentais

para esse sistema, o efeito é contrário, pois, a entalpia rege a interação molecular,

sendo mais importante que a variação das grandezas entrópicas.

Isso pode ser explicado pela estrutura do ligante-receptor e suas

complementariedades: para os dados testados e avaliados perante o experimental, a

estrutura apolar do ligante interage com a superfície do receptor do complexo L99A,

que também é hidrofóbica e completamente sem solvente e enterrada, o que

acarreta em valores favoráveis de energias, pois há uma boa acomodação do

Page 100: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

98

ligante. Assim, a perda entrópica é compensada pela interação da molécula no sitio

de interação.

Nesse escopo vemos que ambos os cálculos de energia de interação,

através da dinâmica molecular usando MM/GBSA ou usando MC, são capazes de

mostrar que as grandezas entálpicas relacionadas com a variação da energia de

interação são altamente favoráveis. Porém, ambos os métodos erram em grandeza,

pois denotam energias bem mais negativas que os valores experimentais.

Essa discrepância pode vir de uma gama de fatores, porém nos ateremos a

duas. Primeiramente, a amostragem das energias nos sítios de ligação, é

consideravelmente afetada pela utilização do receptor rígido. Esta rigidez resulta no

fato que não é possível ter certeza que as regiões de mínimo foram realmente

amostradas similarmente ao sistema biológico.

Em segundo lugar, temos os modelos energéticos como fonte de erro. É

importante ressaltar que os modelos energéticos implementados nesse trabalho são

simples para que sejam feitos os cálculos de forma rápida. No entanto, esses

modelos são dependentes dos parâmetros de campo de força e da função utilizada

para contabilizar as interações

Yin e colaboradores,72 mostraram recentemente que a mudança em

parâmetros do potencial Lennard-Jones (GAFF) podem melhorar os valores

referentes as interações moleculares. Nesse trabalho, os autores analisaram o efeito

dessas mudanças, e observaram que, ao mudar os parâmetros referentes aos raios

e profundidades dos poções de Lennard-Jonnes de alguns tipos atômicos (oxigênio

e nitrogênio), há uma diminuição dos valores absolutos das energias de interação,

melhorando seus dados de simulação perante os dados experimentais.

Pela falta de regiões polares nos ligantes, sabe-se que a interação é

controlada pelo potencial de Lennard-Jones. Assim, podemos inferir, através do

trabalho de Yin e colaboradores, que há espaço para melhorias nos parâmetros de

campo de força.

Em relação aos complexos L99A/M102Q, não se tem dados experimentais

de entropia, porém, através das simulações, podemos inferir algumas características

termodinâmicas.

Page 101: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

99

Considerando a região polar contida em todos os ligantes que compõem os

complexos M102Q, é esperado uma maior interação polar com o receptor, que

refletiria valores mais favoráveis para a energia de interação. Em geral, isso

acontece para os ligantes, como pode ser visto na tabela 1.

Assim, o método MC e a DM utilizando MM/GBSA é capaz de captar a

natureza da ligação e mesmo que não se tenha uma grandeza absoluta que se

iguala aos valores experimentais, a tendência da interação é encontrada, quando se

compara diversos complexos, dados que se reflete nas correlações altas.

5.2 Entropia de ligação

A principal diferença, quando comparamos as energias livres calculadas com

MM/GBSA e as energias livres utilizando o método MC, tendo ambos os métodos

comparados aos dados experimentais, são os valores de entropia. Nenhum dos

métodos é capaz de acertar em valores absolutos as entropias dos sistemas.

Essa divergência vem de várias razões: todos os valores apresentados aqui,

para ambos os métodos, são aproximações de primeira ordem para as distribuições

de probabilidade baseadas no trabalho de Killian e colaboradores.49 Assim, é

compreensível que exista uma diferença entre os valores experimentais e

calculados. Em segundo, a variação entrópica foi calculada apenas para os ligantes,

desprezando a variação entrópica do receptor.

No trabalho de Killian e colaboradores,49 os dados foram analisados

comparando com o método “Mining Minima” de Head e colaborares,38 assim, não

podemos ter uma análise comparativa sobre seu trabalho perante o trabalho

apresentado nesta dissertação.

No entanto podemos dizer que a adição de novos graus de aproximação tem

sua eficácia sendo depende do sistema o qual o método é aplicado. Em alguns

complexos utilizados no trabalho de Killian, a adição da aproximação de segunda

ordem tem um efeito mais substancial que em outros sistemas.

Para a DM utilizando ACCENT, podemos aferir sobre as suas grandezas

absolutas, as quais são mais razoáveis que as da docagem exaustiva, na mesma

Page 102: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

100

ordem de grandeza dos valores experimentais, porém não podemos dizer com

segurança sobre as correlações, pois muitos dos ligantes L99A, para quais temos

valores experimentais. O ACCENT não foi capaz de calcular sua entropia por

considera-los internamente rígidos.

Em relação ao trabalho de Purisima e colaboradores, onde foi feita a

avaliação da energia livre por docagem exaustiva, podemos ver que o método

utilizado tem bastante sucesso na predição de valores absolutos de energia livre,

porém não tem a mesma eficácia na predição da entropia de ligação, como também

não encontra sua tendência. Isto é refletido na correlação negativa de -0,74 em

relação aos dados experimentais. Isso é um indicio que a entropia calculada a partir

de uma amostragem sistemática que não segue critérios termodinâmicos falha em

calcular as entropias corretamente, em contraste com a alta correlação obtida

utilizando a aproximação de primeira ordem amostrada por Monte Carlo Metropolis.

Por último, observando os dados das entropias calculados utilizando a

amostragem de Monte Carlo, vemos que temos uma correlação alta (~0,7) com os

dados experimentais.

Essa correlação alta é reflexo da diferença entre valores entrópicos entre

complexos contendo ligantes flexíveis (184L, 186L, 3HTB e 1NHB) e os restantes,

os quais são rígidos. Esse fato nos mostra que o evento de ligação de uma molécula

flexível no sítio ativo pode amenizar a perda de entropia (-TΔS), representado na

Figura 46, onde vemos as estruturas superpostas do ligante n-butilbenzeno no

estado ligado e no estado livre, mostrando que o sitio não restringe os graus de

liberdade internos, amenizando a perda entrópica.

Page 103: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

101

Figura 46 – Estrutura superposta do n-Butilbenzeno para 100K nos estados ligados e desligados.

Fonte: Elaborada pelo autor.

Isso se dá devido ao fato que a estrutura receptor-ligante gera interações

favoráveis que compensam uma energia interna do ligante levemente desfavorável,

pois no estado complexado, o ligante pode acessar estados torcionais que não

seriam possíveis somente com a energia interna sendo contabilizadas.

Esse fato resulta no acerto da tendência no conjunto dos complexos. No

entanto, as entropias calculadas através do método Monte Carlo não acertam os

valores absolutos das entropias experimentais.

Assim, vemos que: o cálculo de primeira ordem capta a variação entrópica

entre os estados, mas também superestima seus valores. Como já dito, Killian

mostra que a adição das aproximações de segunda e terceira ordem podem ser

eficazes para certos complexos.

Não é possível que seja discutido satisfatoriamente as entropias pelo método do

ACCENT, pois esse método não encontro ligações torcionáveis em diversas das

moléculas de interesse.

Page 104: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

102

5.3 Assinaturas termodinâmicas dos sistemas

Como foco dos trabalhos nesse projeto foi de analisar as assinaturas

termodinâmicas dos sistemas, sendo elas as grandezas entrópicas, entálpicas ou

energias livres, é necessário que sejam analisadas essas grandezas perante suas

relações, determinadas pela equação 1.24.

Figura 47 – Assinatura termodinâmica experimental das moléculas descritas.

Fonte: Elaborada pelo autor.

Figura 48 – Assinatura termodinâmica das moléculas descritas utilizando os dados calculados.

Fonte: Elaborada pelo autor.

Page 105: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

103

O conjunto L99A tem assinaturas termodinâmicas bem significativas, como

vistos na Figura 47 e 48: o complexo 186L, o qual é ligado a molécula n-

butilbenzeno, tem uma variação entrópica relativamente semelhante ao complexo

3DMX, cujo ligante é um benzeno (1,36 kcal/mol e 1.16 kcal/mol, respectivamente).

Essa característica é contra intuitiva em relação aos graus de liberdade adicionais

que a molécula n-butilbenzeno contém.

Quando comparamos a energia livre de ligação dos dois complexos, existe

uma diferença de aproximadamente 1,2 kcal/mol entre complexos ( -6,7 kcal/mol

para 186L e -5,3 kcal/mol, para 3DMX). Essa diferença é causada pela parte

entálpicas das energias livres.

Essas características (energias livres que são regidas pela entalpia) são

significativas para esse conjunto, de acordo com Morton e colaboradores,51 é

encontrada pela quantificação das energias livres utilizando MC. Assim, as energias

tem variações maiores entre os complexos que as variações de entropia entre os

mesmos complexos.

Olhando pelo viés das correlações, também vemos que as entropias têm um

peso significativamente menor, utilizando o caso das simulações MC a 100 K para o

modelo energético AMBER sem solvatação, as correlações com os dados de

energia interna são maiores que as correlações das entropias quando ambas são

comparadas a energia livre experimental.

Porém, a combinação linear das duas gera correlações que são melhores que

as correlações das energias de interação ou das entropias sozinhas. Isso mostra

que a adição da entropia causa uma melhora, mas não é tão significativa, mostrando

ela não é um critério chave para esse complexo, o que está de acordo com o

experimental.

Page 106: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

104

Page 107: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

105

CAPITULO 6

6 CONCLUSÕES

6.1 Conclusões

Nesse trabalho, tivemos como objetivo elaborar um método computacional

para cálculo de energias livres de modo rápido e simplificado o qual possa ser usado

em para um grande número de testes em tempo computacionalmente hábil.

Primeiramente viu-se que o algoritmo é capaz de vasculhar o sítio de

interação e encontrar regiões de mínimo de energia tanto quanto regiões de máximo

frequência no espaço de fase, o qual se orienta na direção do proposito do software,

que é entender melhor como as interações acontecem e mapear o sítio de ligação

para gerar superfícies de energia, no nosso caso, superfícies RMSD versus energias

de interação, para melhor entendermos as interações proteína-ligante

Com nosso software, obtiveram-se dados robustos e estatisticamente

confiáveis, os quais estão de concordância com dados expedidos por métodos

semelhantes, obtendo uma separação melhor que os dados de dinâmica molecular

utilizando MM/GBSA para o cálculo de energias livres em conjunto com o cálculo de

entropias a partir do software ACCENT.

Assim, pode-se concluir que o LiBELa tem potencial para cálculos relativos de

energia livre e estudos de pós-docagem para sistemas simples como o da lisozima,

porém necessita-se de mais elaboração nos algoritmos da classe, como adição de

flexibilidade ao receptor, de melhorias para contabilização de outros graus de

liberdade na entropia (vibracionais e angulares) e de novos modelos energéticos.

Vale destacar que o tempo gasto para os cálculos de DM gira em torno de 22

a 24 horas para cada complexo, utilizando o software AMBER em uma GPU nVidia

GTX 980. Por outro lado, a análise por MC na abordagem proposta consome em

torno de 40 a 60 minutos em um único processador Xeon 2.7Ghz. Embora a

Page 108: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

106

amostragem do sistema nas duas técnicas seja diferente, com aproximações

diferentes, há um ganho de eficiência aparente em se empregar o método MC como

um método para avaliar a interação molecular.

Page 109: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

107

REFERÊNCIAS

1 ACHIEVEMENTS in Public Health 1900-1999: control of infectious diseases. Disponível em: <https://www.cdc.gov/mmwr/preview/mmwrhtml/mm4829a1.htm>. Acesso em: 11 jul. 2016. 2 ALLISON, M. Reinventing clinical trials. Nature Biotechnology, v. 30, n. 1, p. 41-49, 2012. 3 AHMAD, S. R. et al. Renal failure associated with the use of celecoxib and rofecoxib. Drug Safety, v. 25, n. 7, p. 537–544, 2002 4 WHY competition from generics hit Pfizer’s 1Q 2014 revenue - market realist. Disponível em: <http://marketrealist.com/2014/05/pfizers-1q-2014-revenue-hit-competition-generics/>. Acesso em: 30 set. 2016. 5 LEACH, A. R. Molecular modelling : principles and applications. 2nd ed. New York: Prentice Hall, 2001.. 6 MEDICINANET. Registro de medicamentos novos. Disponível em: <http://www.medicinanet.com.br/conteudos/revisoes/6065/registro_de_medicamentos_novos.htm.> . Acesso em 14 jul. 2016. 7 JORGENSEN, W. L. Efficient drug lead discovery and optimization. Accounts of Chemical Research, v. 42, n. 6, p. 724–733, 2009. 8 JONES Research Group. Disponível em: <https://joneslab.chem.wsu.edu/>. Acesso em: 14 jul. 2016. 9 BATOOL, M. Protein modelling and molecular docking: modeller, autodock. Saarbrücken, Germany: LAP Kambert Academic, 2012. 10 MERCADER, A. G.; DUCHOWICZ, P. R.; SIVAKUMAR, P. M. (Ed.). Chemometrics applications and research: QSAR in medicinal chemistry. Toronto: Apple Academic Press, 2015. 11 PUZYN, T.; LESZCZYNSKI, J.; CRONIN, M. T. D. (Ed.). Recent advances in QSAR studies: methods and applications. Dordrecht: Springer, 2010. 12 SAIER, M. H.; STILES, C. D. Molecular dynamics in biological membranes. New York: Springer-Verlag, 1975. 13 HAILE, J. M. Molecular dynamics simulation: elementary methods. New York: Wiley, 1997. 14 FERREIRA, L. et al. Molecular docking and structure-based drug design strategies. Molecules, v. 20, n. 7, p.13384–13421, 2015. 15 RUPP, B. Biomolecular crystallography: principles, practice, and application to structural biology. New York: Garland Science, 2010.

Page 110: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

108

16 LEHNINGER, A. L.; NELSON, D. L.; COX, M. M. Lehninger principles of biochemistry. 6th ed. New York: W.H. Freeman, 2013. 17 BERMAN, H. M. The protein data bank. Nucleic Acids Research, v. 28, n. 1, p. 235–242, 2000. 18 HORNAK, V. et al. Comparison of multiple amber force fields and development of improved protein backbone parameters. Proteins: structure function and bioinformatics, v. 65, n. 3, p. 712–725, 2006. 19 CASE, D. A. et al. AMBER Software 2015. California: University of California, 2015. 20 SALOMON-FERRER, R.; CASE, D. A.; WALKER, R. C. An overview of the amber biomolecular simulation package. Wiley Interdisciplinary Reviews: computational molecular science, v. 3, n. 2, p. 198–210, 2013. 21 BROOKS, B. R. et al. CHARMM: a program for macromolecular energy, minimization, and dynamics calculations. Journal of Computational Chemistry, v. 4, n. 2, p. 187–217, 1983. 22 JORGENSEN, W. L.; TIRADO-RIVES, J. The OPLS [optimized potentials for liquid simulations] potential functions for proteins, energy minimizations for crystals of cyclic peptides and crambin. Journal of the American Chemical Society, v. 110, n. 6, p. 1657-1666, 1988. 23 SCOTT, W. R. P. et al. The GROMOS Biomolecular Simulation Program Package. Journal of Physical Chemistry A, v. 103, n. 19, p. 3596–3607, 1999.. 24 SOTRIFFER, C. A.; GOHLKE, H.; KLEBE, G. Docking into knowledge-based potential fields: a comparative evaluation of drugscore. Journal of Medicinal Chemistry, v. 45, n. 10, p. 1967-1970, 9 2002.. 25 MUEGGE, I. PMF scoring revisited. Journal of Medicinal Chemistry, v. 49, n. 20, p. 5895–5902, 2006. 26 STILL, W. C. et al. Semianalytical treatment of solvation for molecular mechanics and dynamics. Journal of the American Chemical Society, v. 112, n. 16, p. 6127–6129, 1990. 27 QIU, D. et al. The GB/SA continuum model for solvation. A fast analytical method for the calculation of approximate born radii. Journal of Physical Chemistry A, v. 101, n. 16, p. 3005-3014, 1997. 28 KOLLMAN, P. Free-energy calculations - applications to chemical and biological phenomena. Chemistry Review, v. 93, n. 7, p. 2395-2417, 1993. 29 AQVIST, J.; MEDINA, C.; SAMUELSSON, J. E. A new method for predicting binding affinity in computer-aided drug design. Protein Engineering, v. 7, n. 3, p. 385-391, 1994.

Page 111: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

109

30 AQVIST, J. Calculation of absolute binding free energies for charged ligands and effects of long-range electrostatic interactions. Journal of Computational Chemistry, v. 17, n. 14, p. 1587-1597, 1996. 31 CRAMER, C. J. Essentials of computational chemistry : theories and models. 2nd ed. New Jersey: Wiley, 2004. 32 TEMBE, B.; MCCAMMON, J. Ligand receptor interactions. Computers & Chemistry, v. 8, n. 4, p. 281–283, 1984. Doi:10.1016/0097-8485(84)85020-2.. 33 ONUFRIEV, A.; CASE, D. A.; BASHFORD, D. Effective Born radii in the generalized Born approximation: the importance of being perfect. Journal of Computational Chemistry, v. 23, n. 14, p. 1297–1304, 2002.

34 ZWANZIG, R. W. High‐temperature equation of state by a perturbation method. I. Nonpolar gases. Journal of Chemical Physics, v. 22, n. 8, p. 1420–1426, 1954. 35 DAGGETT, V. (Ed.). Protein simulations. Amsterdam: Elsevier, 2003. 36 JENSEN, F. Introduction to computational chemistry. 2nd ed. Hoboken, NJ: John Wiley & Sons, 2007. 37 PURISIMA, E. O.; HOGUES, H. Protein-ligand binding free energies from exhaustive docking. Journal of Physical Chemistry B, v. 116, n. 23, p. 6872-6879, 2012. 38 HEAD, M.; GIVEN, J.; GILSON, M. “Mining minima”: direct computation of conformational free energy. Journal of Physical Chemistry A, v. 5639, n. 2, p. 1609–1618, 1997. 39 UCISIK, M. N. et al. Bringing clarity to the prediction of protein-ligand binding free energies via blurring. Journal of Chemical Theory and Computation, v. 10, n. 3, p. 1314–1325, 2014. 40 MUNIZ, H.; NASCIMENTO, A. Ligand- and receptor-based docking with libela. Journal of Computer-Aided Molecular Design, v. 29, n. 8, p. 713–723, 2015. 41 DILL, K. A.; BROMBERG, S. Molecular driving forces: statistical thermodynamics in chemistry and biology. New York: Garland Science, 2003.. 42 MEIROVITCH, H.; CHELUVARAJA, S.; WHITE, R. P. Methods for calculating the entropy and free energy and their application to problems involving protein flexibility and ligand binding. Current Protein & Peptide Science, v. 10, n. 3, p. 229–243, 2009. 43 SCHLICK, T. Molecular modeling and simulation: an interdisciplinary guide. New York: Springer -Verlag, 2010. V. 21. (Interdisciplinary applied mathematics, v.21).

Page 112: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

110

44 MAIER, J. A. et al. Ff14sb: improving the accuracy of protein side chain and backbone parameters from ff99sb. Journal of Chemical Theory and Computation, v. 11, n. 8, p. 3696–3713, 2015. 45 FERRARI, A. M. et al. Soft docking and multiple receptor conformations in virtual screening. Journal of Medicinal Chemistry, v. 47, n. 21, p. 5076–5084, 2004. 46 STOUTEN, P. F. W. et al. An effective solvation term based on atomic occupancies for use in protein simulations. Molecular Simulation, v. 10, n. 2-6, p. 97–120, 1993.. 47 VERKHIVKER, G. M. et al. Towards understanding the mechanisms of molecular recognition by computer simulations of ligand-protein interactions. Journal of Molecular Recognition, v. 12, n. 6, p. 371–389, 1999. 48 WRIGHT, M. R. An introduction to aqueous electrolyte solutions. Hoboken, NJ: John Wiley, 2007. 49 KILLIAN, B. J.; KRAVITZ, J. Y.; GILSON, M. K. Extraction of configurational entropy from molecular simulations via an expansion approximation. Journal of Chemical Physics, v. 127, n. 2, p. 024107, 2007 50 MORTON, A.; MATTHEWS, B. W. Specificity of ligand binding in a buried nonpolar cavity of T4 lysozyme: linkage of dynamics and structural plasticity. Biochemistry, v. 34, n. 27, p. 8576–8588, 1995. 51 MORTON, A.; BAASE, W. A.; MATTHEWS, B. W. Energetic origins of specificity of ligand binding in an interior nonpolar cavity of T4 lysozyme. Biochemistry, v. 34, n. 27, p. 8564–8575, 1995. 52 BOYCE, S. et al. Predicting ligand binding affinity with alchemical free energy methods in a polar model binding site. Journal of Molecular Biology, v. 394, n. 4, p. 747–763, 2009. 53 WEI, B. et al. A model binding site for testing scoring functions in molecular docking. Journal of Molecular Biology, v. 322, n. 2, p. 339–355, 2002. 54 LIU, L.; BAASE, W. A.; MATTHEWS, B. W. Halogenated benzenes bound within a

non-polar cavity in T4 Lysozyme provide examples of I⋯S and I⋯Se Halogen-bonding. Journal of Molecular Biology, v. 385, n. 2, p. 595–605, 2009. 55 STEINBRECHER, T. B. et al. Accurate binding free energy predictions in fragment optimization. Journal of Chemical Information and Modeling, v. 55, n. 11, p. 2411-2420, 2015. 56 LIU, T. et al. Bindingdb: a web-accessible database of experimentally determined protein-ligand binding affinities. Nucleic Acids Research, v. 35, p. D198–D201, 2007. Doi: 10.1093/nar/gkl999..

Page 113: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

111

57 WORD, J. M. et al. Asparagine and glutamine: using hydrogen atom contacts in the choice of side-chain amide orientation. Journal of Molecular Biology, v. 285, n. 4, p. 1735–1747, 1999.. 58 WANG, J. et al. Automatic atom type and bond type perception in molecular mechanical calculations. Journal of Molecular Graphics and Modelling, v. 25, n. 2, p. 247–260, 2006. 59 WANG, J. et al. Development and testing of a general amber force field. Journal of Computational Chemistry, v. 25, n. 9, p. 1157–1174, 2004. 60 JAKALIAN, A. et al. Fast, efficient generation of high-quality atomic charges. AM1-BCC model: I. Method. Journal of Computational Chemistry, v. 21, n. 2, p. 132–146, 2000.. 61 ANANDAKRISHNAN, R.; AGUILAR, B.; ONUFRIEV, A. V. H++ 3.0: automating pk prediction and the preparation of biomolecular structures for atomistic molecular modeling and simulations. Nucleic Acids Research, v. 40, n. W1, p. W537–W541, 2012. 62 RYCKAERT, J.-P.; CICCOTTI, G.; BERENDSEN, H. J. Numerical integration of the cartesian equations of motion of a system with constraints: molecular dynamics of n-alkanes. Journal of Computational Physics, v. 23, n. 3, p. 327-341, 1977. 63 LUTY, B. A. et al. A molecular mechanics/grid method for evaluation of ligand-receptor interactions. Journal of Computational Chemistry, v. 16, n. 4, p. 454–464, 1995. 64 MENG, E. C.; SHOICHET, B. K.; KUNTZ, I. D. Automated docking with grid-based energy evaluation. Journal of Computational Chemistry, v. 13, n. 4, p. 505–524, 1992. 65 O’BOYLE, N. M. et al. Open babel: an open chemical toolbox. Journal of Cheminformatics, v. 3, n. 1, p. 33-48, 2011. 66 PETTERSEN, E. F. et al. UCSF chimera: a visualization system for exploratory research and analysis. Journal of Computational Chemistry, v. 25, n. 13, p. 1605–1612, 2004. 67 MILLER, B. R. et al. MMPBSA.py : an efficient program for end-state free energy calculations. Journal of Chemical Theory and Computation, v. 8, n. 9, p. 3314–3321, 2012.. 68 BINDER, K.; HEERMANN, D. W. Monte Carlo simulation in statistical physics: an introduction. 5th ed. Heidelberg: Springer, 2010. 69 NEWMAN, M. E. J.; BARKEMA, G. T. Monte Carlo methods in statistical physics. New York: Clarendon Press, 1999.

Page 114: JOÃO VICTOR DE SOUZA CUNHA - teses.usp.br · Muitas noites de comida, jogos e piadas nerds. Sempre lembrarei de vocês Erika, Erick, Heloisa, Karina, Mariana e Lilian. ... Universidade

112

70 EFRON, B.; TIBSHIRANI, R. An introduction to the bootstrap. New York: Chapman & Hall, 1993. 71 HUMPHREY, W.; DALKE, A.; SCHULTEN, K. VMD: visual molecular dynamics. Journal of Molecular Graphics, v. 14, n. 1, p. 33-38, 1996. 72 YIN, J. Et al. Toward improved force-field accuracy through sensitivity analysis of host-guest binding thermodynamics. Journal of Physical Chemistry B, v. 119, n. 32, p. 10145-10155 2015.