Download Análisis Conformacional 2

Document related concepts

Acoplamiento molecular wikipedia , lookup

Predicción de la estructura de las proteínas wikipedia , lookup

Modelado molecular wikipedia , lookup

Dinámica molecular wikipedia , lookup

Filogenética computacional wikipedia , lookup

Transcript
Clase # 8:
Análisis Conformacional (II)
Prof. Ramón Garduño Juárez
Modelado Molecular
Diseño de Fármacos
Introducción
• Conformación: estructura tri-dimensional de una molécula.
• Análisis conformacional es el estudio de las
conformaciones de una molécula y su influencia en las
propiedades de esta molécula.
• La mayoría de las biomoléculas funcionan a través de
conformaciones específicas.
• Distribución de sus conformaciones y sus energías
correspondientes siguen la distribución de Boltzmann
• Mínimo Global
Tópicos
• Búsqueda Conformacional:
1. Búsqueda Sistemática
2. Construcción de Modelos
3. Búsqueda Aleatoria
4. Geometría de Distancias
5. Dinámica Molecular
• Clustering
• Búsqueda del mínimo global: Algoritmo
Genético y Recocido Simulado
Geometría de Distancias
• Usa distancias en lugar de coordenadas para definir las
conformaciones. N(N-1)/2 distancias inter-atómicas en una
molécula.
• Este enfoque aumenta la dimensión del espacio de búsqueda
de 3N en coordenadas Cartesianas o N en espacio diedro.
• El beneficio de este potencial es que en cada grado de
libertad el espacio de búsqueda es más pequeño.
• Por ejemplo, en espacio Cartesiano, cada átomo puede estar
dentro de -100 Ángstrom a +100 Ángstrom. Pero en espacio
distancia, ciertos pares de átomos pueden tener un intervalo
más estrecho. (Los ejemplos se verán después).
• Explora el espacio de conformación al generar distancias
aleatorias.
• Representa la conformación con una matriz de distancia.
Geometría de Distancias: Procedimiento
• Cuatro pasos:
– Se calcula la Matriz de límites superior e inferior
– Distancias aleatorias se asignan dentro de estos
límites
– La Matriz de Distancias se convierte a coordenadas
Cartesianas
– Refinamiento de la conformación (minimización).
• Ampliamente usada en RMN donde las
distancias son medidas experimentalmente.
• Este es uno de los métodos en la predicciónde la
estructura de proteínas.
Pasos iniciales: Suavizado triangular
• U(ac) <= U(ab) + U(bc)
• L(ac) >= L(ab) – U(bc)
a
a
U(ab)b
b
U(bc)
U(ac)
c
a
c
L(ab)
a L(ac) c
b
c U(bc)b
Dinámica Molecular
•
•
•
•
El sistema sigue la ecuación de movimiento de la
segunda Ley de Newton.
Imita la realidad física de la dinámica del sistema
molecular.
En principio ésta puede seguir el mismo paso que
una molécula realiza hacia su estado de mínima
energía.
Sin embargo, la limitación de los recursos de
cómputo y funciones de energía potencial
inadecuadas evitan la aplicación directa de la
dinámica molecular a la búsqueda conformacional.
Dinámica Molecular en la búsqueda
conformacional
• Simulaciones a temperatura alta, la energía cinética extra
previene que el sistema se atrape en un mínimo local.
• Se minimiza para generar las estructuras deseadas.
Comparación
• Datos de la Sección 9.7
• Conformaciones con energías dentro de 3kcal/mol
del mínimo global para cicloheptadecano (C17H34).
Después de 30 días de búsqueda:
• Sistemática
211
• Cartesianas aleatorias
222
• Diedros aleatorios
249
• Geometría de distancias
176
• Dinámica Molecular
169
• Combinación de todas
262
Encontrando el mínimo global :
Algoritmo Evolutivo
•
•
•
•
Algoritmo Genético
Programación Evolutiva
Estrategias de Evolución
Los tres métodos tienen un esquema similar:
–
–
–
–
–
Generan una población de soluciones
Evalúan cada solución
La población cambia con el tiempo
Generan nuevas soluciones (apareamiento)
Nueva solución: hijos; vieja solución: padres
Algoritmo Genético
• M posibles soluciones
• Representados por un cromosoma: 100101100 (por ejemplo:
uso de ángulo torsional)
• Evalúa cada conformación (e.g. usa el campo de fuerza de la
mecánica molecular)
• Escoge a los padres con tendencia hacia las conformaciones
de más baja energía (e.g. usa la selección de la ruleta)
• Entrecruza en un punto azaroso, o mutaciones en ciertos
puntos.
• Repite el ciclo.
• Muchas variantes:
– Los individuos mejor evaluados permanecen sin cambio
– Solo se remplazan los peores casos
– Entrecruce en dos-puntos
• Previene convergencia prematura
– Controla la ‘presión selectiva’, que es la probabilidad relativa de que
el individuo mejor adaptado en una población sea escogido como un
padre relativo a los individuos promedio.
• Programación Evolutiva:
• No emplea el cruzamiento
• Usa solo mutaciones
• Estrategia Evolutiva:
• Usa tanto cruzamiento como mutación
• Toda la población actual está sujeta a
cruzamiento y mutaciones.
• Usa el rango directo más que la probabilidad
temperatura
Búsqueda del Mínimo Global :
Recocido Simulado
Algoritmo de Clustering
• Muchas de las conformaciones muestreadas con
los métodos ya mencionados son muy similares.
• Se necesita un algoritmo para seleccionar un
conjunto pequeño de las conformaciones
representativas.
• Agrupa objetos similares.
• Un análisis de cluster mide la similitud o
disimilitud de un par de objetos.
• RMSD o ángulo de torsión se pueden usar como
medidas.
Método de encadenamiento
• Calcula las distancias entre todos los pares
• Agrupa el par más cercano
• Calcula de nuevo las distancias entre este grupo
con todas las otras conformaciones:
– Encadenamiento Vecino-cercano (cadena simple)
– Encadenamiento Vecino-lejano (cadena completa)
• La iteración termina cuando el número predefinido
de clusters se ha formado o cuando los requisitos
de distancia predefinida se ha satisfecho.
Ajuste Molecular
• RMSD
• Ajuste Flexible
• Dinámica molecular restringida
Aplicación:
resolviendo estructuras de proteína
• Rayos-X
–
–
–
–
Iniciar la construcción del modelo
Minimización
Dinámica molecular restringida
Refinamiento de la estructura
• RMN
– Geometría de Distancias
– Dinámica molecular restringida
– Refinamiento de la estructura
Base de Datos Estructurales
• PDB (protein databank)
• Más de 10,000 estructuras de proteína
resueltas por Rayos-X y RMN.
Reduciendo la dimensionalidad de
una base de datos
• Dimensionalidad: numero de variables que se usan
para describir cada conformación.
• A menudo se encuentra que existen correlaciones
significativas entre estas variables.
• Análisis de Componentes Principales; se usan
comúnmente para reducir la dimensionalidad.
– Un componente principal es una combinación lineal de
las variables.
– Sec 9.14.1