Download Evolución de estructura y función proteica

Document related concepts

Gen wikipedia , lookup

Homología de secuencias wikipedia , lookup

Historia de la biología del ARN wikipedia , lookup

Genómica funcional wikipedia , lookup

Mutación wikipedia , lookup

Transcript
Bioquímica de las Macromoléculas
Evolución de estructura y función
proteica
Romina Hidalgo
proto prefijo del gr. prôtos, que significa primero.
proteico, ca adj. Que cambia con frecuencia de forma, por
alusión a Proteo; dios marino que habiendo recibido de su
padre Neptuno el don de la profecía, para librarse de los que
lo acosaban con sus preguntas cambiaba de forma cuando
quería.
1
Evolución de estructura y función proteica
Introducción:
Todos los organismos vivos son similares a nivel molecular, 20 aminoácidos isómero L y los
mismos nucleótidos con la D-ribosa. Esto está de acuerdo con la teoría de que todos poseen un
ancestro común que había adquirido esas características. Se asume que la diversidad a niveles
mas altos de organización es el resultado de la evolución divergente, y los procesos bioquímicos
más básicos han sido conservados, porque una alteración hubiera sido letal.
La comparación de las secuencias de ADN y de proteínas es la manera mas aceptada para la
reconstrucción de los procesos de evolución. Esto es porque la información contenida en esas
secuencias es muy amplia.
Una cadena de sólo 1000 nucleótidos (como para codificar una proteína promedio) puede
existir como cualquiera de 41000 (10600) secuencias diferentes.
Las variaciones evolutivas de una proteína, aportan mucha información sobre la proteína en
sí misma. La evolución divergente hacia distintas especies resulta en variaciones de la misma
proteína, con esencialmente la misma función biológica pero diferente secuencia. Las diferencias
y similitudes en la secuencia reflejan la estrictez necesaria para estructura y función para esa
proteína.
Las relaciones evolutivas nos dan indicios del rol biológico de proteínas no caracterizadas.
Proteínas que son muy similares en estructura y secuencia pueden llevar a cabo funciones
distintas, y proteínas con estructuras distintas pueden tener funciones idénticas. Se sabe que la
función y la estructura tridimensional están íntimamente relacionadas.
Entender la evolución de la función puede aportar datos para el diseño de proteínas con
funciones nuevas.
Mutaciones y estructura proteica
Las consecuencias de las mutaciones sobre la estructura, depende de la ubicación de los
nucleótidos afectados en el gen, incluso puede ser inocua. Las mutaciones pueden cortar el
polipéptido, o reemplazar un aminoácido por otro. La importancia de este cambio tendrá relación
con la similitud química de los aminoácidos, y será mucho mayor si afecta a modificaciones post
traduccionales, como el clivaje proteolítico. Inserciones y deleciones, afectan el marco de lectura,
y este tipo de mutaciones produce una cadena peptídica irreconocible. Mutaciones en regiones
no codificantes puede alterar la cantidad de proteína sintetizada, e incluso el splicing, afectando
dramáticamente a la proteína.
Luego de la existencia de material genético funcional, su complejidad habría aumentado mas
fácilmente debido a la duplicación de genes existentes que por generación de nuevo material
genético. Con dos copias de cada gen disponibles, una copia puede proveer la función original
necesaria, y la otra acumular las mutaciones que alteran esa función. Si esta copia alterada
eventualmente sirve para una nueva función, probablemente quede retenida en el genoma y
pasado a las siguientes generaciones.
Los genes que ocupan el mismo locus en diferentes especies, y las proteínas producto de
esos genes, se llaman ortólogos, mientras que genes de diferentes loci, pero relacionados por
duplicación de genes son designados parálogos. La filogenia de las especies puede reconstruirse
solo comparando los genes ortólogos. las diferencias entre genes parálogos de diferentes
especies no está relacionada con el tiempo desde la divergencia, sino con el tiempo desde la
duplicación de los genes.
2
Bioquímica de las Macromoléculas
Definiciones
Término
Homólogo
Análogo
Ortólogos
Parálogos
Residuos funcionales
Definición
Surgieron de una proteína ancestral en común, y su relación
evolutiva es evidente por similitudes en la secuencia, la estructura y/o
en la función
Son similares de alguna forma, pero no hay evidencias de ancestro
común. Análogos estructurales comparten el mismo plegamiento, y
análogos funcionales la misma función.
Son genes equivalentes en diferentes especies que surgieron de un
ancestro común por especiación.
Surgieron por duplicación de genes dentro de un genoma, y tienen
funciones diferentes, pero generalmente relacionadas.
Incluyen residuos de unión, en contacto con sustrato y cofactor, y
residuos catalíticos que intervienen en el mecanismo enzimático.
Elongación proteica por duplicación intragénica
Parte o toda la secuencia de aminoácidos es duplicada si se mantiene el marco de lectura.
Las porciones duplicadas pueden acumular cambios por mutaciones y divergir. Se observa este
fenómeno en proteínas con dos mitades de secuencia muy similares, y en la estructura
tridimensional, dos dominios gemelos (como el caso de las ferredoxinas, albúmina, fibrinógeno y
colágeno).
Fusión de genes
Dado que existen un número limitado de plegamientos, y una cantidad inmensurable de
actividades requeridas para la vida, la construcción modular ha sido un importante mecanismo
para originar funciones nuevas.
La fusión de genes ocurre mas frecuentemente en eucariotas que en procariotas,
probablemente porque las dos regiones codificantes de ADN tienen que estar unidas
exactamente con el mismo marco de lectura si ocurre en intrones. Dos regiones codificantes
pueden ser eficientemente fusionadas por recombinación genética con un intrón entre ellas que
puede excisionarse fácilmente. La existencia de intrones en el genoma pareciera facilitar la
fusión, duplicación y rearreglo de segmentos de genes. Hay evidencias que indican que las
proteínas mosaico surgieron a partir del shuffling de intrones y exones.
La fusión de genes no está restringida a los eucariotas, y también ocurre en procariotas,
donde como no hay intrones, la fusión debe ser precisa. Por ejemplo, en la biosíntesis del
triptofano se requieren cinco reacciones que son catalizadas por cinco actividades enzimáticas
diferentes, las cuales en alguna bacterias ocurren en cinco enzimas diferentes, codificadas por
diferentes genes. En otras bacterias, como Escherichia coli, dos pares de estos genes están
fusionados para producir dos polipéptidos bifuncionales. En cada polipéptido bifuncional, las dos
actividades enzimáticas están dirigidas por regiones separadas de la cadena polipeptídica, que
son homólogas a las correspondientes proteínas de otras bacterias.
El método “mix and match” probablemente sea la ruta más rápida para nuevas funciones
genéticas. La fusión de genes puede generar funciones totalmente nuevas, como en las que el
sitio activo se ubica entre dos o más sitios distintos. La fusión genética no necesariamente
modifica la función proteica, y la multiplicidad de dominios puede ser reflejo de la organización
del genoma.
El algunos sistemas de proteínas, sin embargo, la existencia de dos o más centros catalíticos
dentro de una sola cadena es beneficioso ya que facilita la canalización de los intermediarios o
sustratos en pasos sucesivos en el metabolismo.
3
Evolución de estructura y función proteica
Reclutamiento de genes
Se refiere a la adquisición de nuevas funciones por un gen existente. Según el reclutamiento,
genes multifuncionales son sujeto de dos o más presiones de selección, resultando en
limitaciones en la adaptación.
Estas presiones pueden llevar a uno de tres cambios:
mutaciones locales para aumentar una función sin comprometer la otra.
separación de la función (por duplicación y especialización).
reversión del reclutamiento.
Protein Data Bank (PDB)
Como la estructura está mucho más conservada que la secuencia, estos datos facilitan la
identificación de relaciones evolutivas que están ocultas a nivel de la secuencia. estos estudios
sostienen que el mínimo número de familias proteicas es finito con un mínimo estimado en 1000
diferentes plegamientos.
Hay dos puntos de vista para clasificar estructura:
filogenético
con un árbol filogenético, relacionando las distintas familias de acuerdo a su
relación evolutiva. teóricamente hay un único resultado “correcto”.
fenotípico descripción de la estructura (clase, arquitectura y tipo de plegamiento). Esta
descripción no es absoluta, pero muy útil.
Dominios
Las proteínas mas grandes tienen dominios
reconocibles,
pensados
como
unidades
evolutivas, unidades estructurales compactas.
hay evidencia de que se pueden plegar
independientemente. pueden formar proteínas
multimodulares e incluso, un dominio insertarse
en otro.
Todos los esquemas de clasificación de
proteínas apuntan a dividirlas según los
dominios, pero la información estructural es
muy incompleta (a la mayoría de las proteínas
no se les ha determinado la estructura).
Clasificación de dominios proteicos
CATH: Los dominios son asignados por herencia (para proteínas con secuencia muy similar a otra
que ya esté en la base de datos) o por consenso (si en tres algoritmos diferentes se deduce la
misma estructura) o manualmente (si los algoritmos no aportan la misma respuesta).
SCOP: Las asignaciones son hechas manualmente y las proteínas pertenecen a un dominio sólo
si uno de los dominios existe independiente en la base de datos.(La serín proteinasa es 2 barriles
 en CATH y un solo dominio en SCOP).
DALI y VAST: Son totalmente automatizados. Las proteínas se consideran de la misma familia de
homólogas si cumplen una de estas condiciones:
 evidencia de similitud de secuencia significativa.
 evidencia de similitud de estructura significativa.
 evidencia de similitud funcional, ubicación y configuración del sitio activo.
4
Bioquímica de las Macromoléculas
Relaciones Estructura/ Función enzimática
Clase y función
En cuanto al contenido de estructura
secundaria (el amplio nivel de estructura),
se ha encontrado dominancia de / en
enzimas en comparación con no enzimas.
esto refleja la importancia de dominios de
unión a nucleótidos en la función celular, y
puede sugerir múltiples eventos de
duplicación para el uso metabólico. La
clase donde predomina  no es abundante
en enzimas, y esto se puede deber a la
inhabilidad de los grupos polares dentro
de la hélice a estar involucrados en unión
o catálisis, ya que sus puentes de
hidrógeno están satisfechos (en los bordes
de las hojas  los grupos para formar
puentes de hidrógeno están accesibles).
El primer número EC define el tipo de
enzima (oxidorreductasa, transferasa, etc.). No se encontró una relación clara entre este número
y la clase. Sin embargo, para varios ligandos comunes (hemo, DNA, carbohidratos, nucleótidos)
se encontró una notable tendencia ciertas clases de proteínas definidas por requerimientos
estereoquímicos para unión de ligando. La actividad enzimática dependería del arreglo específico
de unos pocos residuos en el sitio activo.
Plegamiento y función
Hay evidencias para creer que existe un
número limitado de plegamientos en la
naturaleza, probablemente debido a las
limitaciones fisicoquímicos del plegamiento
proteico. Consecuentemente, familias de
enzimas
diferentes
evolutivamente
con
funciones no relacionadas pueden compartir
una estructura común, y la similitud
estructural no necesariamente implica una
relación evolutiva. La mayoría de los
plegamientos tienen una familia homóloga
relacionada,
y
puede
ser
considerado
esencialmente
como
un
plegamiento
funcional.
Los plegamientos más comunes son:
Rossman; /; del tipo inmunoglobulina;
barril / (TIM); y el  no-bundle represor de
DNA. El barril TIM ejemplifica la versatilidad funcional de algunas estructuras, asociado a por lo
menos seis funciones catalíticas. Esta versatilidad se debe probablemente a que los residuos del
sitio activo se localizan invariablemente en el extremo carboxilo de las hebras  o en los loops
siguientes, por lo que el sitio activo puede estar en uno de los ocho motivos /.
5
Evolución de estructura y función proteica
Familias homólogas y función
La función describe el
rol de una proteína como
un todo, y no siempre es
posible identificar cada
subfunción
con
cada
dominio constituyente. En
algunas enzimas el sitio
activo se puede asignar a
un
dominio
inequívocamente, pero en
otras,
varios
dominios
cumplen el rol de la
actividad catalítica.
La aplicación de un
plegamiento en diversas
funciones celulares debe
haber
simplificado
los
procesos
metabólicos
durante la evolución.
Como es de esperarse,
familias en las que la
función enzimática no está
conservada, su estructura
tiene
una
diversidad
mucho mayor.
Análogos funcionales
En el otro extremo, es común encontrar enzimas con la misma actividad con estructura
diferente. Probablemente estos análogos funcionales hayan surgido de la duplicación de sitios
activos existentes que asumen nuevos roles catalíticos debido a pequeñas modificaciones. Esta
hipótesis se refuerza cuando se encuentra una enzima en un número reducido de especies, y la
familia de donde proviene ampliamente distribuida.
La identificación de análogos enzimáticos provee mucha información sobre la evolución de
rutas metabólicas, y la diversidad bioquímica de los grandes genomas, que contiene mayor
riqueza en parálogos y análogos. Notablemente, ninguna de las enzimas involucradas en la
replicación del DNA tiene un ortólogo común en Archaea, Bacteria y Eukarya, por lo que se cree
que el ancestro común a los tres dominios más antiguo puede no haber tenido genoma de DNA.
Los análogos funcionales son ejemplos de la convergencia funcional y también del mecanismo
de convergencia, tipificado por las serín-proteasas. Su actividad catalítica está dada de la
orientación espacial de unos pocos aminoácidos, y no es raro que esta misma conformación del
sitio activo se encuentre en diferentes contextos estructurales. Incluso se cree que las
combinaciones catalíticas sean un número limitado que se repite durante la evolución.
6
Bioquímica de las Macromoléculas
Mecanismos de la evolución funcional
La secuencia genética cambia, cambiando la estructura tridimensional, y por lo tanto la
función. Posibles caminos a nuevas funciones:
Nueva función proteica

nuevo gen – nueva proteína – nueva función

moonlighting: el mismo producto génico puede
tener distintas funciones en distintos ambientes, la
función es dependiente del pH, localización celular,
ligandos disponibles, etc.

mutaciones: mutaciones locales que llevan a una
actividad distinta, pero relacionada con la original.

oligomerización: nuevas funciones con oligómeros
idénticos, relacionados, o muy diferentes entre sí.

duplicación: nuevo producto génico con nueva
función.

construcción modular (mix and match), nuevas
actividades al unirse dos genes.
Actividad catalítica y especificidad de sustrato
La actividad catalítica y la especificidad por el sustrato caracterizan las propiedades
funcionales de las enzimas. Sus determinantes estructurales pueden ser independientes, esto le
confiere una ventaja evolutiva a la enzima, ya que la actividad puede ser modificada sin
comprometer la especificidad por el sustrato, y viceversa. Las enzimas primitivas probablemente
tuvieron un amplio rango de actividades y/o especificidad por el sustrato, y se fueron
especializando al incorporar en la evolución grupos funcionales adicionales.
Especificidad de sustrato
Está directamente determinada por la naturaleza de los residuos de unión, aprovechándose
las propiedades de los 20 aminoácidos. Incluso la especificidad puede ser rediseñada en
laboratorio por mutaciones puntuales.
Los loops superficiales generalmente contienen los determinantes estructurales para la
especificidad de sustrato, y esto facilita la rápida divergencia evolutiva y la adaptación, ya que
puede variar la estructura del loop sin afectar el plegamiento global de la proteína.
La naturaleza química de los residuos involucrados en la interacción no es necesariamente el
único determinante de la especificidad. se han encontrado que la mutación de algunos residuos
lejanos le dan forma al sitio activo para la complementariedad del sustrato.
Mecanismo catalítico
Algunas familias enzimáticas presentan gran divergencia en sus actividad catalítica, como
también en su especificidad por el sustrato. El estudio detallado de su estructura y sus
características bioquímicas revelaron que las diferentes actividades y sus reacciones asociadas
compartían cofactor, nucleófilo o mecanismo de reacción. Con el descubrimiento de proteínas
homólogas que catalizan un paso bioquímico común en los contextos de diferentes reacciones
globales, se vió que los residuos esenciales para dicha actividad se conservan durante la
7
Evolución de estructura y función proteica
evolución, mientras que los grupos funcionales adicionales
intermediario de reacción, como la especificidad por el sustrato.
determinan
el
destino
del
Evolución de rutas metabólicas
No se conoce cuántas proteínas ancestrales diferentes hubo originalmente, pero puede que
haya sido una sola. Las homologías distantes se notan mas en la estructura tridimensional (muy
conservada) que en la estructura primaria. Indicadores de homología entre proteínas que
divergieron hace mucho tiempo, sugiere que la mayoría de las proteínas catalizan hoy las vías
metabólicas pueden haber surgido de la duplicación de unos pocos genes.
Hay una teoría que dice que las enzimas de las rutas biosintéticas surgieron en el orden
opuesto en el que están en la ruta por un proceso de duplicación de genes. La proteína que hoy
es última en la ruta biosintética tiene un sitio de unión para el sustrato presente en la “sopa”
original. si el gen para esta proteína fuese duplicado, la proteína del segundo gen podría
mantener el sitio de unión para el mismo sustrato y desarrollar la capacidad de producirlo como
un producto de otros componentes de la sopa primordial. Hay muchos casos donde enzimas de
distintas rutas metabólicas con función catalítica similar pero afinidad por diferentes sustratos
presentan homologías. En este último caso, la evolución de las duplicadas alteró la especificidad
por el sustrato, pero mantuvo el mecanismo catalítico.
Secuencias naturales separadas por grandes distancias
Enzimas
termofílicas
comparten sólo 20-30% de su
secuencia aminoacídica con una
de ambientes más fríos. Para
saber cuáles aminoácidos son
importantes en la adaptación se
determinarían por sustitución
de cada uno, lo cual, por las
combinaciones posibles, sería
imposible.
Otra dificultad es identificar
qué propiedades son debidas a
las presiones evolutivas, cómo
era
la
enzima
primitiva.
Además algunos organismos están sujetos a complejas combinaciones de presiones de selección.
No todas las diferencias entre las propiedades enzimáticas son reflejo de la adaptación, las
mutaciones neutrales son neutrales con respecto al fitness pero no necesariamente a todos los
comportamientos enzimáticos.
Relevancia biológica vs. fisicoquímica
Las enzimas son productos evolutivos y si bien están
sujetos a las leyes físicas y químicas, el proceso
evolutivo tiene mayores limitaciones. la evolución
selecciona
las
funciones
enzimáticas
biológicas
relevantes.
8
Bioquímica de las Macromoléculas
Evolución en laboratorio
Es una herramienta reciente para estudiar la función y adaptación enzimática, que nos
permite observar adaptación bajo condiciones controladas.
Como se pueden definir las presiones evolutivas, se pueden explorar funciones no naturales,
y distinguir lo biológicamente relevante de lo físicamente posible.
pasos:
 generar diversidad (mutagénesis al azar y/o recombinación in vitro)
 identificar variantes mejoradas
El gen que codifica
para la proteína se altera
y se determina el efecto
sobre el organismo, por lo
que se estudia su función
in
vivo.
Alteraciones
genéticas de la estructura
de la proteína tiene la
ventaja
de
ser
extremadamente
específicas.
Cuando
la
proteína
está
bien
caracterizada
genéticamente, lo ideal es
hacer mutagénesis sitio
dirigida. Alternativamente,
cuando se conoce poco de
la proteína o del gen, se
pueden
seleccionar
el
efecto fisiológico deseado
luego de mutagénesis al
azar.
Otra alternativa es interrumpir el gen de interés con una secuencia de inserción.
Luego de haber generado distintas mutaciones del mismo gen, se eligen aquellas que alteran
la estructura y/o la función de la proteína. No hay procedimientos generales para esta selección
porque el procedimiento a utilizar es necesariamente específico para cada gen y proteína y
también depende del organismo. Sin embargo, las mutaciones que alteran la función de la
proteína normal usualmente son seleccionados inicialmente. Si la mutación es letal para el
organismo, pero que actúen sólo bajo ciertas condiciones, como las mutaciones “letal
condicional”; las más usadas son las que dan sensibilidad a temperatura. Luego de la primer
elección, los genes mutados que revierten el efecto de la primer mutación pueden ser
seleccionados; unas pocas revierten la primer mutación, pero otras son mutaciones en otros
lugares, y se puede aislar la proteína.
Mutaciones que afectan una función en particular, se puede deber a una alteración de
residuos específicos, o indirectamente, inhibiendo la síntesis de la proteína o destruyendo su
estructura terciaria.
La naturaleza de las mutaciones que son seleccionadas por este procedimiento, como
también las que producen proteínas suficientemente normales para evitar el proceso de
selección, es muy importante para estudiar la estructura y función proteica.
9
Evolución de estructura y función proteica
Bibliografía:
 Kinch LN, Grishin, NV. Evolution of protein structures and functions. Curr Opin Struct Biol
2002, 12:400-408.
 Thornton JM, Orengo CA , Todd AE, Pearl FMG. Protein folds, functions and evolution. J
Mol Biol 1999, 293:333-342.
 Todd AE, Orengo CA, Thornton JM. Evolution of protein function, from a structural
perpective. Curr Opin Chem Biol 1999, 3:548-556.
 Wood TC, Pearson WR. Evolution of protein secuences and structures. J Mol Biol 1999,
291:977-995.
 Arnold FH, Wintrode PL, Miyazaki K, Gershenson A. How enzymes adapt: lessons from
directed evolution. Trends Biochem Sciences 2001, 26:100-105.
10