Download datos nuevas embargo

Document related concepts

Secuencia Alu wikipedia , lookup

Microsatélite wikipedia , lookup

Haplotipo wikipedia , lookup

Número variable de repeticiones en tándem wikipedia , lookup

Polimorfismos de longitud de fragmentos de restricción wikipedia , lookup

Transcript
CAPÍTULO 3. MARCADORES DE DETERMINACIÓN
DIRECTA (II)
-Extracción y cuantificación de ADN.
-Enzimas de restricción.
-PCR.
-Secuenciación.
-RT-PCR.
-Micromatrices.
-RFLPs.
-VNTRs.
-Genes.
-Inserciones Alu.
-SNPs.
-ADN mitocondrial.
-VCNs.
RFLPs
El tipo más tempranamente estudiado de variante de ADN fue el que puede detectarse cuando una enzima de restricción
encuentra una mutación puntual en su secuencia de reconocimiento habitual, por lo que no puede fijarse. En ese caso, alguno de
los fragmentos de ADN obtenidos mediante esta enzima serán de una longitud diferente. Por ello se conocen estos
polimorfismos como polimorfismos de longitud de los fragmentos de restricción (RFLP en inglés).
Puesto que las diferencias entre las variantes del polimorfismo estriban en la longitud de la molécula y por tanto, en su peso
molecular, pueden reconocerse mediante electroforesis. Así, las técnicas electroforéticas no sólo son aplicables a las moléculas
de proteína sino también a las moléculas de ADN.
Figura: Electroforesis de RFLPs
RFLPs
Barbujani et al, 1997
Proc Natl Acad Sci Usa 94:4516-4519
Mediante enzimas de restricción puede analizarse cualquier región del genoma, codificante o no. Sin embargo, sólo pueden
detectarse cambios dentro de unas secuencias determinadas, de modo que no todas las mutaciones existentes serán reveladas
mediante esta técnica.
Las enzimas de restricción se han utilizado para estudiar numerosas variantes de polimorfismos, desde secuencias de ADN
repetitivas hasta ADN mitocondrial o mutaciones puntuales. Sin embargo, los resultados obtenidos a menudo no son
comparables a los obtenidos por otros métodos, por lo que pueden considerarse un tipo de polimorfismo diferenciado.
La tabla muestra los valores de los diferentes componentes de la varianza molecular obtenidos a partir de STRs y RFLPs,
comparados con varios trabajos sobre proteínas.
RFLPs
Nei M, Takezaki N 1996
Mol Biol Evol 13:170-177
La figura muestra un dendrograma obtenido a partir de RFLPs.
STRs
Otro tipo de polimorfismo de ADN consiste en la existencia de diferentes números de repeticiones en tandem de un núcleo de
unos pocos pares de bases. Son las repeticiones en tándem de número variable (VNTR en inglés). Cuando la secuencia que se
repite consta de 2 a 6 pares de bases, se denominan microsatélites (microsatellites, short tandem repeats o STRs). Si la
secuencia es de una longitud mayor (de entre 7 y 100 nucleótidos), reciben el nombre de minisatélites. Es un tipo de
polimorfismo muy extendido por el genoma, calculándose que existe al menos un millón de STRs, que suponen el 3% del
genoma humano.
Una vez que existe una secuencia repetida, la producción de nuevas variantes se ve facilitada por entrecruzamientos desiguales.
En general, las secuencias repetidas en tándem se encuentran en regiones no codificantes del ADN. Sin embargo, se han
detectado en algunos casos microsatélites que invaden un gen, lo que suele conllevar consecuencias negativas para el individuo
portador, como en el caso de la distrofia miotónica.
El polimorfismo que determinan los VNTRs se caracteriza por el número de repeticiones, de modo que se considera un número
de repeticiones determinado como un alelo y su frecuencia alélica será la frecuencia con la que aparece el mismo número de
repeticiones en una población.
STRs
Los VNTRs pueden analizarse mediante enzimas de restricción. En ese caso, los fragmentos de restricción resultantes variarán
en tamaño dependiendo del número de repeticiones y serán reconocibles mediante electroforesis. Pero también pueden
analizarse mediante la reacción en cadena de la polimerasa y la consiguiente electroforesis. Una variante de esta última técnica
es la que realizan los analizadores de ADN, que son capaces de identificar las diferentes bandas amplificadas y determinar
automáticamente su tamaño y por tanto los diferentes alelos.
En el electroferograma de la figura se observan los dos alelos (3 y 4) de un heterocigoto para el STR D11S1984. Las bandas
rojas corresponden con el ADN control de tamaño conocido.
STRs
Análisis de Structure para un grupo de STRs en diferentes poblaciones
Rosenberg et al, 2002
Science 298:2381-2385
A partir de un grupo suficientemente amplio de STRs, puede discriminarse razonablemente bien entre individuos de diferentes
grupos poblacionales, como muestra este análisis de Structure sobre poblaciones de varios continentes.
STRs
Zhivotovsky et al 2003
Am. J. Hum. Genet. 72:1171–1186
Análisis de Coordenadas Principales para un grupo de STRs en diferentes poblaciones
STRs
Pérez-Miranda et al 2005
J Hum Genet 50:403-414
MDS para STRs en poblaciones de la cuenca mediterranea
Distrofia miotónica tipo I
La distrofia miotónica es una enfermedad genética caracterizada por
severas dificultades para relajar los músculos contraídos, pérdida de
masa muscular, cataratas, defectos en las gónadas y el corazón y
retraso mental. Puede aparecer a diferentes edades, entre la infancia
y la vejez. Puesto que es una enfermedad degenerativa, cuanto más
temprana sea la edad de comienzo, más grave será su manifestación.
Su origen se encuentra en la invasión de un gen estructural (DMPK,
myotonic dystrophy protein kinase, 19q13.3) en su región 3' no
traducida por un microsatélite con una secuencia repetida CTG, que
puede tener entre 5 y 37 repeticiones en individuos normales y hasta
varios miles en afectados, con síntomas más severos cuanto mayor
es el número de repeticiones. Hasta 80 repeticiones determinan una
forma leve, en tanto que a partir de 2.000 copias los síntomas son
severos.
La tasa de mutación estimada para esta enfermedad es de 9,5 . 10-6.
Afecta a 1 de cada 20.000 personas.
En Saguenay (Canadá), la prevalencia es de 1/530, con un origen
común para todos los afectados, localizado en una pareja de
inmigrantes que se instaló en la región en el siglo XVII.
Figura: Paciente de 40 años de edad con distrofia miotónica,
cataratas bilaterales y bloqueo cardíaco
Distrofia miotónica tipo I
La DM1 presenta anticipación, es decir, aparece más temprano en las sucesivas generaciones de una familia, lo que suele
ser proporcional al número de repeticiones, como se observa en esta genealogía.
Figura: Genealogía de DM1 con anticipación
Distrofia miotónica tipo I
Hamzi et al, 2010
Antropo, 23, 73-76.
Curiosamente, como se observa en esta genealogía y en la anterior, el mecanismo de anticipación se transmite exclusivamente
por línea materna.
Figura: Genealogía de DM1 con anticipación
Frecuencias alélicas de genes
PCR-SSP
Utilizando las técnicas de análisis del ADN, también es
posible detectar polimorfismos en los genes, incluyendo
aquellos que eran analizados anteriormente por técnicas
inmunológicas. Naturalmente, ahora se obtiene una
mayor resolución.
Existen varias técnicas mediante las cuales es posible
analizar los diferentes genotipos de un gen. Entre ellas
se pueden citar la PCR-SSP (Sequence Specific Primer)
y la PCR-SSO (Sequence Specific Oligonucleotide). En
la actualidad es posible analizar, por ejemplo, grupos
sanguíneos como el sistema AB0 o genes HLA mediante
esta técnica. Para ello, basta con disponer de sondas
específicas de la secuencia codificante de cada alelo.
El control positivo en la PCR-SSP se consigue con otro par de cebadores que permiten amplificar una fracción no
polimórfica del genoma, de modo que se amplifica siempre.
Frecuencias alélicas de genes
Conocida la secuencia de los diferentes alelos de un
gen, es posible diseñar cebadores específicos de cada
alelo para su amplificación mediante la reacción en
cadena de la polimerasa. Cuando sean complementarias
la secuencia del cebador y la del ADN de una muestra,
se producirá amplificación. Se conocerá, por tanto, el
genotipo de un individuo por electroforesis de los
productos PCR. Donde haya habido amplificación
aparecerá la correspondiente banda en la electroforesis
y donde no haya habido amplificación no aparecerá
nada.
Puesto que un gen a menudo consta de varios exones y
puede haber mutaciones en más de uno, será preciso
utilizar varios pares de cebadores para identificar las
diferencias entre todos los alelos del gen.
En la imagen, cada fila corresponde a un alelo HLA-A,
del grupo A2 y cada columna a una mutación con su
correspondiente par de cebadores.
Frecuencias alélicas de genes
Estas técnicas son muy utilizadas en
la actualidad para el análisis de los
loci HLA.
A menudo también pueden
identificarse los alelos de un gen
mediante enzimas de restricción y
desde luego siempre está disponible
la secuenciación, aunque no
necesariamente es el método más
razonable por su coste.
Figura: Gel de agarosa con el
resultado de un análisis PCR-SSP
para un gen HLA.
Frecuencias alélicas de genes
Número de alelos, en febrero de 2016, de la
región HLA en humanos
http://www.ebi.ac.uk/imgt/hla/stats.html
Frecuencias alélicas de genes
Sánchez-Mazas, 2001
Human Immunology 62:937-948
Análisis MDS con frecuencias HLA-DPB1
Frecuencias alélicas de genes
Pérez-Miranda et al 2004
Tissue Antigens 64: 264–275
Algunas clinas de alelos HLA en Europa
Inserciones Alu
Las inserciones Alu son secuencias de aproximadamente 300 pares de bases originadas a partir del gen 7SL RNA por
retrotransposición. La estructura de los elementos Alu es dimérica; es decir, su secuencia está compuesta por dos
subunidades similares. Esto se debe a que los elementos Alu modernos surgieron de la fusión cabeza-cola de dos Alu
primitivos, que eran monoméricos. El resultado fue una estructura con dos regiones similares, unidas por una región rica
en Adenina y con una cola Poli-A. El monómero del extremo 3’ (derecha) contiene un segmento adicional de 31 pb del que
carece el monómero del extremo 5’ (izquierda). Sin embargo es en el 5´ donde se controla el proceso de
retrotransposición porque es allí donde se encuentra el promotor de la RNA polimerasa III.
Inserciones Alu
Son los más abundantes dentro del grupo de secuencias
SINE (short interspersed elements) en el genoma humano,
ya que hay más de un millón de copias, lo que supone el
10% del genoma. El origen y la amplificación de los
elementos Alu son fenómenos evolutivamente recientes,
que coinciden con la radiación de los primates hace 65
millones de años.
Existen varias familias de elementos Alu, dentro de las
cuales algunas son exclusivas de los seres humanos. No
todos los elementos Alu son polimórficos puesto que
algunos con el paso del tiempo se han fijado o perdido. Sin
embargo, aquellos Alu que se han insertado recientemente
son polimórficos con respecto a su presencia o ausencia
en el genoma humano.
En la figura se esquematiza el proceso de inserción: En
primer lugar, el elemento Alu se transcribe a ARN
mensajero. Después, eventualmente, puede unirse en otro
lugar del genoma y mediante una transcripción inversa
quedar insertado.
Inserciones Alu
Su análisis es relativamente sencillo. Dado que se trata de una secuencia de gran tamaño, puede identificarse su ausencia o
presencia mediante una PCR y una electroforesis en gel de agarosa. La diferencia entre las bandas resultantes,
generalmente de unos 300 pares de bases, puede apreciarse a simple vista.
En la figura, una electroforesis de agarosa de varias muestras analizadas para una inserción Alu.
Inserciones Alu
Watkins et al 2003
Genome Research 13:1607–1618
A pesar de ser marcadores bialélicos y por tanto con un escaso
grado de polimorfismo, son interesantes en Antropología, ya que
puede conocerse el genotipo ancestral (no inserción). Además, se
supone que cada inserción es un evento evolutivo único (o casi),
por lo que todos los portadores de una secuencia derivarían de
un antepasado común.
En la figura se observa un dendrograma obtenido a partir de
frecuencias de 100 inserciones Alu. La población ancestral se ha
definido como una población hipotética con frecuencia de
inserción 0 para las 100 inserciones.
Inserciones Alu
García-Obregón et al 2006 American Journal of Human Biology 18:187-195
Se ha especulado sobre su importancia evolutiva, incluso sobre su implicación en el proceso de especiación, pero todavía no
existen datos consistentes. En todo caso, entre otros hallazgos recientes, se ha observado que existen genes que derivan de
elementos genéticos móviles, como Rag1, una transposasa implicada en los reordenamientos del ADN para la codificación de la
región hipervariable de las moléculas de anticuerpos. Se ha estimado que el 0,5% de las nuevas enfermedades genéticas son
producidas por efecto de la recombinación entre inserciones Alu. También podrían estar implicadas en la reparación del ADN
mutado.
En la figura, un mapa topogenético de una serie de poblaciones de la cuenca mediterránea
Inserciones Alu
Gómez-Pérez et al 2007
Antropo, 14, 29-36.
En la figura se observa la capacidad de discriminación de
tan sólo 8 inserciones Alu, de modo que cada región
aparece claramente diferenciada.
La población ancestral se ha definido como en el caso
anterior, como una población hipotética con frecuencia de
inserción 0 para las 8 inserciones.
SNPs
Polimorfismos de un solo nucleótido (SNPs)
Sus abreviaturas derivan del nombre en inglés (Single Nucleotide Polymorphisms). Son variaciones de una sola base. La mayor parte
de la variabilidad del genoma es de este tipo, estimándose que suponen el 80% de los polimorfismos. Se ha calculado su densidad en
aproximadamente 1 por cada mil pares de bases. A pesar de que son generalmente bialélicos, son más frecuentes y estables que los
microsatélites, lo que les hace interesantes sobre todo para estudios de desequilibrio de ligamiento.
En la figura, la mutación responsable de la anemia falciforme, que es un SNP, detectada mediante enzimas de restricción.
SNPs
Altshuler et al. 2008
Science. 322(5903):881-8.
Análisis de ligamiento de una pequeña región (arriba) y de una
región más grande (abajo) del cromosoma 5, mediante SNPs.
Se muestra un punto naranja cuando existe correlación entre 2
SNPs, es decir, cuando se ha observado desequilibrio de
ligamiento entre ellos. En el gráfico superior se detectan 2 zonas
con desequilibrio de ligamiento y un lugar de frecuente
recombinación (hotspot) en medio.
SNPs
Para su identificación pueden utilizarse distintas técnicas, como las enzimas de restricción, la secuenciación,
las micromatrices o la PCR cuantitativa.
En la figura, 2 SNPs identificados mediante secuenciación (Técnica SNaPshot).
SNPs
Reneland et al 2005 BMC Medical Genetics 2005, 6:9
Actualmente, estos polimorfismos son muy utilizados para la localización de genes causantes de enfermedades, en Genética
Humana.
En la figura, asociación entre la variación en el gen fosfodiesterasa 4D y la densidad mineral del hueso de un grupo de individuos.
Se ha realizado una cartografía fina mediante 80 SNPs en un pequeño fragmento del cromosoma 5. Los puntos indican la
significación para cada SNP y las líneas azul y gris son regresiones, directa y suavizada a partir de estos puntos.
SNPs
Estudio de cartografía de riesgo relativo de asma en 994 niños
asmáticos y 1.243 no asmáticos mediante el análisis de 317.447 SNPs.
Se muestran los valores de significación al 1% y 5%.
Se ha observado una asociación con el gen ORMDL3, situado en 17q21
Moffat et al 2005
Nature. 448(7152):470-3.
SNPs
Rodríguez-Ezpeleta et al 2010
Hum Genet. 128(1):113-7
MDS y análisis Structure realizados a partir de SNPs en una serie de muestras europeas
ADN mitocondrial
Las mitocondrias se transmiten únicamente de la
madre a sus hijos. Dado que las mitocondrias que
porta el espermatozoide no penetran en el óvulo en
el momento de la fertilización (sólo penetra el
núcleo), todas las mitocondrias que posee una
persona en sus células provienen de su madre. Por
tanto, no hay diploidía, meiosis, ni existe la
recombinación en el ADN de las mitocondrias.
El ADN mitocondrial es circular, con dos cadenas
complementarias de 16.569 nucleótidos y tiene 37
genes, de los que 13 codifican para ARN
mensajeros y por lo tanto para proteínas, 22 para
RNA de transferencia y 2 para RNA ribosómico.
El ADN mitocondrial se analiza habitualmente
mediante secuenciación o enzimas de restricción,
aunque lógicamente en este caso el resultado es
menos informativo. Habitualmente se estudian dos
regiones hipervariables, HVR-I y HVR-II, dos zonas
supuestamente neutrales y con una gran
variabilidad, lo que permite una resolución
prácticamente a escala familiar.
Figura: Esquema del ADN mitocondrial humano
ADN mitocondrial
L0
Dispersión de los principales haplogrupos de ADN mt con la colonización por el hombre moderno de los diferentes continentes
ADN mitocondrial
Gagneux et al 1999 Proc Natl Acad Sci 96:5077-5082
Dendrograma de un grupo de primates a partir de ADN mt. Se incluye la secuencia de especimen de neandertal encontrado en
Alemania en 1856 y la secuencia de numt, un fragmento de ADN nuclear del cromosoma 11, cuyo origen parece ser
mitocondrial.
ADN mitocondrial
Alfonso-Sánchez et al 2006
J Hum Genet 51:429-439
MDS para un grupo de poblaciones a partir de ADN mt
Número de copias variable (CNVs)
Redon et al, 2006
Nature 444:444-454
Los polimorfismos de variación en el número de copias se refieren a las
alteraciones en el número de copias de un fragmento determinado de ADN, que
puede implicar deleciones (menor número de copias de lo normal),
duplicaciones (mayor de lo normal) deleciones y duplicaciones combinadas o
patrones más complejos, como puede observarse en la figura.
Afectan al más del 10% del genoma y pueden implicar desde 1.000 nucleótidos
a varios millones.
Número de copias variable (CNVs)
Zarrey et al, 2015
Nature Reviews Genetics 16:172-183
Podría estar implicado en polimorfismos de este tipo entre el 5 y el 10% del
genoma.
En la figura se muestra la distribución de los CNVs por cromosomas para
inserciones (a), delecciones (b) y mezcla de ambas (c), analizados a dos
niveles de resolución.
Analizando este tipo de polimorfismos se han encontrado alrededor de 100
genes que pueden encontrarse completamente eliminados de un cromosoma
sin aparentes efectos para sus portadores.
Número de copias variable (CNVs)
Redon et al, 2006
Nature 444:444-454
Caucasoides
Chinos
Japoneses
Yorubas
Redon et al, 2006
Pueden analizarse mediante diferentes técnicas, pero principalmente mediante micromatrices, con sondas que identifican zonas
representativas de las regiones duplicadas o perdidas.
En general son bastante útiles para discriminar entre poblaciones de diferentes orígenes, como se observa en la figura.