Download Unidad 6. Estructura genética de las poblaciones

Document related concepts

Polimorfismos de longitud de fragmentos de restricción wikipedia , lookup

Microsatélite wikipedia , lookup

Ligamiento wikipedia , lookup

Estudio de asociación del genoma completo wikipedia , lookup

Locus wikipedia , lookup

Transcript
El problema de medir la variación genética
Unidad 6. Estructura genética de las poblaciones
En poblaciones naturales la variación genética es generalizada y hay una amplia
oportunidad para el cambio evolutivo.
Ejemplos:
Catarinas.
Determinación del sexo en el hombre.
Describir las leyes que gobiernan la transmisión de la
información genética hereditaria de una generación a la
siguiente en una población.
6.2 Técnicas para medir la variación genética.
6.3 Polimorfismo y heterocigocidad.
6.4 Variación genética en las poblaciones naturales.
•En 2004: 50.4 % de la población humana eran hombres.
•El radio natural es de 105-107 machos nacidos por cada 100 hembras nacidas. Hembras mas
resistentes y con mayor longevidad, da un radio real de 98-100 m por 100 h.
•Este radio ha sido humanamente distorsionado en algunos países (China, India, Corea del
sur).
Abortos sexo-selectivos - One child policy - preferencia por hijos.
Discriminación para mujeres.
•Grandes cohortes de hombres solteros adultos de clase baja→marginados→mayor violencia.
Tecnología de selección del sexo y cultura familiar.
Como hacer para saber cuanta variedad existe en una población ??
-Que proporción de genes en determinados loci son
polimorficos (variables) en una población dada.
-Que proporción de genes en determinados loci son
heterocigotos en un individuo típico de la población.
Para determinar cuantos loci son
polimorficos en una población
Imposible estudiar cada locus
de un organismo.
No sabemos cuantos loci hay.
Hacer esto implicaría
mucho trabajo
Esto es difícil cuando se
examinan individuos que
provienen de cruzas entre la
progenie.
Para lograrlo:
Eliminar los genes invariables de la muestra.
La solución es observar una muestra de ese loci
Si la muestra es aleatoria y
representativa de la población
Posible extrapolar a la
población entera.
Ejemplos:
-Muestra de 2000 votantes se sabe quien votara en una
elección presidencial.
Estudiar algunos genes que
sean muestra imparcial de
todos los loci.
Técnicas de genética molecular.
DNA → RNA → Proteínas
Seleccionar una serie de proteínas aleatoriamente (sean o no variables en la población)
que representen una muestra imparcial de todos los genes estructurales del organismo.
Si la proteína es invariable entre los individuos, se asume que el gen que codifica para esa
proteína también es invariable.
Si la proteína es variable, entonces sabemos que el gen es variable.
Podemos saber que tan variable es, cuantas formas de la
proteína existen y en que frecuencias existen.
-Biometrias.
Cuantificando la variación genética.
Seleccionar 20 proteínas (≥20 loci).
Secuenciarlas en 100 individuos (Seleccionados aleatoriamente).
Extracción
Agar o poliacrilamida
Zimograma-Patrón de bandas depende del tamaño de la
proteína
Evaluar si existe variación para cada una de las proteínas.
El promedio de la variación por proteína encontrada en los 100
individuos para las 20 proteínas puede ser un estimado de la
cantidad de variación en el genoma de la población.
Para analizar estas 2000 proteínas se han desarrollado técnicas como la electroforesis
en gel.
-Cuantos son homocigotos
-Cuantos son heterocigotos y para cuales alelos.
La intensidad refleja las
proporciones en las que
se encuentran los
productos génicos.
Gel tratado con sol química o substrato especifico y sales
que reaccionan con el producto de la reacción catalizada
por la enzima.
En la posición en el gel donde la enzima especifica ha migrado se lleva a cabo la
siguiente reacción:
Enzima
Substrato → Producto + sal → banda coloreada (mancha o spot)
A partir del numero de manchas y su posición en el gel es posible inferir el genotipo
de cada individuo en ese locus para esa proteína.
1
2 alelos en cada locus
(Ayala y Kiger, 1980)
2 alelos en cada locus
(Ayala y Kiger, 1980)
1 spot → homocigotos Pgm100/100 o Pgm108/108
2 spots → heterocigotos Pgm100/108
Cada individuo presenta diferente movilidad electroforetica y por lo tanto diferentes
secuencias de aminoácidos, esto a su vez implica que están codificados por diferentes
alelos.
Pgm108 8= 8 mm de migración en el gel.
Pgm para fosfoglucomutasa.
Nomenclatura
S, M, F Lento, Medio, Rápido.
a, b, c
Idem
Malato deshidrogenasa Mdl
Esta enzima consiste de dos polipeptidos (A y B)
homocigotos → 1 spot. Ambos alelos hacen la misma subunidad resultando en la misma
banda.
heterocigotos → tres bandas. Diferentes productos alelicos, cada alelo produce una
subunidad diferente. Tres asociaciones son posibles (AA, AB, BB).
(Ayala y Kiger, 1980)
Mas de 2 alelos
Hay proteínas que consisten de cuatro o mas subunidades-pueden ser variantes
alelicas localizadas en el mismo locus.
Heterocigoto 5 o mas spots.
Monomeros 28%
Dimeros
43%
En humanos Trimeros
4%
Tetrameros 24%
Octameros 1%
Limitantes:
-Subestima la cantidad de variación genética.
1) Tripletes sinónimos codifican para el mismo aa.
2) Algunas sustituciones no cambian la movilidad electroforetica de
las proteínas.
Dos medidas comúnmente usadas para medir la variación genética:
Polimorfismo y Heterocigocidad
P= Polimorfismo = Proporción de loci polimorficos en una población.
Diferencias en el DNA que dan origen a diferentes formas proteicas e individuos
Ejemplo:
Poblacion 1
Phoronopsis viridis
Poliqueto marino de la costa de California
Examinamos 30 loci :
12 loci no variables
18 loci variables
(Ayala y Kiger, 1980)
Promedio del polimorfismo de las 4 poblaciones de P. viridis:
(0.6 + 0.5 + 0.53 + 0.47)/4 = 0.525
18/30 = 0.6 de los loci son polimorficos en esa población, o bien el grado de
polimorfismo en la población es de 0.6
2
Heterocigocidad
Una mejor medida de la variación genética.
Limitantes:
H= Frecuencia promedio de los individuos heterocigotos por locus = Heterocigocidad
de la población.
Arbitrariedad
Depende de cuantos individuos se examinen.
Presencia de diferentes alelos en uno o mas loci en cromosomas homologos.
Si N↑ probablemente habrá variación en los 12 loci invariables.
Si N↓ algunos de los 18 loci polimorficos podrían aparecer invariables.
Se calcula obteniendo:
Frecuencia de los individuos heterocigotos en cada locus
Para evitar el efecto del tamaño de muestra es necesario aplicar un criterio de
polimorfismo = Un locus es considerado polimorfico solo cuando el alelo mas común
tiene una frecuencia de < 0.95. Si N↑ y ↑ variantes, la proporción promedio no
cambiara.
Promediando estas frecuencias sobre todos los loci
(4 es solo para ejemplificar, para hacer algo
Imprecisión
2 alelos con 0.95 y 0.05
20 alelos con 0.05
Este es mas variable !
Ambos
polimorficos
con criterio
de 0.95
Ejemplo: Estudiamos 4 loci en una población
valido usar mas, usualmente 20)
Frecuencias de heterocigotos en estos loci son
0.25, 0.42, 0.09, 0
H=(0.25 + 0.42 + 0.09 + 0)/4 = 0.19
La Heterocigocidad de la población es 19%
= Heterocigocidad
observada.
(Ayala y Kiger, 1980)
Si se analizan varias poblaciones de la misma spp. Calcular H para cada población y
después obtener su promedio.
H
H
H
H
población 1 es 0.19
población 2 es 0.15
población 3 es 0.13
población 4 es 0.17
H promedio = 0.16
Analizar las diferencias entre
ellas mediante pruebas
estadísticas.
4.78/71 = 0.067
(Ayala y Kiger, 1980)
Ventajas:
•Es preferida por muchos genetistas poblacionales porque estima la probabilidad de
que dos alelos tomados aleatoriamente de una población sean diferentes.
= proporción de genes que son heterocigotos.
•Cada gameta de diferente individuo porta un alelo en cada locus que puede ser
considerado como muestreado aleatoriamente de la población.
= numero de individuos que son heterocigotos para cada gen en particular.
Para solventar este problema calcular la Heterocigocidad esperada.
Suponer que los individuos se aparean entre ellos aleatoriamente
En cada locus hay 4 alelos con frecuencias; F1, F2, F3 y F4
Suponiendo apareamiento aleatorio; F12, F22, F32 y F42
Hesperada = 1 – (F12 + F22 + F32 + F42)
Limitantes:
•No refleja adecuadamente la cantidad de variación genética en organismos que se
reproducen por auto-fertilización (como plantas) o cuando hay endogamia.
•En ambos casos habrán mas homocigotos aun cuando diferentes individuos porten
diferentes alelos si el locus es variable en la población o las frecuencias alelicas sean
idénticas en dos poblaciones diferentes.
Si F1 = 0.5
F2 = 0.3
F3 = 0.1
F4 = 0.1
F12
F22
F32
F42
=
=
=
=
0.25
0.09
0.01
0.01
H esperada = 1 – (0.25 + 0.09 + 0.01 + 0.01) = 0.64
3
Variación genética en las poblaciones naturales
Se presentan los 27 loci donde se
encontraron dos alelos.
Existe considerable variación genética en la mayoría de las poblaciones naturales
El numero de alelos por locus varia
de 1 (12 loci invariables) a 6 (loci
Acph-2 y loci G3pd-1).
17 spp. de plantas.
125 spp. de animales.
H observada = 7.2 % es < H
esperada = 9.4 %
Esto se debe a cierta autofertilización porque P. viridis es
hermafrodita.
Invertebrados en general
tienen mayor variación
genética que vertebrados,
aunque hay excepciones.
Usando el criterio de 0.95 de la
frecuencia del alelo mas común
<0.95, indica que 28.2 % de los 39
loci estudiados son polimorficos
(11/39=0.282).
H = 13.4 % Invertebrados.
H = 6.0 % Vertebrados.
H = 4.0 % Plantas.
Usando un criterio de 0.99, 51.2 %
son polimorficos (20/39).
(Ayala y Kiger, 1980)
Que tan confiables son estas estimaciones ?
-Si la muestra es aleatoria para todos los loci → debe ser representativa.
-Si todos los alelos son detectados en cada locus.
-Los genes estudiados por electroforesis codifican enzimas y otras proteínas solubles,
estas representan un % considerable de todo el genoma.
Pero hay genes reguladores que no codifican para proteínas y
genes que codifican para proteínas no solubles.
Estas no han sido adecuadamente evaluadas.
-La electroforesis en gel detecta variaciones solo en regiones codificantes, pero pasa
por alto cambios importantes en los elementos reguladores que son la verdadera
razón de la evolución de la forma y la función.
(Ayala y Kiger, 1980)
En Humanos hay 6.7 % de Heterocigocidad detectable por electroforesis.
Una gran variedad de especies han sido analizadas mediante electroforesis de proteínas
Bacterias
Hongos
Plantas superiores
Vertebrados
Invertebrados
Resultados altamente consistentes entre spp.
1/3 de los genes codifican proteínas polimorficas (a nivel proteico).
El promedio de Heterocigocidad en una población sobre todos los loci muestreados es del
10%, esto significa que si se escaneara el genoma de cualquier sp. se vería que 1 de cada
10 genes en un solo individuo es heterocigoto y que 1/3 de todos los genes tienen dos o
mas de esos alelos segregados en cualquiera de sus poblaciones.
-La migración diferencial se basa en la configuración molecular y principalmente en
diferencias de carga de las proteínas, pero sustituciones de aa pueden ocurrir sin que
haya un cambio neto de carga eléctrica o de su configuración.
-Sustituciones en el DNA a veces tampoco cambian el aa codificado, estos son poco
importantes para la evolución (sustituciones efectivas tienen efectos mayores en la
biología del organismo).
Niveles de análisis de variación del genoma entre individuos o entre especies:
-Numero y forma de los
cromosomas (vista a gran escala).
-Variación en los sitios reconocidos por enzimas de
restricción (vista gruesa de la variación de pares de
bases).
Digerir el DNA con enzimas de
restricción.
Cada
enzima
reconocen
una
secuencia de bases única y corta el
DNA en ese sitio.
El resultado son dos fragmentos
cuyo tamaño esta determinado por
la localización del sitio de corte en la
molécula original no cortada.
Ejemplo:
Si usamos una enzima que reconozca un sitio de 4 pb, reconocerá 44=256 pb
(4 nucleótidos).
Y si usamos 8 enzimas diferentes de este tipo 256/8 = 32 → cortaran cada 32 pb
A excepción de zonas donde se presenten mutaciones, inserciones o deleciones por
lo cual el patrón será variable, se obtendrán fragmentos de restricción variable.
(Griffiths et al., 2008)
4
-Secuenciación del DNA – Permite observar la variación por cada par de bases (vista mas fina).
Se estudian las regiones codificantes.
Se puede traducir a aa.
•Actualmente muy desarrollada y robotizada.
•Muchas compañías ofrecen el servios a precios baratos.
•Bases de datos-gran cantidad de secuencias obtenidas de muchos organismos.
GenBank-USA http://www.ncbi.nlm.nih.gov/
EMBL – Europa http://www.ebi.ac.uk/embl/
DDBJ – Japon http://www.ddbj.nig.ac.jp/index-e.html
Programas computacionales gratuitos
(Griffiths et al., 2008)
Actualmente hay muchos marcadores moleculares para estudiar genética en peces e
invertebrados acuáticos.
•Isoenzimas
•RFLP – Restriction fragment lenght polymorphism.
Polimorfismos de longitud de fragmentos de restricción.
•RAPD – Ramdomly amplified polymorphic DNA.
DNA polimorfico amplificado al asar.
•AFLP – Amplified fragment lenght polymorphism.
Polimorifsmo de longitud de fragmentos amplificados.
•mtDNA – Mitocondrial DNA analysis.
Análisis de DNA mitocondrial.
•VNTR – Variable number tandem repeat.
Repeticiones en tandem de numero variable (microsatelites).
•SSR – Simple sequence repeat.
Repeticinoes de secuencia simples.
•EST – Expressed sequence tags.
Etiquetas de secuencia expresada.
•SNP – Single nucleotide polymorphism.
Polimorfismos de nucleótido único.
•Clonación y secuenciación.
En peces también se ha asociado con resistencia a enfermedades.
tolerancia a temperatura.
velocidad del desarrollo.
tolerancia a salinidad.
Cuando hay ↑ actividad en branquias de salmón, los juveniles bajan mas rápido al agua
de mar.
Los grupos con desarrollo enzimático y migración retardada exhiben menor tolerancia
comparado con los grupos precoces.
Isoenzimas
Múltiples formas moleculares de enzimas
individuales.
=Diferente estructura paro catalizan la misma
reacción.
-Productos de diferentes loci con copias múltiples
de genes haciendo la misma enzima o subunidades enzimáticas.
-Alelos diferentes del mismo locus → Allozimas.
Diferencias de expresión
Temporalmente – En diferentes etapas del desarrollo.
Espacialmente – En diferentes tejidos.
Variacion alelica- Numero de alelos.
Ventajas de su análisis:
-Técnicamente es fácil.
-Limitado por el numero de loci disponibles.
-Limitado por el polimorfismo.
-La variación genética medida esta directamente relacionada con los
productos que afectan el desempeño.
Ejemplo- La variación de isoenzimas esta asociada con el
crecimiento en bagre de canal.
↑ variación de isoenzimas ↑ variación del crecimiento
Poblaciones de Fundulus heteroclitus del Norte y del Sur tienen diferentes niveles de
expresión de la lactato deshidrogenasa LDH-3 (glucólisis, piruvato→lactato).
Población del Norte ↑ expresión a ↓ T°C
Población del Sur ↑ expresión a ↑ T°C
1 pb en la región
reguladora !
Heterocigotos y homocigotos se distinguen fácilmente porque
contiene
4
subunidades
que
pueden
asociarse
independientemente para formar tetrámeros dando logar a 5
isoenzimas (isoformas de la enzima).
5
- Útiles para
Mapeo genético
Estudios de genomas de poblaciones.
Determinación de parentesco.
- En algunos casos es necesario saber de genética evolutiva para entender completamente
e interpretar datos de isoenzimas, principalmente con enzimas multimericas.
mtDNA
-En peces con variación isoenzimatica baja se ha
observado alta variación del mtDNA.
-Las tasas de mutación son un orden de magnitud
mayor que en el DNA nuclear.
SSR – Simple sequence repeat.
Repeticinoes de secuencia simples.
Secuencias cortas de 2- 5 pb que se repiten un cierto numero de veces (9- 30).
(ATT)n, (AT)n, (CT)n, (CTT)n,
-Útil para estudios de evolución reciente.
-Regiones de control son particularmente
hipervariables.
-Información conservada sobre todo el linaje
materno, útil para programas de mejora genética.
Detection of SSR length polymorphism using three genotypes, including two inbred parents and their F1.
Parent 1 is homozygous for the (CA)n allele and Parent 2, the (CA)n-2 allele and each produces single PCR products.
The F1, being heterozygous, produces products corresponding to both alleles.
Markers resulting from SSR length polymorphisms are placed on genetic maps in relation to other SSR, RFLP, RAPD,
and phenotypic markers in a manner identical to that used with RFLP or RADP markers.
EST – Expressed sequence tags.
Etiquetas de secuencia expresada.
Son secuencias cortas de cDNA de entre 200 y 500 pb retro-transcritos de uno o
ambos extremos de un gen expresado (mRNA). Cada EST representa un gen.
6
-Relativamente fácil, rápido y barato.
-Es la división de mayor crecimiento en el GenBank.
-Indica donde, cuando y como se expresan los genes.
El mRNA es especifico en cada tejido y estadios del desarrollo o bajo condiciones
medioambientales. Hay diferencias en la expresión de transcritos.
Identificar genes.
Analizar su expresión.
-Útil para análisis de genómica funcional.
-Útil para el desarrollo de microarreglos de DNA que permiten el estudio de genes
diferencialmente expresados.
-Han permitido el mapeo y descubrimiento de muchos genes.
Limitantes:
mRNA es difícil de aislar en algunos tejidos o cantidades muy bajas.
Puede haber regiones reguladoras en los intrones que se pueden pasar por alto.
http://www.ncbi.nlm.nih.gov/dbEST/index.html
SNP – Single nucleotide polymorphism.
Polimorfismos de nucleótido único.
Variaciones entre individuos en cualquier sitio del
genoma, regiones codificantes o no codificantes.
AAGGCT to ATGGCT
-Secuenciación del DNA
-Tipeado de extensiones de primers
-Diseño de oligos alelo-específicos.
-Tecnología de DNA chips (microarreglos)
Los “SNiP” se clasifican de acuerdo a su localización y su función
rSNPs in regulatory regions.
cSNPs in coding regions (exons), cSNPs can either be represented as synonymous (s) or non-synonymous (ns)
SNPs dependent on their influence. sSNPs represent triplets encoding the same amino acid before and after the
polymorphism arise while nsSNPs on the other hand alters the encoded amino acid and may signal chain
termination.
gSNPs located in intergenomic regions.
Desventajas:
-Secuenciado.
-Pruebas de hibridación.
-Costoso.
-Genotipado difícil.
-Muchos SNP pueden ser neutrales y no cambiar la secuencia de aa.
iSNPs located in intronic regions.
Preguntas ????
7