Download Filogeografía - Facultad de Ciencias

Document related concepts

Deriva genética wikipedia , lookup

Diversidad genética wikipedia , lookup

Teoría de la coalescencia wikipedia , lookup

Gen wikipedia , lookup

Genética de poblaciones wikipedia , lookup

Transcript
Variación geográfica
Curso de Evolución 2015
Facultad de Ciencias
Montevideo, Uruguay
http://evolucion.fcien.edu.uy/
http://eva.universidad.edu.uy/
• desde la década de 1960, la electroforesis de proteínas
permitió determinar que:
• la mayoría de las especies tiene poblaciones
estructuradas geográficamente
• el grado y escala en que se manifiesta esta
subdivisión varía según habitat, modos de vida, etc.
7. Variación geográfica. Filogeografía. El
coalescente. Divergencia en aislamiento
estricto.
• las causas y procesos subyacentes pueden incluir:
• aislamiento estricto
• aislamiento parcial (con intercambios)
• divergencia guiada por selección (no excluyente
con las anteriores)
• vamos a enfatizar en esta clase el primer caso
1
2
Filogeografía
Variación geográfica
Campo de estudio interesado en los principios y procesos que
gobiernan la distribución geográfica de los linajes, especialmente
aquellos dentro y entre especies cercanamente emparentadas
• en frecuencias alélicas (determinadas por electroforesis
para proteínas, o para microsatélites)
• en secuencias de ADN (determinadas directa o
indirectamente)
Avise et al., 1987.
• vamos a enfatizar el segundo abordaje
Area A
• usaremos el marco de la filogeografía para
• ilustrar la existencia de variación geográfica
• comenzar a entender los procesos de divergencia
en aislamiento estricto, por deriva genética
FILO
3
Area B
GEO
4
1
ADN mitocondrial
Avise: variación en
el ADN mitocondrial
fuertemente
estructurada
geográficamente
Características “típicas”
(hay muchas variantes):
• genoma compacto (~16 KB)
• numerosas copias por célula
• herencia materna
• no hay recombinación
• evolución rápida
La herencia uniparental sin recombinación llevan a que
los genomas mitocondriales estén relacionados entre sí
por un único árbol genealógico. (“árbol de genes o
alelos, no de individuos”)
5
Ejemplo: rata de pajonal (Scapteromys)
6
Ejemplo: tucu-tucu (Ctenomys pearsoni)
polifilia
monofilia recíproca
A1
A2
A6
70a
A3
A4
A5
1
11
2
3
4 5
6
7
8
9
10
56,58,70b
B1
?
56,58
B2
B3
B4
B5
B6
C1
56,64
58,70b
66,70c
66
C3
?
C4
70a,70c
C5
64
C6
C7
C8
D1
70b
70b
C2
7
56
?
?
64,70b
8
2
Cuatro criterios para postular aislamiento
geográfico histórico
monofilia recíproca
resulta de un proceso
barrera
geográfica
Barrera
geográfica
monofilia
recíproca
(según Avise 2000)
1. Fuerte apoyo para el árbol (por bootstrap, otros métodos)
95
parafilia
99
polifilia
población
ancestral
Historia previa
2. Concordancia con una división
geográfica independiente
(e.g., provincias fitogeográficas)
9
10
Concordancia genealógica
3. Concordancia entre especies (analizadas con el mismo gen)
Especie 1
Distintos genes de una misma especie
especie 2
Burton y Lee, 1994.
Pta. Concepción
4. Concordancia entre genes de una misma especie
Trigriopus californicus
gen 1
gen 2
11
12
3
Concordancia genealógica
Concordancia genealógica
Diferentes especies en provincias biogeogáficas
Diferentes especies con el mismo gen
Eizirik et al. 1998
ocelote
Leopardus pardalis
margay
Leopardus weidii
13
14
Tiempo
pasado
Tiempo
pasado
Avise 2000
presente
15
presente
16
4
pasado
El modelo coalescente
Tiempo
T2
T3
T4
presente
17
T2
T5
Genealogía
• topología
((D,E),(C,(A,B)))
• intervalos de tiempo entre
eventos de coalescencia
{ Ti }, i = 2, 3,…, n
mutaciones sobre ramas (si las
hay)
patrón resultante de variación
T3 genética (sitios variables)
• número
• distribución
A ggt aca cct ggc
T4
B .a. ... g.. t.t
A
B
C
D E
T5
Modelo demográfico: Fisher-Wright
Estudio de las propiedades (genealógicas, mutacionales) de
una muestra de alelos. Típicamente, la muestra está
tomada en el presente y se traza su historia hacia el
pasado.
Una realización del proceso:
Topología.
Tiempos entre eventos de coalescencia {Ti}.
Mutaciones sobre la genealogía.
demografía
mutación
Sewall Wright propuso que la probabilidad de que
dos genes sean descendientes del mismo alelo de
la generación anterior es:
1/2N
siendo,
la probabilidad de que
no lo sean
Probabilidad de que el evento de coalescencia ocurra en un
tiempo t
Probabilidad de
coalescencia en la
generación t
Probabilidad de que no
coalescan los dos alelos en las
anteriores t -1 generaciones
5
Aceptando que el tiempo de espera promedio para un evento
infrecuente (como un coalescente) es el inverso de la
probabilidad de dicho evento:
El coalescente con más de dos alelos
Para n=3 alelos, podemos pensar en la probabilidad de coalescencia
como 1/2N para cada disponible para coalescer, es decir P(coal / n =
3) =3/2N.
E (T2) = 2N
(despreciando la probabilidad de que los tres alelos coalescan en un
mismo ancestro en una generación, lo cual es razonable si 2N>>3)
Para una muestra de
n alelos tendríamos
entonces:
lo que equivale a
P(coal ) 
P (coal ) 
C 2i
2N
con i = 2, 3, ….n
i (i  1) / 2 i (i  1)

2N
4N
El coalescente con más de dos alelos
Implícita en estos resultados está la noción de que son aplicables a un
número cualquiera de alelos, en un momento cualquiera de la historia
genealógica
Es decir que la probabilidad de observar un coalescente para i = 5
alelos es la misma si tomamos en el presente o si los consideramos
hace 500 generaciones
Otro resultado imporante es que E(Tn) < E(Tn-1) < E(Tn-2) < E(T2).
Es decir, los tiempos medios de espera se alargan a medida que el
número de linajes se reduce mediante sucesivos coalescentes.
E (T3) = 2N/3
E (Ti ) 
para i alelos, el tiempo de espera
es:
2N
i (i  1) / 2
=
E (Ti ) 
4N
i(i  1)
Veremos ahora el tiempo esperado para el ancestro común mas
reciente (ACMR) de toda nuestra muestra de alelos, deducido a
partir de la ecuación anterior, sumando todos los valores
esperados de Ti:
E (Ti ) 
4N
i(i  1)
E (TACMR )   Ti  4 N 1  
n
i2


1
n
Este valor se interpreta como el doble del número efectivo de genes
de la población (2 en nuestro modelo, 2N alelos), y esta lectura tiene
un valor general.
Sustituyendo el 2N por el número efectivo de genes de un locus
cualquiera, y el resultado es válido.
Ejemplo:
4N = locus dipliode
2N = haploide
N = ADNm, cromosoma Y o ADN de los cloroplastos
6
Tiempo esperado de arribo a la monofilia por deriva:
depende del tamaño efectivo
A partir del modelo coalescente derivamos:
Tiempo esperado de arribo a la monofilia por deriva:
depende del tamaño efectivo
A partir del modelo coalescente derivamos:
 1
E (TACMR )  4 N 1  
 n
 1
E (TACMR )  4 N 1  
 n
Para un sistema diploide autosómico, E(TACMR)
tiende a 4N
2N
Si lo pensamos como 2x2N, es 2 x número
efectivo de genes
25
Variabilidad genética en un contexto genealógico
Proceso genealógico + mutación
E(s) = T2 
Para un sistema mitocondrial:
2 x N = 2 x N/2 = N (1/4 del valor en
un sistema dipliode autosómico)
Remplazando E(Ti) por 4N/[i(i-1)] y sacando 4N de la sumatoria
como factor común llegamos a:
E (TTOT )   iE (Ti )
n
Sitios que segregan
esperados en esta
rama
26
i 2
E (TTOT )  4 N 
n
i2
n 1
1
1
4 N 
(i  1)
i 1 i
Asumiendo un modelo de sitios infinitos (tasa de mutación baja y un
número alto de clases alélicas posibles) podemos aceptar como una
aproximación razonable que todos los alelos de igual estado deben
ser descendientes de un único alelo (el mutante original).
El número esperado de sitios polimórficos esperados estará
dados entonces por:
Esperanza de la suma de
todas las ramas:
E (TTOT )   iE (Ti )
n
i 2
n 1
n 1
1
1
E ( STOT )  4 N    
i 1 i
i 1 i
7
Tiempo esperado de arribo a la monofilia por deriva:
aplicaciones
O
G
H
C
Tiempo esperado de arribo a la monofilia por
deriva: dos formas de discordancia entre árboles de especie y
árboles de genes
O
G
H
C
*
Un árbol de genes igual al árbol
de especies
Tiempo esperado de arribo a la monofilia por
deriva: dos formas de discordancia entre árboles de especie y
árboles de genes
O
G
H
Algunas cifras:
Intervalo de tiempo: 2 - 4 MA
Tiempo generacional: 20-25 años
Ne actual en humanos: 10.000
C
*
Bajo neutralidad, la prob de observar esta discordancia
depende de la prob de que NO haya coalescencia en el
intervalo marcado (*)
Parentesco cercano
30% de los sitios muestran reparto incompleto de linajes (ILS: “incomplete
lineage sorting”) entre humanos, chimpancés y gorila
E(TACMR)= del orden de 1 MA
Con 1 alelo por especie.
Hay que calcular la prob. de un ancestro de 2-4
o más MA de antigüedad. El resultado en este
caso varía entre 13% y 2%.
Notar que cambios en estimaciones de Ne y
del tiempo generacional pueden cambiar los
resultados de modo sustantivo.
Más que los detalles, importa entender que pueden surgir
discordancias sin flujo génico, por “reparto de linajes”
ancestrales.
A Scally et al. Nature 483, 169-175 (2012) doi:10.1038/nature10842
8
Conclusiones
• las poblaciones naturales están estructuradas en el espacio
• la divergencia es la consecuencia inevitable del aislamiento
geográfico (deriva genética, mutación)
• la concordancia de patrones filogeográficos sugiere
historias comunes de aislamiento y divergencia
• la divergencia pasa por estados de polifilia y parafilia, hasta
llegar a la monofilia recíproca
• el “ritmo” de la divergencia pasiva es 1/2N
• el tiempo esperado de llegada a la monofilia es aprox. 4N
generaciones (para un locus diploide autosómico neutral)
• generalizando, el tiempo de llegada a la monofilia es 2 x
no. de genes en la población (ej., 2 veces N = N, para ADN
mitocondrial)
33
9