Download Filogeografía - Facultad de Ciencias
Document related concepts
Transcript
Variación geográfica Curso de Evolución 2015 Facultad de Ciencias Montevideo, Uruguay http://evolucion.fcien.edu.uy/ http://eva.universidad.edu.uy/ • desde la década de 1960, la electroforesis de proteínas permitió determinar que: • la mayoría de las especies tiene poblaciones estructuradas geográficamente • el grado y escala en que se manifiesta esta subdivisión varía según habitat, modos de vida, etc. 7. Variación geográfica. Filogeografía. El coalescente. Divergencia en aislamiento estricto. • las causas y procesos subyacentes pueden incluir: • aislamiento estricto • aislamiento parcial (con intercambios) • divergencia guiada por selección (no excluyente con las anteriores) • vamos a enfatizar en esta clase el primer caso 1 2 Filogeografía Variación geográfica Campo de estudio interesado en los principios y procesos que gobiernan la distribución geográfica de los linajes, especialmente aquellos dentro y entre especies cercanamente emparentadas • en frecuencias alélicas (determinadas por electroforesis para proteínas, o para microsatélites) • en secuencias de ADN (determinadas directa o indirectamente) Avise et al., 1987. • vamos a enfatizar el segundo abordaje Area A • usaremos el marco de la filogeografía para • ilustrar la existencia de variación geográfica • comenzar a entender los procesos de divergencia en aislamiento estricto, por deriva genética FILO 3 Area B GEO 4 1 ADN mitocondrial Avise: variación en el ADN mitocondrial fuertemente estructurada geográficamente Características “típicas” (hay muchas variantes): • genoma compacto (~16 KB) • numerosas copias por célula • herencia materna • no hay recombinación • evolución rápida La herencia uniparental sin recombinación llevan a que los genomas mitocondriales estén relacionados entre sí por un único árbol genealógico. (“árbol de genes o alelos, no de individuos”) 5 Ejemplo: rata de pajonal (Scapteromys) 6 Ejemplo: tucu-tucu (Ctenomys pearsoni) polifilia monofilia recíproca A1 A2 A6 70a A3 A4 A5 1 11 2 3 4 5 6 7 8 9 10 56,58,70b B1 ? 56,58 B2 B3 B4 B5 B6 C1 56,64 58,70b 66,70c 66 C3 ? C4 70a,70c C5 64 C6 C7 C8 D1 70b 70b C2 7 56 ? ? 64,70b 8 2 Cuatro criterios para postular aislamiento geográfico histórico monofilia recíproca resulta de un proceso barrera geográfica Barrera geográfica monofilia recíproca (según Avise 2000) 1. Fuerte apoyo para el árbol (por bootstrap, otros métodos) 95 parafilia 99 polifilia población ancestral Historia previa 2. Concordancia con una división geográfica independiente (e.g., provincias fitogeográficas) 9 10 Concordancia genealógica 3. Concordancia entre especies (analizadas con el mismo gen) Especie 1 Distintos genes de una misma especie especie 2 Burton y Lee, 1994. Pta. Concepción 4. Concordancia entre genes de una misma especie Trigriopus californicus gen 1 gen 2 11 12 3 Concordancia genealógica Concordancia genealógica Diferentes especies en provincias biogeogáficas Diferentes especies con el mismo gen Eizirik et al. 1998 ocelote Leopardus pardalis margay Leopardus weidii 13 14 Tiempo pasado Tiempo pasado Avise 2000 presente 15 presente 16 4 pasado El modelo coalescente Tiempo T2 T3 T4 presente 17 T2 T5 Genealogía • topología ((D,E),(C,(A,B))) • intervalos de tiempo entre eventos de coalescencia { Ti }, i = 2, 3,…, n mutaciones sobre ramas (si las hay) patrón resultante de variación T3 genética (sitios variables) • número • distribución A ggt aca cct ggc T4 B .a. ... g.. t.t A B C D E T5 Modelo demográfico: Fisher-Wright Estudio de las propiedades (genealógicas, mutacionales) de una muestra de alelos. Típicamente, la muestra está tomada en el presente y se traza su historia hacia el pasado. Una realización del proceso: Topología. Tiempos entre eventos de coalescencia {Ti}. Mutaciones sobre la genealogía. demografía mutación Sewall Wright propuso que la probabilidad de que dos genes sean descendientes del mismo alelo de la generación anterior es: 1/2N siendo, la probabilidad de que no lo sean Probabilidad de que el evento de coalescencia ocurra en un tiempo t Probabilidad de coalescencia en la generación t Probabilidad de que no coalescan los dos alelos en las anteriores t -1 generaciones 5 Aceptando que el tiempo de espera promedio para un evento infrecuente (como un coalescente) es el inverso de la probabilidad de dicho evento: El coalescente con más de dos alelos Para n=3 alelos, podemos pensar en la probabilidad de coalescencia como 1/2N para cada disponible para coalescer, es decir P(coal / n = 3) =3/2N. E (T2) = 2N (despreciando la probabilidad de que los tres alelos coalescan en un mismo ancestro en una generación, lo cual es razonable si 2N>>3) Para una muestra de n alelos tendríamos entonces: lo que equivale a P(coal ) P (coal ) C 2i 2N con i = 2, 3, ….n i (i 1) / 2 i (i 1) 2N 4N El coalescente con más de dos alelos Implícita en estos resultados está la noción de que son aplicables a un número cualquiera de alelos, en un momento cualquiera de la historia genealógica Es decir que la probabilidad de observar un coalescente para i = 5 alelos es la misma si tomamos en el presente o si los consideramos hace 500 generaciones Otro resultado imporante es que E(Tn) < E(Tn-1) < E(Tn-2) < E(T2). Es decir, los tiempos medios de espera se alargan a medida que el número de linajes se reduce mediante sucesivos coalescentes. E (T3) = 2N/3 E (Ti ) para i alelos, el tiempo de espera es: 2N i (i 1) / 2 = E (Ti ) 4N i(i 1) Veremos ahora el tiempo esperado para el ancestro común mas reciente (ACMR) de toda nuestra muestra de alelos, deducido a partir de la ecuación anterior, sumando todos los valores esperados de Ti: E (Ti ) 4N i(i 1) E (TACMR ) Ti 4 N 1 n i2 1 n Este valor se interpreta como el doble del número efectivo de genes de la población (2 en nuestro modelo, 2N alelos), y esta lectura tiene un valor general. Sustituyendo el 2N por el número efectivo de genes de un locus cualquiera, y el resultado es válido. Ejemplo: 4N = locus dipliode 2N = haploide N = ADNm, cromosoma Y o ADN de los cloroplastos 6 Tiempo esperado de arribo a la monofilia por deriva: depende del tamaño efectivo A partir del modelo coalescente derivamos: Tiempo esperado de arribo a la monofilia por deriva: depende del tamaño efectivo A partir del modelo coalescente derivamos: 1 E (TACMR ) 4 N 1 n 1 E (TACMR ) 4 N 1 n Para un sistema diploide autosómico, E(TACMR) tiende a 4N 2N Si lo pensamos como 2x2N, es 2 x número efectivo de genes 25 Variabilidad genética en un contexto genealógico Proceso genealógico + mutación E(s) = T2 Para un sistema mitocondrial: 2 x N = 2 x N/2 = N (1/4 del valor en un sistema dipliode autosómico) Remplazando E(Ti) por 4N/[i(i-1)] y sacando 4N de la sumatoria como factor común llegamos a: E (TTOT ) iE (Ti ) n Sitios que segregan esperados en esta rama 26 i 2 E (TTOT ) 4 N n i2 n 1 1 1 4 N (i 1) i 1 i Asumiendo un modelo de sitios infinitos (tasa de mutación baja y un número alto de clases alélicas posibles) podemos aceptar como una aproximación razonable que todos los alelos de igual estado deben ser descendientes de un único alelo (el mutante original). El número esperado de sitios polimórficos esperados estará dados entonces por: Esperanza de la suma de todas las ramas: E (TTOT ) iE (Ti ) n i 2 n 1 n 1 1 1 E ( STOT ) 4 N i 1 i i 1 i 7 Tiempo esperado de arribo a la monofilia por deriva: aplicaciones O G H C Tiempo esperado de arribo a la monofilia por deriva: dos formas de discordancia entre árboles de especie y árboles de genes O G H C * Un árbol de genes igual al árbol de especies Tiempo esperado de arribo a la monofilia por deriva: dos formas de discordancia entre árboles de especie y árboles de genes O G H Algunas cifras: Intervalo de tiempo: 2 - 4 MA Tiempo generacional: 20-25 años Ne actual en humanos: 10.000 C * Bajo neutralidad, la prob de observar esta discordancia depende de la prob de que NO haya coalescencia en el intervalo marcado (*) Parentesco cercano 30% de los sitios muestran reparto incompleto de linajes (ILS: “incomplete lineage sorting”) entre humanos, chimpancés y gorila E(TACMR)= del orden de 1 MA Con 1 alelo por especie. Hay que calcular la prob. de un ancestro de 2-4 o más MA de antigüedad. El resultado en este caso varía entre 13% y 2%. Notar que cambios en estimaciones de Ne y del tiempo generacional pueden cambiar los resultados de modo sustantivo. Más que los detalles, importa entender que pueden surgir discordancias sin flujo génico, por “reparto de linajes” ancestrales. A Scally et al. Nature 483, 169-175 (2012) doi:10.1038/nature10842 8 Conclusiones • las poblaciones naturales están estructuradas en el espacio • la divergencia es la consecuencia inevitable del aislamiento geográfico (deriva genética, mutación) • la concordancia de patrones filogeográficos sugiere historias comunes de aislamiento y divergencia • la divergencia pasa por estados de polifilia y parafilia, hasta llegar a la monofilia recíproca • el “ritmo” de la divergencia pasiva es 1/2N • el tiempo esperado de llegada a la monofilia es aprox. 4N generaciones (para un locus diploide autosómico neutral) • generalizando, el tiempo de llegada a la monofilia es 2 x no. de genes en la población (ej., 2 veces N = N, para ADN mitocondrial) 33 9