Download influencia de los criterios de selección aic y bic para la selección del

Document related concepts
no text concepts found
Transcript
INFLUENCIA DE LOS CRITERIOS DE SELECCIÓN AIC Y BIC PARA LA SELECCIÓN DEL MODELO DE
EVOLUCION Y LA RECONSTRUCCION DEL ANALISIS BAYESIANO.
Juliette Cristina Gualdrón Díaz
2050158
Introducción
El uso de la sustitución nucleotidica como un modelo de evolución comenzó a ser necesario
cuando las secuencias de DNA se comenzaron a usar para estimar relaciones filogenéticas
entre organismos (Sullivan & Joyce, 2005). Estos modelos de sustitución son usados en los
análisis filogenéticos para describir las diferentes probabilidades de cambios entre un
nucleótido y otro, con el objetivo de corregir los cambios vistos a lo largo de la filogenia
(Posada y Crandall, 2001).
El mejor ajuste del modelo de evolución para ciertos set de datos puede ser seleccionado a
través de pruebas estadísticas. Los test estadísticos de modelos de sustitución nucleotidica son
de dos tipos: algunos son designados para comparar diferentes modelos, y otros para un
conjunto de modelo particular (Posada y Crandall, 2001). Uno de las aproximaciones para la
selección de un modelo es la comparación simultanea de todos los modelos a través del
criterio de información Akaike (AIC) o el criterio de información bayesiano (BIC). Ambos
criterios de selección pueden ser usados para comparar tanto modelos anidados como no
anidados; además en los dos se escoge el modelo que presenta el valor más pequeño entre
todos los modelos evaluados, siendo este el que muestra el mejor ajuste a los datos (Posada,
2008). Sin embargo escoger cual modelo es mas óptimo es un problema para la estimación
correcta de la topología.
El objetivo de este trabajo es comparar y analizar los criterios de selección AIC y BIC, para la
selección del modelo de evolución usando el programa JModeltest y determinar si la topología
obtenida en MrBayes es influenciada por el criterio de selección.
Materiales y Métodos
Se analizaron 6 set de datos, de los cuales tres son genes de arañas de la familia Thomisidae
(Araneae) y los otros tres son genes del género Nothophagus (Nothofagaceae), tomados de
Benjamien et al., (2008) y Manos (1997) respectivamente (Tabla 1).
Las secuencias moleculares de cada uno de los genes se alinearon utilizando MUSCLE 3.6
(Edgar, 2004), para posteriormente determinar el mejor modelo de evolución para cada gen
bajo el criterio estadísticos Akaike (AIC) y de información bayesiana (BIC), usando Jmodeltest
0.1.1 (Posada,2008). El análisis Bayesiano se realizó con MrBayes 3.1.2 (Huelsenbeck y
Ronquist, 2001) solo para el set de datos del genero Nothophagus. Se hicieron análisis
individuales para los genes ITS1,5,8,ITS2 y rbcL, que fueron los que presentaron diferentes
modelos de evolución bajo los dos criterios, posteriormente se hizo un análisis de todos los set
de datos. Los arboles se graficaron usando Figtree 1.2.2.
Resultados
Los modelos de evolución obtenidos para los set de datos correspondientes a las arañas, tanto
los genes mitocondriales (16S y COI) y nucleares (H3) fueron los mismos bajo ambos criterios
de selección. El gen 16S presento el modelo de evolución GTR+G, el gen COI el modelo
TIM+I+G y para el H3 fue k80+G. Por el contrario para los set de datos pertenecientes al
género Nothophagus, presentaron modelos de evolución diferentes bajo ambos criterios de
selección a excepción del espaciador intergénico atpB-rbcL, para el cual se obtuvo el mismo
modelo con los dos criterios estadísticos (Tabla2).
Para el gen ITS1,5,8,ITS2, la topología generada en MrBayes fue la misma para los modelos
GTR+G y TrNef+G (Fig. 1-2) bajo los criterios de selección AIC y BIC respectivamente; Sin
embargo los valores de probabilidad fueron más bajos con el modelo GTR+G en relación a los
valores obtenidos con el modelo TrNef+G. De la misma forma, la topología obtenida para el
gen rbcL (Figura 3-4) también genero las mismas relaciones filogenéticas dentro del género
Nothophagus, no obstante, los valores de probabilidad en ambos casos fueron altos. Además
cabe resaltar que en todas las topologías obtenidas se recupero la monofilia del género de
plantas.
Discusión y Conclusiones
No se presento ninguna relación entre el criterio de selección, el modelo seleccionado y la
reconstrucción topológica; ya que aunque el criterio de selección sea diferente, al igual que el
modelo obtenido, se generaron las mismas relaciones topológicas para los genes.
Aunque la selección de modelos fue diferente para algunos genes, el criterio de selección y el
modelo seleccionado no influencio en la topología. No obstante cabe destacar que los
modelos escogidos bajo el criterio BIC seleccionaron modelos de evolución más simples que
los escogidos por AIC, como lo proponen Posada y Crandall (2001).
Por lo tanto, cabe resaltar que la relación entre el ajuste del modelo a los datos, el criterio de
selección y la capacidad del modelo para predecir correctamente la topología no está clara,
siendo necesario de más análisis de diferentes set de datos e igualmente considerar secuencias
más completas y modelos que permitan elucidar los modelos evolutivos que siguen las
moléculas.
Bibliografía
Benjamin S. P., Dimitrov D., Gillespie R. G., Hormiga G. 2008. Family ties: molecular phylogeny
of crab spiders (Araneae: Thomisidae). Cladistics 24: 708–722
Edgar, Robert C. (2004), MUSCLE: multiple sequence alignment with high accuracy and high
throuhput, Nucleic Acids Research 32(5), 1792-97.
Manos, P. 1997. Systematics of Nothofagus (Nothofagaceae) based on rDNA Spacer
Sequences (ITS): Taxonomic Congruence with Morphology and Plastid Sequences.
American Journal of Botany 84, 1137-1155.
Posada D. 2008. jModelTest: Phylogenetic Model Averaging. Molecular Biology and
Evolution 25, 1253-1256.
Ronquist, F. y Huelsenbeck J. P. 2003. MRBAYES 3: Bayesian phylogenetic inference
under mixed models. Bioinformatics 19, 1572-1574
Sullivan, J & Joyce, P. 2005.Model selection in phylogenetics. Annu.Rev.Ecol.Syst
36:445-466.
Familia
Anexos.
Philodromidea Proernus
Philodromus
Salticidae
Onomastus
Thomisidae
Cebrenninus
Stephanopis
Pseudoporrhopis
Oxytate
Xysticus
Xysticus
Monaeses
Tmarus
Tmarus
Rucinia
Rucinia
(b)
Diaea
Diaea
Cyriogonus
Thomisus
Thomisus
Thomisops
(b)
(a)
Genero
Corylus
Betulia
Nothophagus
Nothophagus
Nothophagus
Nothophagus
Nothophagus
Nothophagus
Nothophagus
Nothophagus
Nothophagus
Nothophagus
Nothophagus
Nothophagus
Nothophagus
Nothophagus
Nothophagus
Nothophagus
Nothophagus
Nothophagus
Nothophagus
Nothophagus
Nothophagus
Nothophagus
Especie
cornuta
nigra
antarctica
nitida
pumilio
betuloides
dombeyi
alessandri
gunni
solandri
fusca
truncata
grandis
brassii
perryi
resinosa
balansae
aequilateralis
alpina
glauca
Obliqua
Cunninghamii
menziesii
moorei
Genero
Haplotamarus
Especie
stigmaticus
sp.
pethiyagodai
rugosus1
sp.
granum
taprobane
californicus
sp.
sp.
angulatus1
angulatus2
albostriata1
albostriata2
subdola
sp.
sp.
granulifrons
sp.
piger
sp.
Tabla 1. Taxas usados en el análisis. (a) taxa del genero
Nothophagus , genes ITS1,5.8S,ITS2 , rbcL, (b) Taxa de la
familia Thomisidae
Modelo Seleccionado
Genes
Nothophagus
Thomisidae
AIC
BIC
ITS1,5.8S,ITS2
rbcL
atpB-rbcL
16S
GTR+G
GTR+I+G
TPM1uf+G
GTR+G
TrNef+G
K80+G
TPM1uf+G
GTR+G
H3
K80+G
K80+G
COI
TIM+I+G
TIM+I+G
Tabla 2. Modelos seleccionados bajo los criterios AIC y BIC, calculados en JModeltest, para
cada gen.
Figura 1. Topología del Gen ITS1,5,8S,ITS2 generada el Mrbayes bajo el criterio de selección
AIC (GTR+G).
Figura 2. Topología del Gen ITS1,5,8S,ITS2 generada el Mrbayes bajo el criterio de selección BIC
(TrNEf+G).
Figura 3. Topología del Gen rbcL generada en Mrbayes bajo el criterio de selección AIC
(GTR+I+G).
Figura 4. Topología del Gen rbcL generada en Mrbayes bajo el criterio de selección BIC
(K80+G).
Figura 5. Topología del espaciador intergénico atpB-rbcL generada en Mrbayes bajo los
criterios de selección AIC y BIC (TPM1uf+G).