Download Efecto de la eliminación de secuencias intronicas en las topologías

Document related concepts

Empalme alternativo wikipedia , lookup

Intrón wikipedia , lookup

Exón wikipedia , lookup

Filogenética computacional wikipedia , lookup

Historia de la biología del ARN wikipedia , lookup

Transcript
Efecto de la eliminación de secuencias intronicas en las topologías
Laura Lucia Estévez Landazábal 2060584
Universidad Industrial de Santander. Escuela de Biología
INTRODUCCIÓN
Una pregunta fundamental en sistemática molecular concierne a la eficacia de diferentes tipos de
secuencias en rescatar clados a diferentes niveles taxonómicos [12]. Un criterio usado para
obtención de datos eficientes es usar genes razonablemente conservados [8]. No todas las
regiones de un gen cambian a la misma tasa [1], la proporción de sitios de rápida evolución es más
grande en intrones que en exones, y las regiones exonicas están caracterizadas por sitios con
varias posiciones que no varían. Las categorías de sitios invariantes o sitios que evolucionan rápido
son inútiles o problemáticos en la reconstrucción de relaciones filogenéticas [10].
La resolución en estudios filogenéticos empleando datos moleculares de exones ha sido en
algunos casos alta [11] y en otros baja[2] [3] [6], mientras que en otros estudios la comparación de
resultados de análisis con intrones y exones del mismo gen ha arrojado topologías consistentes
[13] El uso de las secuencias intronicas de ADN nuclear para el estudio de las relaciones
filogenéticas de organismos cercanamente relacionados ha incrementado, sin embargo, la utilidad
de secuencias intronicas a niveles taxonómicos más altos no ha sido firmemente establecida [9].
El objetivo de este trabajo es construir las filogenias derivadas de genes completos y de sus
regiones codificantes, para observar los efectos de la utilización de dichos fragmentos en los
análisis filogenéticos.
MATERIALES Y METODOS
Se emplearon las secuencias completas y exonicas de los genes codificantes de proteínas CLTC,
CLTCL1, PRKC I y nad1 , los códigos de acceso al GenBank así como los taxa usados fueron
tomados de los artículos de Chojnowski et al ,2008 [3]; Dombrovska & Qiu,2004[4]; Conrad et al,
2006[2].
Se realizo un análisis de máxima Likelihood, las secuencias moleculares de los genes completos y
de las regiones codificantes fueron alineadas en MUSCLE 3.6 [5], utilizando dichas secuencias se
asumió el modelo evolutivo JC69 +Gamma, el cual fue empleado para el procesamiento de los
datos moleculares en el sofware PhyML 3.0 [7]. Calculando el soporte bootstraping no
paramétrico de mil replicas.
RESULTADOS Y DISCUSION
Las topologías resultantes del empleo de las secuencias completas (Fig 2) y post-splicing (Fig 1) del
gen CLTC no nos muestran las mismas relaciones filogenéticas, mientras que el uso de la secuencia
completa agrupa todo el ingroup con un soporte de 1000, a Anser-Aythya en un nodo con soporte
de 1000, a Speotyto y a Buteo como hermanos de Arenaria y esos a su vez como grupos hermanos
de Anhinga, el empleo de los exones nos anida a Notoprocta (uno de los outgroup) con Speotyto, y
reúne a todos los demás en un nodo con un soporte mucho mas bajo que el que reúne a todos los
ingroup en un grupo monofiletico cuando se emplea la secuencia completa.
En los resultados empleando las secuencias del gen CLTCL1 sin Splicing (Fig. 3), se observa el
aumento del soporte tanto del nodo que agrupa a todo el ingroup con respecto al gen post
Splicing (Fig. 4). Las relaciones a pesar de estar resueltas no son las mismas empleando el gen
completo y los exones, usando el gen completo se puede observar la unión de Anser-Crax con
Pandion-Rallus como grupo hermano, mientras que Mesitornis-Ciconia se agrupan aparte. Evento
que no se observa con el uso de los exones, donde se ubica a Crax como grupo hermano de un
clado con todos los demás terminales del ingroup, y no se detecta la relación de los galliformes
con los anseriformes, por lo que se nota que la presencia de las secuencias intronicas tiene
inferencia en las relaciones filogeneticas en este caso.
Para el tercer set de datos, se encuentra que cuando se usaron los exones del gen PRKC I, uno de
los grupos externos (Tamandua) se anidó mostrando relación con el conjunto TrichechusMacroscelides , mientras que los otros cuatro terminales del ingroup se ven relacionados entre
ellos; los soportes de los nodos internos son bajos de la misma manera que ocurre con los
soportes para la topología resultado del gen completo, pero en dicha topología el soporte del
nodo de todo el ingroup es de 1000 (ver Figs. 5 y 6).
En cuanto a los resultados del gen nad1 (Figs. 7 y 8) en ambas topologías se presentan las
especies usadas como outgroup (pertenecientes a las hepáticas) separadas de los musgos, que
aparecen como grupo monofiletico con un soporte de 1000, en la cual las relaciones están
resueltas pero de diferente manera cuando se usa la secuencia génica pre-splicing y post-splicing.
Las diferencias son que en el resultado del gen pre splicing se agrupa Anodon-Risogoniu con
Mnium y el grupo hermano de ellos es Bartramia-Hedwigia, mientras que en el resultado PostSplicing se agrupa Anodon-Risogoniu con Bartramia y su grupo hermano es Mnium-Hedwigia,
también se observa el incremento en los soportes de bootstrap para los nodos cuando se emplea
el gen completo (pre-splicing), lo que lleva a pensar que en este caso las secuencias intronicas
proveen evidencia que hace aumentar el soporte de los nodos.
Las comparaciones anteriores entre las diferentes topologías resultantes del uso del gen completo
y el uso de las regiones exonicas convergen en algunos aspectos, como por ejemplo que el soporte
de los nodos es menor para las topologías que excluyen los intrones, observación que también ha
sido hecha en algunas investigaciones en las que los intrones suministran mas sitios informativos
que proveen mejor soporte para clados bien aceptados [3]. También se aprecia que las relaciones
filogenéticas que se deducen de las topologías obtenidas incluyendo y excluyendo intrones en el
mismo gen son diferentes.
El uso de los exones en ciertos casos ha dejado ramas recientes sin resolver [11], debido a que se
han usado secuencias altamente conservadas que cambian despacio y que no son útiles para
resolver ciertas relaciones como por ejemplo las de Neoaves [3] o tortugas[6], en las que los
intrones han resuelto politomias.
Por lo tanto, los intrones están brindando información filogenética para relacionar diferentes
organismos. El poder de los intrones mencionado en algunos artículos [2] [3] [6] para resolver
politomias no se logro observar en los resultados aquí presentados, ya que no se presentaron
politomias que se resolvieran gracias a la inclusión de las secuencias intronicas. Esto
probablemente debido a que las relaciones entre los taxa usados aqui se podían resolver con la
información de los exones, sin embargo eso no quiere decir que la información de los intrones sea
descartable.
BIBLIOGRAFIA
[1]Castresana,J. 2000. Selection of Conserved Blocks from Multiple Alignments for Their Use in Phylogenetic
Analysis. Molecular Biology and Evolution 17:540-552
[2]Conrad A., Geeta E., Munro M., Montgelard C., Pardini A, & Robinson A. 2006. Indel evolution of
mammalian introns and the utility of non-coding nuclear markers in eutherian phylogenetics. Evolutionary
Genomics Group, Department of Botany and Zoology. Molecular Phylogenetics and Evolution. Vol. 42, (3)
827-837.
[3]Chojnowski, J., Kimball, R., Braun, E. 2008.Introns outperform exons in analyses of basal avian phylogeny
using clathrin heavy chain genes. Gene. 410, 89–96.
[4]Dombrovska, O., Qiu,Y. 2004.Distribution of introns in the mitochondrial gene nad1 in land plants:
phylogenetic and molecular evolutionary implications. Molecular Phylogenetics and Evolution. 32, 246–263.
[5]Edgar, Robert.C. 2004. MUSCLE: multiple sequence alignment with high accuracy and high
throughput, Nucleic Acids Research 32, 1792-97
[6]Fujita, M., Engstrom,T., Starkey, D., Shaffer, H. 2004. Turtle phylogeny: insights from a novel nuclear
intron. Molecular phylogenetics and evolution. 3,1031-1040
[7]Ghindon, S., & Gascuel, O. 2003. A Simple, Fast, and Accurate Algorithm to Estimate Large
Phylogenies by Maximum Likelihood. Systematic Biology, 52, 696-704.
[8] Li, C., Orti, G., Zhang,G., Lu,G.2007. A practical approach to phylogenomics: the phylogeny of ray-finned
fish (Actinopterygii) as a case study. BMC Evolutionary Biology.
[9]Matthee,C., Eick,G., Willows-Munro,s., Montgelard,C., Pardini,A.,Robinson,T.2007.Indel evolution of
mammalian introns and the utility of non-coding nuclear markers in eutherian phylogenetics . Trends in
Genetics. 3, 827-837
[10]Montgelard, C., Forty, E., Arnal, V., Matthee,C .2008. Suprafamilial relationships among Rodentia and
the phylogenetic effect of removing fast-evolving nucleotides in mitocondrial, exón and intron
fragments.Evolutionary Biology, 8:321
[11]Porter,C., Goodman,M., Stanhope, M. 1996.Evidence on Mammalian Phylogeny from Sequences of Exon
28 of the von Willebrand Factor Gene. Molecular Phylogenetics and Evolution.
[12]Springer, M., DeBry, R., Douady, C., Amrine, H., Madsen, O., de Jong, W., Stanhope,M. 2001.
Mitochondrial Versus Nuclear Gene Sequences in Deep-Level Mammalian Phylogeny Reconstruction.
Molecular Biology and Evolution. 18,132-143
[13]Wang, N., Chen,R. 1999.Comparison between phylogeny of introns and exons in primate. Chinese
Science Bulletin
ANEXOS
Fig 1: Topología consenso resultado del análisis de Máxima Verosimilitud para el gen CLTC PostSplicing. Los números sobre los nodos equivalen al soporte en Bootstrap no paramétrico.
Fig 2: Topología consenso resultado del análisis de Máxima Verosimilitud para el gen CLTC PreSplicing. Los números sobre los nodos equivalen al soporte en Bootstrap no paramétrico.
Fig 3: Topología consenso resultado del análisis de Máxima Verosimilitud para el gen CLTCL1 PostSplicing. Los números sobre los nodos equivalen al soporte en Bootstrap no paramétrico.
Fig 4: Topología consenso resultado del análisis de Máxima Verosimilitud para el gen CLTCL1 PreSplicing. Los números sobre los nodos equivalen al soporte en Bootstrap no paramétrico.
Fig 5: Topología consenso resultado del análisis de Máxima Verosimilitud para el PRKC I PostSplicing. Los números sobre los nodos equivalen al soporte en Bootstrap no paramétrico.
Fig 6: Topología consenso resultado del análisis de Máxima Verosimilitud para el PRKC I PreSplicing. Los números sobre los nodos equivalen al soporte en Bootstrap no paramétrico.
Fig 7: Topología consenso resultado del análisis de Máxima Verosimilitud para el gen nad1 PostSplicing. Los números sobre los nodos equivalen al soporte en Bootstrap no paramétrico.
Fig 8: Topología consenso resultado del análisis de Máxima Verosimilitud para el gen nad1 PreSplicing. Los números sobre los nodos equivalen al soporte en Bootstrap no paramétrico.