Download Identificación de mutaciones puntuales mediante secuenciación

Document related concepts

Genética inversa wikipedia , lookup

Transcript
Universidad Miguel Hernández de Elche
Identificación de mutaciones
puntuales mediante
secuenciación masiva en
Arabidopsis thaliana
Ana García Pérez
Tutores:
José Luis Micol Molina
David Wilson Sánchez
Área de Genética
Departamento de Biología Aplicada
Grado en Biotecnología
Facultad de Ciencias Experimentales
Curso académico 2013/2014
JOSÉ LUIS MICOL MOLINA, Catedrático de Genética de la Universidad Miguel
Hernández de Elche, y
DAVID WILSON SÁNCHEZ, contratado predoctoral del Programa Valid+d de la
Generalitat Valenciana,
HACEMOS CONSTAR:
Que el presente trabajo ha sido realizado bajo nuestra dirección y recoge fielmente la
labor realizada por Ana García Pérez como Trabajo de Fin del Grado en Biotecnología.
Las investigaciones reflejadas en esta memoria se han desarrollado íntegramente en la
Unidad de Genética del Instituto de Bioingeniería de la Universidad Miguel Hernández
de Elche.
José Luis Micol Molina
David Wilson Sánchez
Elche, 4 de julio de 2014.
Resumen y Palabras Clave
I.- RESUMEN Y PALABRAS CLAVE
La organogénesis en general y el desarrollo foliar en particular sólo pueden
comprenderse si se identifican los genes que los controlan para desentrañar sus funciones.
La disección genética del desarrollo mediante abordajes mutacionales se ha basado
tradicionalmente en la clonación posicional de los genes mutados mediante análisis de
ligamiento a marcadores moleculares. Las técnicas de secuenciación masiva han
modificado drásticamente estas aproximaciones, reduciendo considerablemente el tiempo
necesario para recorrer el camino que separa el fenotipo del gen.
En este trabajo hemos identificado la mutación causante del fenotipo del mutante
angulata9-1 (anu9-1) de Arabidopsis thaliana, que presenta hojas cloróticas, estrechas y
con indentaciones. Hemos secuenciado el genoma de anu9-1 y su ancestro silvestre Ler
utilizando un secuenciador masivo Ion Proton. Empleando la plataforma bioinformática
Galaxy, hemos analizado las lecturas proporcionadas por el secuenciador y hemos
encontrado una mutación en el gen At5g14100, que codifica la proteína NON-INTRINSIC
ABC PROTEIN 14 (NAP14). Esta mutación introduce un codón de terminación prematuro.
An understanding of organogenesis in general and in particular leaf development
can only be gained through the isolation and study of the genes that control these processes
in order to unravel the functions of these genes. The genetic dissection of development
through mutational approaches has traditionally been based on the positional cloning of the
mutated genes by linkage analysis to molecular markers. Massive sequencing techniques
have dramatically modified these approaches, considerably reducing the time required to
go from the phenotype to the gene.
We studied in this work the angulata9-1 (anu9-1) mutant of Arabidopsis thaliana,
which exhibits narrow, chlorotic and dentate leaves. We sequenced the genome of anu9-1
and its wild type Ler in an Ion Proton massive sequencer. Using the Galaxy bioinformatics
platform, we analyzed the reads provided by the sequencer and have found a mutation in
the At5g14100 gene, which encodes NON-INTRINSIC ABC PROTEIN 14 (NAP14). This
mutation creates a premature stop codon.
Palabras clave: Desarrollo foliar, análisis de mutantes, clonación posicional, secuenciación
masiva, Ion Proton.
1
Conclusiones y Proyección Futura 25
VI.- CONCLUSIONES Y PROYECCIÓN FUTURA
En este trabajo hemos identificado la mutación causante del fenotipo del mutante
angulata9-1 (anu9-1), secuenciado el genoma de anu9-1 y de su parental silvestre Ler en
un secuenciador masivo Ion Proton. Empleando la plataforma de análisis de datos
biológicos Galaxy, hemos analizado las lecturas obtenidas por el secuenciador y hemos
localizado una mutación puntual que introduce un codón de terminación en la región
codificante del gen At5g14100, que codifica la proteína NON-INTRINSIC ABC PROTEIN
14 (NAP14). Estos resultados se han obtenido utilizando exclusivamente recursos de los
que dispone el laboratorio de J.L. Micol y reproducen fielmente los obtenidos anteriormente
por encargo a una empresa externa, que empleó un Illumina HiSeq 2500 con un coste
mucho mayor que el que ha supuesto el trabajo que aquí se presenta.
La secuenciación masiva de ADN, que he comprendido en profundidad durante la
realización de este trabajo, es una poderosísima técnica que permite obtener la secuencia
completa de un genoma en poco tiempo. Esta tecnología conlleva el manejo de numerosas
herramientas bioinformáticas con las que también me he familiarizado.
Las aplicaciones de la secuenciación masiva son numerosas e incluyen el análisis
de la variación genética natural, la identificación de mutaciones de diversa naturaleza, el
análisis de la cromatina o el diagnóstico de enfermedades hereditarias. Esta tecnología
también puede aplicarse al transcriptoma, ya que permite al análisis de la expresión génica.
Los ámbitos de aplicación de la secuenciación masiva incluyen la producción
vegetal y animal, y el estudio de las enfermedades humanas. El previsible abaratamiento
de estas tecnologías a corto plazo hará posible el advenimiento de una medicina realmente
personalizada.