Download Identificación de mutaciones puntuales mediante secuenciación
Transcript
Universidad Miguel Hernández de Elche Identificación de mutaciones puntuales mediante secuenciación masiva en Arabidopsis thaliana Ana García Pérez Tutores: José Luis Micol Molina David Wilson Sánchez Área de Genética Departamento de Biología Aplicada Grado en Biotecnología Facultad de Ciencias Experimentales Curso académico 2013/2014 JOSÉ LUIS MICOL MOLINA, Catedrático de Genética de la Universidad Miguel Hernández de Elche, y DAVID WILSON SÁNCHEZ, contratado predoctoral del Programa Valid+d de la Generalitat Valenciana, HACEMOS CONSTAR: Que el presente trabajo ha sido realizado bajo nuestra dirección y recoge fielmente la labor realizada por Ana García Pérez como Trabajo de Fin del Grado en Biotecnología. Las investigaciones reflejadas en esta memoria se han desarrollado íntegramente en la Unidad de Genética del Instituto de Bioingeniería de la Universidad Miguel Hernández de Elche. José Luis Micol Molina David Wilson Sánchez Elche, 4 de julio de 2014. Resumen y Palabras Clave I.- RESUMEN Y PALABRAS CLAVE La organogénesis en general y el desarrollo foliar en particular sólo pueden comprenderse si se identifican los genes que los controlan para desentrañar sus funciones. La disección genética del desarrollo mediante abordajes mutacionales se ha basado tradicionalmente en la clonación posicional de los genes mutados mediante análisis de ligamiento a marcadores moleculares. Las técnicas de secuenciación masiva han modificado drásticamente estas aproximaciones, reduciendo considerablemente el tiempo necesario para recorrer el camino que separa el fenotipo del gen. En este trabajo hemos identificado la mutación causante del fenotipo del mutante angulata9-1 (anu9-1) de Arabidopsis thaliana, que presenta hojas cloróticas, estrechas y con indentaciones. Hemos secuenciado el genoma de anu9-1 y su ancestro silvestre Ler utilizando un secuenciador masivo Ion Proton. Empleando la plataforma bioinformática Galaxy, hemos analizado las lecturas proporcionadas por el secuenciador y hemos encontrado una mutación en el gen At5g14100, que codifica la proteína NON-INTRINSIC ABC PROTEIN 14 (NAP14). Esta mutación introduce un codón de terminación prematuro. An understanding of organogenesis in general and in particular leaf development can only be gained through the isolation and study of the genes that control these processes in order to unravel the functions of these genes. The genetic dissection of development through mutational approaches has traditionally been based on the positional cloning of the mutated genes by linkage analysis to molecular markers. Massive sequencing techniques have dramatically modified these approaches, considerably reducing the time required to go from the phenotype to the gene. We studied in this work the angulata9-1 (anu9-1) mutant of Arabidopsis thaliana, which exhibits narrow, chlorotic and dentate leaves. We sequenced the genome of anu9-1 and its wild type Ler in an Ion Proton massive sequencer. Using the Galaxy bioinformatics platform, we analyzed the reads provided by the sequencer and have found a mutation in the At5g14100 gene, which encodes NON-INTRINSIC ABC PROTEIN 14 (NAP14). This mutation creates a premature stop codon. Palabras clave: Desarrollo foliar, análisis de mutantes, clonación posicional, secuenciación masiva, Ion Proton. 1 Conclusiones y Proyección Futura 25 VI.- CONCLUSIONES Y PROYECCIÓN FUTURA En este trabajo hemos identificado la mutación causante del fenotipo del mutante angulata9-1 (anu9-1), secuenciado el genoma de anu9-1 y de su parental silvestre Ler en un secuenciador masivo Ion Proton. Empleando la plataforma de análisis de datos biológicos Galaxy, hemos analizado las lecturas obtenidas por el secuenciador y hemos localizado una mutación puntual que introduce un codón de terminación en la región codificante del gen At5g14100, que codifica la proteína NON-INTRINSIC ABC PROTEIN 14 (NAP14). Estos resultados se han obtenido utilizando exclusivamente recursos de los que dispone el laboratorio de J.L. Micol y reproducen fielmente los obtenidos anteriormente por encargo a una empresa externa, que empleó un Illumina HiSeq 2500 con un coste mucho mayor que el que ha supuesto el trabajo que aquí se presenta. La secuenciación masiva de ADN, que he comprendido en profundidad durante la realización de este trabajo, es una poderosísima técnica que permite obtener la secuencia completa de un genoma en poco tiempo. Esta tecnología conlleva el manejo de numerosas herramientas bioinformáticas con las que también me he familiarizado. Las aplicaciones de la secuenciación masiva son numerosas e incluyen el análisis de la variación genética natural, la identificación de mutaciones de diversa naturaleza, el análisis de la cromatina o el diagnóstico de enfermedades hereditarias. Esta tecnología también puede aplicarse al transcriptoma, ya que permite al análisis de la expresión génica. Los ámbitos de aplicación de la secuenciación masiva incluyen la producción vegetal y animal, y el estudio de las enfermedades humanas. El previsible abaratamiento de estas tecnologías a corto plazo hará posible el advenimiento de una medicina realmente personalizada.