Download RUBÉN RODRÍGUEZ ALONSO
Document related concepts
Transcript
RUBÉN RODRÍGUEZ ALONSO PRÁCTICA 6 – ANÁLISIS COMPUTACIONAL DE SECUENCIAS DE DNA Resumen Esta práctica esta basada en el uso de bases de datos de moléculas de interés biológico, secuencias, estructura molecular y ubicación de genes y proteínas, y de las distintas herramientas online para el análisis computacional que en estas bases podemos encontrar. Resultados Ejercicio 1. Busca en GenBank secuencias de ADN de la nécora (Necora puber). ¿Cuántos tipos de genes diferentes encuentras? Podemos observar la subunidad grande, 28S, la 18S, y la 16S del RNA ribosomal y el gen de la histona H3, por lo que hay cuatro tipos de genes Ejercicio 2. Averigua en la base de datos de genomas del EMBL, cuántos pares de bases tiene el genoma de Pseudomonas aeruginosa. Este gen tiene 6264403 BP. Ejercicio 3. Compara esta secuencia proteica consigo misma en Dotlet. Copia y pega sólo la secuencia. Ajusta la escala ("zoom") y la estringencia (escala de grises) para ver mejor. ¿Que puedes deducir de esta comparación? Las rayas diagonales representan cada uno de los puntos en los que coinciden las secuencias, estas rayas se observan ya que son secuencias iguales, y las rayas paralelas a la diagonal que indican repeticiones en la secuencia. Ejercicio 4. Utilizando la herramienta de BLAST identifica el siguiente fragmento de ADN. ¿De qué gen se trata y a que especie pertenece? Se trata del gen que codifica las nucleoproteínas del virus Influenza A, gripe aviar, en este caso pertenece a patos. Ejercicio 5. En el portal del EMBOSS del CNIO estima el uso de codones de la insulina humana con el programa cusp. ¿Cuál es el codón más utilizado para el aminoácido Lisina (K)? El codón más utilizado para la lisina es AAG. Ejercicio 6. Utiliza la herramienta Mapper para construir el mapa de restricción de la siguiente secuencia: GAATTCATACC. ¿Qué enzimas son capaces de cortarla? Los enzimas ApoI (1) EcoRI(1) TspEI(1) BetI(1) BseMII(2) BsePI ( 2) BsiYI (11) serán los capaces de cortar dicha secuencia. Ejercicio 7. Traduce con transeq la siguiente secuencia: CTCGAGGGGTAG. ¿Cuál es la secuencia de aminoácidos de la proteína resultante y cuál es su longitud? La secuencia de aminoácidos es: leucina, ácido glutámico y glicina (LEG), y su longitud es de tres aminoácidos Ejercicio 8. Identifica con GenScan los exones (Print options: CDS) de la siguiente secuencia. ¿Cuántos y qué exones has obtenido? Se han obtenido 4 exones, de los cuales 3 son internos (intr) tratándose el otro de un exon terminal Ejercicio 9. Utilizando el servidor de MFold, predice la estructura de la siguiente secuencia de ARN ¿Cuántas estructuras se predicen? ¿Cuál es su energía? Incluye un dibujo (formato png) de la estructura más probable. Se predicen cuatro estructuras: 1ª estructura Initial dG = -41.1 kcal/mole 2º estructura Initial dG = -39.9 kcal/mole 3ª estructura Initial dG = -39.9 kcal/mole 4ª estructura Initial dG = -39.1 kcal/mole De todas, la estrucura más probable es: Ejercicio 10. Alinea las secuencias del gen pol del VIH-1 en EBI ClustalW. Utilizando el alineamiento resultante (archivo *.aln) construye un árbol filogenético de máxima parsimonia con dnapars. Visualiza el archivo "outtree" en Phylodendron. Según este árbol, ¿que subtipo está más relacionado con el subtipo A? Según el árbol de parsimonia construido el subtipo G es el más relacionado con el subtipo A. Aprendizaje Conocimiento e inicio en el manejo de la bioinformática como método de obtención de información tanto de secuencias de ADN, de polimorfismos y de genomas a través de bases e datos, como de comparación de secuencias utilizando diferentes herramientas online.