Download RUBÉN RODRÍGUEZ ALONSO

Document related concepts

ARN de transferencia wikipedia , lookup

Gen wikipedia , lookup

Ácido desoxirribonucleico wikipedia , lookup

Código genético wikipedia , lookup

Genómica computacional wikipedia , lookup

Transcript
RUBÉN RODRÍGUEZ ALONSO
PRÁCTICA 6 – ANÁLISIS COMPUTACIONAL DE SECUENCIAS DE DNA
 Resumen
Esta práctica esta basada en el uso de bases de datos de moléculas de interés
biológico, secuencias, estructura molecular y ubicación de genes y proteínas, y de las
distintas herramientas online para el análisis computacional que en estas bases podemos
encontrar.
 Resultados
Ejercicio 1. Busca en GenBank secuencias de ADN de la nécora (Necora puber).
¿Cuántos tipos de genes diferentes encuentras?
Podemos observar la subunidad grande, 28S, la 18S, y la 16S del RNA ribosomal
y el gen de la histona H3, por lo que hay cuatro tipos de genes
Ejercicio 2. Averigua en la base de datos de genomas del EMBL, cuántos pares de
bases tiene el genoma de Pseudomonas aeruginosa.
Este gen tiene 6264403 BP.
Ejercicio 3. Compara esta secuencia proteica consigo misma en Dotlet. Copia y
pega sólo la secuencia. Ajusta la escala ("zoom") y la estringencia (escala de grises)
para ver mejor. ¿Que puedes deducir de esta comparación?
Las rayas diagonales representan cada uno de los puntos en los que coinciden
las secuencias, estas rayas se observan ya que son secuencias iguales, y las rayas
paralelas a la diagonal que indican repeticiones en la secuencia.
Ejercicio 4. Utilizando la herramienta de BLAST identifica el siguiente fragmento
de ADN. ¿De qué gen se trata y a que especie pertenece?
Se trata del gen que codifica las nucleoproteínas del virus Influenza A, gripe
aviar, en este caso pertenece a patos.
Ejercicio 5. En el portal del EMBOSS del CNIO estima el uso de codones de la
insulina humana con el programa cusp. ¿Cuál es el codón más utilizado para el
aminoácido Lisina (K)?
El codón más utilizado para la lisina es AAG.
Ejercicio 6. Utiliza la herramienta Mapper para construir el mapa de restricción
de la siguiente secuencia: GAATTCATACC. ¿Qué enzimas son capaces de cortarla?
Los enzimas ApoI (1) EcoRI(1) TspEI(1) BetI(1) BseMII(2) BsePI ( 2)
BsiYI (11) serán los capaces de cortar dicha secuencia.
Ejercicio 7. Traduce con transeq la siguiente secuencia: CTCGAGGGGTAG.
¿Cuál es la secuencia de aminoácidos de la proteína resultante y cuál es su longitud?
La secuencia de aminoácidos es: leucina, ácido glutámico y glicina (LEG), y
su longitud es de tres aminoácidos
Ejercicio 8. Identifica con GenScan los exones (Print options: CDS) de la
siguiente secuencia. ¿Cuántos y qué exones has obtenido?
Se han obtenido 4 exones, de los cuales 3 son internos (intr) tratándose el otro
de un exon terminal
Ejercicio 9. Utilizando el servidor de MFold, predice la estructura de la siguiente
secuencia de ARN ¿Cuántas estructuras se predicen? ¿Cuál es su energía? Incluye un
dibujo (formato png) de la estructura más probable.
Se predicen cuatro estructuras:
1ª estructura Initial dG = -41.1 kcal/mole
2º estructura Initial dG = -39.9 kcal/mole
3ª estructura Initial dG = -39.9 kcal/mole
4ª estructura Initial dG = -39.1 kcal/mole
De todas, la estrucura más probable es:
Ejercicio 10. Alinea las secuencias del gen pol del VIH-1 en EBI ClustalW.
Utilizando el alineamiento resultante (archivo *.aln) construye un árbol filogenético de
máxima parsimonia con dnapars. Visualiza el archivo "outtree" en Phylodendron. Según
este árbol, ¿que subtipo está más relacionado con el subtipo A?
Según el árbol de parsimonia construido el subtipo G es el más relacionado
con el subtipo A.
 Aprendizaje
Conocimiento e inicio en el manejo de la bioinformática como método de
obtención de información tanto de secuencias de ADN, de polimorfismos y de genomas
a través de bases e datos, como de comparación de secuencias utilizando diferentes
herramientas online.