Download Bioinformática
Document related concepts
no text concepts found
Transcript
Bioinformática Bases de datos Pregunta 1: (Bases de datos bibliográficos) Genes de enfermedades hereditarias En esta pregunta, usted elegirá una enfermedad humana y encontrará los números de acceso de GenBank y las secuencias de algunos genes que estén relacionados con ésta. 1. Vaya a la base de datos de OMIM 2. Realice una búsqueda para una enfermedad humana en la que usted este interesado. Algunas posibilidades incluyen: Creutzfeldt-Jakob, Gaucher, leucemia, cáncer de pecho. (Para ayuda en la búsqueda, vea: http://www.omim. org/help/search). 3. Utilizando los resultados de la búsqueda, elija dos resultados que usted utilizará para encontrar secuencias de nucleótidos relacionadas. (No todos los artı́culos en los resultados de la búsqueda tienen una secuencia relacionada. 4. Para cada una de las dos entradas seleccionadas, siga las ligas a una base de datos que contenga la secuencia humana. 5. Obtenga la secuencia de nucleótidos en formato de FASTA. Pregunta 2: (Bases de datos bibliográficos) Artı́culos médicos En esta pregunta, usted buscará artı́culos sobre la enfermedad elegida y restringirá su búsqueda de varias maneras. 1. Vaya a la base de datos de PubMed. 1 2. Realice una búsqueda para la misma enfermedad humana que usted utilizó para OMIM. Anote son cuántos artı́culos encontró allı́. 3. Realice la misma búsqueda, sólo para los artı́culos que aparecieron durante el último año. (Para ayuda sobre cómo utilizar diversas etiquetas de la búsqueda, vea: http://www.ncbi.nlm.nih.gov/books/NBK3827/#pubmedhelp.PubMed_ Quick_Start) 4. Utilizando las herramientas de Pubmed, clasifique los resultados por Autor. 5. Realice una nueva búsqueda para la misma enfermedad humana, en los que los autores sean Smith o Jones. Pregunta 3: Búsqueda refinada de genes En esta pregunta, usted buscará secuencias nucleotı́dicas completas, sin patentes, para un gen especı́fico. 1. Vaya a la base de datos “Nucleotide”, el NCBI. 2. Realice una búsqueda para un gen común. Algunas posibilidades incluyen: tRNA, proteasa, hemoglobina, p53. 3. Restrinja su búsqueda para obtener solamente secuencias completas, excluyendo la palabra “parcial” de la búsqueda. 4. Restrinja su búsqueda aún más eligiendo secuencias solamente de EMBL y excluya las patentes. (Para ayuda ver: http://www.ncbi.nlm.nih.gov/books/ NBK44863/ Pregunta 4. Otras bases de datos Utilizando diferentes bases de datos resuelva los siguientes problemas: 1. Usando el servidor ExPASy busque la secuencia de amino ácidos de la anhidrasa carbónica humana 2. 2. Encuentre los números de acceso en EMBL y GenBank 3. Obtenga el número de acceso del archivo PDB 4. Encuentre en qué cromosoma se localiza el gen. 5. ¿Existe una anhidrasa carbónica en el maı́z? 2 Pregunta 5. Bases de datos de proteı́nas 1. En la base de datos SWISS-PROT (http://www.expasy.org/) busque la entrada para el gen de levadura RPL36B (Los resultados relevantes estarán asociados al los servicios de UniProt) 2. Siga la liga a la base de datos genómica de Saccaromyces y encuentre su localización en el cromosoma 3. En esa bases de datos encuentre el segundo gen en el extremo 5’. 4. Siga la liga a SWISS-PROT 5. Encuentre la localización subcelular de la proteı́na 6. Encuentra la estructura de dominios en PRODOM, y obtenga la lista de genes que tengan al menos un dominio en común con el gen problema. Pregunta 6. PFAM: una base de datos de dominios conservados y famillias de proteı́nas PFAM está disponinle en tres localidades alrededor del mundo: http://pfam.sanger.ac.uk (Reino Unido.) http://pfam.sbc.su.se (Suecia) http://pfam.janelia.org (E. E. U. U.). 1. Haga una búsqueda en Pfam con una secuencia nueva (la puede tomar de alguno de los ejercicios o buscar la secuencia en formato FASTA de una proteı́na de su interés). Pulse SEARCH en la barra de menú superior o o SEQUENCE SEARCH en la lista central. Pegue la secuencia de aminoácidos en formato fasta en el campo de captura de texto. La página de resultados da una representación gráfiuca de los dominios que se encuentran en la secuencia y una tabla con las coincidencias contra los dominios disponibles. Existe la posibilidad de subir archivos de texto previamente preparados con hasta 1000 seceuncias en formato fasta para hacer este mismo tipo de análisis al mimso tiempo para todas ellas. 2. Haga una búsqueda en Pfam a partir de un identificador de GenBank o de UniProt. Desde la página principal. En la página de entrada pulse el vı́nculo VIEW A SEQUENCE, escriba el nombre o el número en la caja de captura de texto y pulse GO. Escribir el número de acceso (p. ej., P15498, 1322900) o el identificador (p. ej., AV HUMAN, CAA96955.1) es la forma más rápida 3 de explorar Pfam porque los autores ya tienen resultados precalculados de las coincidencias de cada secuencias contra los perfiles estadı́sticos para todo UniProt y GenBank. 3. Explore Pfam con un identificador de estructura de proteı́na del PDB. Desde la página principal selecciones VIEW A STRUCTURE y escriba la clave de identificación de una estructura en el PDB (P. EJ., 2bcd) en el campo de captura de texto. 4. Explore Pfam a partir de una palabra o una frase. Desde la página principalseleccione KEYWORD SEARCH y escriba la palabra o palabras para buscar. Los espacios en blanco automáticamente son tratados como si fueran el operador lógico AND (“Y”), de manera que si se escribe RNA POYMERASE es como si se hubiera escrito RNA AND POLYMERASE. ¿Qué consecuencias cree Usted que tenga este comportamiento? 5. Busque Pfam con los nombre o identificadores de familias o clanes conocidos. Esto se hace seleccionando VIEW A PFAM FAMILY o VIEW A CLAN y escribiendo los identificadores de familia o clan en el campo de captura de texto. Esto permite llegar rápidamente a las páginas de Familias o Clanes. Los formatos de los identificadores de las entradas pueden tener los siguiente estilos: CBS o PF00571, PF01657 para las entradas de Pfam-A; PB137753 para las entradas de Pfam-B que están sólo en la edición más reciente de Pfam; y Kazal o CL0005 (por ejemplo) para un clan conocido. 6. Busque Pfam para familias dentro de diferentes proteomas: selecciones BROWSE en la barra superior y aparcerá un listado alafbético de todas las familias clanes y proteomas disponibles. Seleccionar una letra hará que se muestre una lista de todos los proteomas de especies cuyo nombre empieza con esa letra y que tienen proteı́nas representadas en Pfam. Al seleccionar una especie se muestra la página de su proteoma, la cual da su linaje taxonómico, el número de secuencias y de dominios y el grado de cobertura. También se muestran las arquitecturas de dominios, las composiciones de dominios y cuales son las proteı́nas con estructura tridimensional resuelta que se encuentran en ese proteoma. Pregunta 7. Bases de datos especializadas 1. Encuentre una base de datos para mutaciones relacionadas con fibrosos cistica 4 2. Encuentre el gen teashirt en la base de datos Flybase 3. Encuentre las entradas correspondientes de SWISS-PROT, EMBL y TRANSFAC Pregunta 8. Base de datos KEGG 1. Encuentre la enzima número EC1.2.3.4 en la base de datos KEGG 2. Desde KEGG acceda a la entrada ENZYME en ExPASy, y de ahı́ vaya a la entrada en SWISSPROT, y desde ahı́ la entrada en PROSITE. Reporte los números de acceso ası́ como la información especializada que se puede encontrar en cada bases de datos. 3. ¿Qué tipo de información se encuentra en la base de datos BRENDA? Pregunta 9. Combinando varias bases de datos El receptor de IL-2 tiene tres cadenas 1. Utilizando SRS o ENTREZ busque las secuencias del receptor de IL-2. ¿Qué búsqueda permitirı́a obtener las tres cadenas en los resultados?¿Cuántas entradas en GenBank hay para secuencias de receptores de IL-2? 2. Encuentre las secuencias de mRNA para las cadenas alfa y gamma del receptor en humanos. 3. Obtenga los números de acceso de Swiss-Prot. 4. Encuentre 5 artı́culos relevantes en Pubmed. 5. ¿Los genes del receptor IL-2 alfa y gamma están presentes en OMIM? ¿En qué cromosoma se localizan? 6. Usando los mapas citogenéticos de las regiones que rodean el locus (use MapView) diga si existen enfermedades asociadas con estos genes. Dé una breve descripción de estas enfermedades. 5