Download Bioinformática

Document related concepts
no text concepts found
Transcript
Bioinformática
Bases de datos
Pregunta 1: (Bases de datos bibliográficos) Genes de enfermedades hereditarias
En esta pregunta, usted elegirá una enfermedad humana y encontrará los números
de acceso de GenBank y las secuencias de algunos genes que estén relacionados con
ésta.
1. Vaya a la base de datos de OMIM
2. Realice una búsqueda para una enfermedad humana en la que usted este interesado. Algunas posibilidades incluyen: Creutzfeldt-Jakob, Gaucher, leucemia, cáncer de pecho. (Para ayuda en la búsqueda, vea: http://www.omim.
org/help/search).
3. Utilizando los resultados de la búsqueda, elija dos resultados que usted utilizará para encontrar secuencias de nucleótidos relacionadas. (No todos los
artı́culos en los resultados de la búsqueda tienen una secuencia relacionada.
4. Para cada una de las dos entradas seleccionadas, siga las ligas a una base de
datos que contenga la secuencia humana.
5. Obtenga la secuencia de nucleótidos en formato de FASTA.
Pregunta 2: (Bases de datos bibliográficos) Artı́culos médicos
En esta pregunta, usted buscará artı́culos sobre la enfermedad elegida y restringirá su búsqueda de varias maneras.
1. Vaya a la base de datos de PubMed.
1
2. Realice una búsqueda para la misma enfermedad humana que usted utilizó para
OMIM. Anote son cuántos artı́culos encontró allı́.
3. Realice la misma búsqueda, sólo para los artı́culos que aparecieron durante el
último año. (Para ayuda sobre cómo utilizar diversas etiquetas de la búsqueda,
vea: http://www.ncbi.nlm.nih.gov/books/NBK3827/#pubmedhelp.PubMed_
Quick_Start)
4. Utilizando las herramientas de Pubmed, clasifique los resultados por Autor.
5. Realice una nueva búsqueda para la misma enfermedad humana, en los que los
autores sean Smith o Jones.
Pregunta 3: Búsqueda refinada de genes
En esta pregunta, usted buscará secuencias nucleotı́dicas completas, sin patentes,
para un gen especı́fico.
1. Vaya a la base de datos “Nucleotide”, el NCBI.
2. Realice una búsqueda para un gen común. Algunas posibilidades incluyen:
tRNA, proteasa, hemoglobina, p53.
3. Restrinja su búsqueda para obtener solamente secuencias completas, excluyendo la palabra “parcial” de la búsqueda.
4. Restrinja su búsqueda aún más eligiendo secuencias solamente de EMBL y excluya las patentes. (Para ayuda ver: http://www.ncbi.nlm.nih.gov/books/
NBK44863/
Pregunta 4. Otras bases de datos
Utilizando diferentes bases de datos resuelva los siguientes problemas:
1. Usando el servidor ExPASy busque la secuencia de amino ácidos de la anhidrasa
carbónica humana 2.
2. Encuentre los números de acceso en EMBL y GenBank
3. Obtenga el número de acceso del archivo PDB
4. Encuentre en qué cromosoma se localiza el gen.
5. ¿Existe una anhidrasa carbónica en el maı́z?
2
Pregunta 5. Bases de datos de proteı́nas
1. En la base de datos SWISS-PROT (http://www.expasy.org/) busque la entrada para el gen de levadura RPL36B (Los resultados relevantes estarán asociados al los servicios de UniProt)
2. Siga la liga a la base de datos genómica de Saccaromyces y encuentre su localización en el cromosoma
3. En esa bases de datos encuentre el segundo gen en el extremo 5’.
4. Siga la liga a SWISS-PROT
5. Encuentre la localización subcelular de la proteı́na
6. Encuentra la estructura de dominios en PRODOM, y obtenga la lista de genes
que tengan al menos un dominio en común con el gen problema.
Pregunta 6. PFAM: una base de datos de dominios conservados y famillias de proteı́nas
PFAM está disponinle en tres localidades alrededor del mundo:
http://pfam.sanger.ac.uk (Reino Unido.)
http://pfam.sbc.su.se (Suecia)
http://pfam.janelia.org (E. E. U. U.).
1. Haga una búsqueda en Pfam con una secuencia nueva (la puede tomar de alguno
de los ejercicios o buscar la secuencia en formato FASTA de una proteı́na de
su interés). Pulse SEARCH en la barra de menú superior o o SEQUENCE
SEARCH en la lista central. Pegue la secuencia de aminoácidos en formato fasta
en el campo de captura de texto. La página de resultados da una representación
gráfiuca de los dominios que se encuentran en la secuencia y una tabla con
las coincidencias contra los dominios disponibles. Existe la posibilidad de subir
archivos de texto previamente preparados con hasta 1000 seceuncias en formato
fasta para hacer este mismo tipo de análisis al mimso tiempo para todas ellas.
2. Haga una búsqueda en Pfam a partir de un identificador de GenBank o de
UniProt. Desde la página principal. En la página de entrada pulse el vı́nculo
VIEW A SEQUENCE, escriba el nombre o el número en la caja de captura
de texto y pulse GO. Escribir el número de acceso (p. ej., P15498, 1322900)
o el identificador (p. ej., AV HUMAN, CAA96955.1) es la forma más rápida
3
de explorar Pfam porque los autores ya tienen resultados precalculados de
las coincidencias de cada secuencias contra los perfiles estadı́sticos para todo
UniProt y GenBank.
3. Explore Pfam con un identificador de estructura de proteı́na del PDB. Desde
la página principal selecciones VIEW A STRUCTURE y escriba la clave de
identificación de una estructura en el PDB (P. EJ., 2bcd) en el campo de
captura de texto.
4. Explore Pfam a partir de una palabra o una frase. Desde la página principalseleccione KEYWORD SEARCH y escriba la palabra o palabras para buscar. Los
espacios en blanco automáticamente son tratados como si fueran el operador
lógico AND (“Y”), de manera que si se escribe RNA POYMERASE es como si
se hubiera escrito RNA AND POLYMERASE. ¿Qué consecuencias cree Usted
que tenga este comportamiento?
5. Busque Pfam con los nombre o identificadores de familias o clanes conocidos.
Esto se hace seleccionando VIEW A PFAM FAMILY o VIEW A CLAN y
escribiendo los identificadores de familia o clan en el campo de captura de
texto. Esto permite llegar rápidamente a las páginas de Familias o Clanes.
Los formatos de los identificadores de las entradas pueden tener los siguiente
estilos: CBS o PF00571, PF01657 para las entradas de Pfam-A; PB137753 para
las entradas de Pfam-B que están sólo en la edición más reciente de Pfam; y
Kazal o CL0005 (por ejemplo) para un clan conocido.
6. Busque Pfam para familias dentro de diferentes proteomas: selecciones BROWSE en la barra superior y aparcerá un listado alafbético de todas las familias
clanes y proteomas disponibles. Seleccionar una letra hará que se muestre una
lista de todos los proteomas de especies cuyo nombre empieza con esa letra y
que tienen proteı́nas representadas en Pfam.
Al seleccionar una especie se muestra la página de su proteoma, la cual da su
linaje taxonómico, el número de secuencias y de dominios y el grado de cobertura. También se muestran las arquitecturas de dominios, las composiciones de
dominios y cuales son las proteı́nas con estructura tridimensional resuelta que
se encuentran en ese proteoma.
Pregunta 7. Bases de datos especializadas
1. Encuentre una base de datos para mutaciones relacionadas con fibrosos cistica
4
2. Encuentre el gen teashirt en la base de datos Flybase
3. Encuentre las entradas correspondientes de SWISS-PROT, EMBL y TRANSFAC
Pregunta 8. Base de datos KEGG
1. Encuentre la enzima número EC1.2.3.4 en la base de datos KEGG
2. Desde KEGG acceda a la entrada ENZYME en ExPASy, y de ahı́ vaya a
la entrada en SWISSPROT, y desde ahı́ la entrada en PROSITE. Reporte los
números de acceso ası́ como la información especializada que se puede encontrar
en cada bases de datos.
3. ¿Qué tipo de información se encuentra en la base de datos BRENDA?
Pregunta 9. Combinando varias bases de datos
El receptor de IL-2 tiene tres cadenas
1. Utilizando SRS o ENTREZ busque las secuencias del receptor de IL-2. ¿Qué búsqueda permitirı́a obtener las tres cadenas en los resultados?¿Cuántas entradas en
GenBank hay para secuencias de receptores de IL-2?
2. Encuentre las secuencias de mRNA para las cadenas alfa y gamma del receptor
en humanos.
3. Obtenga los números de acceso de Swiss-Prot.
4. Encuentre 5 artı́culos relevantes en Pubmed.
5. ¿Los genes del receptor IL-2 alfa y gamma están presentes en OMIM? ¿En
qué cromosoma se localizan?
6. Usando los mapas citogenéticos de las regiones que rodean el locus (use MapView) diga si existen enfermedades asociadas con estos genes. Dé una breve
descripción de estas enfermedades.
5