Download Bioinformática

1

2

3

4

5

Document related concepts

no text concepts found

Transcript

Bioinformática
Bases de datos
Pregunta 1: (Bases de datos bibliográficos) Genes de enfermedades hereditarias
En esta pregunta, usted elegirá una enfermedad humana y encontrará los números
de acceso de GenBank y las secuencias de algunos genes que estén relacionados con
ésta.
1. Vaya a la base de datos de OMIM
2. Realice una búsqueda para una enfermedad humana en la que usted este interesado. Algunas posibilidades incluyen: Creutzfeldt-Jakob, Gaucher, leucemia, cáncer de pecho. (Para ayuda en la búsqueda, vea: http://www.omim.
org/help/search).
3. Utilizando los resultados de la búsqueda, elija dos resultados que usted utilizará para encontrar secuencias de nucleótidos relacionadas. (No todos los
artı́culos en los resultados de la búsqueda tienen una secuencia relacionada.
4. Para cada una de las dos entradas seleccionadas, siga las ligas a una base de
datos que contenga la secuencia humana.
5. Obtenga la secuencia de nucleótidos en formato de FASTA.
Pregunta 2: (Bases de datos bibliográficos) Artı́culos médicos
En esta pregunta, usted buscará artı́culos sobre la enfermedad elegida y restringirá su búsqueda de varias maneras.
1. Vaya a la base de datos de PubMed.
1
2. Realice una búsqueda para la misma enfermedad humana que usted utilizó para
OMIM. Anote son cuántos artı́culos encontró allı́.
3. Realice la misma búsqueda, sólo para los artı́culos que aparecieron durante el
último año. (Para ayuda sobre cómo utilizar diversas etiquetas de la búsqueda,
vea: http://www.ncbi.nlm.nih.gov/books/NBK3827/#pubmedhelp.PubMed_
Quick_Start)
4. Utilizando las herramientas de Pubmed, clasifique los resultados por Autor.
5. Realice una nueva búsqueda para la misma enfermedad humana, en los que los
autores sean Smith o Jones.
Pregunta 3: Búsqueda refinada de genes
En esta pregunta, usted buscará secuencias nucleotı́dicas completas, sin patentes,
para un gen especı́fico.
1. Vaya a la base de datos “Nucleotide”, el NCBI.
2. Realice una búsqueda para un gen común. Algunas posibilidades incluyen:
tRNA, proteasa, hemoglobina, p53.
3. Restrinja su búsqueda para obtener solamente secuencias completas, excluyendo la palabra “parcial” de la búsqueda.
4. Restrinja su búsqueda aún más eligiendo secuencias solamente de EMBL y excluya las patentes. (Para ayuda ver: http://www.ncbi.nlm.nih.gov/books/
NBK44863/
Pregunta 4. Otras bases de datos
Utilizando diferentes bases de datos resuelva los siguientes problemas:
1. Usando el servidor ExPASy busque la secuencia de amino ácidos de la anhidrasa
carbónica humana 2.
2. Encuentre los números de acceso en EMBL y GenBank
3. Obtenga el número de acceso del archivo PDB
4. Encuentre en qué cromosoma se localiza el gen.
5. ¿Existe una anhidrasa carbónica en el maı́z?
2
Pregunta 5. Bases de datos de proteı́nas
1. En la base de datos SWISS-PROT (http://www.expasy.org/) busque la entrada para el gen de levadura RPL36B (Los resultados relevantes estarán asociados al los servicios de UniProt)
2. Siga la liga a la base de datos genómica de Saccaromyces y encuentre su localización en el cromosoma
3. En esa bases de datos encuentre el segundo gen en el extremo 5’.
4. Siga la liga a SWISS-PROT
5. Encuentre la localización subcelular de la proteı́na
6. Encuentra la estructura de dominios en PRODOM, y obtenga la lista de genes
que tengan al menos un dominio en común con el gen problema.
Pregunta 6. PFAM: una base de datos de dominios conservados y famillias de proteı́nas
PFAM está disponinle en tres localidades alrededor del mundo:
http://pfam.sanger.ac.uk (Reino Unido.)
http://pfam.sbc.su.se (Suecia)
http://pfam.janelia.org (E. E. U. U.).
1. Haga una búsqueda en Pfam con una secuencia nueva (la puede tomar de alguno
de los ejercicios o buscar la secuencia en formato FASTA de una proteı́na de
su interés). Pulse SEARCH en la barra de menú superior o o SEQUENCE
SEARCH en la lista central. Pegue la secuencia de aminoácidos en formato fasta
en el campo de captura de texto. La página de resultados da una representación
gráfiuca de los dominios que se encuentran en la secuencia y una tabla con
las coincidencias contra los dominios disponibles. Existe la posibilidad de subir
archivos de texto previamente preparados con hasta 1000 seceuncias en formato
fasta para hacer este mismo tipo de análisis al mimso tiempo para todas ellas.
2. Haga una búsqueda en Pfam a partir de un identificador de GenBank o de
UniProt. Desde la página principal. En la página de entrada pulse el vı́nculo
VIEW A SEQUENCE, escriba el nombre o el número en la caja de captura
de texto y pulse GO. Escribir el número de acceso (p. ej., P15498, 1322900)
o el identificador (p. ej., AV HUMAN, CAA96955.1) es la forma más rápida
3
de explorar Pfam porque los autores ya tienen resultados precalculados de
las coincidencias de cada secuencias contra los perfiles estadı́sticos para todo
UniProt y GenBank.
3. Explore Pfam con un identificador de estructura de proteı́na del PDB. Desde
la página principal selecciones VIEW A STRUCTURE y escriba la clave de
identificación de una estructura en el PDB (P. EJ., 2bcd) en el campo de
captura de texto.
4. Explore Pfam a partir de una palabra o una frase. Desde la página principalseleccione KEYWORD SEARCH y escriba la palabra o palabras para buscar. Los
espacios en blanco automáticamente son tratados como si fueran el operador
lógico AND (“Y”), de manera que si se escribe RNA POYMERASE es como si
se hubiera escrito RNA AND POLYMERASE. ¿Qué consecuencias cree Usted
que tenga este comportamiento?
5. Busque Pfam con los nombre o identificadores de familias o clanes conocidos.
Esto se hace seleccionando VIEW A PFAM FAMILY o VIEW A CLAN y
escribiendo los identificadores de familia o clan en el campo de captura de
texto. Esto permite llegar rápidamente a las páginas de Familias o Clanes.
Los formatos de los identificadores de las entradas pueden tener los siguiente
estilos: CBS o PF00571, PF01657 para las entradas de Pfam-A; PB137753 para
las entradas de Pfam-B que están sólo en la edición más reciente de Pfam; y
Kazal o CL0005 (por ejemplo) para un clan conocido.
6. Busque Pfam para familias dentro de diferentes proteomas: selecciones BROWSE en la barra superior y aparcerá un listado alafbético de todas las familias
clanes y proteomas disponibles. Seleccionar una letra hará que se muestre una
lista de todos los proteomas de especies cuyo nombre empieza con esa letra y
que tienen proteı́nas representadas en Pfam.
Al seleccionar una especie se muestra la página de su proteoma, la cual da su
linaje taxonómico, el número de secuencias y de dominios y el grado de cobertura. También se muestran las arquitecturas de dominios, las composiciones de
dominios y cuales son las proteı́nas con estructura tridimensional resuelta que
se encuentran en ese proteoma.
Pregunta 7. Bases de datos especializadas
1. Encuentre una base de datos para mutaciones relacionadas con fibrosos cistica
4
2. Encuentre el gen teashirt en la base de datos Flybase
3. Encuentre las entradas correspondientes de SWISS-PROT, EMBL y TRANSFAC
Pregunta 8. Base de datos KEGG
1. Encuentre la enzima número EC1.2.3.4 en la base de datos KEGG
2. Desde KEGG acceda a la entrada ENZYME en ExPASy, y de ahı́ vaya a
la entrada en SWISSPROT, y desde ahı́ la entrada en PROSITE. Reporte los
números de acceso ası́ como la información especializada que se puede encontrar
en cada bases de datos.
3. ¿Qué tipo de información se encuentra en la base de datos BRENDA?
Pregunta 9. Combinando varias bases de datos
El receptor de IL-2 tiene tres cadenas
1. Utilizando SRS o ENTREZ busque las secuencias del receptor de IL-2. ¿Qué búsqueda permitirı́a obtener las tres cadenas en los resultados?¿Cuántas entradas en
GenBank hay para secuencias de receptores de IL-2?
2. Encuentre las secuencias de mRNA para las cadenas alfa y gamma del receptor
en humanos.
3. Obtenga los números de acceso de Swiss-Prot.
4. Encuentre 5 artı́culos relevantes en Pubmed.
5. ¿Los genes del receptor IL-2 alfa y gamma están presentes en OMIM? ¿En
qué cromosoma se localizan?
6. Usando los mapas citogenéticos de las regiones que rodean el locus (use MapView) diga si existen enfermedades asociadas con estos genes. Dé una breve
descripción de estas enfermedades.
5

Top subcategories

Top subcategories

Top subcategories

Top subcategories

Top subcategories

Top subcategories

Top subcategories

Download Bioinformática