Download Introducción a la línea de comando y a la programación para

Document related concepts

Programación con datos masivos en R wikipedia , lookup

R (lenguaje de programación) wikipedia , lookup

Transcript
Introducción a la línea de comando y a la programación para
análisis bioinformáticos.
Coordinador: Dr. Andrés Iriarte
Docentes participantes: Dr. Guillermo Lamolle & Dr. Héctor Musto
Colaboradores: Mag. Eugenio Jara
Contenido:
Como resultado de los avances en la tecnología de secuenciación se ha generado una
revolución en diversas áreas de la biología. Estás metodologías generan una enorme cantidad
de información, genomas completos, genes e incluso permite estimar con precisión sus
niveles de expresión. Por sus características estos datos sólo pueden ser analizados mediante
herramientas bioinformáticas. Muchas de estas herramientas se desarrollan sin una interfaz
gráfica, y las que la tienen suelen desarrollarse más lentamente o en versiones no
actualizadas. Adquirir manejo en su entorno es fundamental para lograr un uso eficiente de
las mismas. Los datos de secuenciación masiva han sido utilizados para responder preguntas
en una variedad de problemas y han permitido plantearse nuevos experimentos o
aproximaciones. Este curso plantea introducir a los estudiantes en el uso de la línea de
comando, en herramientas para análisis de datos de genomas y secuenciación masiva y en
elementos básicos de programación en bash, perl y R. El curso está orientado a estudiantes
avanzados de grado y estudiantes de posgrado de áreas biológicas sin formación en
bioinformática.
Palabras claves: Linux, Biología Computacional, Programación.
Programa:
Teórico (1 hr. 15 min.):
1. Introducción al Curso. Historia de la Bioinformática // Biología Computacional.
2. Introducción a sistema operativo Linux. Uso de la terminal. Formatos y programas.
Lenguajes de programación.
3. Comandos básicos en la terminal y comandos para el manejo de textos. Concepto de
pipeline y path.
4. Herramientas del paquete Emboss I: Introducción al emboss y manejo básico de
secuencias.
5. Herramientas del paquete Emboss II: Comandos del emboss.
6. Introducción a la programación.
7. Programación en el shell (“Bash scripting”) I: Manejo de variables y listas, salidas y
entradas. Integración con otros lenguajes de programación.
8. Programación en el shell(“Bash scripting”) II: Loops (for, while, until) y Condicional
(if).
9. Introducción al lenguaje de programación Perl I.
10. Programación en Perl II
11. Introducción a R. Manejo de datos, entradas y salidas y tipos de objetos.
12. Estadística básicas y gráficos simples en R.
Práctico (2 hr. 45 min.):
1. Desplazamiento a través de la terminal, manejo de diferentes formatos y programas.
2. Uso de comandos básicos en la terminal y manejo de textos: rm, ls, less, cat, sed, awk,
uniq, sort, wget, y otros.
3. Comandos del paquete Emboss I. Manejo simple de secuencias.
4. Comandos del paquete Emboss II.
5. Comparación de scripts escritos en distintos lenguajes.
6. Scripting shell I. Variables y listas.
7. Scripting Shell II. Recorrer listas, ejecutar acciones repetidas y uso de loops y
condicional en general.
8. Scripting Perl I.
9. Scripting Perl II.
10. Uso de R Studio. Manejo de datos en R, entradas y salidas y tipos de objetos.
11. Estadística básicas y gráficos simples en R.
Evaluación: Examen individual, con preguntas abiertas y ejercicios, 3 horas.
INCIO: 13 de Marzo.
FINALIZACIÓN: 29 de Marzo.
El curso será dictado en la Sala de Bioinformática “Carlos Hormaeche”, Instituto de Higiene.
Horario: 9:30 – 13:30 hs.
Carga Horaria: Teóricos 1 hr. 15 min. // Prácticos 2 hrs. 45 min. // Evaluación 3 hrs.
Trabajo domiciliario 10 hs.
Total 48 hs.
Contacto: [email protected] // [email protected]