Download Programa del taller - CISEPA

Document related concepts

Análisis de correspondencias múltiples wikipedia , lookup

Centro de Estudios Distributivos, Laborales y Sociales wikipedia , lookup

Transcript
Investigación Social Aplicada Usando Stata 13
DESCRIPCIÓN
Objetivo: Brindar a los alumnos las herramientas necesarias para el manejo, análisis
descriptivo y exploratorio de bases de datos en ciencias sociales, sean de microdatos o
de datos agregados. En particular, se busca que los alumnos del curso desarrollen la
capacidad para desenvolverse en el entorno de Stata 13 para (i) administrar y consolidar
las bases de datos que tengan a su disposición, resolviendo de manera independiente los
problemas usualmente presentes en bases de datos de ciencias sociales (e.g. tratamiento
de missing values, uso de factores de expansión, corrección de errores sistemáticos en los
datos, construcción de variables de interés); (ii) describir y analizar exploratoriamente
los datos, en búsqueda de patrones presentes en ellos mediante el uso de las
herramientas del software (e.g. distribuciones, gráficos, mapas geográficos, tablas, tests);
y (iii) realizar algunas pruebas de hipótesis introductorias, según sean necesarias y
frecuentes en cada ciencia social1. A lo largo del curso, se hará énfasis en que los
alumnos “aprendan a aprender” en Stata 13, la que suele ser la habilidad más
importante en el software, mediante el uso adecuado del archivo de ayuda, el manual y
los servidores especializados de usuarios del software.
Público objetivo:
Investigadores o tesistas en ciencias sociales y alumnos de
últimos ciclos de facultad con interés en la investigación con algún tema de
investigación en mente, y que requieren el manejo de información cuantitativa, poco
familiarizados con Stata 13.
Estrategia metodológica:
-
Modalidad presencial para las presentaciones en clases prácticas.
Manejo interactivo de los casos desarrollados en el curso.
Presentación, y análisis exploratorio y descriptivo de las principales bases de
datos nacionales2 y globales3. Se hará énfasis en aquella información de acceso
No obstante, elcurso no busca ser un curso teórico sobre investigación en ciencias sociales, si bien se hará el
repaso necesario de nociones de estadística importantes para el desarrollo de la investigación. Por el contrario,
el énfasis del curso estará en el análisis cuantitativo y el manejo de bases de datos, ambos elementos
suficientemente extensos e importantes para el desarrollo de una investigación, tomando como supuesto que el
tema que se investiga está bien acotado y es relevante para la disciplina.
2 Por ejemplo, Encuestas de Hogares (ENNIV, ENAHO), Censo Nacional de Población y Vivienda, Encuesta
Demográfica de Salud Familiar (ENDES), datos de la Comisión de la Verdad y Reconciliación (CVR), Registro
1
-
fácil y público, cuya información pueda ser estudiada, en principio, desde
diferentes ciencias sociales; no obstante, se atenderán consultas sobre bases de
datos específicas de interés para los alumnos.
Evaluación en base a un trabajo (para casa) aplicando las herramientas
desarrolladas en el curso. La aprobación de la evaluación es necesaria para
obtener el certificado del curso.
Conocimientos previos recomendados:
Estadística
(Probabilidad
y
Estadística Inferencial).
Horario:
Lunes, 27 de octubre, de 7:00 p.m. a 10:00 p.m.
Martes, 28 de octubre, de 6:00 p.m. a 10:00 p.m.
Miércoles, 29 de octubre, de 7:00 p.m. a 10:00 p.m.
Jueves, 30 de octubre, de 6:00 p.m. a 10:00 p.m.
Viernes, 31 de octubre, de 6:00 p.m. a 10:00 p.m.
Lugar:
Aulas Informáticas PUCP (Edificio Mc Gregor).
INSCRIPCIÓN
Inversión: Público en general: S/. 350 // Estudiantes de pregrado: S/. 250
Vacantes: 39 alumnos
Informes:
[email protected]
EXPOSITOR
José Luis Flor Toro, Candidato a Magíster en Economía de la PUCP, Bachiller en
Economía de la PUCP. Actualmente, es Asesor en el Despacho Ministerial de
Nacional de Municipalidades (RENAMU), Sistema Integrado de Administración Financiera (SIAF),
Inventarios de Desastres Naturales (DesInventar, SINPAD).
3 Por ejemplo, Penn World Tables, Polity IV, y Latinobarómetro.
PRODUCE. Ha sido Jefe de Prácticas a Tiempo Completo en el Departamento de
Economía de la PUCP (2012-2014) y es asistente de investigación en varios proyectos con
profesores del Departamento de Economía y coautor de varios documentos de
investigación, y cuenta con ponencias nacionales e internacionales. Sus temas de interés
son el desarrollo y el crecimiento económico, la desigualdad económica, y el efecto de
los desastres naturales sobre el desarrollo económico.
PROGRAMA
Sesión 1. Elementos básicos
de Stata y del manejo de
bases de datos.
Sesión 2. Análisis
descriptivo I.
Sesión 3. Análisis
descriptivo II.
Sesión 4. Análisis
exploratorio.
Sesión 5. Elementos básicos
de programación y solución
de problemas prácticos.
Lunes 3/11.
Lunes 10/11
(1a) Presentación
(1b) “Aprendiendo a hablar en Stata”.
(1c) Manejo de bases de datos en ciencias sociales.
(2a) Distribuciones: Tablas.
(2b) Distribuciones: Gráficos.
(3a) Estadísticos descriptivos.
(3b) Mapas en Stata.
Asignación del trabajo para la evaluación.
(4a) Relaciones entre dos o más variables 1.
(4b) Relaciones entre dos o más variables 2.
(5a) Programación funcional en Stata.
(5b) El problema de los missing values y las soluciones
al problema.
Entrega de trabajos4 (vía correo electrónico).
Devolución de trabajos corregidos (vía correo
electrónico) y recojo de certificados.
El trabajo (para casa) es el componente único de la evaluación de los alumnos del curso, y deberá ser
aprobado con nota aprobatoria (11 o más), para la entrega del certificado correspondiente. Aunque el nivel de
dificultad y los temas serán definidos durante el curso mismo, en líneas generales el trabajo consistirá en dos
elementos: (i) la replicación de procedimientos desarrollados en el curso (60% de la nota) y (ii) la solución de
un problema práctico basado en ciertos elementos desarrollados durante el curso pero que también requerirá
que el alumno aprenda a usar algunos comandos por su cuenta. De esta manera, la forma de evaluación busca
ser consistente con el objetivo del curso.
4
CONTENIDOS
Sesión 1. Elementos básicos de Stata y del manejo de bases de datos.
(1a) Presentación. ¿Por qué Stata? ¿Qué pueden decirnos los datos?
(1b) “Aprendiendo a hablar en Stata”. Algunas convenciones de Stata. La interface de
Stata y sus elementos. El uso de do-files y log-files para ordenar nuestro trabajo.
(1c) Manejo de bases de datos en ciencias sociales. Acceso a e ingreso de los datos.
Descripción y exploración de la base de datos. Creación y modificación de variables.
Tipos de variables: string y numéricas. Missing values. Manejo de etiquetas. Formas long
y wide de las bases de datos. Juntando bases de datos. Almacenamiento y exportación de
la base de datos.
Sesión 2. Análisis descriptivo I.
(2a) Distribuciones: Tablas. Valores medios de una distribución: media, mediana, y
moda. Dispersión y sus medidas: desviación estándar, varianza, coeficiente de variación.
Tabulaciones y tablas.
(2b) Distribuciones: Gráficos. Gráficos para distintos tipos de variables: categóricas,
categóricas ordenadas, cuantitativas. Manejo y almacenamiento de gráficos. Otros
gráficos en Stata. Series de tiempo.
Sesión 3. Análisis descriptivo II.
(3a) Estadísticos descriptivos. Uso de tablas en Stata. Uso apropiado de factores de
expansión: tipos de factores de expansión. Diseños de encuesta. Pruebas de hipótesis:
¿Qué nos dicen y cómo las interpretamos? ¿Cuándo podemos confiar en ellas? ¿Cómo
las ejecutamos?
(3b) Mapas en Stata. Construcción de mapas en Stata: acceso a shapefiles, transformación
y uso de comandos pertinentes. Diseño de mapas: distritales, provinciales,
departamentales, por cuenca, internacionales. Manejo y almacenamiento de mapas.
Sesión 4. Análisis exploratorio.
(4a) Relaciones entre dos o más variables 1. Gráficos de dispersión. Correlaciones,
covarianzas. Correlación entre variables ordinales. Regresión bivariada y multivariada:
supuestos del modelo clásico de regresión lineal, “usos y abusos”, alcances y
limitaciones.
(4b) Relaciones entre dos o más variables 2. Análisis de varianza: one-way y two-way.
Análisis factorial: principal factor y principal-component factor.
Sesión 5. Elementos básicos de programación y solución de problemas prácticos.
(5a) Programación funcional en Stata. Loops: -foreach- y –forvalues-. Macros: -local- y –
global-. Manejo de los contenidos de r(.) y e(.). Matrices. Comandos –egen-. Prefijo –by-.
(5b) El problema de los missing values y las soluciones al problema. La naturaleza del
problema. Imputación: supuestos, métodos y comandos relevantes.
(5c) El helpfile y otros recursos para el aprendizaje. El archivo de ayuda de Stata: alcances
y limitaciones. Statalist. Comandos en –ssc install-. Ejercicios.
Referencias bibliográficas
Acock, A.C.
2010 “A gentle introduction to Stata”, 3rd Ed. College Station, TE : Stata Press, 2010.
Baum, C.
2005 “A little bit of Stata programming goes a long way…”. SUGUK 2005, invited
lecture. Disponible en http://fmwww.bc.edu/ec-p/wp612.pdf.
2009 “An introduction to Stata programming”. College Station, TE : Stata Press, 2009
2011 “Using Stata for Applied Research: Reviewing its Capabilities” En: Journal of
Economic Surveys, 2011, 25:2, 380-394
StataCorp
2011 “Stata 12 Base Reference Manual”. College Station, TX: Stata Press.