Download Presentación Power Point
Document related concepts
no text concepts found
Transcript
Introducción del Curso Rafael de Arce Borda Profesor Economía Aplicada, UAM [email protected] La invasión de la información La primera computadora programable fue inventada en 1947 y tenía la capacidad de almacenar 20 palabras. La invasión de la información “Se creará un sistema informático nacional con decenas de millones de terminales en las oficinas y en los hogares (....) que suministrarán servicios de biblioteca e información con posibilidades de compra, pedidos, facturación y cosas por el estilo” “Comisión sobre el año 2000” AÑO 1965. D.Bell, D. Muynihan, S.Brezizinsky, J.Q. Wilson, M. Meed. La invasión de la información “La capacidad de proceso de un chip de silicona se doblará cada 18 meses....” ¿Qué es la econometría? • Valavanis (1959): "El objetivo de la econometría es expresar las teorías económicas bajo una forma matemática a fin de verificarlas por métodos estadísticos y medir el impacto de una variable sobre otra, así como predecir acontecimientos futuros y dar consejos de política económica ante resultados deseables. " • Klein (1962): "El principal objetivo de la econometría es dar contenido empírico al razonamiento a priori de la economía." • Malinvaud (1966): "... aplicación de las matemáticas y método estadístico al estudio de fenómenos económicos". • Intriligator (1978): "Rama de la economía que se ocupa de la estimación empírica de relaciones económicas". • Chow (1983): "Arte y ciencia de usar métodos para la medida de relaciones económicas". "HAY TRES CLASES DE MENTIRAS: LAS MENTIRAS, LAS MALDITAS MENTIRAS Y LAS ESTADISTICAS" (MARK TWAIN) • En estadística descriptiva, las medidas de resumen suponen una generalización normal. • En estadística inferencial, al dar una estimación estoy cometiendo un error llamado error de muestreo debido a que no estoy considerando a toda la población, sino a una parte de ella. • Tipos de errores: – Errores de observación (sobrecobertura, procesamiento o medida) – Errores no de observación (no cobertura o sin respuesta) FASES DEL PROCESAMIENTO Y ANÁLISIS DE DATOS Necesidad de medir un fenómeno o de explotar una información “estadística” Tabulación de los resultados Introducción de los datos en el software Validación de los datos Definición de los meta-datos Generación de nuevas variables derivadas Primeros estadísticos de resumen Selección de la técnica de análisis Procesamiento e interpretación de resultados Informe de resultados Obtención de la información • Fuentes secundarias • Fuentes primarias – Diseño de la encuesta – Selección de la muestra: • Muestreo aleatorio sistemático • Muestreo por grupos • Muestreo por conglomerados Tipos de variables (I) • Según el significado de los valores que pueden tomar las variables (series), distinguimos diferentes tipos de variables. • El tipo de variable es importante: afecta a lo que podemos hacer con ella, al tipo de análisis que podemos hacer. • Los métodos estadísticos que usamos dependen del tipo de variable. Tipos de variables (II) • Variables Categóricas – Nominales: hombre (0), mujer (1) – Ordinales: alto (3), medio (2), bajo (1) • Variables de escala – Intervalo (sin cero absoluto): ejemplo, valoraciones subjetivas de 1 a 5; nota en un examen. – Razón (completas) : ejemplo, renta Selección del Análisis • Resumen de información de las variables: – Categóricas: frecuencias y gráficos – Escala (intervalo o razón): medias, medianas, modas, desviación típica, recorridos, percentiles, … • Agrupación de variables / sujetos: – Análisis factorial – Análisis Cluster • Relación entre variables – Tablas bivariadas: Correlaciones – tablas de contingencia – Anova vs discriminante – Regresión/correlación Análisis individual de Series 1. 2. 3. 4. 5. Conteo de datos: frecuencias y gráficos de sectores o barras. Creación de una “curva de Lorenz” a partir de las frecuencias. Estadísticos descriptivos: media, mediana, desviación típica, moda. Primer acercamiento a los atípicos (diferencia entre media y mediana) Est. Descriptivos sobre cocientes (razón): pruebas medias robustas, índices de regresibilidad (dif. Relativo al precio), coeficientes de concentración Simetría y Curtosis Explorando la función de densidad de la serie: 1. 2. 3. 6. Histograma Pruebas gráficas de la distribución (Q-Q y Q-Q sin tendencia) Pruebas de normalidad (Jarque-Bera, Saphiro-Wilks, Kolmogorovsmirnof, corrección de Lillieford). Generando valores atípicos a partir de la normalidad Selección del Análisis (II) Depend. Independ. Cualitativa (categórica) Cualitativa Cuantitativa (categórica) (escala) Tablas de contingencia Anova Fuma-no Fuma = f(Sexo) L Regresión O Moroso (si-no)=f(renta,hijos, G /correlación antigüedad laboral,…) I Vtas. Producto= f(renta pc, precio, publicidad) T Discriminante Cuantitativa (escala) Vtas. Producto= f(Localización Geográfica) Análisis de Series Temporales • Técnicas autoproyectivas – – – – Medias móviles Estimación de la tendencia Descomposición de componentes clásicas Alisados exponenciales • Modelos ARIMA o Box-Jenkins • Modelos Vectores Autorregresivos (VAR) • Modelos de regresión estructurales – Corte transversal – Corte temporal – Datos de Panel • Modelos no lineales La función Normal La función Normal Nota sobre el contraste de hipótesis Nota sobre el contraste de hipótesis Decisión Estadística No significativo Significativo No diferencias Correcto Error Tipo II (falso +) Diferencias Error Tipo I (falso -) Correcto Población Nivel de significación: Probabilidad de rechazar la hipótesis nula cuando es cierta (p-value, probability,…).