Download Presentación Power Point

Document related concepts
no text concepts found
Transcript
Introducción del Curso
Rafael de Arce Borda
Profesor Economía Aplicada, UAM
[email protected]
La invasión de la información
La primera computadora programable fue inventada en 1947 y
tenía la capacidad de almacenar 20 palabras.
La invasión de la información
“Se creará un sistema informático nacional con decenas
de millones de terminales en las oficinas y en los hogares
(....) que suministrarán servicios de biblioteca e
información con posibilidades de compra, pedidos,
facturación y cosas por el estilo”
“Comisión sobre el año 2000” AÑO 1965.
D.Bell, D. Muynihan, S.Brezizinsky, J.Q. Wilson, M. Meed.
La invasión de la información
“La capacidad de proceso de un chip de silicona se doblará cada 18
meses....”
¿Qué es la econometría?
• Valavanis (1959): "El objetivo de la econometría es expresar las
teorías económicas bajo una forma matemática a fin de verificarlas
por métodos estadísticos y medir el impacto de una variable sobre
otra, así como predecir acontecimientos futuros y dar consejos de
política económica ante resultados deseables. "
• Klein (1962): "El principal objetivo de la econometría es dar
contenido empírico al razonamiento a priori de la economía."
• Malinvaud (1966): "... aplicación de las matemáticas y método
estadístico al estudio de fenómenos económicos".
• Intriligator (1978): "Rama de la economía que se ocupa de la
estimación empírica de relaciones económicas".
• Chow (1983): "Arte y ciencia de usar métodos para la medida de
relaciones económicas".
"HAY TRES CLASES DE MENTIRAS: LAS MENTIRAS,
LAS MALDITAS MENTIRAS Y LAS ESTADISTICAS"
(MARK TWAIN)
• En estadística descriptiva, las medidas de resumen suponen una
generalización normal.
• En estadística inferencial, al dar una estimación estoy cometiendo
un error llamado error de muestreo debido a que no estoy
considerando a toda la población, sino a una parte de ella.
• Tipos de errores:
– Errores de observación (sobrecobertura, procesamiento o
medida)
– Errores no de observación (no cobertura o sin respuesta)
FASES DEL PROCESAMIENTO Y ANÁLISIS DE DATOS
 Necesidad de medir un fenómeno o de explotar una
información “estadística”
 Tabulación de los resultados
 Introducción de los datos en el software
 Validación de los datos
 Definición de los meta-datos
 Generación de nuevas variables derivadas
 Primeros estadísticos de resumen
 Selección de la técnica de análisis
 Procesamiento e interpretación de resultados
 Informe de resultados
Obtención de la información
• Fuentes secundarias
• Fuentes primarias
– Diseño de la encuesta
– Selección de la muestra:
• Muestreo aleatorio sistemático
• Muestreo por grupos
• Muestreo por conglomerados
Tipos de variables (I)
• Según el significado de los valores que pueden tomar
las variables (series), distinguimos diferentes tipos de
variables.
• El tipo de variable es importante: afecta a lo que
podemos hacer con ella, al tipo de análisis que podemos
hacer.
•
Los métodos estadísticos que usamos dependen del
tipo de variable.
Tipos de variables (II)
• Variables Categóricas
– Nominales: hombre (0), mujer (1)
– Ordinales: alto (3), medio (2), bajo (1)
• Variables de escala
– Intervalo (sin cero absoluto): ejemplo,
valoraciones subjetivas de 1 a 5; nota en un
examen.
– Razón (completas) : ejemplo, renta
Selección del Análisis
• Resumen de información de las variables:
– Categóricas: frecuencias y gráficos
– Escala (intervalo o razón): medias, medianas, modas,
desviación típica, recorridos, percentiles, …
• Agrupación de variables / sujetos:
– Análisis factorial
– Análisis Cluster
• Relación entre variables
– Tablas bivariadas: Correlaciones – tablas de
contingencia
– Anova vs discriminante
– Regresión/correlación
Análisis individual de Series
1.
2.
3.
4.
5.
Conteo de datos: frecuencias y gráficos de sectores o barras.
Creación de una “curva de Lorenz” a partir de las frecuencias.
Estadísticos descriptivos: media, mediana, desviación típica,
moda. Primer acercamiento a los atípicos (diferencia entre
media y mediana)
Est. Descriptivos sobre cocientes (razón): pruebas medias
robustas, índices de regresibilidad (dif. Relativo al precio),
coeficientes de concentración
Simetría y Curtosis
Explorando la función de densidad de la serie:
1.
2.
3.
6.
Histograma
Pruebas gráficas de la distribución (Q-Q y Q-Q sin tendencia)
Pruebas de normalidad (Jarque-Bera, Saphiro-Wilks, Kolmogorovsmirnof, corrección de Lillieford).
Generando valores atípicos a partir de la normalidad
Selección del Análisis (II)
Depend.
Independ.
Cualitativa
(categórica)
Cualitativa
Cuantitativa
(categórica)
(escala)
Tablas de
contingencia
Anova
Fuma-no Fuma = f(Sexo)
L
Regresión
O
Moroso (si-no)=f(renta,hijos,
G /correlación
antigüedad laboral,…)
I Vtas. Producto= f(renta pc,
precio, publicidad)
T
Discriminante
Cuantitativa
(escala)
Vtas. Producto=
f(Localización Geográfica)
Análisis de Series Temporales
• Técnicas autoproyectivas
–
–
–
–
Medias móviles
Estimación de la tendencia
Descomposición de componentes clásicas
Alisados exponenciales
• Modelos ARIMA o Box-Jenkins
• Modelos Vectores Autorregresivos (VAR)
• Modelos de regresión estructurales
– Corte transversal
– Corte temporal
– Datos de Panel
• Modelos no lineales
La función Normal
La función Normal
Nota sobre el contraste de hipótesis
Nota sobre el contraste de hipótesis
Decisión Estadística
No significativo
Significativo
No diferencias
Correcto
Error Tipo II
(falso +)
Diferencias
Error Tipo I
(falso -)
Correcto
Población
Nivel de significación: Probabilidad de rechazar la hipótesis nula
cuando es cierta (p-value, probability,…).