Download guia stata

Document related concepts
no text concepts found
Transcript
Maestría en Economía UNLP
Econometría Avanzada 2012
Instructivo de Stata
Trabajo Práctico 1
Estadísticas Descriptivas y Reportes
Los comandos de Stata más utilizados para calcular estadísticas descriptivas de una o
varias variables son summarize, tabstat y table. Por ejemplo:
summarize x1 x2 x3
calcula el promedio, el desvío estándar, el mínimo y el máximo de las variables x1, x2
y x3. Otras estadísticas adicionales se obtienen al utilizar la opción detail.
summarize x1 x2 x3, detail
El comando tabstat es más completo, ya permite definir los estadísticos de interés.
Por ejemplo:
tabstat x1 x2 x3, s(mean sd cv p10 p50 p90)
calcula la media, el desvío estándar, el coeficiente de variación y los percentiles 10, 50
y 90 de las variables x1, x2 y x3.
Por último, el comando table permite filtrar las estadísticas por alguna variable
categórica. Por ejemplo, si la variable u indica con 1 si la observación corresponde al
área urbana y con 0 si corresponde a la rural, y se quiere calcular el promedio de x1,
x2 y x3 por área geográfica, una opción es:
summarize x1 x2 x3 if u==0
summarize x1 x2 x3 if u==1
La alternativa a esto es utilizar el comando table con la siguiente sintaxis:
table u, c(mean x1 mean x2 mean x3)
Esta sentencia calcula el promedio de las variables x1, x2 y x3 para cada área (para
cada valor posible de la variable u) y las presenta en forma de tabla.
Creación de variables
La incorporación de nuevas variables al dataset se hace con el comando generate,
o su abreviación gen. Por ejemplo, para crear una nueva variable (llamémosla z) que
contenga el cuadrado de la variable y, se escribe:
gen z = y^2
1
Otro ejemplo es la transformación logarítmica:
gen ly = ln(y)
donde ly es una nueva variable que contiene los valores del logaritmo natural de la
variable y.
Regresiones por OLS
Para correr una regresión por Mínimos Cuadrados Ordinarios (OLS) se utiliza el
comando regress. Por ejemplo, supongamos que se quiere estimar los parámetros
del siguiente modelo por OLS:
y = β0 + β1 x1 + β2 x2 + β 3 x3 + µ
entonces el comando a utilizar en Stata es:
regress y x1 x2 x3
donde y es la variable dependiente y x1, x2 y x3 son los regresores.
Test de hipótesis sobre coeficientes
En general, una prueba de hipótesis sobre cualquier combinación de coeficientes de
una regresión puede hacerse con el comando test. El mismo es un comando postregresión; esto significa que para utilizarlo se debe haber ejecutado previamente el
comando regress (o similar). Siguiendo con el caso anterior, supongamos la
siguiente prueba de hipótesis:
H0: β1 = 0
vs
H1: β1 ≠ 0
entonces luego de ejecutar el comando regress se escribe lo siguiente:
test x1 = 0
donde el resultado será el valor del estadístico de prueba junto con su p-valor.
Dado que la prueba anterior es un test de significatividad individual, el resultado
coincide con el test t que muestra la salida de regresión de Stata. Sin embargo,
cualquier otra combinación de parámetros en la hipótesis nula también puede
ponerse a prueba con el comando test, por ejemplo:
H0: β1 = β2 = 0
vs
H1: β1 ≠ 0 ν β2 ≠ 0
En este caso luego de la regresión debe escribirse:
test x1 = x2 = 0
Obviamente, si en la línea de comandos se escribe
2
test x1 = x2 = x3 = 0
el resultado en pantalla coincide con el test conjunto (F) que aparece en la salida de
regresión de Stata.
3