Download mieperho - DME

Document related concepts
no text concepts found
Transcript
INTRODUCCION GENERAL AL
Aplicaciones con la
Encuesta Nacional de Hogares
Abrir archivos de datos
USE
use d:\panel\panel_1.dta
Abre el archivo “panel_1.dta”
use d:\panel\panel_1.dta, clear
Abre el archivo “panel_1.dta” aun si se
encuentra en la memoria activa y tiene
cambios respecto a la versión guardada
STAT TRANSFER
Guardar archivos de datos
SAVE
save d:\panel\panel_2.dta
Guarda datos con el nombre “panel_2.dta”
save d:\panel\panel_1.dta, replace
Reemplaza el archivo “panel_1.dta” con los
datos de la base de datos activa.
LOG USING
log using d:\panel\resulta_1.txt
Crea el archivo “resulta_1.txt” y graba los resultados
en formato texto.
log using d:\panel\resulta_1.txt, replace
Reemplaza el contendido del archivo “resulta_1.txt”
con los nuevos resultados
log using d:\panel\resulta_1.txt, append
Adiciona los nuevos resultados al final del archivo
“resulta_1.txt”
DESCRIBE
describe
Muestra el formato y etiqueta de las variables de la
base de datos
d
Es el modo abreviado de describe
d mieperho
Muestra el formato y etiqueta de la variable
“mieperho”
SUMMARIZE
summarize
Muestra el número de casos, media, desviación estándar,
mínimo y máximo
sum
Es el modo abreviado de summarize
sum mieperho, detail
Además de los estadísticos por defecto, muestra
percentiles, kurtosis, Skewness de la variable “mieperho”
INSPECT
inspect mieperho
Muestra un histograma pequeño e información
sobre las observaciones de la variable “mieperho”
TABULATE
tabulate mieperho
Muestra las frecuencias de “mieperho”
tab mieperho
Es la forma abreviada de tabulate
tab pobreza, generate (pob99)
Muestra las frecuencias de “pobreza” y crea 3
variables dicotómicas con los valores de “pobreza”
TABULATE
tabulate year pobreza
Muestra el número de casos del cruce de las
variables “year” y pobreza”
tabulate year pobreza, row
Muestra el número de casos y el porcentaje
horizontal del cruce de las variables “year” y
“pobreza”
TABULATE, SUM
tabulate year, sum(mieperho)
Muestra la media, desviación estándar y el número de
casos de la variable “mieperho” en cada categoría de la
variable “year”
tabulate pobreza (if year==1999), sum mieperho
Muestra la media, desviación estándar y el número de
casos de la variable “mieperho” en cada categoría de la
variable “pobreza”, cuando “year “ es igual a 1999.
TABULATE,SUM
tabulate year pobreza, sum(mieperho)
Muestra la media, desviación estándar y el número de
casos de la variable “mieperho” en cada categoría del
cruce de las variables “year” y “pobreza”
tabulate year pobreza, sum(mieperho) means
Muestra la sólo la media de la variable “mieperho” en
cada categoría del cruce de las variables “year” y
“pobreza”
SORT, BY, TABULATE
sort year
Ordena los datos en función de la variable “year”
by year: tabulate(pobreza)
Presenta las frecuencias de la variable “pobreza”
en forma indepediente para cada valor de la
variable “year”
TABLE
table year
Presenta el conteo de casos por cada valor de la variable
“year”
table year pobreza, row col
Presenta el conteo de casos del cruce de las variables “year”
(en filas) y “”pobreza” (en columnas), así como los totales de
filas y columnas
table year pobreza, row col c(mean mieperho)
Presenta el promedio de miembros de los hogares
pertenecientes a cada categoría del cruce de las variables
“year” (en filas) y “”pobreza” (en columnas), así como los
totales de filas y columnas
GENERATE
generate inghogm=inghogtr/3
Crea la variable “inghogm” que resulta de dividir la
variable “inghogtr” entre 3.
gen pobre=1 if(pobreza==1 | pobreza ==2)
Crea la variable “pobre” que toma valor 1 si la variable
“pobreza” tiene valor 1 o valor 2.
gen pobregas = (pobre==1)
Crea la variable dummy “pobregas” que toma valor 1
cuando la variable “pobre” es igual a 1, y es 0 en los otros
casos
Operadores matemáticos y lógicos
+
suma
sqrt() raíz cuadrada
>
mayor que
resta
exp() exponencial
>=
mayor o igual que
/
división
<
menor que
*
multiplicación
•
•
•
•
•
•
•
•
•
~
<=
^
&
==
ln()
|
~=
!=
not
menor o igual que
potencia
y
igual
logaritmo natural
o
diferente
diferente
GENERATE
1.
Variable numérica
gen ingmpc=(inghog1d/(miperho*3))
2.
Número de orden
gen id=_n
3.
Variable rezagada:
gen lagid=id[_n-1]
GENERATE
4. Variable dummy:
gen mas5=(mieperho>=5)
5. Variable tipo carácter:
gen str2 texto="si“
REPLACE
replace inghogm=inghogtr/3
Reemplaza los valores de la variable “inghogm” que se
encuentra en la base de datos.
replace pobre=1 if(pobreza==1 | pobreza ==2)
Reemplaza la variable “pobre” que se encuentra en la base
de datos
ANALISIS DE DATOS DE
ENCUESTAS
Incorporación del Diseño Muestral de
la Enaho
Diseño de la Enaho
La Enaho es una encuesta con diseño complejo .
Todas las estimaciones deben realizarse teniendo en
cuenta este diseño.
PONDERACION = Factorho
CONGLOMERADOS O CLUSTER = Conglome
ESTRATOS = Estrato
SVYSET, SVYDES
svyset pweight fachog
Indica que las poderaciones se encuentran en la variable “fachog”
svyset psu conglome
Indica que los conglomerados están identificados en la variable
“conglome”
svyset strata estrato
Indica que los estratos están determinados por la variable “estrato”
svydes
Permite visualizar los parámetros especificados con los comandos
anteriores.
SVYDES
. svydes
pweight:
Strata:
PSU:
Strata
estrato
-------1
2
3
4
5
-------5
fachog
estrato
conglome
#PSUs
-------447
182
158
24
126
-------937
#Obs
-------1197
555
466
197
1102
-------3517
#Obs per PSU
---------------------------min
mean
max
-------- -------- -------1
2.7
6
1
3.0
6
1
2.9
5
3
8.2
12
1
8.7
12
-------- -------- -------1
3.8
12
SVYMEAN
svymean mieperho percepho
Estima del promedio de las variables “mieperho” y
“percepho”
svymean mieperho percepho if(pobreza==3)
Estima el promedio de las variables “mieperho” y
“percepho” pero sólo para los “Hogares Pobres extremos”,
es decir, cuando la variable “pobreza” toma valor 1
SVYMEAN
. svymean mieperho percepho
Survey mean estimation
pweight:
Strata:
PSU:
fachog
estrato
conglome
Number of obs
Number of strata
Number of PSUs
Population size
=
3517
=
5
=
937
= 5447315.2
---------------------------------------------------------------------Mean |
Estimate
Std. Err.
[95% Conf. Interval]
Deff
---------+-----------------------------------------------------------mieperho |
4.701369
.0515334
4.600234
4.802504
1.850805
percepho |
2.133357
.0278439
2.078713
2.188001
2.027123
----------------------------------------------------------------------
SVYMEAN
svymean mieperho, by(pobreza)
Estima del promedio de “mieperho” para cada categoría
de la variable “pobreza”
svymean mieperho, by (estrato) ci obs
Estima del promedio de “mieperho” para cada categoría
de la variable “estrato” y además obtiene el intervalo de
confianza y el número de observaciones que intervino en
cada cálculo.
SVYPROP
svyprop pobreza
Estimación de las proporciones de cada categoría de la
variable “pobreza”
svyprop pobreza if (urru5==1)
Estima la proporción de hogares en cada categoría de la
variable “pobreza” del área urbana, es decir, cuando “urru5”
toma el valor de 1
svyprop pobreza, by (urru5)
Estima la proporción de hogares en cada categoría de la
variable “pobreza”, en forma independiente para cada
categoría de la variable “urru5”
SVYTAB
svytab estrato pobreza
Estimación de las proporciones de cada categoría de la variable
“pobreza”
svytab,se ci deff
Luego de la coma se especifican los estadísticos que se mostrarán en
la celda de la tabla
svytab, row
Especifica que la proporción se estima en forma independiente para
cada fila
svytab pobreza estrato if (urru5==1)
Presenta la proporciones del cruce de “pobreza” con estrato” en los
hogares donde “urru5” toma valor 1, es decir, el área urbana.
SVYREG
svyreg gashpcmd ingpcmd
Estima un modelo de regresión lineal donde la variable
dependiente es “gashpcmd” y las variables independientes son
la constante e “ingpcmd”
svyreg gashpcmd inghpcmd mieperho percepho
Estima un modelo de regresión lineal con variable
independiente “gashpcm” y variables independientes
constante, “inghpcmd”, “mieperho” y “percepho”
POVDECO
povdeco gashpcmd, varpl (lp)
Estimación de los índices FGT en función de la variable
“gashpcmd”, comparándola con la variable “lp”. En otras
palabras, “lp” es la variable que contiene el valor de la Linea de
Pobreza y “gashpcmd” (gasto per cápita mensual deflactado)
es la variable que mide el bienestar del individuo.
povdeco gashpcmd [w=facpob], varpl (lp)
Estima los índices FGT al igual que el comando anterior , pero
considera los datos ponderados por la variable “facpob”
SEPOV
sepov gashpcmd, p(lp)
Estimación de los índices FGT en función de la variable
“gashpcmd”, comparándola con la variable “lp”. “lp” es la
variable que contiene el valor de la Linea de Pobreza y
“gashpcmd” (gasto per cápita mensual deflactado) es la
variable que mide el bienestar del individuo.
sepov gashpcmd, p(lp) by (urru5)
Estimación de los índices FGT, al igual que en el caso
anterior, para cada categoría de la variable “urru5”
sepov gashpcmd if(dominio==8), p(lp)
SEPOV
. sepov gashpcmd, p(lp)
Poverty measures for the variable gashpcmd:
gasto total percapita mensual
Survey mean estimation
pweight: facpob
Number of obs
=
3517
Strata:
estrato
Number of strata =
5
PSU:
conglome
Number of PSUs
=
937
Population size = 25609840
--------------------------------------------------------------------Mean |
Estimate
Std. Err.
[95% Conf. Interval]
Deff
---------+----------------------------------------------------------p0 |
.3784438
.01526
.3484958
.4083918
3.480784
p1 |
.110638
.0059543
.0989527
.1223234
3.803857
p2 |
.0450111
.0030714
.0389834
.0510388
3.497021
---------------------------------------------------------------------