Download Algunas tecnicas basicas

Document related concepts
no text concepts found
Transcript
Algunas técnicas básicas
Luis Rosero Bixby
University of California at Berkeley
Las técnicas
1. Agregación
2. Suavizamiento
3. Ajuste a control macro
4. Normalización
(La mayoría son en realidad consejos de
programación)
1. Agregación
• Para pasar de micro-datos a promedios por edades
• Comando Stata para promedios ponderados:
collapse (mean) x y z [weight=facexpan], by(age)
• “facexpan” son los factores de expansión de la muestra
(pudimos modificarlos para reproducir la estimación de la
pob. por edades simples)
• Para tener también el número de observaciones y la
población en cada edad:
generate unos = 1
Collapse (rawsum) unos (sum) fexpan (mean)….
2. Suavizamiento (Apéndice B)
• Para reducir el ruido del muestreo por trabajar con
edades simples
• Se suavizan los niveles más bajos (ejemplo: YE y YS)
• Los niveles mas altos se obtienen por suma (YL no se
suaviza!)
• No sobre-suavizar picos, valles y ceros reales
• Los valores falsos negativos deben reemplazarse con
ceros
• No incluir en el suavizamiento edades que por
definición tienen ceros (ej. niños en YL)
2. Suavizamiento con Stata
• Se trabaja con el archivo de promedio de edades
• Se usa la técnica de regresión local (lowess)
lowess Y age, bw(0.1) gen(Ysua)
• Jugar con valores alternativos de band width (bw)
• Debido a que lowess no permite weight se usa el truco de
expandir la muestra (p. ej. una línea por cada 10
observaciones) antes de suavizar.
gen obs10 = round(nobs/10)
expand obs10, gen(duplicada)
lowess.....
drop if duplicada==1
3. Ajuste a control macro
Cálculo del factor de corrección
Cálculo perfiles ajustados
3. Ajuste a control macro en stata
* control macro
gen yle_macro = 15542
* agregados crudos (con valores suavizados)
egen double yle_tot = total(pob2006/1000000 * yle_sua)
*Factor de correccion
gen fyle = yle_macro / yle_tot
*Valores ajustados al control
gen YLE = fyle * yle_s
4. Normalización
Porque al comparar
perfiles,
nos interesa más la
forma que el nivel
de la curva.
4. Cómo se normaliza
• Se calcula el promedio YL edades 30-49 (unidad de
ingreso):
egen YL3049 = mean(YL) if edad>=30 & edad<=49
replace YL3049 = YL3049[35] if YL3049==.
(Esta es una constante para todas las edades)
• YL normalizado es el YL relativo al de edades 30-49:
gen YL_nor = YL/YL3049
Laboratorio 4. Técnicas básicas
Aplicar las técnicas básicas de:
1.
2.
3.
4.
Agregación
Suavizamiento
Ajuste a control macro
Normalización
Para completar la estimación del ingreso laboral
(Código para hacerlo con Ecuador 2006 en:
YL-ECua-Part2.do)