Download El estimador de traslación para muestreos postcensales.

Document related concepts

Error cuadrático medio wikipedia , lookup

Estimador wikipedia , lookup

Sesgo estadístico wikipedia , lookup

Corrección de Bessel wikipedia , lookup

Varianza wikipedia , lookup

Transcript
ESTADÍSTICA ESPAÑOLA
Núm. 11 i, 1986, págs. 81 a 86
EI estimador de traslación para muestreos
postcensales
por MARIANO RUIZ ESPEJO
Universidad Autónorna de Madrid
RESUMEN
Se analiza la construcción deI estimador de traslación viendo
analogías con estimadores de razón. También se compara la precisión de la estrategia de muestreo (m.a.s., x; ) siendo x^ el estimador de traslación, con la estrategia (m.a.s., ^}, dando una regla
empírica de cuándo es preferible la primera estrategia.
Prxluórus cluve: Estimador de traslación, muestreo aleatorio simple, muestreo de encuestas.
1.
INTRODLrCCION
E1 estimador de traslación es un caso especial de estimador por diferencia y por tanto, a su vez, caso particular del estimador de regresión. Su uso
es apropiado cuando se dispone de un conocimiento global de la población
y de la variable a investigar, pero en un instante anterior a la realización del
muestreo. De aquí se deduce que su utilización debe limitarse a aquellos
problemas de inferencia en los que se ha realizado un censo previo y se
dispone de la variable x^^ observada en el censo, por ejemplo la producción
de trigo en la campaña inicial del decenio en la unidad i de la población. E1
total producido en el instante inicial es
82
ESTAUÍSTIC'A F..SPAÑOI_A
donde N es el número de explotaciones consideradas en el censo inicial del
decenio, o también el tamaño de la población finita, sobre la que queremos
inferir sobre su parámetro media poblacional en un instante o campaña
posterior, por ejemplo cinco años después del censo inicial. La media poblacional del censo será
1
N
- - ^ XOi
11^ i _ , ^
(1)
Suponemos que el tamaño de la población no ha variado en el períado
que separa el censo del muestrea, es decir, la producción de trigo se observa
en las mismas unidades o explotaciones que se consideraron en el censo inicial. Por tanto descartamos la pasibilidad de existencia de unidades vacias o
extrañas y el de unidades repetidas (1Vliras, 1979} en el marco de muestreo,
asi como de omisiones (Sánchez-Crespo, 1980).
Tanto en el estimador de razón como en el estimador media-de-razones
valor
observado en el muestreo xi en la unidad i-ésima son corregidos
el
mediante una variable auxiliar disponible de un censa previo, por ejemplo,
la superficie en explotación yi de la unidad i= l, ^, ..., N. Basta suponer una
relación de tipo lineal entre 1a variable auxiliar yi con la variable a observar
xi del tipo
xi=Ryi
para que el sesgo del estimador de razón o el media-de-razones se anule y
además el error cuadrático medio o varianza (por tener sesgo nulo) se anule
a su vez. Es decir, un cambio de variable conocido como cambio de escala
entre la variable a observar y la variable auxiliar hace del estimador de razón o del estimador media-de-razones estimadores muy eficientes.
O^tro tanto ocurre con el estimador de traslación cuando se trata de
cambios de origen entre la variable a observar xi y la variable auxiliar
yi =xQi. E1 estimador de traslación está definido así
xr=X+(Xo^xo)
donde
1
es la media muestral de las observaciones xi seleccionadas por muestreo probabilístico, de tamaño muestral n. Además
EL ESTIMADUR DE TRASLAC[ÓN PARA MUESTREOS POSTC'FNSALES
1
H3
n
^ ^Oi
es la media muestral pero obtenida de los datos del censo previo, y X ^ está
definido en (1). Si xo c X o, la muestra subestima en el censo inicial el valor
medio de la producción de trigo por explotación. Lo cual sugiere corno deseable corregir la estimación x dada por la media muestral, por z, que sobreestima al parámetro
- 1 N
X = N__ ^ x;
en dicha muestra precisamente en el valor X o- Xo en que se subestimaba
X o por el estimador media muestral xU en el censo para la misma muestra
seleccionada. Recíprocamente si xo > X o la muestra tenderá a sobreestimar
con x el parámetro_media poblacionar X, y así x^ corrige x restándole una
cantidad positiva (X o- za ) equivalente a la sobreestimación de la misma
muestra en el censo previo.
Es fácil comprobar que si existe una relación funcional entre la variable
x^ y xo^, para todo i= 1, 2, ..., N del tipo carnbio de origen, es decir
x^ - xo^ + k
(i -- 1, 2, ..., N)
^2^
con k constante real, el estimador z^ resulta insesgado y con varianza cero.
Esto es sencillo de probar. E1 estimador z^^ es siempre insesgado, bajo diseño
de muestreo aleatorio simple
B(x^)=E(zi)-X =E[z+(Xo--.xo)^-^ --E(z)+Xo-E^^o)-X --o
puesto que E (x) = X y E(zo j= X o.
Además, supuesto un cambio de origen del tipo dado en (2),
X^-x+^X o-xo)-xo+k+^xo-^o)=X o+k--X
el estimador de traslación es idénticamente la media poblacional .X, y por
tanto su varianza se anula con transformaciones del tipo (^). Estas transformaciones no siempre se darán exactamente, pero con ligeras modificaciones
el estimador xr conservará su eficiencia máxima de modo aproximado.
ESTAD^STICA ESPAÑOLA
2.
^,CUANDO EL ESTIMADOR .^t ES PREFERIBLE A LA
IWiEDIA MUESTRAL x?
Podemos expresar el estimador xr como
1 n
1 ^^
^
^ ^^
x^=-- ^ (x;+X--xo;)=
n^1
n^^
donde ,^^ = xi + X o- xo^ es la observación i-ésima corregida por traslación en
base a los datos censales previos. Bajo diseño de muestreo aleatorio sirnple
(m.a.s.)
_
_N--n cr2
^-n
V(x`} ^ ly__' l
y
N-n ^x
V(x)= Ñ- 1 n
donde
l
tlZ --
"
-
I
^
^ (Z^- ^^)2 =-- ^, [x^+X
N ^-^
N ^-^
-xo^-(X ^+X o-X o)^2=
- V(X^+X o-xo^)= V(x^-^-t^)
donde t; = X o- xo^ {i = 1, 2, ..., N), y
6x--V(x^)
Tenemos, V(x^ )< V(z) si y solo si V(xi + ti )< V(x; ).
Pero1
Y(x^ + t^ ) = V(x^ ) + V(ti ) + 2 Cov (xi, t^ ) < V(x^ )
si y solo si
V(t^ )+ 2 Cov (x^, t^ )< 0
Es decir, cuando y solo cuando
V(t^) +2 Pxr ^Y(x,} <0
o sea,
Pxt ^
__1%V(tr)^
2
i^(x^)
_ ^^_.
^ ^,^„x
FL FSTIMAUOR DE TRASLACibIY PARA MUESTREOS F^)STC:ENSALES
^S
donde crt es conocido de los datos del censo previo, y ^^.zt y ^r.X sólo son estimables a partir de los datos de la muestra, pues son parámetros desconocidos. Empíricamente ^^zt puede estimarse por
n
^ (^i-X)(tiit)
^
_
^xt ^
i= 1
n
^ (Xi _
i= 1
y a su vez o-x puede estimarse por la cuasidesviación tipica
LT x = Sx. ---
Xi - Y )2
Por tanto, con los datos obtenidos en la muestra, el estimador xl es más
e^ciente que el estimador x aproximadamente cuando
A
^t
Pxt <
2 6x
o bien
n
t )
^.._.__ .
^ ( Xi - x} ^ti ^
^1
n
_
<^
.^ ri -- 1
crt
2
^ (ti -t )^
i= 1
y es sencillo ver que ^t =^r^^,, por tanto, cuando sea
n
^ (X^-x) (ti-t)
i^,
___--
^n- 1 ^^^^
n
^ ^ti -t ^^
1a estrategia de muestreo (m.a.s., zt ) es preferible a la estrategia (m.a.s., z).
ESTAD1STlCA ^.SPAIVOLA
E3IBLIOGRAFíA
C'O(^FiRAN, W. Ci. ( ly7?): SUi11rI! ^lt/ t^c^hnir^u^s (3rd. editi^n ^. wiiey. New York.
M^RAS, J. (1979): ^,?^f^ctus en e( murc^, cle mu^streu. Estadistica Españo^a, N." K?-K3, 27-4y.
SANC^NE:"1_-CRESPC^, J. L, ( l98()): Cursc^ intE^nsit,v c^e muesirev en pvhluci^^nes finitus. 1. N. E. Madrid.
SUMMARY
THE TRANSFER ESTIMATOR FOR POST CENSLIS
SAM PLINGS.
The construction of the transfer estimator is analysed by
seeing analogies with ratio estimators. Also the precision of the
strategy (s.r.s., x^ ), when z, is the transfer estimator, is compared
with the sampling strategy (s.r.s., x), giving an empirical rule to
indicate when the first strategy is preferable.
AMS 19$0. Subject classification. Primary 62 D OS.