Download e) Media de proporciones muéstrales

Document related concepts

Estadístico muestral wikipedia , lookup

Muestra estadística wikipedia , lookup

Intervalo de confianza wikipedia , lookup

Distribución t de Student wikipedia , lookup

Corrección de Bessel wikipedia , lookup

Transcript
Distribución de Promedios Muéstrales
Para comprender que significa distribución de promedios muéstrales,
vamos a suponer que realizamos un experimento con bombos como los
usados en la lotería. Colocamos un número muy grande de bolas blancas
en un bombo blanco, en cada una de las cuales figura un dato X. Este
bombo representa la población de observaciones X, y tiene media m y
varianza s2. Supongamos que a continuación hacemos lo siguiente:
1) Tomamos una muestra de n=10 bolas blancas.
2) Calculamos la media y la anotamos en una bola azul.
3) Colocamos la bola azul en un segundo bombo de color azul.
4) Devolvemos las bolas blancas a su bombo y le damos vueltas.
5) Repetimos toda la operación muchas veces hasta que el bombo azul
esté lleno de bolas azules.
Entonces, los números del bombo azul forman una población de
promedios muéstrales. Esta es una población derivada de la anterior, y
tiene la misma media o promedio que la distribución original, pero su
varianza es un enésimo de la varianza de la distribución original:
En el caso del bombo azul, si denominamos
media, tenemos:
a la varianza y mm a la
La distribución de medias muéstrales está situada en el mismo lugar
(alrededor de la misma media) que la distribución original, pero es mucho
mas estrecha, porque su varianza es la décima parte de la varianza
original. La distribución original de observaciones representada por el
bombo blanco se denomina comúnmente distribución madre o base. Al
construir la población de promedios muéstrales, realizábamos
extracciones de 10 bolas blancas después de dar vueltas al bombo. Es
decir, que estábamos realizando un muestreo aleatorio de la población
madre, porque cada una de las bolas blancas tenía la misma posibilidad
de ser elegida para integrar la muestra. Aunque la población original no
sea de distribución normal, si el muestreo es aleatorio, la población de
promedios muéstrales se aproximará a la normalidad, es decir, será casi
de distribución normal. Este efecto se debe a un teorema de estadística
matemática denominado Teorema Central del Límite. En resumen, si se
cumple la hipótesis de muestreo aleatorio, tenemos:
En general, en los problemas que se presentan habitualmente, existe una
población de observaciones cualesquiera, de la cual tomamos una
muestra aleatoria, por medio de la cual intentamos conocer todo lo que
sea posible acerca de la población de la cual fue extraída. El promedio
de la muestra de n elementos pertenece a la distribución de promedios
muéstrales de la población original. Es decir, que el promedio de la
muestra que obtuvimos es uno de los muchos promedios muéstrales que
se distribuyen alrededor de m con desviación estándar.
Por lo tanto, si la muestra es mas grande (n mayor), estaremos en una
distribución de promedios con desviación estándar mas pequeña, por lo
cual, el promedio de la muestra estará mas cerca del promedio del
universo. Es por esto que es razonable pensar que el promedio de la
muestra es una estimación del promedio del universo.
Distribución Muestral de Proporción.
La necesidad de encontrar la proporción, porcentaje o porciento de una
situación dada en una población es tarea frecuente en estadística.
La distribución muestral de proporciones es el conjunto de todas las
muestras posibles del mismo tamaño extraídas de una población, junto
con el conjunto de todas las proporciones muéstrales.
Ejemplo:
Existen 6 vendedores en una compañía, los vendedores A, B, C, fuman y
los vendedores X, Y, Z no fuman considerando los vendedores como
población y el fumar como tipo de porcentaje, se pide:
a) Proporción de números de fumadores considerando los datos de
población.
<m>P= {n(A)}/ {n (Omega)} </m>
Donde:
P => Proporción Poblacional
n(A) => Cantidad de eventos pedidos
<m>n (Omega) </m> => Tamaño de población
P = 3/6 = 0.50
b) Desviación Estándar de Población
<m>delta P = sqrt (PQ) </m>
P = Proporción poblacional
Q=1-P
<m>delta P = sqrt (0.50 * 0.50) = 0.50</m>
c) Cantidad de muestras de tamaño 4
<Sub>N</sub>C<sub>n</sub>
N => Tamaño de Población
n => Tamaño de Muestra
<Sub>6</sub>C<sub>4</sub> = 15 muestras
d) Distribución Muestral de Proporción
Recordar que es el cuadro de las muestras y las p muéstrales.
Donde p es el numero de elementos en la muestra que cumplen la
característica pedida dividida entre el tamaño de la muestra.
^Muestra^<m>overline X</m>^ |abcx|3/4|0.75| |abcy|3/4|0.75|
|abcz|3/4|0.75| |abxy|2/4|0.50| |abxz|2/4|0.50| |abyz|2/4|0.50|
|acxy|2/4|0.50| |acxz|2/4|0.50| |acyz|2/4|0.50| |axyz|1/4|0.25|
|bcxy|2/4|0.50| |bcxz|2/4|0.50| |bcyz|2/4|0.50| |bxyz|1/4|0.25|
|cxyz|1/4|0.25| | | |‹m›Sigma p= 7.50</m>|
e) Media de proporciones muéstrales
<m>overline {p} = {Sigma p} /n</m>
Nota: el **valor esperado de la proporción** es igual a la media de la
población proporcional.
<m>overline {p} = {Sigma 7.50} / 15 = 0.50</m>
f) Error Estándar de la Proporción
f.1) Para Muestras menores de 30 elementos
<m>sigma _p=sqrt {{PQ/N}. {N-n}/ {N-1}} </m>
<m>sigma _p=sqrt {{0.5*0.5/4}. {6–4}/ {6–1}} </m>
<m>sigma _p=sqrt {0.0625 / 0.4} </m>
<m>sigma _p=sqrt {0.025} = 0.15813883</m>.
DISTRIBUCIÓN DE LAS
MEDIAS MUESTRALES
Si una población es N  ,   o
bien si n  30 , las medias
muéstrales se distribuyen según

una N   ,
 


n
  

X Es una N   ,
n

DISTRIBUCIÓN DE LAS
PROPORCIONES
MUESTRALES
Si en una población se conoce la
proporción de individuos que
presenta una cierta característica
p, en una muestra de tamaño n la
proporción pr de individuos con
esa característica se distribuye
según una Normal:

Pr es una N  p,

pq 
 q=1-p
n 
(Siempre que np  5 y nq  5 )
INTERVALO DE CONFIANZA
PARA LA MEDIA  .
Con un nivel de confianza del
1    %
INTERVALO DE CONFIANZA
PARA UNA PROPORCIÓN:


 
 X  z 
,
X

z



n
n 
2
2

Conociendo la proporción pr de
individuos que presenta una
cierta característica en una
muestra de tamaño n, queremos
estimar la proporción p de
individuos de la población que
presenta esa característica
mediante un intervalo de
confianza y un nivel de confianza
del 1   
Error máximo admisible:
Error = z  
2

n
Aproximación de la Binomial
mediante una Normal:
Si X es B(n, p) sabemos que
  np y   npq . Pues bien, si
np  5 y nq  5 resulta que X
coincide prácticamente con una
Normal: X es N np, npq



 pr  z  

2

pr  (1  pr )
, pr  z  
n
2
Error = z  
2
pr  (1  pr )
n
pr  (1  pr ) 
n 
