Download Presentación de PowerPoint

Document related concepts

Distribución t de Student wikipedia , lookup

Varianza wikipedia , lookup

Estadístico muestral wikipedia , lookup

Prueba t de Student wikipedia , lookup

Error cuadrático medio wikipedia , lookup

Transcript
Distribuciones derivadas del
muestreo
DISTRIBUCIONES DERIVADAS DEL MUESTREO
Cuando se trata de una muestra de datos
seleccionados aleatoriamente de una población,
surge la pregunta de si las estadísticas observadas en
esa muestra serán parecidas a las estadísticas de
población de donde se obtuvo la muestra.
2
DISTRIBUCIONES DERIVADAS DEL MUESTREO
Por ejemplo, si obtenemos al azar muestras de
frijol almacenado, medimos el contenido de proteína,
y obtenemos el promedio de proteína de ese frijol, la
pregunta que nos hacemos es:
¿Es ese valor promedio de proteína parecido al
contenido de proteína promedio de todo el frijol
almacenado en el país o en la región?
3
DISTRIBUCIONES DERIVADAS DEL MUESTREO
En primer lugar se debe establecer que un
estadístico de una muestra aleatoria (como la media de
la muestra, la varianza, la desviación estándar o
cualquier otro), va a tener una distribución derivada del
modelo de distribución que estamos suponiendo que
tienen las observaciones que componen la muestra.
La variable x de la
muestra se
distribuye como:
4
DISTRIBUCIONES DERIVADAS DEL MUESTREO
Se desea determinar el calibre promedio de
cierto tipo de árbol que crece en una región (El
calibre de un árbol es su diámetro, medido seis
pulgadas arriba de la tierra).
Para este estudio se toma una muestra
aleatoria de 16 árboles que miden 13 pies de altura,
y se mide el calibre de cada uno de ellos. Se
obtienen los siguientes resultados: 2.3, 1.9, 1.7,
2.1, 1.5, 1.8, 1.8, 1.1, 2.1, 1.5, 2.0, 1.6, 1.3, 1.6,
1.5, y 1.3.
x  1.7
s  0.332
5
DISTRIBUCIONES DERIVADAS DEL MUESTREO
Suponemos que los calibres de los árboles
siguen una distribución normal, y sabemos que los
parámetros del modelo de distribución normal serán:
 = Calibre promedio de todos los árboles de 13 pies
de altura que crecen en esa región.

=Desviación estándar del calibre de los árboles
que tienen las características especificadas.
Surge entonces la idea de estimar

con la media
muestral y  con la desviación estándar de la muestra.
Así:
1.7 es una estimación de 
0.332 es una estimación de 
6
12
11
10
9
8
7
6
5
4
3
2
1
0
DISTRIBUCIONES
DERIVADAS DEL
MUESTREO
¿Podemos suponer que los árboles (de 13 pies
de altura) de toda la región tendrán un calibre
promedio de 1.7?
Esto va a depender de cómo se distribuye el
calibre de los árboles, de si su variación es grande
o chica, y del tamaño de la muestra de árboles.
7
12
11
10
9
8
7
6
5
4
3
2
1
0
DISTRIBUCIONES
DERIVADAS DEL
MUESTREO
Lo que se va a saber en esta unidad es que
la media de la muestra es un buen estimador de
la media de la población, y que depende de la
varianza y del tamaño (n) de la muestra, qué tan
lejos o tan cerca pueda estar la media de la
muestra de la verdadera media de la población.
8
DISTRIBUCIONES DERIVADAS DEL MUESTREO
¿Qué sucede si otras personas también están
estudiando el calibre de los árboles de esa región, y
tienen muestras con promedios y desviaciones
estándar diferentes ?
Media = 1.96
Dev. St. = 0.38
Media = 1.83
Dev. St. = 0.60
Media = 1.91
Dev. St. = 0.48
9
DISTRIBUCIONES DERIVADAS DEL MUESTREO
Es por ello, que cuando tenemos una muestra,
decimos que el promedio estimado de la población
de árboles será de 1.7.
Respecto a la posibilidad de que haya otras
muestras con diferentes promedios y desviaciones
estándar, esto se deduce del modelo de
distribución que se supuso para la población.
Si los valores aleatorios de calibre siguen un
modelo de distribución normal, los promedios de
cada muestra aleatoria tendrán también una
distribución normal.
10
DISTRIBUCIONES DERIVADAS DEL MUESTREO
Los estadísticos de la muestra tienen una
distribución de probabilidades derivada de la
distribución de la variable aleatoria con la que se
calcula el estadístico.
Si la media de la muestra procede de valores de X
con una distribución binomial [XB(np, npq)], la media
muestral tendrá una distribución binomial:
[ X B(p, pq/n)]
Si la media de la muestra procede de valores de X
con una distribución de Poisson, la media tendrá una
distribución Poisson, con media , y varianza /n.
11
Distribuciones derivadas del muestreo
Una de las propiedades de la media de la
muestra, es que cualesquiera que sea la
distribución de X, cuando la muestra es
suficientemente grande, la media de la muestra
tendrá una distribución aproximadamente
normal.
Esto se deriva del Teorema Central del
Límite.
12
Teorema central del límite
Si se tiene una muestra aleatoria de tamaño n,
tomada de una población con un valor de la media y un
valor dado de la varianza, y si n es suficientemente
grande, la media de la muestra se distribuye
aproximadamente normal con media igual a la media de
la población y varianza igual ala varianza de la
población dividida n (2/n).
Es así que la variable aleatoria:
X 
/ n
se distribuirá aproximadamente normal con media 0 y
varianza 1 (o sea tendrá una distribución normal
estándar).
13
Distribución de la media muestral
X tiene alguna distribución con media 1.7 y varianza 0.81.
La media de una muestra de tamaño 100 tendrá una
distribución con media 1.7 y varianza 0.0081.
12
11
10
9
8
7
6
5
4
3
2
1
0
Distribución de X
Distribución de
X
Desv. estándar = 0.9
Desv. estándar = 0.09
Media = 1.7
14
Distribución Z de la media de la muestra
Dos reglas para calcular la media
y la varianza de una nueva
variable (NX) que es una
transformación lineal de otra (X):
Sea la transformación:
Donde NV=Nueva variable
μ =media poblacional de X
σ = desv. estándar de X
NX   X
NX 
X
La media poblacional de NX será:
Media (NX) - μ
La varianza poblacional de NX será:
1
 Var(NX)
2

15
Distribución estandardizada
de la media de la muestra ( Z )
Si la nueva variable es la media de la muestra, la media de la
distribución es μ (aplicando el teorema central del límite), y la
varianza de la distribución de la media de la muestra es σ2/n, donde
n es el tamaño de la muestra.
Eso se resume en la ecuación a la derecha.
X se distribuye N(,  n)
2
Calcule la media y la varianza de Z para la media de una
muestra de tamaño 20 (n=20) cuya distribución tiene
una media μ de 5 y una varianza σ2 de 0.82
16
Distribución estardardizada de la media
de la muestra
(X  μ) n
Zc 
σ
Tabla de Z
0.8431
0.05
Z
P [ z > zc ]
-1.0
0.8431
1.64
0.05
1.96
0.025
2
0.023
17
Distribución de t de Student
0.3
( X  )
tc 
sX
0.25
(n-1) = 34
0.2
0.15
P{t > t(34)= 2.3} = 0.01
0.1
0.05
0
sX 
-3
2
s
n
-2
-1
0
1
2
3
Valores de t de Student
Tabla de t
Grados de
Libertad (n-1)
0.10
0.05
1
6.314
12.706
2
2.920
4.303
8
1.860
2.306
0.05
0.025
P [ t > tc]
0.15
P [ t >| tc|]
0.075
18
Distribución de Chi-cuadrado
  {(n  1) s } /( )
2
c
2
2
Tabla de Chi-Cuadrado
Grados de
Libertad
(n-1)
=0.05
= 0.01
1
3.84
6.63
2
5.99
9.21
8
2.73
20.09
50
45
40
35
30
25
20
15
10
5
0
G. de L. = 19
P{2 > 2 (19) = 3.77} = 0.05
0
1
2
3
4
5
6
Valores de Chi-Cuadrado
= 0.001
P [ χ2 > χ2c ] = 
19
Distribución de F
30
25
s
Fc 
s
2
a
2
b
G. de L. Num. = 7
G. de L. Den. = 16
20
15
P {F > F(7,16) =10.5} = 0. 049
10
5
0
0
2
4
6
8
10
12
14
Valores de F
Tabla de F
Grados de libertad del Numerador (m-1)
Grados de
Libertad
Denominador
(n-1)
1
2
8
1
161.45
199.50
238.88
2
18.513
19.000
19.371
4.4590
3.4381
8
5.3177
20
Cálculo de probabilidades
El software enseñado hasta el presente (Excel e
Infostat) tiene implementado el cálculo de
probabilidades.
Se harán demostraciones en clase.
21
Ejercicios
Se realizarán varios ejercicios con las distribuciones
vistas y con el uso de tablas.
22
Resumen
Población estadística
Muestra
Propiedades de la muestra:
Muestra aleatoria
Muestra representativa
Muestra suficiente
Procedimientos de muestreo
Distribuciones derivadas del muestreo
23