Download DISTRIBUCION DE ESTADISTICOS MUESTRALES. Archivo

Document related concepts

Estadístico muestral wikipedia , lookup

Muestra estadística wikipedia , lookup

Prueba t de Student wikipedia , lookup

Distribución t de Student wikipedia , lookup

Corrección de Bessel wikipedia , lookup

Transcript
Ensayo de Rendimiento
DISTRIBUCIÓN
DE
ESTADÍSTICOS
MUESTRALES
Muestreo
Objetivo: conocer propiedades de
una población a partir de una
muestra
Propiedades
Parámetros
Los estadísticos muestrales sirven
como estimación (aproximación) de
los parámetros
Muestreo
Los parámetros son constantes
Los estadísticos son variables
aleatorias y poseen
distribución asociada
Distribución de estadísticos
muestrales: objetivos
•Comprender la naturaleza aleatoria
de los estadísticos muestrales.
•Estudiar las propiedades
estadísticas de la media y la
varianza muestrales.
•Adquirir destrezas en el cálculo de
probabilidades asociadas a estos
estadísticos.
Distribución de estadísticos
muestrales
Las distribuciones de los
estadísticos muestrales se estudian
suponiendo poblaciones de tamaño
infinito.
Distribución de los estadísticos
muestrales
Muestreo aleatorio con reposición:
las unidades seleccionadas pueden
repetirse dentro de la muestra y
entre muestras.
Muestreo aleatorio sin reposición:
las unidades seleccionadas no se
repiten dentro de la muestra y
entre muestras.
Distribución del estadístico media
muestral: ejemplo
Se tiene una población (finita) de
cuatro plantas de zapallos (N=4),
donde la característica de interés es
el número de zapallos por planta.
Se realizará un muestreo aleatorio
simple con reposición, para muestras
de tamaño 2.
Objetivo: estudiar la distribución
de la media muestral.
Distribución del estadístico media
muestral
P1
P2
P3
P4
X = Nº de
frutos
3
2
1
4
f(xi)
1/4
1/4
1/4
1/4
0.50
f(x)
Planta
Función de densidad del
número de frutos en una
población de 4 plantas de
zapallo.
0.25
0.00
1
2
3
Número de frutos
4
Distribución del estadístico media
muestral
La esperanza será:
  i xi f ( xi)
 1
   
1
4
2
1
4
3
1
4
4
1
4

1 2  3  4
4
 2.5
Distribución del estadístico media
muestral
La varianza será:

 2   i xi  
  1  2.5 
2
2
1
4
= +  4  2.5 
2
 f (x )
2
  2  2.5 
1
4
 1.25
i
2
1
4
  3  2.5 
2
1
4

Distribución del estadístico media
muestral
Tomando muestras de dos
plantas con reposición, hay N2
muestras posibles para
extraer, esto es 42=16
muestras.
Distribución del estadístico media
muestral
Espacio muestral generado por muestreo aleatorio
con muestras de tamaño n=2, con reposición, de una
población de cuatro plantas de zapallo.
Muestra
Plantas
Nro. de
frutos
Media
muestral
Muestra
Plantas
Nro. de
frutos
Media
muestral
1
P1P1
3; 3
3.0
9
P3P1
1; 3
2.0
2
P1P2
3; 2
2.5
10
P3P2
1; 2
1.5
3
P1P3
3; 1
2.0
11
P3P3
1; 1
1.0
4
P1P4
3; 4
3.5
12
P3P4
1; 4
2.5
5
P 2 P1
2; 3
2.5
13
P4P1
4; 3
3.5
6
P 2 P2
2; 2
2.0
14
P4P2
4; 2
3.0
7
P 2 P3
2; 1
1.5
15
P4P3
4; 1
2.5
8
P 2 P4
2; 4
3.0
16
P4P4
4; 4
4.0
Distribución del estadístico media
muestral
Media Muestral
1
1.(1/16) = 0.0625
1.5
2.(1/16) = 0.125
2
3.(1/16) = 0.1875
2.5
4.(1/16) = 0.25
3
3.(1/16) = 0.1875
3.5
2.(1/16) = 0.125
4
1.(1/16) = 0.0625
Valores que asume la variable aleatoria
“media muestral del número de frutos” en
muestras de tamaño n=2 y sus densidades.
Distribución del estadístico media
muestral
0.25
f(x)
0.20
0.15
0.10
0.05
1.0
1.5
2.0
2.5
3.0
Medias muestrales
3.5
4.0
Función de densidad de la
variable aleatoria media
muestral del número de
frutos.
Distribución del estadístico media
muestral
 x  2.5  
x 
2

2

n
1.25
 0.625
2
Error Estándar
EE   x  
2
2
n
Distribución del estadístico media
muestral
Si se hubieran utilizado muestras de mayor
tamaño, se vería que la función de densidad se
aproxima más aún a la gráfica de una densidad
normal, con idéntica esperanza y varianza
inversamente proporcional al tamaño muestral.
0.25
f(x)
0.20
0.15
0.10
0.05
1.0
1.5
2.0
2.5
3.0
Medias muestrales
3.5
4.0
Este comportamiento no es
casual sino la consecuencia de
un importantísimo resultado
que se resume en el siguiente
teorema:
Teorema Central del Límite
Sea X una variable aleatoria con esperanza µ
y varianza finita 2. Sea X la media muestral
de una muestra aleatoria de tamaño n y Z la
variable aleatoria definida como:
Z


 



X   
 
n 
entonces, la distribución de Z se aproxima
a la distribución normal estándar cuando n
se aproxima a infinito.
Ejemplo de un muestreo aleatorio sin
reposición desde una población finita
Rendimientos de un híbrido de maíz
(N=15)
99.04
95.74
102.64
107.66
104.48
Sin reposición
94.98
96.42
111.75
103.49
101.24
 = 101.77
101.52
85.44
112.86
104.93
104.31
2 = 44.67
Muestreo
Muestreo: todas las muestras
posibles de tamaño n
Estadísticos: media y varianza
muestrales
Distribución de las medias
de muestras con n=2
Ajuste: Normal(101.766,20.940)
0.37
frecuencia relativa
0.28
0.19
0.09
0.00
89.00
92.43
95.86
99.29 102.71 106.14 109.57 113.00
Media (n=2)
Distribución de las medias
de muestras con n=3
Ajuste: Normal(101.766,12.792)
0.26
frecuencia relativa
0.19
0.13
0.06
0.00
93.22
90.89
97.90
95.56
102.57
107.25
111.92
100.24
104.91
109.59
Media (n=3)
Distribución de las medias
de muestras con n=5
Ajuste: Normal(101.766,6.384)
0.20
frecuencia relativa
0.15
0.10
0.05
0.00
91.0
89.0
95.0
93.0
99.0
103.0
107.0
111.0
97.0
101.0
105.0
109.0
113.0
Media (n=5)
Distribución de las medias
de muestras con n=8
Ajuste: Normal (101.766, 2.792)
0.18
frecuencia relativa
0.13
0.09
0.04
0.00
92.43
89.00
99.29
95.86
106.14
102.71
Media (n=8)
113.00
109.57
Distribución del estadístico media
muestral
Cuando se hace un muestreo aleatorio
sin reposición desde una población finita
las expresiones para obtener la
esperanza y la varianza de la variable
media muestral son:
x  
Corrección
por finitud
  N n
x 


n  N 1 
2
2
En síntesis:
n2
n3
n5
n8
 x  101.766
 x  101.766
 x  101.766
 x  101.766
x 
2
x 
2
x 
2
x 
2

2
n

2
n

2
n

2
n




N n
N 1
N n
N 1
N n
N 1
N n
N 1





2

15  1
44.67 15  5
5

15  1
44.67 15  3
3





44.67 15  2
15  1
44.67 15  8
8
15  1




 20.94
 12.76
 6.38
 2.76
En síntesis:
Ajuste: Normal(101.766,20.940)
0.37
frecuencia relativa
n=2
0.19
0.09
frecuencia relativa
0.19
0.28
0.00
89.00
Ajuste: Normal(101.766,12.792)
0.26
n=3
0.13
0.06
0.00
92.43
95.86
93.22
99.29 102.71 106.14 109.57 113.00
90.89
Media (n=2)
97.90
95.56
102.57
107.25
111.92
100.24
104.91
109.59
Media (n=3)
Ajuste: Normal(101.766,6.384)
0.20
Ajuste: Normal (101.766, 2.792)
0.18
0.13
0.10
n=5
0.05
0.09
n=8
0.04
0.00
0.00
91.0
89.0
frecuencia relativa
frecuencia relativa
0.15
95.0
93.0
99.0
103.0
107.0
111.0
97.0
101.0
105.0
109.0
113.0
Media (n=5)
92.43
89.00
99.29
95.86
106.14
102.71
Media (n=8)
113.00
109.57
Conclusión
Cuando el tamaño de la muestra
aumenta, la varianza de las medias
disminuye
Recordando…
Error Estándar
EE 
x  
2
2
n
Ejemplo
El diámetro de las tortas de girasol se
distribuye normalmente con media 18 cm y
desviación estándar de 6 cm.
En una muestra de 10 tortas, ¿cuál es la
probabilidad de encontrar tortas con
diámetro promedio inferior a 16 cm?
Ejemplo
¿Cuál es la probabilidad, en una
muestra con n=10, de encontrar
tortas con diámetro inferior a 16
cm. si la distribución del diámetro
se aproxima a una N (18;36/10)?
0
4
7
11
14
16
18
21
25
28
32


16  18 

P  X  16   P  Z 
 P  Z  1.05  0.14885  0.15

6


10 

35
Ejemplo
Área: P(Zz)
Tabla de Cuantiles de la Distribución Normal
z
área
z
área
z
área
quantil
z
-3.25
0.00058
-1.00
0.15866
1.25
0.89435
0.00001
-4.265
-3.20
0.00069
-0.95
0.17106
1.30
0.90320
0.0001
-3.719
-3.15
0.00082
-0.90
0.18406
1.35
0.91149
0.001
-3.090
-3.10
0.00097
-0.85
0.19766
1.40
0.91924
0.00
-2.576
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
-1.20
0.11507
1.05
0.85314
3.30
0.99952
0.995
2.576
-1.15
0.12507
1.10
0.86433
3.35
0.99960
0.999
3.090
-1.10
0.13567
1.15
0.87493
3.40
0.99966
0.9999
3.719
-1.05
0.14686
1.20
0.88493
3.45
0.99972
0.99999
4.265
Distribución del estadístico media
muestral
Cuando no se conoce la varianza
poblacional:


 X  
T 

S




n


Tn1
Grados
de
libertad
Observación: los grados de libertad de la T se
corresponden con el tamaño de la muestra con
la que se calculó S.
Distribución T de Student
0.45
Dist. Normal
Densidad
0.34
Dist. T
0.23
0.11
0.00
-5
-4
-3
-2
-1
0
1
2
3
4
5
Ejemplo
Si la producción diaria de leche se aproxima a
una distribución normal y se tiene la siguiente
muestra de producciones diarias de leche (en
litros):
67.9 69.3 70.0 74.8 75.3 69.6 67.3 65.8 70.5
¿Cuál es la probabilidad que una variable T, con los
grados de libertad apropiados para este problema,
exceda el valor de T obtenido a partir de los datos
anteriores, si se supone que la producción promedio
de leche en la población es de 67 litros?
Ejemplo
X  70.0556 lts.
S = 3.1887 lts.
n=9
 = 67 lts.
-5.0
-4.0
-3.0
-2.0
-1.0
0.0
1.0
2.0
3.0
4.0
5.0




X  
70.06  67 


P T 
  P  T  3.19
  P T  2.87   0.01
S




n
9




Ejemplo
Tabla de Cuantiles de la Distribución T

1
2
.
8
9
10
11
.
49
50
0.700 0.725
0.727 0.854
0.617 0.713
.
.
0.546 0.624
0.543 0.621
0.542 0.619
0.540 0.617
.
.
0.528 0.602
0.528 0.602
0.300 0.275
0.750 0.775 0.800 0.825
1.000 1.171 1.376 1.632
0.816 0.931 1.061 1.210
.
.
.
.
0.706 0.794 0.889 0.993
0.703 0.790 0.883 0.986
0.700 0.786 0.879 0.980
0.697 0.783 0.876 0.976
.
.
.
.
0.680 0.762 0.849 0.944
0.679 0.761 0.849 0.943
0.250 0.225 0.200 0.175
0.850 0.875 0.900 0.925
1.963 2.414 3.078 4.165
1.386 1.604 1.886 2.282
.
.
.
.
1.108 1.240 1.397 1.592
1.100 1.230 1.383 1.574
1.093 1.221 1.372 1.559
1.088 1.214 1.363 1.548
.
.
.
.
1.048 1.164 1.299 1.462
1.047 1.164 1.299 1.462
0.150 0.125 0.100 0.075
0.950 0.975 0.990 0.995
6.314 12.71 31.82 63.66
2.920 4.303 6.965 9.925
.
.
.
.
1.860 2.306 2.896 3.355
1.833 2.262 2.821 3.250
1.812 2.228 2.764 3.169
1.796 2.201 2.718 3.106
.
.
.
.
1.677 2.010 2.405 2.680
1.676 2.009 2.403 2.678
0.050 0.025 0.010 0.005
Distribución asociada al estadístico
varianza muestral
Espacio muestral generado por muestreo aleatorio
con muestras de tamaño n=2, con reposición, de una
población de cuatro plantas de zapallo.
Muestra
Plantas
Nº de
frutos
Varianza
Muestra
Plantas
Nº de
frutos
Varianza
1
P1P1
3-3
0.0
9
P3P1
1-3
2.0
2
P1P2
3-2
0.5
10
P3P2
1-2
0.5
3
P1P3
3-1
2.0
11
P3P3
1-1
0.0
4
P1P4
3-4
0.5
12
P3P4
1-4
4.5
5
P2P1
2-3
0.5
13
P4P1
4-3
0.5
6
P2P2
2-2
0.0
14
P4P2
4-2
2.0
7
P2P3
2-1
0.5
15
P4P3
4-1
4.5
8
P2P4
2-4
2.0
16
P4P4
4-4
0.0
Distribución del estadístico
varianza muestral
Varianza Muestral
P  S 2  s2 
0
4.(1/16) = 0.25
0.5
6.(1/16) = 0.375
2
4.(1/16) = 0.25
4.5
2.(1/16) = 0.125
Valores que asume la variable aleatoria
“varianza muestral del número de frutos” en
muestras de tamaño n=2 y sus densidades.
Distribución del estadístico
varianza muestral
0.40
0.30
F(s2)
0.20
0.10
0.00
0.00
1.50
3.00
S2
4.50
Función de densidad de la
variable aleatoria varianza
muestral del número de
frutos.
Distribución de las varianzas de
muestras con n=3
0.54
Estadística descriptiva
Variable
Media
Var(n)
VarianzaC(n=3) 44.67
1977.49
frecuencia relativa
0.40
0.27
0.13
0.00
0.0
56.2
28.1
112.4
84.3
168.5
140.4
VarianzaC(n=3)
224.7
196.6
252.8
Distribución de las varianzas de
muestras con n=5
0.24
Estadística descriptiva
Variable
Media
Var(n)
VarianzaC(n=5) 44.67
873.27
frecuencia relativa
0.18
0.12
0.06
0.00
0.0
25.2
12.6
50.5
37.9
75.7
63.1
88.4
VarianzaC(n=5)
101.0
126.2
113.6
138.8
Distribución Chi cuadrado
Para calcular probabilidades
asociadas a varianzas muestrales
se utiliza la distribución de la
variable:
S (n  1)
2

2

2
n 1
Grados
de
libertad
Distribución Chi cuadrado
0.48
2 gl
Densidad
0.36
4 gl
0.24
6 gl
0.12
0.00
0
4
8
11
15
Ejemplo
Un fitomejorador desea controlar la
variabilidad de los brotes comerciales de
espárrago, ya que las normas de embalaje
establecen una longitud máxima de cajas de
23.5 cm.
La variable largo del brote de espárrago
sigue una distribución normal, con una
varianza de 2.25 cm2.
Ejemplo
¿Cuál es la probabilidad que
una muestra de 5 cajas,
tenga una desviación
estándar que exceda a 2 cm,
si la verdadera desviación
estándar es de 1.5 cm?
0.0
2.0
4.0
6.0
8.1 10.1 12.1 14.1 16.1 18.1
2

S
 n  1   2 4  4  
2
2
P  S  2  P  S  4  P   
  P   

2

2.25 




 P   2  7.11  1  P   2  7.11  1  0.85  0.15
Ejemplo
Tabla de Cuantiles de la Distribución Chi-Cuadrado

0.010 0.025
0.05
0.10
0.15
0.20
0.25
0.30
0.35
0.40
0.45
0.50
1 0.0002 0.0010 0.0039 0.0158 0.0358 0.0642 0.1015 0.1485 0.2059 0.2750 0.3573 0.4549
.
.
.
.
.
.
.
.
.
.
.
.
.
4 0.2971 0.4844 0.7107 1.0636 1.3665 1.6488 1.9226 2.1947 2.4701 2.7528 3.0469 3.3567
.
.
.
.
.
.
.
.
.
.
.
.
.
49 28.9407 31.5549 33.9303 36.8182 38.8588 40.5344 42.0104 43.3664 44.6491 45.8895 47.1114 48.3350
0.55
0.60
0.65
0.70
0.75
0.80
0.85
0.90
0.95
0.975
0.99
0.999

1 0.5707 0.7083 0.8735 1.0742 1.3233 1.6424 2.0723 2.7055 3.8415 5.0239 6.6349 10.8278
.
.
.
.
.
.
.
.
.
.
.
.
.
4 3.6871 4.0446 4.4377 4.8784 5.3853 5.9886 6.7449 7.7794 9.4877 11.1433 13.2767 18.4670
.
.
.
.
.
.
.
.
.
.
.
.
.
49 49.5796 50.8659 52.2186 53.6697 55.2653 57.0786 59.2411 62.0375 66.3386 70.2224 74.9194 85.3511