Download Distribución de la media muestral

Document related concepts

Estadístico muestral wikipedia , lookup

Prueba t de Student wikipedia , lookup

Corrección de Bessel wikipedia , lookup

Distribución t de Student wikipedia , lookup

Error estándar wikipedia , lookup

Transcript
Introducción
Media y varianza poblacional
Sea
X  x1 , x2 ,..., xN  una variable aleatoria discreta.
Se definen la media y la varianza poblacional de X denotadas por  y 2
respectivamente, como
1

N
N
 xi
i 1
y
1
2 
N
N
2


x


 i
i 1
donde N es el tamaño de la población.
Nótese que para calcular estos valores es necesario medir a todos los
individuos de la población
Introducción
Definición: Un parámetro es un valor calculado a partir de todos los valores
de cierta variable en una población. Un parámetro es un valor constante y
caracteriza a la población. (ej.  y 2 ).
Los valores de los parámetros de una población son generalmente
desconocidos y determinarlos (estimarlos) es el propósito de la inferencia
estadística.
Definición: Una estadística es un valor calculado a partir de los datos de
una muestra. Una estadística es entonces una variable aleatoria ya que
toma diferente valores para cada muestra. (ej. Media, mediana, moda,
varianza, DAM, S de una muestra).
Definición: La distribución de todos los valores posibles que puede tomar
alguna estadística, calculados a partir de muestras del mismo tamaño
extraídas al azar de la misma población, se conoce como distribución
muestral de esa estadística.
Introducción
La distribución muestral de una estadística puede construirse
empíricamente cuando se obtiene de una población finita, discreta.
Para construir una distribución muestral se siguen los siguientes pasos:
1. De una población finita de tamaño N, se extraen al azar todas las
muestras posibles de tamaño n, con reemplazo.
2. Se calcula la estadística de interés para cada muestra
3. Se construye la tabla de frecuencias, la cual es la función de
distribución del estadístico correspondiente.
Distribución de la media muestral
Para ilustrar este procedimiento construiremos la función de distribución
de la media muestral de una pequeña población conformada por el
número de huevos de 5 tortugas Laud que desovaron en cierta playa.
El número de huevos por tortuga fue de 68 70 72 74 y 76
El número de muestras posibles de tamaño 2 con sustitución es de 25
(68,68), (68,70), (68,72), (68,74), (68,76),
(70,68), (70,70), (70,72), (70,74), (70,76),
(72,68), (72,70), (72,72), (72,74), (72,76),
(74,68), (74,70), (74,72), (74,74), (74,76),
(76,68), (76,70), (76,72), (76,74), (76,76)
Distribución de la media muestral
x
68
70
72
74
68
68
69
70
71
72
70
69
70
71
72
73
72
70
71
72
73
74
74
71
72
73
74
75
76
72
73
74
75
76
Tabla de frecuencias
76
0.2
0.16
0.12
0.08
0.04
0
68
69
70
71
72
73
74
75
76
x
f
68
1
69
70
71
72
73
74
2
3
4
5
4
3
75
76
2
1
~
f
0.04
0.08
0.12
0.16
0.20
0.16
0.12
0.08
0.04
Distribución de la media muestral
La media de la población es:
68  70  72  74  76 360


 72
5
5
La varianza de la población es:
2
2
2
2
2










68

72

70

72

72

72

74

72

76

72
2 
5
16  4  0  4  16
40

8
5
5

Distribución de la media muestral
Calcúlese ahora la media de todas las medias:
68(1)  69(2)  70(3)  71(4)  72(5)  73(4)  74(3)  75(2)  76(1)
x 

25
68  138  210  284  360  292  222  150  76 1800

 72
25
25
Por lo tanto
x  
Distribución de la media muestral
Calcúlese ahora la varianza de la media muestral
2
2
2
2
2














68

72
(
1
)

69

72
2

70

72
3

71

72
(
4
)

72

72
(5)
2 

x
25
73  72 2 (4)  74  72 2 (3)  75  72 2 2  76  72 2 1 
25
16  18  12  4  0  4  12  18  16 100

4
25
25
Por lo tanto
 
2
x

2
n
Distribución de la media muestral
Este resultado puede generalizarse en el siguiente teorema:
Teorema del Límite Central
Sea X una variable aleatoria con cualquier distribución, con media  y
varianza 2. La función de distribución de la media muestral es
aproximadamente normal con media  y desviación estándar 
Cuando el tamaño de la muestra (n) es grande.
n
Distribución de la media muestral
0.95
 2

n
x1 x3

x4 x2
2

n
Distribución de la media muestral
Cuando la distribución de X es normal la distribución de la media
muestral es normal con media  y desviación estándar 
Sin importar el tamaño de la muestra.
n
¿Que tan grande debe ser el tamaño de la muestra para que la
distribución de la media muestral sea aproximadamente normal, cuando
proviene de una población con distribución diferente a la normal?
El tamaño de la muestra depende del grado de no normalidad de la
población. Sin embargo, una regla empírica señala que una muestra de
tamaño 30 es suficiente, en la mayoría de las situaciones, para aplicar el
teorema del límite central.
Distribución de la media muestral
Ejemplo:
Se sabe que el peso de los pargos se distribuye aproximadamente normal
con media 2.4 kg. y desviación estándar de 0.6 kg. Si se toma una
muestra al azar de 10 pargos, calcule la probabilidad de que tengan un
peso medio entre 2.56 y 2.74.
La población es muy grande comparada con el tamaño de la muestra y se
sabe que:
  2.4 y   0.6




0.34 
2
.
56

2
.
4
2
.
74

2
.
4
 0.16


P

z

P

z




P(2.56  x  2.74 ) 
0.6
0.6 

0.19 
 0.19


10
10


Entonces:
P0.84  z  1.78  P( z  1.78)  P( z  0.84 ) 0.4625  0.2995  0.1629