Download Tema 13: Distribución muestral de un estadístico

Document related concepts
no text concepts found
Transcript
Análisis de Datos I
Esquema del Tema 13
Tema 13: Distribución muestral de un
estadístico
1. INTRODUCCIÓN
2. MUESTREO ALEATORIO SIMPLE
3. DISTRIBUCIÓN MUESTRAL DE UN ESTADÍSTICO
4. DISTRIBUCIÓN MUESTRAL DE LA MEDIA
Caso 1: La variable de partida es normal
Caso 2: La variable de partida no es normal
5. EJERCICIOS
__________________
Bibliografía: Tema 13 (pág. 347-358) y Tabla II
del apéndice final
Ejercicios recomendados: 1, 2, 3, 4, 5 y 6
Carmen Ximénez
1
Análisis de Datos I
Esquema del Tema 13
1. INTRODUCCIÓN
La estadística inferencial trata sobre las inferencias con respecto a poblaciones (sus
parámetros,  y 2) a partir de la información contenida en las muestras (los
estadísticos, X y S2).
Para poder llevar a cabo esas inferencias es necesario conocer la relación que se
establece entre estadísticos y parámetros. El concepto que permite poner en relación
ambas cosas es “La distribución muestral de un estadístico”.
2. MUESTREO ALEATORIO SIMPLE, m.a.s.
Ejemplo: Tenemos una población con los siguientes elementos: X = {1, 2 y 3}.
Donde  = 2 2 = 0,67.
Se extraen muestras de N = 2 elementos:
Con reposición, tenemos 9 posibles muestras:
(1, 1); (1, 2); (1, 3); (2, 1); (2, 2); (2, 3); (3, 1); (3, 2); y (3, 3).
Sin reposición, tenemos 6 posibles muestras:
(1, 2); (1, 3); (2, 1); (2, 3); (3, 1); y (3, 2).
En cada una de las muestras pueden calcularse los correspondientes estadísticos
descriptivos:
Por ejemplo, con reposición:
Las medias serían:
1; 1,5; 2; 1,5; 2; 2,5; 2; 2,5; y 3, respectivamente.
Las varianzas serían: 0; 0,25; 1; 0,25; 0; 0,25; 1; 0,25; y 0, respectivamente.
Por tanto, los estadísticos descriptivos son variables aleatorias que pueden adoptar diferentes valores y que tienen su propia distribución de probabilidad. 3. DISTRIBUCIÓN MUESTRAL DE UN ESTADÍSTICO
En el ejemplo vemos que X puede tomar 5 posibles valores y que la probabilidad que
corresponde a cada uno de ellos (f ( X i), su distribución) es:
X
i
f ( X i)
1
1,5
2
2,5
3
Total:
1/ 9
2/ 9
3/ 9
2/ 9
1/ 9
1
Donde E( X ) =  X i · f ( X i ) = (1)(1/ 9) + (1,5)(2/ 9) + … + (3)(1/ 9) = 2
 2 ( X ) =  [ X i 2 · f ( X i )] – [ E( X )] 2 = [(12)(1/ 9) + … + (32)(1/ 9)] - 22 = 0,33
No es necesario construir la distribución de un estadístico (p.e. de X ) en todos los
casos ya que cada estadístico tiene su propia distribución muestral conocida.
En este tema nos ocuparemos de la distribución muestral de la media: X .
Carmen Ximénez
2
Análisis de Datos I
Esquema del Tema 13
4. DISTRIBUCIÓN MUESTRAL DE LA MEDIA
CASO 1: La variable de partida es normal: X N (; )
1. Valor esperado: E( X )  
2
2. Varianza:  ( X ) 
2
N
;
donde  ( X ) 

N
es el error típico de la media
El valor de N afecta al error típico de la media, ( X )
Por ejemplo, si
Con N1 = 4
X  N (50; 20)

 ( X )  20/ 4  10
Con N2 = 25 
 ( X )  20/ 25  5
Con N3 = 100 
 ( X )  20/ 100  2
3. Modelo de distribución: X  N ( ;
30

N
50
70
).
Para obtener valores en tablas hay que convertir las puntuaciones X i en típicas. Es decir:
z
Xi 
 / N
N0; 1
CASO 2. La variable de partida no es Normal
Cuando la variable X con media  y desviación típica , no sigue un modelo de
distribución conocido, la distribución muestral de X se parece más a la de la distribución
normal a medida que aumenta el tamaño de las muestras sobre las que se calcula.
Teorema del Límite Central, TLC
Independientemente de cómo sea la distribución de X, la distribución muestral de X
tiende a la normal cuando el tamaño de las muestras tiende a infinito.
Mediante este teorema pueden calcularse probabilidades asociadas a los valores de las medias
cuando se desconoce la forma de la distribución muestral de partida, siempre y cuando las
muestras sean lo suficientemente grandes (algunos autores plantean que el parecido con la
distribución normal empieza a ocurrir desde tamaños muestrales de 30 observaciones).
Carmen Ximénez
3
Análisis de Datos I
Esquema del Tema 13
5. EJERCICIOS
EJERCICIO 1 (resuelto)
El CI de los alumnos de un centro especial de se distribuye normalmente con media 80 y
desviación típica 10. Si extraemos una muestra aleatoria simple de 25 alumnos:
X  N(80; 10)
X  N(80; 10
25 )
a) Si se extrae un sujeto al azar, ¿Cuál es la probabilidad de que obtenga como mínimo una
puntuación en CI de 75?
X 
75 - 80
P (X 75) = 1 - P (z 
) = 1 - P (z 
) = 1 - P (z -0,50) = 0,6915

10
b) ¿Cuál es la probabilidad de que su media aritmética sea mayor de 75?
X 
75 - 80
P ( X 75) = 1 - P (z 
) = 1 - P (z 
) = 1 - P (z -2,50) = 0,9938
10/5
/ N
c) ¿Cuál es la probabilidad de que su media aritmética sea como máximo 83?
X 
83 - 80
P ( X 83) = P (z 
) = P (z 
) = P (z 1,50) = 0,9332
10/5
/ N
d) ¿Qué valor debería tomar la media aritmética para que la probabilidad de obtenerlo en esa
muestra sea como máximo 0,85?
X i  80
P ( X  X i) = 0,85 …. z 0,85 = 1,04 …. 1,04 
 X i  82, 08 
10 / 5
EJERCICIO 2
Sabemos que los pesos de los españoles tienen una media de 65 kilos y una desviación típica
de 7. Si extraemos una m.a.s. de 36 sujetos y calculamos la media:
1) ¿Cuál es la probabilidad de que la media supere el valor 62,5?
2) ¿Cuál es la probabilidad de que la media quede por debajo de 67?
3) ¿Cuál es la probabilidad de que la media quede comprendida entre 62 y 64?
Solución: Como N = 36 X  N (65; 7 / 6) . 1) 0,9838; 2) 0,9564; 3) 0,1898.
EJERCICIO 3
La variable X se distribuye normalmente con media 50 y desviación típica 12. Si extraemos
una muestra aleatoria simple de 16 alumnos:
1) Si se extrae un sujeto al azar, ¿Cuál es la probabilidad de que obtenga al menos una
puntuación de 45?
2) ¿Cuál es la probabilidad de que su media aritmética sea menor de 58?
3) ¿Cuál es la probabilidad de que su media aritmética sea como mínimo 45?
4) ¿Qué tamaño tendría que tener la muestra para que la probabilidad de encontrar medias
superiores a 52 fuese 0,2578?
Solución: 1) 0,6628; 2) 0,9962; 3) 0,9525; 4) n = 15 sujetos.
Carmen Ximénez
4