Download Estadística de prueba - Departamento de Matemática Aplicada y

Document related concepts

Prueba de Levene wikipedia , lookup

Prueba t de Student wikipedia , lookup

Prueba de Bartlett wikipedia , lookup

Estadístico muestral wikipedia , lookup

Distribución t de Student wikipedia , lookup

Transcript
Universidad de Chile
Facultad de Ciencias Químicas y Farmacéuticas
Curso de Elementos de Estadística
Prof. María Pilar Sánchez
Clase Nº10:
Pruebas para una y dos muestras.
Otoño, 2003
Pruebas de hipótesis para la media de
una población
• Cuando se quiere estudiar la hipótesis de una
media de una población hay tres posibilidades:
a.- En una población normal con varianza conocida.
b.- En una población normal con varianza desconocida.
c.- En una población que no presenta distribución normal.
• Es posible según algunos autores aplicar la teoría
aún
cuando
las
poblaciones
sólo
estén
distribuídas en forma normal siempre y cuando la
desviación de la normalidad sea moderada.
Ejemplo 1: Muestreo en población normal
y varianza conocida.
Cuando se extraen datos de una población normal
con varianza conocida la estadística de prueba es:
x  0
z
/ n
Ej:Una profesora está interesada en conocer la edad
media de una cierta población y se pregunta si la
población media de esa población es diferente de 30
años. Para ello dispone de una muestra aleatoria
simple de 10 alumnos que se extrajo de la población
de interés. La media de la muestra fue de 27 años y
se conoce que la varianza de la población es de 20.
• Datos:
x  27,  
• Suposiciones:
20 ,   30, n  10
La muestra proviene de una
distribución normal.
Ejemplo 1: continuación…
• Hipótesis: H o : μ  30 y H a : μ  30
• Distribución de la estadística de prueba: se sabe
•
•
que tiene distribución normal con media=0 y
varianza de 1.
Regla de decisión: Ho se rechaza si zcalc cae en la
zona de rechazo, utilizando =0.05 (error de tipo
I) que está dividida en dos partes iguales
(/2=0.025).
Valor crítico de la estadística de prueba: Se busca
en la tabla z, y nos preguntamos que valor de z
tiene una probabilidad igual a 0.025 y es valor es
1.96.
Ejemplo 1: continuación…
• Cálculo de la estadística de prueba:
27  30
3
z

 2.12
20 / 10 1.4142
• Decisión estadística: Se puede rechazar Ho
•
•
porque -2.12 está en la región de rechazo con un
nivel de significación de =0.05.
Conclusión: Se concluye que  no igual a 30.
Valor de p: Busco en la tabla que valor de
probabilidad tiene -2.12 y da 0.017 y en ejemplo
debemos sumar dos veces por las dos colas y se
dice que la hipótesis se rechaza con un valor de p
igual a 0.0340.
Ejemplo 2: El mismo ejemplo pero con
una prueba de una cola.
• Datos y suposiciones las mismas anteriores.
• Hipótesis: H o : μ  30 y H a : μ  30
• Cálculo de la estadística de prueba:
x  0 27  30
z

 2.12
/ n
20 / 10
• Regla de decisión: Si el zcalc cae en la zona de
•
rechazo se rechaza Ho. Como es una prueba de una
cola o unilateral se busca en la tabla que valor de z
tiene una probabilidad de 0.05 y es -1.645.
Decisión estadística y Conclusión: Como -2.12 es
menor que -1.645 se rechaza Ho y se concluye que
la media de la población es menor de 30 años.
Ejemplo 3: Muestreo a partir de una
población normal y varianza desconocida.
Cuando se desconoce la varianza de la población la
estadística de prueba es :
x  0
t 
s/ n
Ej 3: Se tiene una muestra de 14 varones sanos con
diferentes IMC (peso/est2) para probar una técnica
de medición para estudios metabólicos. Se quire
saber si es posible concluir que la media del IMC no
es 35.
Individuo 1 2 3 4 5 6 7 8 9 10 11 12 13 14
•Datos:
IMC 23 25 21 37 39 21 23 24 32 57 23 26 31 45
• Supuestos : Los 14 individuos siguen una
distribución normal.
Ejemplo 3: continuación…
H o : μ  35 y H a : μ  35
• Hipótesis:
• Estadística de prueba: dado que se desconoce la
•
•
•
•
varianza de la población se utiliza s2.
Distribución de la estadística de prueba:
distribuye t de Student con n-1 grados de
libertad.
Regla de decisión: A un nivel de significancia de
=0.05, si el valor de tcalc es mayor que tcrítico
(2.1604) entonces se rechaza H0.
30.5  35
t
 1.58
Cálculo de la estadística de prueba: 10.64 / 14
Decisión estadística: -1.58 cae en la zona de no
rechazo por lo tanto no se rechaza H0.
Pruebas de hipótesis para la diferencia
de medias de dos poblaciones.
Cuando se quieren comparar dos poblaciones se
utiliza con mayor frecuencia cualquiera de las
siguientes hipótesis: H :     0 y H :     0
0
1
2
A
1
2
H 0 : 1   2  0 y H A : 1   2  0
H 0 : 1   2  0 y H A : 1   2  0
Y también se pueden dar tres situaciones :
a.- Cuando el muestreo se hace en poblaciones normales con
varianza conocida.
b.- Cuando el muestreo se efectúa en poblaciones normales y
varianzas desconocidas y
c.- Cuando el muestreo se realiza a partir de poblaciones no
normales.
Ejemplo 4: Muestreo en poblaciones
normales y varianza conocida.
Se quiere saber si hay diferencias en la
concentración de ac.úrico en sujetos normales y con
síndrome de Down. Se realizó la medición en 12
pacientes con Down y su media fue de 4.5 mg/mL y
en 15 individuos sanos cuya media fue de 3.4
mg/mL.
2
2
x

4
.
5
,


1
;
x

3
.
4
,

1
2
2  1.5; n1  12 y n 2  15
• Datos: 1
• Supuestos: los datos provienen de poblaciones
con distribución normal y se conoce su varianza.
• Hipótesis: H :     0 y H :     0
0
1
2
A
1
2
Ejemplo 4: continuación…
• Estadística de prueba: z 
( x1  x2 )  ( 1   2 ) 0
 12
n1

 22
n2

(4.5  3.4)  0
 2.57
1 1.5

12 15
• Distribución de la estadística de prueba: La
•
•
•
estadística de prueba sigue una distribución normal
estándar.
Regla de decisión: H0 se rechaza a menos que el
valor de zcalc entre los valores críticos, si zcrítico está
entre+/-1.96, es decir, que -1.96<zcalc<+1.96.
Decisión estadística: Se rechaza H0 porque
2.57>1.96.
Conclusión: Con los datos disponibles es posible
detectar diferencias estadísticamente significativas
entre las dos concentraciones de ac. Úrico de ambas
poblaciones (Down y normal).
Ejemplo 5: Muestreo en poblaciones
normales y varianza desconocida.
Se quiere saber de la destrucción pulmonar en
fumadores y no fumadores, específicamente si los
fumadores tienen mas daño que los no fumadores.
• Datos:
x f  17 .5, s f  4.4711 , n f  9;
xnf  12 .4, s nf  4.8492 , nnf  16
• Supuestos : la destrucción pulmonar sigue una
distribución normal y no se conocen las varianzas
poblacionales, pero se suponen que son iguales.
Ejemplo 5: continuación…
H 0 :  f   nf , H A :  f   nf
• Hipótesis:
• Estadística de prueba:
( x1  x2 )  ( 1   2 ) 0
t
s
2
p
n1

s
2
p

n2
(17.5  12.4)  0
 2.6573
21.2165 21.2165

16
9
• Y la varianza combinada se calcula como.
(n1  1) s  (n2  1) s
s 
n1  n2  2
2
p
2
1
2
2
Ejemplo 5: continuación…
• Distribución de la estadística de prueba: Sigue una
•
•
•
distribución t de Student con n1+n2 -2 grados de
libertad.
Regla de decisión: Se rechaza H0 a menos que el
tcalc esté entre los valores críticos. En este caso, si
tcrítico es +/-1.7139, luego -1.7139<tcalc<+1.7139.
Decisión estadística: Se rechaza H0 porque
2.6573>1.7139 y cae en la zona de rechazo.
Conclusión: Con los datos experimentales se puede
concluir que si hay más daño pulmonar en los
fumadores que en los no fumadores.
Ejemplo 6: Comparación entre datos
pareados
Para realizar el análisis se utiliza di que es la
diferencia entre pares de observaciones. Se quiere
saber la pérdida de peso (IMC) después del trat. con
una dieta.
• Datos:
Antes
Después
Dif
117,3 111,4 98,4 104,3 105,4 100,4 81,7 89,5 78,2 98,5111111
83,3 85,9 75,8 82,9 82,3 77,7 62,7 69 63,9 75,9444444
-34 -25,5 -22,6 -21,4 -23,1 -22,7 -19 -20,5 -14,3 -22,566667
• Supuestos:
Las diferencias
distribución normal.
di
siguen
una
Ejemplo 6: continuación…
• Hipótesis:
H 0 :  d  0; H A :  d  0
• Distribución de la estadística de prueba: Si H0 es
•
verdadera, la estadística de prueba sigue una
distribución t de Student con n-1 grados de
libertad.
Regla de decisión: A un nivel =0.05, el valor de
tcrítico es 1.8595. Se rechaza H0 si el valor de tcalc
es menor o igual que el valor crítico.
Ejemplo 6: continuación…
• Cálculo de la estadística de prueba:

d
di
n
2
; sd


(d i  d ) 2
n 1

n

di  (

n(n  1)
di ) 2
;t 
d   d0
sd
• Decisión estadística: Se rechaza H0 porque tcalc=•
12.7395 cae en la región de rechazo.
Conclusión: Se puede concluir que el programa de
dieta de bajas calorías es eficaz.