Download s 2 1 +

Document related concepts

Prueba de Levene wikipedia , lookup

Prueba t de Student wikipedia , lookup

Poder estadístico wikipedia , lookup

Prueba de Bartlett wikipedia , lookup

Análisis de la varianza wikipedia , lookup

Transcript
COMPROBACION DE
HIPOTESIS SOBRE DOS
PROMEDIOS
Mario Briones L.
MV, MSc
2005
Comprobación de hipótesis acerca de la
Media de la muestra de una población
Caso I: Supuestos
- Población con distribución normal
- Desviación estándar conocida
- Bilateral
Comprobación de hipótesis acerca de la
Media de la muestra de una población
Cada vez que se comparan dos promedios, se obtiene
una diferencia entre las infinitas diferencias posibles
entre ambos grupos o poblaciones, con muestras
del mismo tamaño.
POBLACION A
POBLACION B
por ejemplo,
si se quiere comparar el peso de dos
poblaciones de peces, sólo podemos
tener acceso a dos
muestras, una de cada población.
Cada una de estas muestras,
como ya sabemos, tiene error. Por lo
tanto, cada vez que
se repitiese la comparación, habría
distintos promedios
y distintas diferencias entre cada una
de las dos poblaciones.
Es importante aquí
comprender que si en
realidad no hay
diferencia entre ambos
promedios
poblacionales (caso en
que la hipótesis nula es
verdadera), entonces la
sumatoria de todas las
diferencias obtenidas en
cada una de las
sucesivas
comparaciones, SERÍA
CERO.
DISTRIBUCION DE LA DIFERENCIA
Si no existe diferencia entre m1 y m2, muestreos sucesivos
darán similar cantidad de valores positivos y negativos a
la expresión x1 -x2, lo que significa que m1-m2=0
Esta es la unidad de
distribución de esta
curva: la varianza
de las diferencias.
s2x1-x2=s21/n1 +s22/n2
mx1-x2=m1 -m2=0
x1-x2
(x1-x2) - (m1-m2)
Z=---------------------------------------s21/n1 + s22/n2
X2-X1
X1
X2
Puede verse que si la hipótesis nula (ausencia de diferencia
entre los promedios) es verdadera, la media real m de la
diferencia es cero, ya que se cancelan todas las diferencias
al estarse estimando con ambas muestras, el mismo valor
X2-X1
X1
X2
Puede verse que si la hipótesis nula (ausencia de diferencia
entre los promedios) es verdadera, la media real m de la
diferencia es cero, ya que se cancelan todas las diferencias
al estarse estimando con ambas muestras, el mismo valor
X2-X1
X2
X1
Todas estas son posibles hipótesis nulas y alternativas
al comparase dos promedios, uni o bilaterales.
H0: m2 - m1= 0
HA: m2 - m1 0
H0: m2 - m1 0
HA: m2 - m1< 0
H0: m2 - m1 0
HA: m2 - m1> 0
Comprobación de hipótesis acerca de dos
medias
Caso I: Supuestos
-Muestreo a partir de poblaciones con
distribución normal
- Desviación estándar conocida
- Bilateral
Un grupo de investigadores desea saber si
los datos que han reunido proporcionan
evidencia suficiente que indique una
diferencia en las concentraciones medias de
ácido úrico en suero entre individuos normales e
individuos con síndrome de Down.
Se dirá que los datos proporcionan dicha
evidencia si puede rechazarse la hipótesis
nula de que las medias
son iguales.
1. Datos: Mediciones de ácido úrico en el suero de 12 individuos
con síndrome de Down y 15 individuos normales. Los
promedios son
Individuos con síndrome de Down, X1= 4.5 mg/100 ml
Individuos normales, X2= 3.4 mg/100 ml
2. Supuestos: Los datos constituyen dos muestras aleatorias
independientes, cada una extraída de una población
con distribución normal y con varianza igual a 1mg/100ml.
3. Hipótesis:
H0: m2 - m1= 0
HA: m2 - m1 0
4. Estadística de prueba:
(X1 - X2) - (m1 - m2)
z=
s 21
s 22
+
n1
n2
5. Distribución de la estadística de prueba:
Normal unitaria, cuando la hipótesis nula es verdadera
6. Regla de decisión:
Sea a= 0.05. Los valores críticos de z son  1.96
Se rechaza H0 a menos que
-1.96 < z calculada < 1.96
7. Estadística de prueba calculada:
(4.5 - 3.4) - 0
z=
1
1
+
12
15
1.1
=
0.39
= 2.82
8. Decisión estadística:
Se rechaza H0 ya que 2.82 > 1.96
9. Conclusión:
En base a los datos disponibles, hay una indicación
de que las medias no son iguales para la concentración
de ácido úrico entre individuos normales e individuos
con síndrome de Down.
Comprobación de hipótesis acerca de dos
medias
Caso I: Supuestos
-Muestreo a partir de poblaciones con
distribución normal
- Desviación estándar desconocida
- Bilateral
Alternativas
varianza desconocida e igual en ambas poblaciones
(n1-1)s21 + (n2-1)s22
s2P=
n1 +n2 -2
varianza desconocida y distinta en ambas poblaciones
Se dispone de valores de perímetro torácico en caballos
chilenos adultos, machos y hembras. Se quiere comprobar
que el sexo del animal influye sobre el perímetro del tórax.
Para esto se debe rechazar la Hipótesis nula de
que el sexo de los caballos no tiene importancia o
no influye sobre el perímetro.
1. Datos:
machos
n1= 38
X1= 171.83 cm
s1= 4 cm
hembras
n2=39
X2= 173.6 cm
s2= 6.15 cm
2. Supuestos:
Los datos constituyen muestras aleatorias INDEPENDIENTES,
se desconoce la varianza pero se supone que es igual en
ambas poblaciones.
(Independientes significa que no existe relación entre los
individuos de una y otra población. Por ej. No son hermanos)
3. Hipótesis:
H0: m2 - m1= 0
HA: m2 - m1 0
4. Estadística de prueba:
(X1 - X2) - (m1 - m2)
t=
s2 P
s2 P
+
n1
n2
5. Distribución de la estadística de prueba
Cuando la hipótesis nula es verdadera, la estadística
de prueba sigue la distribución t de Student con
n1
+
n2 - 2 grados de libertad
6. Regla de decisión
Sea a= 0.05, los valores críticos de t son  1.99
Se rechaza H0 a menos que -1.99<tcalculada<1.99
7. Estadística de prueba calculada:
A) varianza promedio s2P
(n1-1)s21 + (n2-1)s22
s2P=
n1 +n2 -2
(38-1)42 + (39-1)6.152 592 + 1437.3
s2P=
=
= 27.1
38 + 39 -2
75
B) Estadística calculada
(171.83 - 173.6) - 0
t=
-1.77
=
27.1
27.1
+
38
39
= -1.26
1.4
8. Decisión estadística:
No puede rechazarse H0, ya que -1.99 < 1.26 < 1.99
9. Conclusión:
Con los datos disponibles no se puede concluir que
el perímetro torácico de los caballos chilenos, machos
y hembras, sea diferente.
Intervalo de confianza para la media
real de la diferencia en la población
Cuando se conoce la varianza de la población
( x1  x 2 )  E < (m1  m2 ) < ( x1  x2 )  E
E  za / 2
s
2
1
n1

s
2
2
n2
Ej: concentración de ácido úrico en
individuos con y sin sídrome de Down
Individuos con síndrome de Down, X1= 4. 5 mg/100 ml
Individuos normales, X2= 3.4 mg/100 ml
Diferencia observada 4.5 – 3.4= 1.1
1 1
E  1.96

 0.759
12 15
Límite inferior= 1.1–0.759= 0.341
Límite superor= 1.1+0. 759 = 1.859
Con un 95% de confianza la diferencia real entre los promedios de las
concentraciones de ácido úrico de las personas con y sin síndrome de
Down, se encuentra entre 0.341 y 1. 859 mg/100 ml (observe que este
intervalo no incluye al cero).
Intervalo de confianza para la media
real de la diferencia en la población
Cuando no se conoce la varianza de la población
( x1  x 2 )  E < (m1  m2 ) < ( x1  x2 )  E
E  t P / Gl
2
P
2
P
s
s

n1 n2
Ej: perímetro toráxico en
caballos machos y hembras
Perímetro de machos= 171.83 cm
Perímetro de hembras= 173.6 cm
Diferencia observada= 171.83 – 173.6 = –1.77
27.1 27.1
E  1.99

 2.36
38
39
Límite inferior= –1.77–2.36 =–4.13
Límite superior= –1.77+2.36=0.59
Con un 95% de confianza la media real de la
diferencia puede ser cero