Download se rechaza la hipótesis nula ya que

Document related concepts

Prueba t de Student wikipedia , lookup

Contraste de hipótesis wikipedia , lookup

Poder estadístico wikipedia , lookup

Prueba de Levene wikipedia , lookup

Prueba de Bartlett wikipedia , lookup

Transcript
COMPROBACION DE
HIPOTESIS, UN PROMEDIO
Mario Briones L.
MV, MSc
2005
Nuevas ideas en Medicina
Veterinaria


Hay ciertas razas de perros en las
cuales la presentación de glaucoma es
más común.
Implicancias: ???
Nuevas ideas en Medicina
Veterinaria


Se pueden utilizar otras sustancias
antifúngicas, aparte del verde malaquita
para controlar los hongos en los
salmones.
Implicancias: ???
Beyond science
According to Arthur C. Clarke, there are four stages in
the acceptance of any new idea. They are:"It's nonsense."
"It may be real but it's not important“
"I always said it was important"
"I thought of it first!“
For the past two hundred years, science has, for the
most part, been stuck permanently in stage one,
venturing to stage two only when compelled to by
undeniable evidence.
"Stones cannot fall from the sky, because there are no
stones in the sky," Antoine Lavoisier, father of modern
chemistry, told his fellow members of the Academie des
Sciences in the 1790s.
Fusion is the process taking place in the Sun's core where,
at temperatures of millions of degrees, hydrogen atoms
are compressed together by elemental forces to form
helium and a massive outpouring of energy in the
thermonuclear reaction of the hydrogen bomb.
It is not difficult, then, to imagine how people who have
invested their talent and their lives in the quest to tame
such forces are likely to react when told that fusion is
possible at room temperature, and in a jam jar.
The scientific world was astounded when, in March 1989,
Professor Martin Fleischmann of Southampton University
and his former student, Professor Stanley Pons of the
University of Utah, held a press conference at which they
jointly announced the discovery of 'cold fusion' – the
production of usable amounts of energy by what seemed
to be a nuclear process occurring in a jar of water at room
temperature.
Fleischmann and Pons told an incredulous press conference
that they had passed an electric current through a pair of
electrodes made of precious metals -- one platinum, the
other palladium -- immersed in a glass jar of heavy water
in which was dissolved some lithium salts. This very simple
set-up was claimed to produce heat energy between four
and ten times greater than the electrical energy they were
putting in. No purely chemical reaction could produce a
result of such magnitude so, said the scientists, it must be
nuclear fusion.
Cold Fusion
Pons and
Fleischmann
Hipótesis Hipótesis
verdadera
falsa
Se acepta
correcto
Error tipo I
a=0.05 ó 0.01
significancia
Se rechaza Error tipo II correcto
b= 0.2 ó menos
poder de prueba= 1-b
PRINCIPALES SUPUESTOS EN LAS
PRUEBAS DE HIPOTESIS.
- NORMALIDAD DE LA VARIABLE
- CONOCIMIENTO DE LA VARIANZA
- COLAS DE LA HIPÓTESIS
Normalidad de la variable

Significa suponer que la muestra se ha
tomado desde una población con
distribución normal.
Conocimiento de la varianza

Significa elegir entre los supuestos:


La muestra es pequeña y s2 es sólo un
estimador de s2.
La muestra es lo suficientemente grande
para considerar que se conoce s2 (o bien
se conoce por antecedentes previos)
Colas de la hipótesis


Significa definir, a priori, la desviación
desde la hipótesis.
Por ejemplo, no es lo mismo la idea: “la
estatura de los hombres es diferente de
la estatura de las mujeres” que la idea
“la estatura de los hombres es mayor
que la de las mujeres” (dos y una cola,
respectivamente).
Comprobación de hipótesis acerca de la
media de la muestra de una población
Caso I: Supuestos
- Población con distribución normal
- Desviación estándar conocida
- Bilateral
Población
Promedio de peso :
m
Muestra
Promedio de peso:
x
Suponga que se toma
una muestra y conocemos
la distribución de la variable
s
s/n
X
m
La curva grande es la distribución de la variable,
La curva más pequeña es la distribución
del estimador.
X
m
Existen por lo tanto, probabilidades determinadas
por el área bajo la curva normal, de que nuestro
estimador esté reflejando a m
La hipótesis más sencilla:

Se toma una muestra y se obtiene un
promedio: Pertenecerá ese promedio a
una población donde la media tiene un
valor determinado y conocido???
Respuesta intuitiva (no
estadística)

Si no es igual al promedio, el estimador
no podría estar representándolo
Respuesta estadística

Todos los estimadores tienen error, por
lo tanto, este promedio de la muestra,
que no es exactamente igual al
postulado (hipotetizado), podría ser un
estimador de ese valor de m, con un
margen de error (probabilidad de error,
cuyo máximo permitido, alfa, podría ser
0.05)
Definición de la probabilidad


Por ejemplo, se desea tener un 95% de
certeza de que un promedio obtenido
en una muestra, refleja un valor de m
determinado
Cuantas unidades de dispersión (error
estándar) habrá que cubrir hacia ambos
lados del promedio para tener esta
certeza?
A=1
a/2=0.025
-1.96
Región de rechazo
a/2=0.025
0.95
0
1.96
Región de aceptación
z
Región de rechazo
Si se define una probabilidad de 95%, el valor
de z que pone límite a esta probabilidad es ±1.96
Ejemplo y pasos de la prueba de hipótesis,
para un caso “real”.
Varios investigadores están interesados en la
concentración media de una enzima en una población.
Los antecedentes previos, por datos obtenidos en otras
poblaciones, similares a la de interés, pero con
diferencias fisiológicas conocidas,
indican que
esta concentración debería ser diferente.
Supóngase que se plantea la siguiente pregunta:
¿Puede concluirse que la
concentración media de la enzima en esta
población es distinta de 25 ?
(no importa la unidad de medición en este caso).
Se podrá concluir que la concentración media de la
Enzima es distinta de 25 si puede rechazarse la
hipótesis nula de que la media es igual a 25.
Porque deben existir dos
hipótesis??


Para delimitar las probabilidades a
verdadero y falso.
Hipótesis Nula: representa lo conocido,
la ausencia de diferencia: ej. Antes y
después de apretar el interruptor de
experimento de Pons y Fleishmann: no
existe la fusión en frío.
Porqué deben existir dos
hipótesis??


Hipótesis Alterna: representa el cambio,
lo diferente a lo conocido, lo nuevo.
La hipótesis que se debe probar como
falsa es la nula, de modo que sólo
pueda efectuarse cuando se ha
obtenido evidencia contundente de que
es es falsa. (Por ejemplo, al medir una
considerable cantidad de radiación con
el experimento de P & F)
Porque debe existir dos
hipótesis??

Solamente cuando se ha demostrado
que la hipótesis nula es falsa, con una
probabilidad inferior a un límite alfa (ej.
0.05 ó 5%) de estar equivocado, se
podrá tomar considerar que la hipótesis
alterna es verdadera, precisamente por
ser lo contrario de la hipótesis nula.
1. Datos: Los datos son las mediciones de la enzima
hechas en una muestra de 10 individuos de la
población de interés. El promedio es 21 y la
varianza es 45.
2. Supuestos: Se supone que la muestra proviene
de una población de concentraciones de la enzima
con distribución normal y una varianza conocida
de s2=45.
3. Hipótesis: la hipótesis que debe probarse,
o hipótesis nula, es que la concentración media
de la enzima en la población es igual a 25. La
hipótesis alternativa es que la concentración
media de la enzima no es igual a 25
Puede expresarse de la siguiente manera:
H0: m = 25
HA: m 25
4. Estadística de prueba: Dado que se está
poniendo a prueba una hipótesis acerca de la
media de una población, se supone que la
población está distribuida normalmente y se
conoce la varianza, la estadística de prueba es:
Z
X  m0
s
n
(Lo que esta expresión dice es que z medirá en unidades
estandarizadas de error estándar, la distancia que existe
entre la media de la muestra y la media de la población)
5. Distribución de la estadística de prueba:
Si la hipótesis nula es verdadera, entonces la
estadística de prueba tiene distribución
normal con media cero y varianza 1.
Explicación: la estadística de prueba es una
distancia (entre lo observado y lo hipotetizado),
dividido por la dispersión de esa distancia. Si la
Ho es verdadera, entonces la fluctuación de este
indice está centrada en cero distancia desde
m.
6. Regla de decisión:
A=1
a/2=0.025
-1.96
Región de rechazo
a/2=0.025
0.95
0
1.96
Región de aceptación
z
Región de rechazo
Se rechazará la hipótesis nula si el valor de z
calculado es menor que -1.96 o mayor que 1.96
7. Estadística de prueba calculada:
21  25  4
z

 1.88
6.7
2.12
10
8. Decisión estadística: no se puede rechazar la
hipótesis nula ya que -1.88 está en el área de
aceptación.
9. Se concluye que m puede ser igual a 25. En otras
palabras, la muestra que tiene un promedio de 21
ha sido tomada, con un 95% de certeza, en una
población donde la media es 25.
Comprobación de hipótesis acerca de la
media de la muestra de una población
Caso II: Supuestos
- Población con distribución normal
- Desviación estándar conocida
- Unilateral
Con los datos del ejemplo anterior
en lugar de plantear m
 25, plantear m< 25
Se puede contestar si se rechaza la hipótesis nula
m 25
1. Datos: ejemplo anterior
2. Supuestos: ejemplo anterior
3. Hipótesis
H0: m
25
HA: m<
25
4. Estadística de prueba
X-m0
z= -------s/n
5. Distribución de la estadística de prueba: ejemplo anterior
6. Regla de decisión:
sea a=0.05
dónde ubicar la región de rechazo?
Valores pequeños rechazan la hipótesis nula.
La región de rechazo deberá estar en la cola inferior
de la distribución.
Toda la probabilidad de a estará en esa cola.
25
A=1
a=0.05
0.95
-1.64
0
Región de aceptación
z
Región de rechazo
Regla: se rechaza H0 si el valor calculado de la estadística de
prueba es menor o igual que -1.645
7. Estadística de prueba calculada
21 - 25
z= -------- = -1.88
45/10
8. Decisión estadística: se rechaza la hipótesis nula
ya que -1.88 < -1.645
9. Conclusión: La media verdadera es menor a 25
Esto significa que hay casos en los cuales, el cambio
en la hipótesis puede rechazar una hipótesis nula unilateral que
ha sido aceptada como bilateral.
Comprobación de hipótesis acerca de la
media de la muestra de una población
Caso III: supuestos
- Población con distribución normal
- Desviación estándar desconocida
- Bilateral
Se midieron las concentraciones de amilasa en suero de una muestra
aleatoria de 15 personas aparentemente sanas.
Se quiere saber si se puede concluir que la media de la población
de la cual se obtuvo la muestra es distinta de 120.
1. Datos: Determinaciones de amilasa en suero de 15 personas
aparentemente sanas. La media y la desviación estándar
calculadas a partir de la muestra son, respectivamente,
96 y 35 unidades/100 ml.
2. Supuestos: Las 15 determinaciones constituyen una muestra
aleatoria de una población de determinaciones con
distribución normal. Se desconoce la varianza de la
población.
3. Hipótesis:
H0: m = 120
HA: m  120
4. Estadística de prueba:
X - m0
t = ----------s/n
5. Distribución de la estadística de prueba: está distribuida como
la t de student con n-1 grados de libertad, si la hipótesis
nula es verdadera.
6. Regla de decisión:
sea a= 0.05
como la prueba es bilateral, se ubica a/2= 0.025
en cada cola. Los grados de libertad son 14.
Los valores de t son 2.1448 y -2.1448
rechazo
rechazo
-2.14
0
2.14
aceptación
t
Regla: se rechaza H0 si la t calculada es mayor o igual a 2.1448
o menor o igual que -2.1448
Estadística de prueba calculada:
96 - 120 -24
t= ----------- = ------= -2.65
35/15
9.04
8. Decisión estadística: Se rechaza H0 ya que -2.65 cae en la
región de rechazo.
9. Conclusión: La conclusión, basada en estos datos, es que la media
de la población de la cual provino esta muestra no es 120.