Download Hipótesis nula

Document related concepts
no text concepts found
Transcript
Estadística
2010
Clase 4
Maestría en Finanzas
Universidad del CEMA
Profesor: Alberto Landro
Asistente: Julián R. Siri
Clase 4
1. Test de Hipótesis
2. Propiedades de los estimadores
1. Test de Hipótesis
• Problema: Nuevamente tenemos una v.a. X con una FDP conocida f  x;  .
Después de obtener una muestra aleatoria n, obtenemos el estimador puntual,  .
Pero este estimador que obtuvimos, ¿es compatible con algún valor específico
de  bajo hipótesis?
TEST
 H 0 :    *  Hipótesis nula

de
*
H
:



 Hipótesis alternativa

HIPOTESIS
 1
Simples
Compuestas
• Para comprobar la hipótesis nula se utiliza la información muestral para obtener el
estadístico de prueba, un estimador puntual del parámetro desconocido. Entonces
pasamos a averiguar la distribución muestral del estadístico de prueba y utilizar el
método de intervalos de confianza para probar dicha hipótesis nula.
1. Test de Hipótesis
• Un test de hipótesis puede ser entendido como un procedimiento
estadístico simple cuya finalidad es corroborar o desmentir alguna
afirmación que se hace con relación a un parámetro poblacional.
En definitiva, es una regla de decisión sobre determinadas
características de los parámetros poblacionales de nuestro interés.
Hipótesis nula: Suposición inicial sobre el parámetro poblacional
bajo estudio que sirve para iniciar el procedimiento de prueba o
verificación.
Hipótesis alternativa: Hipótesis que se establece como alternativa
de la hipótesis nula; si la H0 es rechazada, entonces será la
hipótesis alternativa la que se tomará tentativamente como válida.
1. Test de Hipótesis
1. Test de Hipótesis
• Nivel de significación de una prueba: Se llama así a la probabilidad
máxima de cometer un error de tipo I. A dicha probabilidad se la
suele denotar con la letra griega α.
• Lo más usual es que al principio uno establezca cuál es el valor de α
que desea aplicar en la prueba. A la probabilidad máxima de cometer
un error de tipo II se le denota con la letra griega β.
1. Test de Hipótesis: Tipos de error al tomar una decisión
Ejemplo 1: Se juzga a un individuo por la presunta comisión de un delito
Los datos pueden refutarla.
• H0: Hipótesis nula
– Es inocente
La que se acepta si las pruebas no
indican lo contrario.
Rechazarla por error tiene graves
consecuencias.
• H1: Hipótesis alternativa
– Es culpable
No debería ser aceptada sin una gran
evidencia a favor.
Rechazarla por error tiene
consecuencias consideradas menos
graves que la anterior.
7
1. Test de Hipótesis: Tipos de error al tomar una decisión
Realidad
Inocente
Inocente
OK
Culpable
Error
Menos grave
Veredicto
Culpable
Error
OK
Muy grave
8
1. Test de Hipótesis: Tipos de error al tomar una decisión
Ejemplo 2: Se cree que un nuevo tratamiento ofrece buenos resultados
Ejemplo 3: Parece que hay una incidencia de enfermedad más alta de lo normal
• H0: Hipótesis nula
No especulativa
– (Ej.1) Es inocente
– (Ej.2) El nuevo tratamiento no tiene efecto
– (Ej.3) No hay nada que destacar
• H1: Hipótesis alternativa
– (Ej.1) Es culpable
– (Ej.2) El nuevo tratamiento es útil
– (Ej. 3) Hay una situación anormal
Especulativa
9
1. Test de Hipótesis
Terminología: el intervalo de confianza que se construye se denomina la región de
aceptación y el o las áreas por fuera de ella se conocen como regiones críticas,
o de rechazo. Por último, los límites inferior y superior de la región de
aceptación se denominan valores críticos.
ERRORES TIPO I y TIPO II
Estado de la naturaleza
Decisión
H0 es verdadera
H0 es falsa
Rechazar
Error tipo I
No hay error
No rechazar
No hay error
Error tipo II
Deseable: minimizar los errores tipo I y tipo II. Pero, para cualquier tamaño de
muestra dado, no es posible minimizar ambos simultáneamente. Es preferible
tener baja probabilidad de cometer un error de tipo I y luego tratar de minimizar
al máximo la probabilidad de incurrir en un error de tipo II.
1. Test de Hipótesis
• Un test de hipótesis se llama bilateral (o de dos colas) cuando la
hipótesis alternativa involucra el signo “≠” para el parámetro que se
somete a prueba.
Región de aceptación
1-
- z/2
+ z/2
1. Test de Hipótesis
• Un test de hipótesis se llama unilateral (o de una cola) cuando la
hipótesis alternativa involucra el signo “<” (test unilateral izquierdo)
o bien el signo “>” (test unilateral derecho).
Unilateral izquierdo
H1: m < 40
Unilateral derecho
H1: m > 40
1. Test de Hipótesis: Método del intervalo de confianza
Dado que tenemos a X i N  m ,  2  , podemos inferir que el estadístico de prueba
está distribuido como
X
N  m , 2 n 
Entonces, si conocemos la distribución de probabilidades de X , ¿cómo establecemos
si un intervalo de confianza de 100 1    para m , basado en este último,
contiene al planteo de nuestra hipótesis nula? Veamos los pasos a seguir:
1.
2.
Puesto que
X
N  m ,  2 n  , se cumple que:
X m
Zi 
 n
N  0,1
Entonces, de la tabal de distribución normal se sabe que:
P  Z 2  Zi  Z 2   100 1    %
1. Test de Hipótesis: Método del intervalo de confianza
3. Reordenando y sustituyendo términos da:

 

Pr  X  Z 2
 m  X  Z 2
  100 1    %
n
n

Éste es un intervalo de confianza al 100 1    para m . Lo único que se debe
*
hacer es ver si m  m se encuentra en este intervalo. Si se encuentra no
podemos rechazar la hipótesis nula, en caso contrario sí.
1. Test de Hipótesis: Método del intervalo de confianza
Terminología:
•
•
Nivel de significancia  : probabilidad de cometer un error de tipo I.
Potencia de la prueba: dado que la probabilidad de un error tipo II está
representada por  , la probabilidad de no cometerlo se denomina de esta
última forma (entiéndase como la capacidad de rechazar una hipótesis nula
falsa).
P-value de un estadístico de prueba:
•
También conocido como nivel exacto de significancia, es el nivel más bajo de
significancia al cual puede rechazarse una hipótesis nula.
1. Test de Hipótesis: Método de la prueba de significancia
•
Inversamente, dado que en cualquier aplicación dada, conocemos tanto a X y
n, pero los verdaderos valores de m y  no se conocen. Si  es especificado,
y asumimos un valor determinado de m mediante la hipótesis nula, podemos
calcular un estadístico Z,
X  m*
Zi 
 n
N  0,1
Y consultar en la tabla de la distribución qué probabilidad asociada tiene. La idea
clave es el estadístico de prueba y su distribución de probabilidad bajo el valor
*
supuesto m  m . La prueba se conoce como prueba Z.
Cuando se dice que un estadístico de prueba es significativo, quiere decirse que se
puede rechazar la hipótesis nula.
1. Test de Hipótesis
• A fin de realizar un test de hipótesis sobre un parámetro poblacional,
es recomendable seguir los siguientes 5 pasos:
P1. Emitir una hipótesis nula (H0) relativa a algún parámetro de la
población. La hipótesis debe involucrar alguno de los signos “=”, “≥”
o “≤”, pero no puede involucrar ninguno de los signos “<”, “>”, ni
tampoco “≠”.
P2. Especificar un nivel de significación α a emplear. Lo convencional
es emplear los niveles del 5% ( α = 0,05) o del 1% ( α = 0,01).
P3. Extraer de la población una muestra aleatoria de tamaño n, y
calcular el estadístico de prueba apropiado (z, t, etc.).
P4. Comparar el valor numérico obtenido para el estadístico de prueba
con un valor tabulado (valor crítico - z*, t*, etc. -) de la distribución
estadística teórica correspondiente.
P5. Decidir si se rechaza o no la hipótesis nula.
1. Test de Hipótesis
• Veamos dos casos de tests para la media poblacional
1- Los paquetes de harina marca XYZ de medio kilogramo afirman
contener en su etiqueta un contenido neto de 500 gr. Supongamos
que deseamos evaluar dicha afirmación a partir de nuestra creencia
de que los paquetes contienen menor cantidad de harina. Para ello,
se eligen al azar 50 paquetes y se los pesa con una balanza de
precisión, obteniendo los siguientes datos muestrales:
X  492 gr.
S  34, 4 gr.
Planteamos entonces la hipótesis nula y alternativa:
H 0 : m  500 gr.
H1 : m  500 gr.
Para la realización del test, usaremos un nivel de significación del
α = 0,05.
1. Test de Hipótesis
Aunque desconocemos cómo se distribuye el peso de los paquetes,
por tratarse de una muestra grande (n > 30) usaremos la distribución
normal estándar a fin de hallar nuestro valor crítico. Para un nivel de
significación de 0,05 la tabla correspondiente arroja un valor de
z* = -1,645.
1. Test de Hipótesis
El estadístico que utilizaremos es:
x m

n
Reemplazando en el mismo por los datos del ejercicio se obtiene
que:
492  500 

z
 1, 644
 34, 4 7, 07 
Dado que -1,645 < -1,6444, el valor calculado del estadístico de
prueba no alcanza a caer en zona de rechazo. Por lo tanto, al nivel
de significación del 5% no se puede rechazar la hipótesis nula.
Es decir, no existen argumentos para afirmar que los paquetes
de harina XYZ contienen (en promedio) menos que lo
anunciado en sus etiquetas.
1. Test de Hipótesis
• Supongamos que ahora deseamos realizar un test de hipótesis
relativo a la varianza o la desviación estándar poblacionales. Para
ello, deberemos usar el estadístico de prueba llamado chi−cuadrado
muestral, definido como sigue:
2
n

1
S


2 
2

• En un test unilateral a la derecha (o de cola derecha), la
hipótesis nula será:
H 0 :  2   02
y la hipótesis alternativa será:
H1 :  2   02
• Para un nivel de significación α, la región de rechazo se busca en
tablas de la distribución chi−cuadrada con ν = n −1 grados de
libertad.
1. Test de Hipótesis
• En cambio, en un test unilateral a la izquierda (o de cola
izquierda), la hipótesis nula es:
H 0 :  2   02 o bien H 0 :  2   02,
y la hipótesis alternativa es: H1 :  2   02
Por último, para un test bilateral (o de dos colas), se tiene:
H 0 :  2   02
y la hipótesis alternativa es:
H1 :  2   02
1. Test de Hipótesis
• Veamos un ejemplo. Supongamos que estamos analizando el tiempo
(en minutos) de espera de los clientes en la ventanilla de un banco.
Antes de un curso de capacitación para los empleados de atención al
público se sabía que la desviación estándar era 2,3 minutos. Luego del
curso de capacitación, el tiempo de espera de 10 clientes tomados al
azar fue de: 1,8; 5,2; 4,3; 6,6; 2,5; 3,4; 2,6; 5,6; 4,7 y 4,0.
Por lo tanto:
H 0 :  2   2, 3
H1 : 
2
  2, 3
2
2
con α = 0,05. ¿Sirvió el curso de capacitación para disminuir la
varianza de los tiempos de espera?
1. Test de Hipótesis
De los datos muestrales, hallamos que S = 1,5166 minutos. A primera
vista podríamos sospechar que el curso sí sirvió, pero veamos: el valor
crítico para la distribución chi−cuadrado con 9 grados de libertad es
de 3,32.
Si reemplazamos en el estadístico de prueba por los datos del
ejercicio, obtendremos que:
9  1, 5166 2 

  3, 913  3, 32
2, 32
Por lo tanto, no existe suficiente evidencia estadística en contra de la
hipótesis H0, así que se concluye que probablemente el curso de
capacitación no sirvió para disminuir la varianza de manera
perceptible (o significativa).
2. Propiedades de los estimadores: muestras pequeñas
•
Insesgamiento
–
Un estimador es insesgado si el valor esperado del mismo es igual al parámetro a
estimar, es decir,


E     E    0
•
Mínima Varianza
–
•
Se dice que un estimador es de mínima varianza del parámetro, si la varianza del
mismo es menor igual que la del resto de los estimadores.
Linealidad
–
Un estimador es lineal con respecto al parámetro, si es una función lineal de las
observaciones muestrales. Así, por ejemplo la media muestral definida como
1
1
X   X i   x1  ...  xn 
n
n
es un estimador lineal de X.
2. Propiedades de los estimadores: muestras pequeñas
•
Mejor estimador lineal insesgado
–
•
Si  es lineal, es insesgado y tiene mínima varianza entre todos los estimadores
lineales e insesgados de  , entonces se denomina MELI.
Error Medio Cuadrático (EMC)
–
Definimos al EMC de un estimador

como

EMC ( )  E   
Haciendo contraste con la varianza de

2
, la cual está definida como

var( )  E   E  


2
Esta última mide la dispersión de la distribución de  alrededor de su media,
mientras que EMC ( ) mide la dispersión alrededor del verdadero valor del
parámetro. El criterio es buscar un estimador cuyo EMC sea el menor en un conjunto
de estimadores comparables.
2. Propiedades de los estimadores: muestras grandes
•
Insesgamiento asintótico
–
Un estimador

es asintóticamente insesgado si
 
lim E  n  
n 
•
Consistencia
–
Se dice que  es un estimador consistente si se aproxima al verdadero valor de
a medida que el tamaño de la muestra aumenta.


lim P       1
n 

 >0
p lim  
•
Eficiencia asintótica
–
•
Si  es consistente y su varianza asintótica es menor que la varianza asintótica de
todos los demás estimadores consistentes de  , entonces es llamado
asintóticamente eficiente.
Normalidad asintótica
–
n 
Se dice que un estimador  está normalmente distribuido asintóticamente si su
distribución muestral tiende a aproximarse a la distribución normal a medida que el
tamaño de la muestra aumenta de manera indefinida