Download Estadística

Document related concepts

Prueba t de Student wikipedia , lookup

Estadístico muestral wikipedia , lookup

Distribución normal wikipedia , lookup

Muestra estadística wikipedia , lookup

Distribución t de Student wikipedia , lookup

Transcript
Estadística
Para el caso de dos variables aleatorias
X e Y, se puede mostrar que
Pero
y
Entonces
donde
son desconocidos.
covarianza muestral
Estadística
Estimación de intervalos de confianza
¿Cuál es el intervalo (de confianza) donde
existe una alta probabilidad de que el
parámetro a este contenido?
Existen diferentes condiciones bajo las cuales pueden
obtenerse los intervalos de confianza. Aquí solo
veremos una de ellas.
Estadística
Estimación del intervalo de confianza para
de
una muestra obtenida de una distribución normal
con varianza conocida.
Veamos esto por medio de un ejemplo:
Supongamos que la media muestral de ventas
de cierto producto es 200 unidades.
Así que
es un estimador de la
“demanda” media desconocida
Estadística
Asumiendo que se conoce la desviación
standard de la media muestral (
).
¿Este estimador implica que la demanda media
no es mayor que 250, ni menor que 150 ?
Elijamos un nivel de confianza (
95%
)del
Estadística
Estadística
Suponga que se toma una muestra de tamaño 16
de cierto producto y se encuentra que el peso en
gramos de cada uno de ellos es:
506, 508, 499, 503, 504, 510, 497, 512, 514, 505,
493, 496, 506, 502, 509 y 496.
Si el peso de los productos es una variable
aleatoria con distribucion Gaussiana y desviación
standard
, obtenga el intervalo de
confianza del 90%.
Estadística
Pruebas de hipótesis estadística
Problema de tomar una decisión (aceptar/no rechazar,
rechazar) basándonos en los datos experimentales
Existen diferentes pruebas para no rechazar (o
rechazar) alguna característica/parámetro de una
distribución/población: Student t-test, NeymannPearson test, Fisher's F-test.
Aquí, sólo veremos la llamada “prueba de bondad de un
ajuste” (Chi-square goodness of fit test)
Estadística
Estadística
Recordatorio e información preliminar
Gamma distribution:
Sea Y una variable aleatoria dada por
donde
sigue una distribución Gaussiana con
y
Entonces
Y sigue una distribución
Estadística
La distribución
es un caso particular de la
distribución Gama (recuerden el caso visto en clase:
con
y
, es decir,
donde n son los “grados de libertad”. El valor medio y
varianza están dados por:
y
)
Estadística
Generalización: se puede mostrar que la suma de
variables aleatorias X de la forma:
i
donde las Xi siguen una distribución normal
está dada por una distribución
libertad:
con
y
con n grados de
Estadística
Pruebas de hipótesis
Nos interesa saber si nuestro modelo teórico
describe correctamente (estadísticamente hablando)
los datos experimentales (o datos numéricos).
La hipótesis H0 a verificar (llamada hipótesis nula) es
H0 : nuestro modelo es correcto, desde un punto de
vista estadístico.
¿De acuerdo a la muestra que tenemos no rechazamos
o rechazamos la hipótesis nula ?
Estadística
Consideramos la hipótesis nula:
H0: F(x) = F0(x)
donde F0 representa nuestro modelo teórico y F el
resultado observado.
Existen varias pruebas, aquí sólo veremos la llamada
-test
Esta prueba de bondad considera la suma de las
variables estandarizadas:
donde Ni es el valor observado y fi el valor teórico
Estadística
¿ De dónde sale esta fórmula ?
Estadística
Detalles:
Sea la hipótesis nula:
Consideremos una muestra de tamaño
variable aleatoria X, dividida en
n de la
k clases
(exhaustivas y mutuamente excluyentes). Sea el
número de observaciones en la i-ésima clase
Como sabemos
la probabilidad
ésima clase.
(nuestro modelo) podemos obtener
de obtener una observación en la i-
Estadística
De modo que
Sea
la realización de
(i=1,2,...,k), de modo que:
(i-ésima clase)
De esta forma la probabilidad de la muestra
“agrupada” está dada por la distribución
multinomial:
Estadística
Veamos un caso simple: k=2 (distribución binomial) y
consideremos la variable aleatoria
Para
n grande, sabemos que Y se aproxima a una
distribución Gaussiana/Normal.
También que si Y sigue una distribución Gaussiana
entonces Y2 sigue una distribución
(caso particular
de la distribución gama)
Estadística
También sabemos que la suma de los cuadrados de n
variables aleatorias con distribución Gaussiana sigue
una distribución
(en este caso con n-1 grados de libertad. Tenemos la
constricción de que el tamaño de la muestra es fija)
Estadística
Consideremos entonces el cuadrado de Y:
Para n grande esta variable sigue una distribución
Gaussiana. Además, ésta puede escribirse como:
donde se ha utilizado que
y
Estadística
Entonces en general tenemos
Estadística
Regresando al problema, se puede mostrar que la
variable
sigue una distribución , con k-1 grados de libertad
(en un histograma, k es el número de clases).
Estadística
Ahora fijemos el criterio para no rechazar la
hipótesis. Para ello hacemos uso de la función
acumulativa de la distribución
Estadística
Distribución
típica
Estadística
Así, el criterio para no rechazar la hipótesis nula es
depende del valor de Y (o ) con el
cuantil
de la distribución .
El valor del quantil
puede consultarse
en tablas (k: número de grados de libertad).
Estadística
Si se satisface que
Entonces la hipótesis no se puede rechazar (no hay
razones estadísticas para rechazar el modelo). Se
acostumbra a imponer un valor de significancia de