Download Estadística
Document related concepts
Transcript
Estadística Para el caso de dos variables aleatorias X e Y, se puede mostrar que Pero y Entonces donde son desconocidos. covarianza muestral Estadística Estimación de intervalos de confianza ¿Cuál es el intervalo (de confianza) donde existe una alta probabilidad de que el parámetro a este contenido? Existen diferentes condiciones bajo las cuales pueden obtenerse los intervalos de confianza. Aquí solo veremos una de ellas. Estadística Estimación del intervalo de confianza para de una muestra obtenida de una distribución normal con varianza conocida. Veamos esto por medio de un ejemplo: Supongamos que la media muestral de ventas de cierto producto es 200 unidades. Así que es un estimador de la “demanda” media desconocida Estadística Asumiendo que se conoce la desviación standard de la media muestral ( ). ¿Este estimador implica que la demanda media no es mayor que 250, ni menor que 150 ? Elijamos un nivel de confianza ( 95% )del Estadística Estadística Suponga que se toma una muestra de tamaño 16 de cierto producto y se encuentra que el peso en gramos de cada uno de ellos es: 506, 508, 499, 503, 504, 510, 497, 512, 514, 505, 493, 496, 506, 502, 509 y 496. Si el peso de los productos es una variable aleatoria con distribucion Gaussiana y desviación standard , obtenga el intervalo de confianza del 90%. Estadística Pruebas de hipótesis estadística Problema de tomar una decisión (aceptar/no rechazar, rechazar) basándonos en los datos experimentales Existen diferentes pruebas para no rechazar (o rechazar) alguna característica/parámetro de una distribución/población: Student t-test, NeymannPearson test, Fisher's F-test. Aquí, sólo veremos la llamada “prueba de bondad de un ajuste” (Chi-square goodness of fit test) Estadística Estadística Recordatorio e información preliminar Gamma distribution: Sea Y una variable aleatoria dada por donde sigue una distribución Gaussiana con y Entonces Y sigue una distribución Estadística La distribución es un caso particular de la distribución Gama (recuerden el caso visto en clase: con y , es decir, donde n son los “grados de libertad”. El valor medio y varianza están dados por: y ) Estadística Generalización: se puede mostrar que la suma de variables aleatorias X de la forma: i donde las Xi siguen una distribución normal está dada por una distribución libertad: con y con n grados de Estadística Pruebas de hipótesis Nos interesa saber si nuestro modelo teórico describe correctamente (estadísticamente hablando) los datos experimentales (o datos numéricos). La hipótesis H0 a verificar (llamada hipótesis nula) es H0 : nuestro modelo es correcto, desde un punto de vista estadístico. ¿De acuerdo a la muestra que tenemos no rechazamos o rechazamos la hipótesis nula ? Estadística Consideramos la hipótesis nula: H0: F(x) = F0(x) donde F0 representa nuestro modelo teórico y F el resultado observado. Existen varias pruebas, aquí sólo veremos la llamada -test Esta prueba de bondad considera la suma de las variables estandarizadas: donde Ni es el valor observado y fi el valor teórico Estadística ¿ De dónde sale esta fórmula ? Estadística Detalles: Sea la hipótesis nula: Consideremos una muestra de tamaño variable aleatoria X, dividida en n de la k clases (exhaustivas y mutuamente excluyentes). Sea el número de observaciones en la i-ésima clase Como sabemos la probabilidad ésima clase. (nuestro modelo) podemos obtener de obtener una observación en la i- Estadística De modo que Sea la realización de (i=1,2,...,k), de modo que: (i-ésima clase) De esta forma la probabilidad de la muestra “agrupada” está dada por la distribución multinomial: Estadística Veamos un caso simple: k=2 (distribución binomial) y consideremos la variable aleatoria Para n grande, sabemos que Y se aproxima a una distribución Gaussiana/Normal. También que si Y sigue una distribución Gaussiana entonces Y2 sigue una distribución (caso particular de la distribución gama) Estadística También sabemos que la suma de los cuadrados de n variables aleatorias con distribución Gaussiana sigue una distribución (en este caso con n-1 grados de libertad. Tenemos la constricción de que el tamaño de la muestra es fija) Estadística Consideremos entonces el cuadrado de Y: Para n grande esta variable sigue una distribución Gaussiana. Además, ésta puede escribirse como: donde se ha utilizado que y Estadística Entonces en general tenemos Estadística Regresando al problema, se puede mostrar que la variable sigue una distribución , con k-1 grados de libertad (en un histograma, k es el número de clases). Estadística Ahora fijemos el criterio para no rechazar la hipótesis. Para ello hacemos uso de la función acumulativa de la distribución Estadística Distribución típica Estadística Así, el criterio para no rechazar la hipótesis nula es depende del valor de Y (o ) con el cuantil de la distribución . El valor del quantil puede consultarse en tablas (k: número de grados de libertad). Estadística Si se satisface que Entonces la hipótesis no se puede rechazar (no hay razones estadísticas para rechazar el modelo). Se acostumbra a imponer un valor de significancia de