Download Distribuciones-T_Chi2_F

Document related concepts

Distribución t de Student wikipedia , lookup

Distribución χ² wikipedia , lookup

Prueba t de Student wikipedia , lookup

Distribución T² de Hotelling wikipedia , lookup

Varianza wikipedia , lookup

Transcript
Distribución T-Student
En probabilidad y estadística, la distribución t (de Student) es una distribución
de probabilidad que surge del problema de estimar la media de una población
normalmente distribuida cuando el tamaño de la muestra es pequeño. Surge,
en la mayoría de los estudios estadísticos prácticos, cuando la desviación típica
de una población se desconoce y debe ser estimada a partir de los datos de
una muestra.
Existen dos versiones de la prueba t-Student: una que supone que las
varianzas poblacionales son iguales y otra versión que no asume esto último.
Para decidir si se puede suponer o no la igualdad de varianza en las dos
poblaciones, se debe realizar previamente la prueba F-Snedecor de
comparación de dos varianzas.
Un poco de historia.
La prueba t-Student fue desarrollada en 1899 por el químico inglés William
Sealey Gosset (1876-1937), mientras trabajaba en técnicas de control de
calidad para las destilerías Guiness en Dublín . Debido a que en la destilería,
su puesto de trabajo no era inicialmente de estadístico y su dedicación debía
estar exclusivamente encaminada a mejorar los costes de producción, publicó
sus hallazgos anónimamente firmando sus artículos con el nombre de
"Student".
La distribución t de Student es la distribución de probabilidad del cociente:
donde
Z tiene una distribución normal de media nula y varianza 1
V tiene una distribución chi-cuadrado con ν grados de libertad
Z y V son independientes
Si μ es una constante no nula, el cociente es una variable aleatoria
que sigue la distribución t de Student no central con parámetro de
no-centralidad μ.
Intervalos de confianza derivados de la distribución t de
Student
El procedimiento para el cálculo del intervalo de confianza basado en
la t de Student consiste en estimar la desviación típica de los datos S
y calcular el error estándar de la media= S/(raíz cuadrada de n),
siendo entonces el intervalo de confianza para la media = x media +t (alfa/2) multiplicado por (S/(raíz cuadradada de n)).
Es este resultado el que se utiliza en el test de Student: puesto que la
diferencia de las medias de muestras de dos distribuciones normales
se distribuye también normalmente, la distribución t puede usarse
para examinar si esa diferencia puede razonablemente suponerse
igual a cero.
para efectos prácticos el valor esperado y la varianza son :
E(t(n))= 0 y Var (t(n-1)) = n/(n-2) para > 3.

Las
distribuciones
“t”
de
Student,
Chi
cuadrado
(
2)
y
F,
se
derivan
de
la
distribución Normal y están relacionadas con la teoría del muestreo
pequeño n< 30.

Son muy importantes pues son la base de metodologías
inferenciales, tales como Intervalos de Confianza y Pruebas de
Hipótesis.

Las variables “t”,
2 y F surgen de
transformaciones de variables aleatorias en las que están
involucrados estadísticos muestrales, tales como la media y la
variancia. En la práctica, por lo tanto, no podemos decir por Ej.
que el peso, la altura, etc., se distribuyen según t”,
2yF
DISTRIBUCIÓN DE STUDENT O DISTRIBUCIÓN “t”
En muchos casos se seleccionan de una población normal, muestras de
tamaño pequeño n < 30 y x desconocido
El estadístico “t” será
DEFINICIÓN
Una variable con distribución t de Student se define como el cociente entre una
variable normal estandarizada y la raíz cuadrada positiva de una variable 2
dividida por sus grados de libertad.
CARACTERISTICAS

La distribución se denomina distribución de Student o distribución “t”.

Es simétrica, con media de 0, y variancia mayor que 1.

Es más achatada que la normal y adopta diferentes formas, según el
número de grados de libertad.

La variable t se extiende desde -a +.

A medida que aumenta los (n -1) grados de libertad la distribución “t” se
aproxima en su forma a una distribución normal.

El parámetro de la distribución es (n-1) grados de libertad, originando
una distribución diferente para cada tamaño de muestra.
¿Cómo se deduce una distribución de “t”?

Extraigo K muestras de tamaño n < 30.

Calculo para cada muestra el valor de “t”.

Grafique la distribución para cada tamaño muestral
DISTRIBUCIÓN CHI_ CUADRADO
Para muestras extraídas de una población normal con variancia
2, con tamaño n < 30, siendo S2 la variancia de la
muestra entonces el estadístico
2 será
DEFINICIÓN
Una variable Chi cuadrado se define como la suma de n variables normales
estandarizadas elevadas al cuadrado.
CARACTERISTICAS

Por definición, una variable
positivos: 0 "
2 adopta valores
2 " ".

La distribución es asimétrica positiva.

A medida que aumenta el tamaño de la muestra la curva es menos
asimétrica, aproximándose a una curva normal.

Para

El
cada
tamaño
parámetro
muestral, se
2 diferente.
tendrá
una
distribución
que
caracteriza
a
una
distribución
2 son sus grados de libertad (n-1), originado
una distribución para cada grado de libertad,
¿Cómo se deduce una distribución
2?

Extraer K muestras de tamaño n < 30

Para cada muestra, por ejemplo n = 5, transformamos cada valor de x:
x1, x2, x3, x4 y x5 en Z: z1, z2, z3, z4 y z5, utilizando:

Para cada muestra calculamos:

Entonces podríamos escribir , así:
(1)

Si cambiamos en (1) la media poblacional
por X, resulta:

Dado que: , despejando tenemos:
(2)
, al reemplazar en (2) llegamos a:

Finalmente si se calcula para cada una de las K muestras y se grafica en
un eje de coordenadas el
2 se genera una
distribución de
2 con (n-1) grados de
libertad.
DISTRIBUCIÓN F DE FISHER
Considerando dos muestras aleatorias independientes, de tamaño n1 y n2,
extraídas de una población normal, el estadístico F será
DEFINICIÓN
Una variable F se define como el cociente entre dos variables ji-cuadrado
divididas por sus correspondientes grados de libertad.
CARACTERISTICAS

Una variable con distribución F es siempre positiva por lo tanto su
campo de variación es 0 " F " "

La distribución de la variable es asimétrica, pero su asimetría
disminuye cuando aumentan los grados de libertad del numerador
y denominador.

Hay una distribución F por cada par de grados de libertad.

Parámetros: Grados de libertad asociados al numerador y
denominador.
chi-cuadrado
Si para todo ,
sigue una distribución normal con media 0 y varianza 1
entonces
sigue una distribución chi-cuadrado con grados de
libertad. Esto lo expresamos del siguiente modo:
.
Teorema
Sean
variables
aleatorias
independientes
normalmente
distribuidas, con media 0 y varianza comun
. Entonces,
, donde
es una matriz simétrica, sigue una distribución chi-cuadrado de
grados de libertad si y sólo si
es una matriz idempotente.
Teorema
Sean
variables
aleatorias
independientes
distribuidas, con media 0 y varianza común 1. Sean, además
y
matrices simétricas de dimensión
. Entonces
independientes si y sólo si
.
normalmente
y
con
y
son
Distribución F de Fisher-Snedecor
Si y son variables aleatorias independientes que se distribuyen como sendas
chi-cuadrado de y grados de libertad respectivamente, entonces
sigue
una distribución F de Fisher de
grados de libertad en el numerador y
grados de libertad en el denominador.
Definición de distribución t de Student
Si es una variable aleatoria con distribución normal de media 0 y varianza 1 y
es otra variable aleatoria, independiente de con distribución
entonces
sigue una distribución t de Student de
grados de libertad.
Relación entre las distribuciones t y F
Como
se deduce que si es una variable con una distribución t de
Student de grados de libertad, entonces sigue una distribución F de Fisher
con un grado de libertad en el numerador y en el denominador.