Download Inferencia Estadística

Document related concepts

Estimador wikipedia , lookup

Estimación estadística wikipedia , lookup

Estadístico muestral wikipedia , lookup

Error cuadrático medio wikipedia , lookup

Error estándar wikipedia , lookup

Transcript
Inferencia Estadística
CONTENIDO
 Introducción
 Propiedades de los estimadores
 Estimaciones Puntuales y de Intervalo
 Distribuciones Derivadas del Muestreo
 Uso de las Tablas
 Intervalos de Confianza
 Tamaño de muestra y estimación
2
Objetivos
 Describir las características de la inferencia
estadística
 Definir las propiedades de los estadísticos de
una muestra
 Describir cómo se calculan los estimadores
puntuales y por intervalo
3
Introduccion
La inferencia estadística comprende dos
tipos de procesos: Estimación y Pruebas de
Hipótesis
Estimación es el procedimiento mediante
el cual obtenemos conclusiones respecto a
parámetros o características de la población, a
través de la muestra.
4
Introducción
En investigación, generalmente se obtiene una
muestra de la población a estudiar y con ésta se
calculan los estadísticos de interés. Como estos
estadísticos son aleatorios (solo se tomó una muestra)
se debe realizar un proceso llamado
Inferencia
Estadística para obtener una estimación de los
(estadísticos) parámetros de la población. Este ultimo
proceso es llamado Estimación Paramétrica.
En el caso en que la distribución poblacional no
es conocida, o no se puede suponer un modelo de
distribución adecuado, se hace uso de la Estimación
No-paramétrica para las inferencias estadísticas.
5
Distribuciones derivadas del muestreo
Una de las propiedades de la media de la
muestra, es que cualesquiera que sea la
distribución de X, cuando la muestra es
suficientemente grande, la media de la muestra
tendrá una distribución aproximadamente
normal.
Esto se deriva del Teorema Central del
Límite.
6
Teorema central del límite
Si se tiene una muestra aleatoria de tamaño
n, tomada de una población con media  y
varianza 2, si n es suficientemente grande, X se
distribuye aproximadamente normal con media
 y varianza 2/n.
Es así que la variable aleatoria:
X 
/ n
se
distribuirá
aproximadamente
estándar (con media 0 y varianza 1)
normal
7
Distribución de la media muestral
12
11
10
9
8
7
6
5
4
3
2
1
0
Distribución de X
Distribución de
X
=1.7
8
Distribución Z
de la media de la muestra
Si la nueva variable es la media de la muestra, la media de la distribución
es μ (aplicando el teorema central del límite), y la varianza de la
distribución de la media de la muestra es σ2/n, donde n es el tamaño de la
muestra.
Eso se resume en la ecuación a la derecha.
X se distribuye N(, 2 n)
Calcule la media y la varianza de Z para la media de una
muestra de tamaño 20 (n=20) cuya distribución tiene
una media μ de 5 y una varianza σ2 de 0.82
9
Estimación
Al seleccionar una muestra de una población
podemos utilizarla para tratar de estimar un
parámetro poblacional.
Este método, conocido como estimación de
parámetros se puede realizar de dos maneras: La
estimación puntual y la estimación por intervalos.
La primera básicamente es asignarle un
número al parámetro (por eso es puntual), y la
segunda consiste en encontrar un intervalo donde
esperamos que el parámetro se encuentre con
cierta probabilidad.
10
Estimación
Para realizar cualquiera de los dos
tipos de estimación, se parte de un
estimador (estadístico de la muestra),
que debido a que es una función de las
observaciones de la muestra, tiene una
distribución de probabilidades.
11
Inferencia estadística
El proceso aleatorio de selección de la
muestra nos asegura ciertas
características distribucionales de las
observaciones de la muestra, mismas
que nos sirven para proponer
"estimadores" de los parámetros
poblacionales.
Un estimador es una función de las
observaciones de una muestra.
Un parámetro es una característica
del modelo de probabilidad
(distribucional) supuesto para la
población.
POBLACION
MUESTRA
12
INFERENCIA ESTADISTICA
Existen algunas características deseables que
pueden tener los estimadores:
Estimador Insesgado
Estimador Consistente
Estimador de Varianza Mínima
13
PROCESO PARA LA INFERENCIA
ESTADISTICA
1. Definición de la variable en estudio.
2. Definición de la población: Definir y delimitar la
población para poder obtener la muestra.
3. Modelo probabilístico de distribución de la variable
en la población considerada.
4. Selección del procedimiento aleatorio de obtención
de la muestra de acuerdo al modelo de distribución
de probabilidades de la población.
5. Enumeración de las propiedades distribucionales
de la muestra.
6. Inferencia estadística.
14
ESTIMACION PUNTUAL
POBLACION
MEDIA POBLACION: 1.7827
DESVIACION ESTANDAR
POBLACION: 0.1772
1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9
2
2.1 2.2
HUMEDAD
Los estimadores
puntuales son
estadísticos de la muestra
que estiman parámetros
de la población
MUESTRA
X  1.6834
s  0.2150
15
ESTIMACION PUNTUAL
Estimador de
la Media de la
Distribución
Modelo de
Distribución
Media de la
Distribución
Varianza de la
Distribución
Binomial
np
np(1-p)
Poisson
λ
λ
X
Normal
μ
σ2
X
16
ESTIMACION PUNTUAL
Modelo de
Distribución
Media de la
Distribución
Varianza de la
Distribución
Estimador
de la media
de dist.
Binomial
p
{p(1-p)}/n
X
Estimador de
la varianza
de dist.
X(1  X)
n
Binomial
np
np(1-p)
n
Poisson


X
Normal
μ
σ2
X
X
n
X (1  X)
X
s2
17
INTERVALOS DE CONFIANZA
Un intervalo de confianza para un parámetro de
la población consiste en uno o dos valores límites
dentro de los cuales se espera que esté contenido el
parámetro poblacional con cierta probabilidad.
Los intervalos de confianza pueden ser
superiores, inferiores o para ambos lados.
Intervalo de confianza para la media de una
población con distribución aproximadamente
normal y varianza conocida (2)
P{ Y  ( Z1 / 2 )( 
n
)    Y  ( Z1 / 2 )( 
n
)}  1  
18
INTERVALOS DE CONFIANZA
Intervalo de confianza para la media de una
población con distribución aproximadamente
normal y varianza conocida (2)
P{ YLim. Superior
( Z1: Y/2(Z)( ) ( /
1 / 2
n)
n
)    Y  ( Z1 / 2 )( 
n
)}  1  
Lim. Superior : Y  (Z1 / 2 ) ( / n)
Lim. Inferior : Y  (Z1 / 2 ) ( / n)
19
INTERVALOS DE CONFIANZA
Intervalo de confianza para la media de una
población con distribución aproximadamente
normal y varianza desconocida
P{ Y  t[(1  / 2),(n1)] (s / n )    Y  t [(1  / 2),(n1)] (s / n )}  1  
Lím. Inf .  Y  t (1 / 2) (n1)  (s / n)
Lím. Sup.  Y  t (1 / 2) (n1)  (s / n)
20
INTERVALOS DE CONFIANZA
21
INTERVALOS DE CONFIANZA
Intervalo de confianza para la varianza de una
población con distribución aproximadamente
normal
22
INTERVALOS DE CONFIANZA
Intervalo de confianza para la proporción (p) de
una población con distribución binomial, usando
una muestra grande (Teorema Central del Límite)
P(p̂  Z1 / 2
p̂(1  p̂)
p̂(1  p̂)
 p  p̂  Z1 / 2
)  1 
n
n
23
Ejercicios
Se pondrán ejercicios en clase
24
TAMAÑO DE MUESTRA Y ESTIMACIÓN
La confiabilidad de una estimación
depende del nivel de confianza establecido y
del tamaño de la muestra.
Si se hace un intervalo de confianza de
99%, éste será más confiable que uno de 95%;
pero también el intervalo de 99% será más
grande que el 95%.
Cuanto más grande es el tamaño de la
muestra, mayor será la confiabilidad de la
estimación.
25
CÓMO CALCULAR EL TAMAÑO DE MUESTRA
 Seleccione las características a medir que sean
más importantes y dentro de éstas las que tengan
mayor variación (A esta característica vamos a
llamarle W).
 Calcule, o estime con una muestra preliminar o
con datos de otros estudios, la varianza, desviación
estándar o coeficiente de variación de W.
 Establezca una diferencia mínima d0 que desea
detectar entre dos unidades de la muestra.
d0 = W1-W2
26
Cómo Calcular el Tamaño de Muestra
Por ejemplo, se desea detectar una diferencia
mínima de 0.5 mm de mercurio entre dos mediciones
de presión arterial. Aquí, d0 = 0.5.
 A partir de la desviación estándar o del coeficiente
de variación de W de algún trabajo anterior o de la
literatura científica, se calcula la varianza (s2W).
Las fórmulas para calcular el tamaño de
muestra serán:
27
Cómo Calcular el Tamaño de Muestra
n = (s2W •t2(/2, gl. error)) /d20
Si no se tiene el dato de grados de libertad del error
(gl. error), se puede usar:
n = (sW2•Z2(/2)) /d20
Si la medición es de atributos (una proporción o
porcentaje p):
n =(z2/2•p2W•(1-pW)2)/d20
28
RESUMEN






Introducción
Estimadores
Propiedades de los estimadores
Estimación Puntual
Intervalos de confianza
Tamaño de muestra y estimación
29