Download Inferencia estadística

Document related concepts
no text concepts found
Transcript
Inferencia estadística
Matemáticas aplicadas
a las CCSS II
Ana Pola
IES Avempace
Estadística inferencial
Plantea y resuelve el problema de
establecer previsiones y conclusiones
generales sobre una población a partir de
los resultados de una muestra.
 La herramienta fundamental es el cálculo
de probabilidades y, más concretamente,
la distribución normal.

INFERENCIA
ESTADÍSTICA
ESTIMACIÓN
DE
PARÁMETROS
ESTIMACIÓN
POR
PUNTOS
ESTIMACIÓN
POR
INTERVALOS
CONTRASTE
DE
HIPÓTESIS
POBLACIÓN
Es el conjunto de todos los individuos
objeto de nuestro estudio
MUESTRA
Es un subconjunto extraído de la
población. Su estudio sirve para inferir
características de la población
PARÁMETROS POBLACIONALES
O PARÁMETROS
ESTADÍSTICOS MUESTRALES
O ESTADÍSTICOS
Son los índices centrales y de
dispersión que definen una población
Son los índices centrales y de
dispersión que definen una muestra
Suelen constituir una buena estimación de
los respectivos parámetros, razón por la que
reciben también el nombre de
ESTIMADORES
Métodos de muestreo

Muestreo no aleatorio


Los elementos de la población no tienen la misma
probabilidad de ser incluidos en la muestra.
Muestreo aleatorio

Todos los elementos de la muestra se eligen al azar,
por tanto, cada elemento de la población tiene la
misma probabilidad de ser incluido en la muestra.
•
•
•
•
•
Muestreo aleatorio simple
Muestreo aleatorio sistemático
Muestreo aleatorio estratificado
Muestreo por conglomerados
…
Muestreo aleatorio simple

Consiste en seleccionar n elementos sin
reemplazamiento de entre los N que
componen la población, de modo que
todas las muestras de tamaño n que se
puedan formar, tengan la misma
probabilidad.
Muestreo aleatorio sistemático


Es una variedad del anterior. Se numeran todos
los elementos de la población y se dividen en
tantos intervalos iguales como elementos deba
contener la muestra. Se extrae al azar un
elemento del primer intervalo y, posteriormente,
los que ocupan el mismo lugar en los restantes
intervalos.
Se utiliza cuando los elementos de la población
están ordenados en listas.
Muestreo aleatorio estratificado
Se divide la población en clases
homogéneas, llamadas estratos.
 La muestra se escoge aleatoriamente en
número proporcional al de los
componentes de cada estrato.
 Se utiliza cuando se desea que la
muestra tenga una composición análoga
a la población.

Muestreo por conglomerados
Consiste en distinguir inicialmente
núcleos de población de carácterísticas
similares a la propia población.
 Se utiliza cuando la población se
encuentra agrupada en conglomerados y
cada uno de estos es representativo de la
población total.

Distribuciones de muestreo

Dada una población de N elementos, podemos considerar todas las posibles
muestras aleatorias de tamaño n.
POBLACIÓN
M1
M2
M3 … Mk
x1
x2
x3 … xk …
Distribución muestral de medias
1
2
3 … k …
Distribución muestral de desviaciones típicas
…
me1 me2 me3 …mek …
Distribución muestral de medianas
Distribución muestral
de medias

Dada una población de N elementos, podemos considerar todas las posibles
muestras aleatorias de tamaño n.

La media de la distribución
muestral de medias es igual a
la media de la población

Si la población es infinita o si el
muestreo es con reposición, su
desviación típica es
POBLACIÓN
X con , 
M1
M2
M3 … Mk
…
x1
x2
x3 … xk
…
Distribución muestral de medias de tamaño n
Teorema central del límite

Si se toman muestras de tamaño n > 30
de una población, con una distribución
cualquiera, media  y una desviación
típica , la distribución muestral de
medias se aproxima a una distribución
normal
Población N()
Población cualquiera con n≥30
Distribución de
medias muestrales
Distribución de
medias muestrales
Ejemplo

Una población está formada por sólo cinco
elementos, con valores 3, 5, 7, 9 y 11.
Consideramos todas las muestras posibles de
tamaño 2 con reemplazamiento que pueden
extraerse de esta población. Se pide calcular:




a) La media de la población.
b) La desviación típica de la población.
c) La media de la distribución muestral de medias.
d) La desviación típica de la distribución muestral de
medias, es decir, el error típico de las medias.
Solución

Población: 3, 5, 7 ,9 ,11
a)
La media de la población es
b)
La desviación típica de la población es
Población: 3, 5, 7, 9, 11

Construyamos la distribución muestral de medias:
MUESTRAS
3
5
7
9 11 11 11 11 11
33 35 37 39
53 55 57 59
73 75 77 79
93 95 97 99
11
11
11
11 3 5 7 9 11
Elementos
Media de la
muestra, xi
3
Media de la
muestra, xi
4
5
6
7
Número de
muestras
4
5
6
7
8
5
6
7
8
9
6
7
8
9 10
7
8
9 10 11
Probabilidad
P(x i)
x1
3
1
1/25
x2
4
2
2/25
x3
5
3
3/25
x4
6
4
4/25
x5
7
5
1/5
x6
8
4
4/25
x7
9
3
3/25
x8
10
2
2/25
x9
11
1
1/25
1/4
1/5
3/20
1/10
1/20
0
3
4
5
6
7
8
9
10
11
Media de la
muestra, xi
Número de
muestras
Probabilidad
P(x i)
x1
3
1
1/25
x2
4
2
2/25
x3
5
3
3/25
x4
6
4
4/25
x5
7
5
1/5
x6
8
4
4/25
x7
9
3
3/25
x8
10
2
2/25
x9
11
1
1/25
c)
La media de la distribución muestral de
medias es:
d)
La desviación típica de la distribución
muestral de medias es:
Cuando la población es infinita o las muestras se extraen con
reemplazamiento, se verifica
Ejercicio 1

En una oposición en la que participaban miles de candidatos se hizo un
examen tipo test.
Las calificaciones se distribuyeron normalmente con media  = 72 puntos y
desviación típica  = 10.
a)
¿Cuál es la probabilidad de que un opositor elegido al azar obtenga más de 76
puntos?
La población sigue una N(72,10)
b)
¿Cuál es la probabilidad de que una muestra de 64 opositores obtenga un
promedio superior a 76 puntos?
La media muestral de medias será X  72 y la desviación tipica
La distribución muestral de medias será N(72; 1,25)
X 

n

10
10 5


64 8 4
Ejercicio 2

Se sabe que el peso medio de los estudiantes varones
de la Universidad de Zaragoza es = 76,4 kg, con una
desviación típica = 7,5 kg. Se extrae una muestra
aleatoria (sin reposición) de 100 estudiantes de dicha
población.
Cuál es la probabilidad de que el peso medio de la
muestra sea:
a)
b)
c)
d)
Superior a 75 kg.
Inferior a 75,6 kg.
Entre 76 y 77,5 kg.
Inferior a 74 kg o superior a 78 kg.
Distribución muestral
de proporciones





Sea una población en la que la proporción de individuos que posee una cierta característica es
p. En consecuencia, la proporción de los individuos que no al tiene es 1 - p = q.
Consideramos todas las posibles muestras de tamaño n que puede extraerse de esa población.
La proporción, P, de individuos con
dicha característica en la muestra
de tamaño n es
La media de la distribución
muestral de proporciones coincide
con la proporción de los elementos
de la población
Si la población es infinita o si el
muestreo es con reposición, su
desviación típica es
POBLACIÓN
p, q = 1-p
M1
M2
M3 … Mk
…
p1
p2
p3 … pk
…
Distribución muestral de proporciones de tamaño n
Ejemplo

Un partido político tiene, en un determinado país, un
porcentaje de votos estimado en el 25%. Se elige una
muestra aleatoria de 100 personas.
Calcula la probabilidad de que en la muestra exista al
menos un 30% de votantes del partido político en
cuestión.

Solución:
La proporción de votantes del partido es: p = 0,25 y por tanto
La distribución muestral de la proporción P es N(0,25 ; 0,043)
Ejercicio

Una máquina fabrica piezas de precisión. En
su producción habitual fabrica un 3% de piezas
defectuosas. Un cliente recibe una caja de 500
piezas procedentes de la fábrica.
a)
b)
¿Cuál es la probabilidad de que encuentre más del
5% de piezas defectuosas en la caja?
¿Cuál es la probabilidad de que encuentre menos
de un 1% de piezas defectuosas?
El problema inverso
Hemos visto cómo, dado un intervalo, se
puede calcular la probabilidad de que la
variable se encuentre en dicho intervalo.
 Ahora nos plantearemos el problema
inverso, es decir, dado el tipo de intervalo
y su probabilidad, calcular sus extremos.

Intervalos característicos
o de probabilidad

Si la variable X tiene una distribución de
media , se llama intervalo característico
correspondiente a una probabilidad p a
un intervalo centrado en la media,
( - k,  + k),
tal que la probabilidad de que X
pertenezca a dicho intervalo es p:
P( - k < X <  + k) = p
Intervalos característicos
en distribuciones N(0,1)

En una distribución normal N(0,1), si (-k, k) es el intervalo
característico correspondiente a una probabilidad p, es decir, si
P(-k < Z < k) = p
diremos que k es el valor crítico correspondiente a p.
Principales valores críticos
1-
 /2
z  /2
0,90
0,05
1,645
0,95
0,025
1,96
0,99
0,005
2,575
Cálculo del valor crítico
Intervalo característico
Valor crítico
Cálculo del valor crítico
Intervalos característicos
en distribuciones N(,)

Deseamos encontrar un intervalo centrado en la media ( - k,  + k) tal
que
P( - k < X <  + k) = p = 1- 
es decir, el intervalo en el cual esté el 100·(1- )% de los individuos de la
población.



Si X es N(,), entonces, Z 
X

es N(0,1)
P(-z/2 ≤ Z ≤ z/2) = 1-  , entonces, P(-z/2 ≤
Por tanto, el intervalo característico será:
z /2 
X

 z /2
  z /2    X    z /2  
X   ≤ z ) = 1- 
/2

   z /2    X    z /2  
En una distribución N(,), el intervalo
característico correspondiente a una probabilidad
p = 1-  , es:
( - z/2·,  + z/2·)