Download intervalos de confianza - Departamento de Métodos Estadísticos

Document related concepts

Distribución t de Student wikipedia , lookup

Distribución normal wikipedia , lookup

Prueba t de Student wikipedia , lookup

Método delta wikipedia , lookup

Parámetro estadístico wikipedia , lookup

Transcript
DEPARTAMENTO DE MÉTODOS ESTADÍSTICOS
UNIVERSIDAD DE ZARAGOZA
EUITI
MÉTODOS ESTADÍSTICOS DE LA
INGENIERÍA
CUADERNO PARA EL EXAMEN
2009-2010
Isolina Alberto Moralejo
Cuaderno examen
Métodos Estadísticos de la Ingeniería
INGENIERÍA TÉCNICA INDUSTRIAL
MÉTODOS ESTADÍSTICOS DE LA INGENIERÍA
OBJETIVOS DE LA ASIGNATURA
Todo lo relacionado con la toma, procesamiento, análisis e interpretación de
datos numéricos pertenece al terreno de la Estadística. En esta asignatura se
aprenderá a extraer información de conjuntos de datos, a interpretar esta
información y a obtener conclusiones, basadas en datos experimentales, que
ayuden al ingeniero a la toma de decisiones. Esto incluye tareas tan diversas
como decidir si revisar o no un proceso de fabricación que puede estar
desajustado, lanzar o no un nuevo producto al mercado, comprar o no una
nueva máquina, etc.
A lo largo del curso se expondrán aplicaciones de la estadística a problemas
concretos de la ingeniería.
PRÁCTICAS
Las prácticas de la asignatura serán sesiones de 2 horas distribuidas en
semanas alternas. Los grupos de prácticas se deberán formar en la primera
semana del cuatrimestre. Los grupos de prácticas, así como los horarios de las
mismas los podréis consultar en el aula.
Procurad hacer los grupos de forma que no se os solapen las prácticas de
Métodos Estadísticos con las de otras asignaturas.
Las prácticas se realizarán con el programa Microsoft Excel.
Escuela Universitaria de Ingeniería Técnica Industrial
2
Cuaderno examen
Métodos Estadísticos de la Ingeniería
CRITERIOS DE EVALUACIÓN
La evaluación de la asignatura será mediante una prueba escrita. Dicha
prueba constará de dos partes. La primera consistirá en la resolución de
ejercicios teórico-prácticos y puntuará sobre 7.5 puntos. La segunda consistirá
en el análisis de un conjunto de datos en el ordenador utilizando el software
Microsoft Excel y puntuará sobre 2.5 puntos. Se dispondrá de dos horas y
media para la primera parte y una hora para la segunda.
Como mínimo habrá que sacar un 3 (sobre 7.5 puntos) en la primera parte y
un 0.75 (sobre 2.5 puntos) en la segunda parte. Una vez conseguido esto, la
nota de la asignatura se calculará sumando las notas obtenidas en las dos
partes.
Para la realización del examen únicamente se dispondrá del cuaderno de
examen que está disponible en reprografía.
Para el examen es imprescindible llevar calculadora.
No se guardan partes de la asignatura (teoría o prácticas) entre convocatorias.
En cada examen hay que presentarse a ambas partes.
[Nota: el Departamento de Métodos Estadísticos está ubicado en el edificio
Leonardo Torres Quevedo]
Escuela Universitaria de Ingeniería Técnica Industrial
3
Cuaderno examen
Métodos Estadísticos de la Ingeniería
ESTADÍSTICA DESCRIPTIVA UNIDIMENSIONAL
Datos {xi}, i = 1,...,N; K clases, k = 1,....K; marca de clase = x k
Media = x =
∑ x i ∑ nk x k
=
i
N
Varianza = s 2 =
k
N
=
∑ fk x k
k
∑ ( x i − x )2 ∑ nk ( x k − x )2
=
i
N
Cuasi-varianza = sˆ 2 =
k
N
=
∑ fk ( x k − x )2
k
∑ ( x i − x ) 2 ∑ nk ( x k − x ) 2
i
=
N −1
k
N −1
Desviación típica = s = s 2
Cuasidesviación típica = sˆ = sˆ 2
La desigualdad de Chebychev garantiza que el porcentaje de observaciones dentro del
1 ⎞
⎛
intervalo x ± ks es, al menos, de ⎜1 − 2 ⎟ 100%
⎝ k ⎠
Coeficiente de variación = CV =
s
x
Grupos en una variable cuantitativa según una cualitativa
La variable X con N observaciones, media x y varianza s2 se divide en L grupos (h = 1,...,L).
En cada uno de ellos se calcula el número de datos, la media y la varianza:
n1, x1, s12
n 2 , x 2 , s 22
......
n h , x h , s h2
.....
n L , x L , s L2
nh
al peso relativo o ponderación de cada grupo. Entonces, la media y la
N
varianza globales se calculan:
Llamamos w h =
L
Media ponderada = x = ∑ w h x h
h =1
Varianza = s 2 =
∑ w h s h2 + ∑ w h (x h − x )
2
h
h
Escuela Universitaria de Ingeniería Técnica Industrial
4
Cuaderno examen
Métodos Estadísticos de la Ingeniería
ESTADÍSTICA DESCRIPTIVA BIDIMENSIONAL
(xi, yi), i = 1,...,N
Covarianza = cov( x, y ) =
∑ (xi
− x )( y i − y )
i
N
Recta de regresión: yˆ = a + bx , donde:
a=y−
cov( x, y )
cov( x, y )
x; b =
2
sx
s x2
Coeficiente de correlación lineal = r =
cov( x, y )
; −1≤ r ≤ 1
sxsy
PROBABILIDAD
Cuando un suceso A puede ocurrir condicionado a la ocurrencia de varios Bi, mutuamente
excluyentes y exhaustivos (sistema completo de sucesos) (Σ P(Bi) = 1), se tiene que:
n
Teorema de la Probabilidad Total: P ( A) = ∑ P ( A | Bi )P (Bi )
i =1
Teorema de Bayes: P (B j | A) =
P ( A | B j )P (B j )
n
∑ P ( A | Bi )P(Bi )
i =1
APROXIMACIONES ENTRE VARIABLES
TEOREMA CENTRAL DEL LÍMITE
Sean Xi, i = 1,...,n, una muestra aleatoria simple procedente de una población X (no
necesariamente normal), con media μ y varianza σ2. Si n es suficientemente grande (n>30),
Y = Σ Xi se distribuye N (nμ, nσ2)
X = Y/n se distribuye N ( μ ,
σ2
n
)
Escuela Universitaria de Ingeniería Técnica Industrial
5
Cuaderno examen
Métodos Estadísticos de la Ingeniería
VARIABLES ALEATORIAS DISCRETAS
Variable
Parámetros Definición
Bernoulli
Ber (p)
p∈(0,1)
⎧0 si fracaso
X =⎨
⎩1 si éxito
Rango de valores
k=0,1
Función de probabilidad
Tabla/Función de
distribución
P(X=k)=pk(1-p)1-k
Media
p
Varianza
Reproductividad
p(1-p)
Si {Xi}i=1,...,n ≈ Ber (p)
independientes ⇒
n
∑ Xi ≈
Bin (n,p)
i =1
Binomial
Bin (n,p)
Poisson
P(λ)
Geométrica
Geom(p)
Número de éxitos
n >0 entero en n realizaciones del experip∈(0,1)
mento.
Muestreo con
reposición.
Número de
λ >0
ocurrencias en
un intervalo
continuo de
amplitud una
unidad.
Número de
fracasos antes
p∈(0,1)
del primer éxito.
k=0,1,...,n
k=0,1,2,3,....
k=0,1,2,3,....
⎛n⎞
P ( X = k ) = ⎜⎜ ⎟⎟ p k (1 − p ) n − k
⎝k ⎠
P( X = k ) =
e − λ λk
k!
P ( X = k ) = (1 − p) k p
Ver tabla
np
np(1-p)
Ver tabla
λ
λ
F (k ) = 1 − (1 − p) k +1
1− p
p
1− p
p2
Si X1 ≈ Bin (n1,p) y
X2 ≈ Bin (n2,p)
independientes ⇒
X1 + X2 ≈ Bin (n1+n2,p)
Si X1 ≈ P(λ1) y X2 ≈ P(λ2)
independientes ⇒
X1 + X2 ≈ P(λ1+λ2)
Si {Xi}i=1,...,n ≈ Geom (p)
independientes ⇒
n
∑ Xi ≈
BN (n,p)
i =1
Binomial negativa
BN(n,p)
Número de
n >0 entero fracasos antes
del n-ésimo éxito.
p∈(0,1)
Hipergeométrica D≤N
H(N,D,n)
n≤N
N,D,n
enteros
positivos
k=0,1,2,3,....
⎛ n + k − 1⎞
⎟⎟(1 − p ) k p n Relación con la Binomial:
P ( X = k ) = ⎜⎜
k
⎠
⎝
FBN ( n, p ) (k ) =
n(1 − p)
p
n(1 − p )
nD
N
np (1 − p )( N − n)
N −1
= 1 − FBin( n+ k , p ) (n − 1)
Número de exitos
en la muestra.
Muestreo sin
reposición.
k=max{0, n+D-N},
1,..., min{n,D}
Escuela Universitaria de Ingeniería Técnica Industrial
⎛ N − D ⎞⎛ D ⎞
⎜⎜
⎟⎟⎜⎜ ⎟⎟
⎝ n − k ⎠⎝ k ⎠
P( X = k ) =
⎛N⎞
⎜⎜ ⎟⎟
⎝n ⎠
p2
con p=D/N
6
Si X1 ≈ BN (n1,p) y
X2 ≈ BN (n2,p)
independientes ⇒
X1 + X2 ≈ BN (n1+n2,p)
No es reproductiva
Cuaderno examen
Métodos Estadísticos de la Ingeniería
VARIABLES ALEATORIAS CONTINUAS
Variable
Uniforme
U(a,b)
Parámetros
a<b
Exponencial
Exp(λ)
λ >0
Función de densidad
Tabla/Función de distribución
⎧ 1
si x ∈ (a, b)
⎪
f ( x) = ⎨ b − a
⎪0 en otro caso
⎩
⎧0 si x ≤ a
⎪x−a
⎪
F ( x) = ⎨
si x ∈ (a, b)
⎪b − a
⎪⎩1 si x ≥ b
⎧⎪λ e −λx si x ∈ (0, ∞)
f ( x) = ⎨
⎪⎩0 en otro caso
⎧⎪0 si x ≤ 0
F ( x) = ⎨
⎪⎩1 − e −λ x si x > 0
Esperanza
Varianza
a+b
2
(b − a)2
12
1
1
λ
λ2
Reproductividad
No es reproductiva
Si {Xi}i=1,...,n ≈ Exp (λ) independientes
⇒
n
∑ Xi ≈
γ (n, λ)
i =1
Gamma
γ(p,λ)
Normal
2
N(μ,σ )
λ >0
p >0
⎧ λ p −λx p −1
e
x
si x ∈ (0, ∞)
⎪
f ( x) = ⎨ Γ( p )
⎪0 en otro caso
⎩
μ ∈ (-∞,+∞)
2
σ ∈ (0,+∞)
f ( x) =
1
σ 2π
−
e
( x− μ )2
2σ 2
Ver tabla
p
p
λ
λ2
μ
σ
2
Si X1 ≈ γ(p1,λ) y X2 ≈ γ(p2,λ)
independientes ⇒
X1 + X2 ≈ γ( p1+p2,λ)
2
2
Si X1 ≈ N(μ1,σ1 )y X2 ≈ N(μ2, σ2 )
independientes ⇒
2
2
X1 + X2 ≈ N(μ1+μ2, σ1 +σ2 )
x∈ (-∞,+∞)
VARIABLES ALEATORIAS CONTINUAS ASOCIADAS AL MUESTREO EN POBLACIONES NORMALES
Chi-cuadrado n=grados de libertad
2
n >0 entero
χn
t de Student
tn
n=grados de libertad
n >0 entero
F de
SnedecorFisher
Fn,m
n=g.l. numerador
m=g.l. denominador
n,m >0 enteros
Es un caso particular de Gamma con
p=n/2 y λ=1/2
Ver tabla para percentiles
n
2n
Ver tabla para percentiles
0
n
n−2
Si X1 ≈ χ2n y X2 ≈ χ2m independientes
⇒
2
X1 + X2 ≈ χ n+m
Si X1 ≈ tn y X2 ≈ tm independientes ⇒
X1 + X2 ≈ tn+m
si n >2
Escuela Universitaria de Ingeniería Técnica Industrial
Ver tabla para percentiles
7
No es reproductiva
Cuaderno examen
Métodos Estadísticos de la Ingeniería
INTERVALOS DE CONFIANZA
1.
Intervalo de confianza para la media μ de una distribución normal de varianza σ2 conocida:
⎡
σ
σ ⎤
, x + z1−α / 2
I = ⎢ x − z1−α / 2
⎥
n
n⎦
⎣
2.
Intervalo de confianza para la media μ de una distribución normal de varianza σ2
desconocida:
(a) Muestras pequeñas (n≤30):
⎡
sˆ
sˆ ⎤
I = ⎢ x − t n −1;1−α / 2
, x + t n −1;1−α / 2
⎥
n
n⎦
⎣
(b) Muestras grandes (n>30):
⎡
sˆ
sˆ ⎤
I = ⎢ x − z1−α / 2
, x + z1−α / 2
⎥
n
n⎦
⎣
3.
Intervalo de confianza para la varianza σ2 de una distribución normal:
⎡ (n − 1)sˆ 2 (n − 1)sˆ 2 ⎤
I=⎢ 2
, 2
⎥
⎣⎢ χ n −1;1−α / 2 χ n −1;α / 2 ⎦⎥
4.
Intervalo de confianza para la diferencia de medias (μ1-μ2) de dos distribuciones normales
independientes:
(a) Varianzas poblacionales σ X2 y σ Y2 conocidas:
⎡
σ X2 σ Y2
σ X2 σ Y2 ⎤⎥
, ( x − y ) + z1−α / 2
I = ⎢( x − y ) − z1−α / 2
+
+
nX
nY
nX
nY ⎥
⎢
⎣
⎦
(b) Varianzas poblacionales desconocidas:
(b1) Varianzas desconocidas pero iguales:
⎡
1
1
1
1 ⎤
, ( x − y ) + t n X + nY −2;1−α / 2 sˆ p
I = ⎢( x − y ) − t n X + nY −2;1−α / 2 sˆ p
+
+
⎥
n X nY
n X nY ⎥⎦
⎢⎣
donde
sˆ p2 =
(n X − 1)sˆ 2X + (nY − 1)sˆY2
n X + nY − 2
es
un
promedio
ponderado
de
las
cuasivarianzas muestrales.
Escuela Universitaria de Ingeniería Técnica Industrial
8
Cuaderno examen
Métodos Estadísticos de la Ingeniería
(b2) Varianzas desconocidas y distintas:
⎡
sˆ 2X sˆY2
sˆ 2X sˆY2 ⎤
⎥
I = ⎢( x − y ) − t f ;1−α / 2
+
+
, ( x − y ) + t f ;1−α / 2
n X nY
n X nY ⎥
⎢
⎣
⎦
donde f =
(sˆ
⎛ sˆ 2X sˆY2 ⎞
⎜
⎟
+
⎜ n X nY ⎟
⎝
⎠
2
) (
2
2
X
)
nX
sˆ 2 n
+ Y Y
nX +1
nY + 1
2
− 2 aproximado al entero más próximo, son los
grados de libertad de la t de Student (aproximación de Welch)
5.
Intervalo de confianza para el cociente de varianzas
σ X2 σ Y2
de dos poblaciones
normales independientes:
⎡
sˆ 2X FnY −1;n X −1;1−α / 2 ⎤
sˆ 2X
⎥
I=⎢ 2
,
ˆY2
⎢ sˆY Fn X −1;nY −1;1−α / 2
⎥
s
⎣
⎦
6.
Intervalo de confianza para el parámetro p de una distribución binomial Bin(n,p):
⎡
pˆ (1 − pˆ )
pˆ (1 − pˆ ) ⎤
I = ⎢ pˆ − z1−α / 2
, pˆ + z1−α / 2
⎥
n
n
⎢⎣
⎥⎦
donde pˆ = x / n es la frecuencia relativa muestral.
7.
Intervalo de confianza para la diferencia de parámetros (p1-p2) de dos distribuciones
binomiales independientes Bin(n1,p1) y Bin(n2,p2):
⎡
pˆ X (1 − pˆ X ) pˆ Y (1 − pˆ Y )
pˆ X (1 − pˆ X ) pˆ Y (1 − pˆ Y ) ⎤
+
+
⎥
I = ⎢( pˆ X − pˆ Y ) − z1−α / 2
, ( pˆ X − pˆ Y ) + z1−α / 2
nX
nY
nX
nY
⎢⎣
⎥⎦
8.
Intervalo de confianza para la media de la diferencia de datos emparejados:
(a) Muestras pequeñas (n≤30):
⎡
sˆ
sˆ ⎤
I = ⎢d − t n −1;1−α / 2 d , d + t n −1;1−α / 2 d ⎥
n
n⎦
⎣
n
donde: d =
∑ di
i =1
n
n
; d i = x i − y i ; sˆ d2 =
∑ (d i − d ) 2
i =1
n −1
(b) Muestras grandes (n>30):
⎡
sˆ
sˆ ⎤
I = ⎢d − z1−α / 2 d , d + z1−α / 2 d ⎥
n
n⎦
⎣
Escuela Universitaria de Ingeniería Técnica Industrial
9
Cuaderno examen
Métodos Estadísticos de la Ingeniería
Fórmulas para líneas centrales y límites de control de los Gráficos de Control
Gráfico de
Dispersión medida por
Línea Central
Límites
x±
3s
Medias
Desviaciones típicas
Medias
Rangos
Desviaciones típicas
Desviaciones típicas
s
B3 s ; B 4 s
Rangos
Rangos
R
D3 R ; D4 R
s=
∑ si
k
y
R =
∑ Ri
k
; σˆ =
c2 n
x
x±
x
3R
d2 n
s
R
ó σˆ =
donde si y Ri son la desviación típica y el rango
c2
d2
de cada muestra, respectivamente. μ̂ = x .Se tienen k muestras cada una de tamaño n.
Coeficientes para los gráficos de control
n
c2
B3
B4
d2
D3
D4
2
0.5642
0
3.267
1.128
0
3.276
3
0.7236
0
2.568
1.693
0
2.575
4
0.7979
0
2.266
2.059
0
2.282
5
0.8407
0
2.089
2.326
0
2.115
6
0.8686
0.030
1.970
2.534
0
2.004
7
0.8882
0.118
1.882
2.704
0.076
1.924
8
0.9027
0.185
1.815
2.847
0.136
1.864
9
0.9139
0.239
1.761
2.970
0.184
1.816
10
0.9227
0.284
1.716
3.078
0.223
1.777
11
0.9300
0.321
1.679
3.173
0.256
1.744
12
0.9359
0.354
1.646
3.258
0.284
1.719
13
0.9410
0.382
1.618
3.336
0.308
1.692
14
0.9453
0.406
1.594
3.407
0.329
1.671
15
0.9490
0.428
1.572
3.472
0.348
1.652
16
0.9523
0.448
1.552
3.532
0.364
1.636
17
0.9551
0.466
1.534
3.588
0.379
1.621
18
0.9576
0.482
1.518
3.640
0.392
1.608
19
0.9599
0.497
1.503
3.689
0.404
1.596
20
0.9619
0.510
1.490
3.735
0.414
1.586
21
0.9638
0.523
1.477
3.778
0.425
1.575
22
0.9655
0.534
1.466
3.819
0.434
1.566
23
0.9670
0.545
1.455
3.858
0.443
1.557
24
0.9684
0.555
1.445
3.895
0.452
1.548
25
0.9696
0.565
1.435
3.931
0.459
1.541
Escuela Universitaria de Ingeniería Técnica Industrial
10
Cuaderno examen
Métodos Estadísticos de la Ingeniería
TABLAS
Binomial
Poisson
Normal estándar
t de Student
Chi-cuadrado de Pearson
F de Snedecor-Fisher
Escuela Universitaria de Ingeniería Técnica Industrial
11