Download intervalos de confianza - Departamento de Métodos Estadísticos
Document related concepts
Transcript
DEPARTAMENTO DE MÉTODOS ESTADÍSTICOS UNIVERSIDAD DE ZARAGOZA EUITI MÉTODOS ESTADÍSTICOS DE LA INGENIERÍA CUADERNO PARA EL EXAMEN 2009-2010 Isolina Alberto Moralejo Cuaderno examen Métodos Estadísticos de la Ingeniería INGENIERÍA TÉCNICA INDUSTRIAL MÉTODOS ESTADÍSTICOS DE LA INGENIERÍA OBJETIVOS DE LA ASIGNATURA Todo lo relacionado con la toma, procesamiento, análisis e interpretación de datos numéricos pertenece al terreno de la Estadística. En esta asignatura se aprenderá a extraer información de conjuntos de datos, a interpretar esta información y a obtener conclusiones, basadas en datos experimentales, que ayuden al ingeniero a la toma de decisiones. Esto incluye tareas tan diversas como decidir si revisar o no un proceso de fabricación que puede estar desajustado, lanzar o no un nuevo producto al mercado, comprar o no una nueva máquina, etc. A lo largo del curso se expondrán aplicaciones de la estadística a problemas concretos de la ingeniería. PRÁCTICAS Las prácticas de la asignatura serán sesiones de 2 horas distribuidas en semanas alternas. Los grupos de prácticas se deberán formar en la primera semana del cuatrimestre. Los grupos de prácticas, así como los horarios de las mismas los podréis consultar en el aula. Procurad hacer los grupos de forma que no se os solapen las prácticas de Métodos Estadísticos con las de otras asignaturas. Las prácticas se realizarán con el programa Microsoft Excel. Escuela Universitaria de Ingeniería Técnica Industrial 2 Cuaderno examen Métodos Estadísticos de la Ingeniería CRITERIOS DE EVALUACIÓN La evaluación de la asignatura será mediante una prueba escrita. Dicha prueba constará de dos partes. La primera consistirá en la resolución de ejercicios teórico-prácticos y puntuará sobre 7.5 puntos. La segunda consistirá en el análisis de un conjunto de datos en el ordenador utilizando el software Microsoft Excel y puntuará sobre 2.5 puntos. Se dispondrá de dos horas y media para la primera parte y una hora para la segunda. Como mínimo habrá que sacar un 3 (sobre 7.5 puntos) en la primera parte y un 0.75 (sobre 2.5 puntos) en la segunda parte. Una vez conseguido esto, la nota de la asignatura se calculará sumando las notas obtenidas en las dos partes. Para la realización del examen únicamente se dispondrá del cuaderno de examen que está disponible en reprografía. Para el examen es imprescindible llevar calculadora. No se guardan partes de la asignatura (teoría o prácticas) entre convocatorias. En cada examen hay que presentarse a ambas partes. [Nota: el Departamento de Métodos Estadísticos está ubicado en el edificio Leonardo Torres Quevedo] Escuela Universitaria de Ingeniería Técnica Industrial 3 Cuaderno examen Métodos Estadísticos de la Ingeniería ESTADÍSTICA DESCRIPTIVA UNIDIMENSIONAL Datos {xi}, i = 1,...,N; K clases, k = 1,....K; marca de clase = x k Media = x = ∑ x i ∑ nk x k = i N Varianza = s 2 = k N = ∑ fk x k k ∑ ( x i − x )2 ∑ nk ( x k − x )2 = i N Cuasi-varianza = sˆ 2 = k N = ∑ fk ( x k − x )2 k ∑ ( x i − x ) 2 ∑ nk ( x k − x ) 2 i = N −1 k N −1 Desviación típica = s = s 2 Cuasidesviación típica = sˆ = sˆ 2 La desigualdad de Chebychev garantiza que el porcentaje de observaciones dentro del 1 ⎞ ⎛ intervalo x ± ks es, al menos, de ⎜1 − 2 ⎟ 100% ⎝ k ⎠ Coeficiente de variación = CV = s x Grupos en una variable cuantitativa según una cualitativa La variable X con N observaciones, media x y varianza s2 se divide en L grupos (h = 1,...,L). En cada uno de ellos se calcula el número de datos, la media y la varianza: n1, x1, s12 n 2 , x 2 , s 22 ...... n h , x h , s h2 ..... n L , x L , s L2 nh al peso relativo o ponderación de cada grupo. Entonces, la media y la N varianza globales se calculan: Llamamos w h = L Media ponderada = x = ∑ w h x h h =1 Varianza = s 2 = ∑ w h s h2 + ∑ w h (x h − x ) 2 h h Escuela Universitaria de Ingeniería Técnica Industrial 4 Cuaderno examen Métodos Estadísticos de la Ingeniería ESTADÍSTICA DESCRIPTIVA BIDIMENSIONAL (xi, yi), i = 1,...,N Covarianza = cov( x, y ) = ∑ (xi − x )( y i − y ) i N Recta de regresión: yˆ = a + bx , donde: a=y− cov( x, y ) cov( x, y ) x; b = 2 sx s x2 Coeficiente de correlación lineal = r = cov( x, y ) ; −1≤ r ≤ 1 sxsy PROBABILIDAD Cuando un suceso A puede ocurrir condicionado a la ocurrencia de varios Bi, mutuamente excluyentes y exhaustivos (sistema completo de sucesos) (Σ P(Bi) = 1), se tiene que: n Teorema de la Probabilidad Total: P ( A) = ∑ P ( A | Bi )P (Bi ) i =1 Teorema de Bayes: P (B j | A) = P ( A | B j )P (B j ) n ∑ P ( A | Bi )P(Bi ) i =1 APROXIMACIONES ENTRE VARIABLES TEOREMA CENTRAL DEL LÍMITE Sean Xi, i = 1,...,n, una muestra aleatoria simple procedente de una población X (no necesariamente normal), con media μ y varianza σ2. Si n es suficientemente grande (n>30), Y = Σ Xi se distribuye N (nμ, nσ2) X = Y/n se distribuye N ( μ , σ2 n ) Escuela Universitaria de Ingeniería Técnica Industrial 5 Cuaderno examen Métodos Estadísticos de la Ingeniería VARIABLES ALEATORIAS DISCRETAS Variable Parámetros Definición Bernoulli Ber (p) p∈(0,1) ⎧0 si fracaso X =⎨ ⎩1 si éxito Rango de valores k=0,1 Función de probabilidad Tabla/Función de distribución P(X=k)=pk(1-p)1-k Media p Varianza Reproductividad p(1-p) Si {Xi}i=1,...,n ≈ Ber (p) independientes ⇒ n ∑ Xi ≈ Bin (n,p) i =1 Binomial Bin (n,p) Poisson P(λ) Geométrica Geom(p) Número de éxitos n >0 entero en n realizaciones del experip∈(0,1) mento. Muestreo con reposición. Número de λ >0 ocurrencias en un intervalo continuo de amplitud una unidad. Número de fracasos antes p∈(0,1) del primer éxito. k=0,1,...,n k=0,1,2,3,.... k=0,1,2,3,.... ⎛n⎞ P ( X = k ) = ⎜⎜ ⎟⎟ p k (1 − p ) n − k ⎝k ⎠ P( X = k ) = e − λ λk k! P ( X = k ) = (1 − p) k p Ver tabla np np(1-p) Ver tabla λ λ F (k ) = 1 − (1 − p) k +1 1− p p 1− p p2 Si X1 ≈ Bin (n1,p) y X2 ≈ Bin (n2,p) independientes ⇒ X1 + X2 ≈ Bin (n1+n2,p) Si X1 ≈ P(λ1) y X2 ≈ P(λ2) independientes ⇒ X1 + X2 ≈ P(λ1+λ2) Si {Xi}i=1,...,n ≈ Geom (p) independientes ⇒ n ∑ Xi ≈ BN (n,p) i =1 Binomial negativa BN(n,p) Número de n >0 entero fracasos antes del n-ésimo éxito. p∈(0,1) Hipergeométrica D≤N H(N,D,n) n≤N N,D,n enteros positivos k=0,1,2,3,.... ⎛ n + k − 1⎞ ⎟⎟(1 − p ) k p n Relación con la Binomial: P ( X = k ) = ⎜⎜ k ⎠ ⎝ FBN ( n, p ) (k ) = n(1 − p) p n(1 − p ) nD N np (1 − p )( N − n) N −1 = 1 − FBin( n+ k , p ) (n − 1) Número de exitos en la muestra. Muestreo sin reposición. k=max{0, n+D-N}, 1,..., min{n,D} Escuela Universitaria de Ingeniería Técnica Industrial ⎛ N − D ⎞⎛ D ⎞ ⎜⎜ ⎟⎟⎜⎜ ⎟⎟ ⎝ n − k ⎠⎝ k ⎠ P( X = k ) = ⎛N⎞ ⎜⎜ ⎟⎟ ⎝n ⎠ p2 con p=D/N 6 Si X1 ≈ BN (n1,p) y X2 ≈ BN (n2,p) independientes ⇒ X1 + X2 ≈ BN (n1+n2,p) No es reproductiva Cuaderno examen Métodos Estadísticos de la Ingeniería VARIABLES ALEATORIAS CONTINUAS Variable Uniforme U(a,b) Parámetros a<b Exponencial Exp(λ) λ >0 Función de densidad Tabla/Función de distribución ⎧ 1 si x ∈ (a, b) ⎪ f ( x) = ⎨ b − a ⎪0 en otro caso ⎩ ⎧0 si x ≤ a ⎪x−a ⎪ F ( x) = ⎨ si x ∈ (a, b) ⎪b − a ⎪⎩1 si x ≥ b ⎧⎪λ e −λx si x ∈ (0, ∞) f ( x) = ⎨ ⎪⎩0 en otro caso ⎧⎪0 si x ≤ 0 F ( x) = ⎨ ⎪⎩1 − e −λ x si x > 0 Esperanza Varianza a+b 2 (b − a)2 12 1 1 λ λ2 Reproductividad No es reproductiva Si {Xi}i=1,...,n ≈ Exp (λ) independientes ⇒ n ∑ Xi ≈ γ (n, λ) i =1 Gamma γ(p,λ) Normal 2 N(μ,σ ) λ >0 p >0 ⎧ λ p −λx p −1 e x si x ∈ (0, ∞) ⎪ f ( x) = ⎨ Γ( p ) ⎪0 en otro caso ⎩ μ ∈ (-∞,+∞) 2 σ ∈ (0,+∞) f ( x) = 1 σ 2π − e ( x− μ )2 2σ 2 Ver tabla p p λ λ2 μ σ 2 Si X1 ≈ γ(p1,λ) y X2 ≈ γ(p2,λ) independientes ⇒ X1 + X2 ≈ γ( p1+p2,λ) 2 2 Si X1 ≈ N(μ1,σ1 )y X2 ≈ N(μ2, σ2 ) independientes ⇒ 2 2 X1 + X2 ≈ N(μ1+μ2, σ1 +σ2 ) x∈ (-∞,+∞) VARIABLES ALEATORIAS CONTINUAS ASOCIADAS AL MUESTREO EN POBLACIONES NORMALES Chi-cuadrado n=grados de libertad 2 n >0 entero χn t de Student tn n=grados de libertad n >0 entero F de SnedecorFisher Fn,m n=g.l. numerador m=g.l. denominador n,m >0 enteros Es un caso particular de Gamma con p=n/2 y λ=1/2 Ver tabla para percentiles n 2n Ver tabla para percentiles 0 n n−2 Si X1 ≈ χ2n y X2 ≈ χ2m independientes ⇒ 2 X1 + X2 ≈ χ n+m Si X1 ≈ tn y X2 ≈ tm independientes ⇒ X1 + X2 ≈ tn+m si n >2 Escuela Universitaria de Ingeniería Técnica Industrial Ver tabla para percentiles 7 No es reproductiva Cuaderno examen Métodos Estadísticos de la Ingeniería INTERVALOS DE CONFIANZA 1. Intervalo de confianza para la media μ de una distribución normal de varianza σ2 conocida: ⎡ σ σ ⎤ , x + z1−α / 2 I = ⎢ x − z1−α / 2 ⎥ n n⎦ ⎣ 2. Intervalo de confianza para la media μ de una distribución normal de varianza σ2 desconocida: (a) Muestras pequeñas (n≤30): ⎡ sˆ sˆ ⎤ I = ⎢ x − t n −1;1−α / 2 , x + t n −1;1−α / 2 ⎥ n n⎦ ⎣ (b) Muestras grandes (n>30): ⎡ sˆ sˆ ⎤ I = ⎢ x − z1−α / 2 , x + z1−α / 2 ⎥ n n⎦ ⎣ 3. Intervalo de confianza para la varianza σ2 de una distribución normal: ⎡ (n − 1)sˆ 2 (n − 1)sˆ 2 ⎤ I=⎢ 2 , 2 ⎥ ⎣⎢ χ n −1;1−α / 2 χ n −1;α / 2 ⎦⎥ 4. Intervalo de confianza para la diferencia de medias (μ1-μ2) de dos distribuciones normales independientes: (a) Varianzas poblacionales σ X2 y σ Y2 conocidas: ⎡ σ X2 σ Y2 σ X2 σ Y2 ⎤⎥ , ( x − y ) + z1−α / 2 I = ⎢( x − y ) − z1−α / 2 + + nX nY nX nY ⎥ ⎢ ⎣ ⎦ (b) Varianzas poblacionales desconocidas: (b1) Varianzas desconocidas pero iguales: ⎡ 1 1 1 1 ⎤ , ( x − y ) + t n X + nY −2;1−α / 2 sˆ p I = ⎢( x − y ) − t n X + nY −2;1−α / 2 sˆ p + + ⎥ n X nY n X nY ⎥⎦ ⎢⎣ donde sˆ p2 = (n X − 1)sˆ 2X + (nY − 1)sˆY2 n X + nY − 2 es un promedio ponderado de las cuasivarianzas muestrales. Escuela Universitaria de Ingeniería Técnica Industrial 8 Cuaderno examen Métodos Estadísticos de la Ingeniería (b2) Varianzas desconocidas y distintas: ⎡ sˆ 2X sˆY2 sˆ 2X sˆY2 ⎤ ⎥ I = ⎢( x − y ) − t f ;1−α / 2 + + , ( x − y ) + t f ;1−α / 2 n X nY n X nY ⎥ ⎢ ⎣ ⎦ donde f = (sˆ ⎛ sˆ 2X sˆY2 ⎞ ⎜ ⎟ + ⎜ n X nY ⎟ ⎝ ⎠ 2 ) ( 2 2 X ) nX sˆ 2 n + Y Y nX +1 nY + 1 2 − 2 aproximado al entero más próximo, son los grados de libertad de la t de Student (aproximación de Welch) 5. Intervalo de confianza para el cociente de varianzas σ X2 σ Y2 de dos poblaciones normales independientes: ⎡ sˆ 2X FnY −1;n X −1;1−α / 2 ⎤ sˆ 2X ⎥ I=⎢ 2 , ˆY2 ⎢ sˆY Fn X −1;nY −1;1−α / 2 ⎥ s ⎣ ⎦ 6. Intervalo de confianza para el parámetro p de una distribución binomial Bin(n,p): ⎡ pˆ (1 − pˆ ) pˆ (1 − pˆ ) ⎤ I = ⎢ pˆ − z1−α / 2 , pˆ + z1−α / 2 ⎥ n n ⎢⎣ ⎥⎦ donde pˆ = x / n es la frecuencia relativa muestral. 7. Intervalo de confianza para la diferencia de parámetros (p1-p2) de dos distribuciones binomiales independientes Bin(n1,p1) y Bin(n2,p2): ⎡ pˆ X (1 − pˆ X ) pˆ Y (1 − pˆ Y ) pˆ X (1 − pˆ X ) pˆ Y (1 − pˆ Y ) ⎤ + + ⎥ I = ⎢( pˆ X − pˆ Y ) − z1−α / 2 , ( pˆ X − pˆ Y ) + z1−α / 2 nX nY nX nY ⎢⎣ ⎥⎦ 8. Intervalo de confianza para la media de la diferencia de datos emparejados: (a) Muestras pequeñas (n≤30): ⎡ sˆ sˆ ⎤ I = ⎢d − t n −1;1−α / 2 d , d + t n −1;1−α / 2 d ⎥ n n⎦ ⎣ n donde: d = ∑ di i =1 n n ; d i = x i − y i ; sˆ d2 = ∑ (d i − d ) 2 i =1 n −1 (b) Muestras grandes (n>30): ⎡ sˆ sˆ ⎤ I = ⎢d − z1−α / 2 d , d + z1−α / 2 d ⎥ n n⎦ ⎣ Escuela Universitaria de Ingeniería Técnica Industrial 9 Cuaderno examen Métodos Estadísticos de la Ingeniería Fórmulas para líneas centrales y límites de control de los Gráficos de Control Gráfico de Dispersión medida por Línea Central Límites x± 3s Medias Desviaciones típicas Medias Rangos Desviaciones típicas Desviaciones típicas s B3 s ; B 4 s Rangos Rangos R D3 R ; D4 R s= ∑ si k y R = ∑ Ri k ; σˆ = c2 n x x± x 3R d2 n s R ó σˆ = donde si y Ri son la desviación típica y el rango c2 d2 de cada muestra, respectivamente. μ̂ = x .Se tienen k muestras cada una de tamaño n. Coeficientes para los gráficos de control n c2 B3 B4 d2 D3 D4 2 0.5642 0 3.267 1.128 0 3.276 3 0.7236 0 2.568 1.693 0 2.575 4 0.7979 0 2.266 2.059 0 2.282 5 0.8407 0 2.089 2.326 0 2.115 6 0.8686 0.030 1.970 2.534 0 2.004 7 0.8882 0.118 1.882 2.704 0.076 1.924 8 0.9027 0.185 1.815 2.847 0.136 1.864 9 0.9139 0.239 1.761 2.970 0.184 1.816 10 0.9227 0.284 1.716 3.078 0.223 1.777 11 0.9300 0.321 1.679 3.173 0.256 1.744 12 0.9359 0.354 1.646 3.258 0.284 1.719 13 0.9410 0.382 1.618 3.336 0.308 1.692 14 0.9453 0.406 1.594 3.407 0.329 1.671 15 0.9490 0.428 1.572 3.472 0.348 1.652 16 0.9523 0.448 1.552 3.532 0.364 1.636 17 0.9551 0.466 1.534 3.588 0.379 1.621 18 0.9576 0.482 1.518 3.640 0.392 1.608 19 0.9599 0.497 1.503 3.689 0.404 1.596 20 0.9619 0.510 1.490 3.735 0.414 1.586 21 0.9638 0.523 1.477 3.778 0.425 1.575 22 0.9655 0.534 1.466 3.819 0.434 1.566 23 0.9670 0.545 1.455 3.858 0.443 1.557 24 0.9684 0.555 1.445 3.895 0.452 1.548 25 0.9696 0.565 1.435 3.931 0.459 1.541 Escuela Universitaria de Ingeniería Técnica Industrial 10 Cuaderno examen Métodos Estadísticos de la Ingeniería TABLAS Binomial Poisson Normal estándar t de Student Chi-cuadrado de Pearson F de Snedecor-Fisher Escuela Universitaria de Ingeniería Técnica Industrial 11