Download Medidas de dispesión
Document related concepts
Transcript
Estadística Administrativa I 2016-1 Medidas de dispersión También llamadas medidas de variabilidad. Son complementarias a las medidas de ubicación. Mide la diferencia que existe entre un promedio y los datos utilizados para calcularlo. 2 Medidas de dispersión Una medida mientras más baja es, los datos están más cerca de la media; al contrario, una dispersión muy alta hace que la media aritmética ya no sea tan confiable al momento de tomar decisiones y sea necesario tomar otros tipos de promedio. 3 Tipos de medidas de dispersión • • • • Rango Desviación media Varianza Desviación estándar 4 Rango • Es la medida de dispersión mas simple, es la diferencia entre el dato mayor y el menor de una muestra. • Esta medida es la que más se utiliza para realizar controles de procesos estadísticos (CPE), puesto que determina en qué parámetros nos debemos basar para la toma de decisiones. 5 Ejemplo 5.1 . . . Estamos vendiendo cámaras digitales con precios que varían según los megapíxeles, zoom, tipo de lente y la capacidad de la Micro SD. Los precios en dólares que se han marcado para modelos específicos son: 340 390 380 450 290 500 425 370 270 280 400 475 220 310 Determinar el rango de precios que estamos ofreciendo a los clientes. 6 . . . Ejemplo 5.1 𝑅𝑎𝑛𝑔𝑜 = 𝑚𝑎𝑥 − 𝑚𝑖𝑛 • Determinar cuál es el precio mayor y cuál es el menor en la muestra: 340 390 380 450 290 500 425 370 270 280 400 475 220 310 Rango = 500 – 220 = 280 Estamos ofreciendo cámaras a precios entre 220 y 500 dólares lo que representa una rango de 280 dólares. 7 Desviación media Representa el punto medio del rango; con esta medida se puede considerar cuál es el rango promedio de los datos de una muestra. Es la media aritmética de los valores absolutos de las desviaciones con respecto a la media aritmética. 8 Desviación media 𝑀𝐷 = • MD • X • n • = = = = |𝑋 − 𝑋| 𝑛 Desviación media Dato de la muestra Tamaño de la muestra Sumar todos los datos 9 Ejemplo 5.2 . . . La cantidad de capuccinos vendidos por Espresso Americano en el aeropuerto Toncontín, entre 3 y 4 de la tarde de una muestra de 5 días de hace dos meses fue de 20, 40, 50, 60 y 80 vasos de 12 onzas. Se desea conocer el promedio medio de la venta diaria. Calcular la desviación media. 10 . . . Ejemplo 5.2 𝑀𝐷 = |𝑋 − 𝑋| 𝑛 a) Media aritmética 20 + 40 + 50 + 60 + 80 250 𝑋= = 5 5 𝑋 = 50 b) Desviación Media 20 − 50 + 40 − 50 + 50 − 50 + 60 − 50 + |80 − 50| 𝐷𝑀 = 5 −30 + −10 + 0 + 10 + |30| 30 + 10 + 0 + 10 + 30 𝐷𝑀 = = 5 5 80 𝐷𝑀 = = 16 5 La desviación media es de 16 capuccinos por día. 11 Varianza Es la media aritmética de las desviaciones de la media aritmética elevadas al cuadrado. Es la medida de dispersión más utilizada en los estudios inferenciales. 𝜎 2 𝑠 2 12 Varianza • Poblacional • Muestral 𝜎2 = (𝑥 − µ)2 𝑁 𝑺2 = (𝑥 − 𝑋)2 𝑛−1 13 Ejemplo 5.3 . . . La oficina de ventas está revisando los pedidos que fueron recibidos de parte de los 5 vendedores contratados para la zona rural. Juan 38 Pedro 26 Ramón 13 Rodrigo 41 Marcos 22 Calcular la varianza de pedidos entre vendedores Variación cuadrada poblacional 14 Ejemplo 5.3…… 𝜎2 = (𝑥 − µ)2 5 a) Media aritmética 38 + 26 + 13 + 41 + 22 140 𝜇= = = 28 5 5 b) Varianza 38 − 28 2 + 26 − 28 2 + 13 − 28 2 2 + 22 − 28 2 + 41 − 28 𝜎2 = 5 2 + −2 2 + −15 2 + 13 2 + −6 2 10 𝜎2 = 5 100 + 4 + 225 + 169 + 36 534 2 𝜎 = = = 106.8 5 5 La varianza es de 106.8 pedidos cuadrados de la zona rural. 15 Desviación estándar 𝜎 Para calcular la desviación estándar se calcula la raíz cuadrada de la varianza. Con este simple método, se garantiza que las unidades cuadradas se conviertan en unidades simples. 𝜎= 𝜎2 16 Ejemplo 5.4 . . . 𝜎= 𝜎2 La oficina de ventas está revisando los pedidos que fueron recibidos de parte de los 5 vendedores contratados para la zona rural. Juan 38 Pedro 26 Ramón 13 Rodrigo 41 Marcos 22 El valor de la varianza es 106.8 pedidos cuadrados. Se quiere calcular la desviación estándar. 𝜎 2 = 106.8 𝜎 = 106.8 = 10.3344 La desviación estándar de la población es de 10.33 pedidos por vendedor . . . Ejemplo 5.4 28 18 Variación y Muestras La variación en las muestras difiere de la utilizada en la población, se da una unidad de diferencia con respecto a la tamaño de la muestra. 𝑺2 = 𝑠= (𝑥 − 𝑋)2 𝑛−1 𝑠2 19 Ejemplo 5.5 . . . Los salarios por hora de una muestra de empleados de medio tiempo de Home Depot son: $12, $20, $16, $18 y $19 por hora. Calcular la desviación estándar de la muestra. Proceso: 1. Media aritmética 2. Varianza 3. Desviación estándar 20 (𝑥 − 𝑋)2 𝑛−1 𝑠2 = . . . Ejemplo 5.5. Media aritmética 12 + 20 + 16 + 18 + 19 85 𝑋= = = 17 5 5 Varianza 𝑠2 = 𝑠2 = 12 − 17 −5 2 2 + 3 + 20 − 17 2 2 + 16 − 17 5−1 + −1 2 + 1 5−1 2 + 2 2 2 + 18 − 17 2 + 19 − 17 25 + 9 + 1 + 1 + 4 40 = = 4 4 𝑠 2 = 10 Desviación estándar 𝑠 = 3.162 La variación promedio de la muestra es de 3.2 dólares por hora 2 Teorema de Chebyshev En cualquier conjunto de observaciones de una muestra o una población, la proporción de valores que se encuentran a k desviaciones estándar de la media es de por lo menos 1− 1/k2, siendo k cualquier constante mayor que 1. 1 𝑝=1− 2 𝑘 22 Teorema de Chebyshev • Una desviación estándar pequeña para una muestra, indica que estos valores se localizan cerca de la media; por el contrario, una desviación grande revela que las observaciones se encuentran muy dispersas con respecto a la media. • Según el teorema de Chebyshev para que una medida de dispersión sea confiable, el 75% de los datos deben encontrarse a cierta cantidad de desviaciones estándares de la media, ya sea antes o después de ella. 23 Teorema de Chevyshev Desviación grande Desviación pequeña 24 Ejemplo 5.6 . . . La media aritmética de la aportación para la cooperativa de parte de los empleados de “La Oficina Ideal” es de 316.00 y la desviación estándar de 113.60. ¿Qué porcentaje de las aportaciones se encuentra en más o menos de 3.5 desviaciones estándares? 25 . . . Ejemplo 5.6 1 𝑝=1− 2 𝑘 𝑋 = 316.00 𝑠 = 113.60 𝑘 = 3.5 1 𝑝 =1− 3.5 2 1 =1− = 1 − 0.0816 12.25 𝑝 = 0.9184 = 0.92 El 92% de los datos de la muestra están alrededor de las 3.5 desviaciones a ambos lados de la media aritmética. 26 La regla empírica En cualquier distribución de frecuencias simétrica, aproximadamente el 68% de los datos se encuentran entre más y menos 1 desviación estándar; cerca del 95% se encuentran entre más y menos 2 desviaciones estándar y el 99.7% (casi todas) estarán entre más y menos 3 desviaciones estándar. 68% 95% 99.7% ±1𝜎 ±2𝜎 ±3𝜎 27 Ejemplo 5.7 . . . En una empresa de bienes y raíces, los precios de la renta de casas que se ofrecen en alquiler en la zona Sur tienen una distribución de frecuencias simétrica. La media de la muestra es de L.8,000 y la desviación estándar de L.1,500. ¿Entre qué cantidades se encuentra el 95% de los precios?. 28 . . . Ejemplo 5.7 Regla Empírica 68% 95% 99.7% 𝜇 ± 1𝜎 𝜇 ± 2𝜎 𝜇 ± 3𝜎 El 95% equivale a 2 desviaciones estándar a cada lado de la media. 𝜇 ± 2𝜎 = 8000 ± 2(1500) = 8000 ± 3000 8000 − 3000 = 8000 + 3000 = 5000 11000 El 95% de los precios de las casas en la zona Sur oscilan entre L.5,000 y L.11,000. 29 Una fábrica de jugos entrega sus productos a 10 distribuidoras especializadas y los pedidos entregados del mes pasado en miles de cajas fue la siguiente: 1 2 2 2 8 5 7 7 1 5 Calcular: • Medidas de dispersión • Aplicar teorema de Chebychev para 3 desviaciones estándar. • Aplicar la regla empírica para el 68% de los casos Rango Datos 1 2 8 𝐷𝑎𝑡𝑜 𝑚𝑎𝑦𝑜𝑟 = 8 𝐷𝑎𝑡𝑜 𝑚𝑒𝑛𝑜𝑟 = 1 𝑅𝑎𝑛𝑔𝑜 = 8 − 1 = 7 El rango es de 7 mil cajas. 7 1 2 2 5 7 5 Desviación media a) Media aritmética 40 1+2+8+7+1+2+2+5+7+5 =4 = 𝜇= 10 10 b) Desviación media |𝑋 − 𝑋| 𝑀𝐷 = 𝑛 1−4 + 2−4 + 8−4 + 7−4 + 1−4 + 2 − 4 + 2 − 4 + 5 − 4 + 7 − 4 + |5 − 4| 𝑀𝐷 = = 2.4 10 La desviación media es de 2.4 mil cajas por distribuidor. Varianza a) Media aritmética 40 𝜇= 10 =4 𝜎2 = b) Varianza 𝜎2 = 1−4 2−4 (𝑥 − µ)2 𝑁 2 + (2 − 4)2 +(8 − 4)2 + 7 − 4 2 + 1 − 4 2 + 2+ 2−4 2+ 5−4 2+ 7−4 2+ 5−4 2 10 66 𝜎 = = 6.6 10 2 La varianza es de 6.6 mil cajas cuadradas. Desviación estándar 𝜎 2 = 6.6 𝜎 = 6.6 𝜎 = 2.569 La desviación estándar es de 2.6 mil cajas Teorema de Chevyshev 𝑘=3 1 1 𝑝=1− = 1 − = 1 − 0.1111 2 3 9 𝑝 = 0.8889 El 89% de las entregas están en más o menos 3 desviaciones estándares de la media. Regla empírica (68%) 𝜇=4 𝜎 = 2.569 68% 95% 99.7% 𝜇 ± 1𝜎 𝜇 ± 2𝜎 𝜇 ± 3𝜎 𝜇 ± 1𝜎 = 4 ± 1(2.569) = 4 ± 2.569 4 − 2.569 = 4 + 2.569 1.431 = 6.569 El 68% de las entregas que se hacen están entre 1.4 y 6.6 mil cajas. Distribuciones Astro es una empresa que vende productos para el hogar y de las ventas del mes pasado recolectó una muestra 8 vendedores para estudiar la variación entre cada uno de ellos. Las ventas (cientos de cajas) de cada vendedor fue la siguiente: 1 2 6 7 2 2 5 7 Calcular: • Medidas de dispersión • Aplicar teorema de Chebychev para 3 desviaciones estándar. • Aplicar la regla empírica para el 99.7% de los casos Rango Datos 1 2 𝐷𝑎𝑡𝑜 𝑚𝑎𝑦𝑜𝑟 = 7 𝐷𝑎𝑡𝑜 𝑚𝑒𝑛𝑜𝑟 = 1 𝑅𝑎𝑛𝑔𝑜 = 7 − 1 = 6 El rango es de 600 cajas. 6 7 2 2 5 7 Desviación media a) Media aritmética 1+2+6+7+2+2+5+7 𝑋= 8 32 =4 = 8 b) Desviación media |𝑋 − 𝑋| 𝑀𝐷 = 𝑛 1−4 + 2−4 + 6−4 + 7−4 + 2−4 + 2−4 + 5−4 + 7−4 𝑀𝐷 = = 2.25 8 La desviación media es de 225 cajas por vendedor. Varianza a) Media aritmética 32 =4 𝑋= 8 𝑠2 = b) Varianza 𝑠2 = 1−4 2−4 (𝑥 − µ)2 𝑛−1 2 + (2 − 4)2 +(6 − 4)2 + 7 − 4 2 + 2+ 2−4 2+ 5−4 2+ 7−4 2 8−1 44 𝑠 = = 6.29 7 2 La varianza es de 629 cajas cuadradas. Desviación estándar 𝑠 2 = 6.29 𝜎 = 6.29 𝜎 = 2.508 La desviación estándar es de 251 cajas Teorema de Chevyshev - Para 3 desviaciones estándar 1 𝑘=3 %=1− 2 𝑘 1 % = 1 − 2 = 0.889 3 Según el teorema de Chevyshev se tendrían cubiertos el 89% de los casos. Regla Empírica - Para 3 desviaciones estándar 𝑋=4 68% 95% 99.7% 𝑠 = 2.508 𝑋 ± 3𝑠 = 4 ± 3(2.508) 𝑋 ± 1𝑠 𝑋 ± 2𝑠 𝑋 ± 3𝑠 = 4 ± 7.529 = 4 − 7.529 4 + 7.529 = 0 11.524 Según la regla empiríca las entregas se hacen entre 0 y 1152 cajas. Para más información leer la página web www.lbanegas.com 𝐵𝑖𝑏𝑙𝑖𝑜𝑔𝑟𝑎𝑓í𝑎 Lind, D.A., Marchal, W.G., Wathen, S.A. (15). (2012). Estadística Aplicada a los Negocios y la Economía. México: McGrawHill David M. Levine, Timothy C. Krehbiel, Mark L. Berenson. 2006. Estadística para Administración. (4° edición). Naucalpan de Juárez, México.: Pearson Prentice Hall 45