Download Medidas de dispesión

Document related concepts

Desviación típica wikipedia , lookup

Medidas de dispersión wikipedia , lookup

Corrección de Bessel wikipedia , lookup

Varianza wikipedia , lookup

Error estándar wikipedia , lookup

Transcript
Estadística
Administrativa I
2016-1
Medidas de
dispersión
También llamadas medidas de variabilidad.
Son complementarias a las medidas de
ubicación.
Mide la diferencia que existe entre un
promedio y los datos utilizados para
calcularlo.
2
Medidas de
dispersión
Una medida mientras más baja es, los datos están
más cerca de la media; al contrario, una
dispersión muy alta hace que la media aritmética
ya no sea tan confiable al momento de tomar
decisiones y sea necesario tomar otros tipos de
promedio.
3
Tipos de medidas de
dispersión
•
•
•
•
Rango
Desviación media
Varianza
Desviación estándar
4
Rango
• Es la medida de dispersión mas simple, es la
diferencia entre el dato mayor y el menor de una
muestra.
• Esta medida es la que más se utiliza para realizar
controles de procesos estadísticos (CPE), puesto que
determina en qué parámetros nos debemos basar
para la toma de decisiones.
5
Ejemplo 5.1 . . .
Estamos vendiendo cámaras digitales con precios que
varían según los megapíxeles, zoom, tipo de lente y la
capacidad de la Micro SD. Los precios en dólares que
se han marcado para modelos específicos son:
340
390
380
450
290
500
425
370
270
280
400
475
220
310
Determinar el rango de precios que estamos
ofreciendo a los clientes.
6
. . . Ejemplo 5.1
𝑅𝑎𝑛𝑔𝑜 = 𝑚𝑎𝑥 − 𝑚𝑖𝑛
• Determinar cuál es el precio mayor y cuál es el menor en la
muestra:
340
390
380
450
290
500
425
370
270
280
400
475
220
310
Rango = 500 – 220 = 280
Estamos ofreciendo cámaras a precios entre 220 y 500
dólares lo que representa una rango de 280 dólares.
7
Desviación media
Representa el punto medio del rango; con
esta medida se puede considerar cuál es el
rango promedio de los datos de una muestra.
Es la media aritmética de los valores
absolutos de las desviaciones con respecto a
la media aritmética.
8
Desviación media
𝑀𝐷 =
• MD
• X
• n
•
=
=
=
=
|𝑋 − 𝑋|
𝑛
Desviación media
Dato de la muestra
Tamaño de la muestra
Sumar todos los datos
9
Ejemplo 5.2 . . .
La cantidad de capuccinos vendidos por Espresso
Americano en el aeropuerto Toncontín, entre 3 y 4
de la tarde de una muestra de 5 días de hace dos
meses fue de 20, 40, 50, 60 y 80 vasos de 12 onzas.
Se desea conocer el promedio medio de la venta
diaria. Calcular la desviación media.
10
. . . Ejemplo 5.2
𝑀𝐷 =
|𝑋 − 𝑋|
𝑛
a) Media aritmética
20 + 40 + 50 + 60 + 80 250
𝑋=
=
5
5
𝑋 = 50
b) Desviación Media
20 − 50 + 40 − 50 + 50 − 50 + 60 − 50 + |80 − 50|
𝐷𝑀 =
5
−30 + −10 + 0 + 10 + |30| 30 + 10 + 0 + 10 + 30
𝐷𝑀 =
=
5
5
80
𝐷𝑀 =
= 16
5
La desviación media es de 16 capuccinos por día.
11
Varianza
Es la media aritmética de las desviaciones
de la media aritmética elevadas al cuadrado.
Es la medida de dispersión más utilizada en
los estudios inferenciales.
𝜎
2
𝑠
2
12
Varianza
• Poblacional
• Muestral
𝜎2 =
(𝑥 − µ)2
𝑁
𝑺2 =
(𝑥 − 𝑋)2
𝑛−1
13
Ejemplo 5.3 . . .
La oficina de ventas está revisando los pedidos que
fueron recibidos de parte de los 5 vendedores
contratados para la zona rural.
Juan
38
Pedro
26
Ramón
13
Rodrigo
41
Marcos
22
Calcular la varianza de pedidos entre vendedores
Variación cuadrada poblacional
14
Ejemplo 5.3……
𝜎2 =
(𝑥 − µ)2
5
a) Media aritmética
38 + 26 + 13 + 41 + 22 140
𝜇=
=
= 28
5
5
b) Varianza
38 − 28 2 + 26 − 28 2 + 13 − 28 2
2 + 22 − 28 2
+
41
−
28
𝜎2 =
5
2 + −2 2 + −15 2 + 13 2 + −6 2
10
𝜎2 =
5
100 + 4 + 225 + 169 + 36 534
2
𝜎 =
=
= 106.8
5
5
La varianza es de 106.8 pedidos cuadrados de la zona rural.
15
Desviación estándar
𝜎
Para calcular la desviación estándar se calcula
la raíz cuadrada de la varianza.
Con este simple método, se garantiza que las
unidades cuadradas se conviertan en unidades
simples.
𝜎=
𝜎2
16
Ejemplo 5.4 . . .
𝜎=
𝜎2
La oficina de ventas está revisando los pedidos que fueron
recibidos de parte de los 5 vendedores contratados para la
zona rural.
Juan
38
Pedro
26
Ramón
13
Rodrigo
41
Marcos
22
El valor de la varianza es 106.8 pedidos cuadrados. Se
quiere calcular la desviación estándar.
𝜎 2 = 106.8
𝜎 = 106.8 = 10.3344
La desviación estándar de la población es de 10.33 pedidos
por vendedor
. . . Ejemplo 5.4
28
18
Variación y Muestras
La variación en las muestras difiere de la
utilizada en la población, se da una unidad
de diferencia con respecto a la tamaño de
la muestra.
𝑺2 =
𝑠=
(𝑥 − 𝑋)2
𝑛−1
𝑠2
19
Ejemplo 5.5 . . .
Los salarios por hora de una muestra de
empleados de medio tiempo de Home Depot son:
$12, $20, $16, $18 y $19 por hora.
Calcular la desviación estándar de la muestra.
Proceso:
1. Media aritmética
2. Varianza
3. Desviación estándar
20
(𝑥 − 𝑋)2
𝑛−1
𝑠2 =
. . . Ejemplo 5.5.
Media aritmética
12 + 20 + 16 + 18 + 19 85
𝑋=
=
= 17
5
5
Varianza
𝑠2 =
𝑠2
=
12 − 17
−5
2
2
+ 3
+ 20 − 17
2
2
+ 16 − 17
5−1
+ −1 2 + 1
5−1
2
+ 2
2
2
+ 18 − 17
2
+ 19 − 17
25 + 9 + 1 + 1 + 4 40
=
=
4
4
𝑠 2 = 10
Desviación estándar
𝑠 = 3.162
La variación promedio
de la muestra es de 3.2
dólares por hora
2
Teorema de Chebyshev
En cualquier conjunto de observaciones
de una muestra o una población, la
proporción de valores que se encuentran
a k desviaciones estándar de la media es
de por lo menos 1− 1/k2, siendo k
cualquier constante mayor que 1.
1
𝑝=1− 2
𝑘
22
Teorema de Chebyshev
• Una desviación estándar pequeña para una
muestra, indica que estos valores se localizan
cerca de la media; por el contrario, una
desviación grande revela que las
observaciones se encuentran muy dispersas
con respecto a la media.
• Según el teorema de Chebyshev para que una
medida de dispersión sea confiable, el 75% de
los datos deben encontrarse a cierta cantidad
de desviaciones estándares de la media, ya
sea antes o después de ella.
23
Teorema de Chevyshev
Desviación grande
Desviación pequeña
24
Ejemplo 5.6 . . .
La media aritmética de la aportación para la
cooperativa de parte de los empleados de “La
Oficina Ideal” es de 316.00 y la desviación
estándar de 113.60.
¿Qué porcentaje de las aportaciones se
encuentra en más o menos de 3.5 desviaciones
estándares?
25
. . . Ejemplo 5.6
1
𝑝=1− 2
𝑘
𝑋 = 316.00
𝑠 = 113.60
𝑘 = 3.5
1
𝑝 =1−
3.5
2
1
=1−
= 1 − 0.0816
12.25
𝑝 = 0.9184 = 0.92
El 92% de los datos de la muestra están alrededor de las
3.5 desviaciones a ambos lados de la media aritmética.
26
La regla empírica
En cualquier distribución de frecuencias
simétrica, aproximadamente el 68% de los datos
se encuentran entre más y menos 1 desviación
estándar; cerca del 95% se encuentran entre más
y menos 2 desviaciones estándar y el 99.7% (casi
todas) estarán entre más y menos 3 desviaciones
estándar.
68%
95%
99.7%
±1𝜎
±2𝜎
±3𝜎
27
Ejemplo 5.7 . . .
En una empresa de bienes y raíces, los precios de la
renta de casas que se ofrecen en alquiler en la zona
Sur tienen una distribución de frecuencias simétrica.
La media de la muestra es de L.8,000 y la desviación
estándar de L.1,500.
¿Entre qué cantidades se encuentra el 95% de los
precios?.
28
. . . Ejemplo 5.7
Regla Empírica
68%
95%
99.7%
𝜇 ± 1𝜎
𝜇 ± 2𝜎
𝜇 ± 3𝜎
El 95% equivale a 2 desviaciones estándar a cada lado de la
media.
𝜇 ± 2𝜎 = 8000 ± 2(1500)
= 8000 ± 3000
8000 − 3000
=
8000 + 3000
=
5000
11000
El 95% de los precios de las casas en la zona Sur oscilan
entre L.5,000 y L.11,000.
29
Una fábrica de jugos entrega sus productos a 10
distribuidoras especializadas y los pedidos
entregados del mes pasado en miles de cajas fue la
siguiente:
1
2
2
2
8
5
7
7
1
5
Calcular:
• Medidas de dispersión
• Aplicar teorema de Chebychev para 3
desviaciones estándar.
• Aplicar la regla empírica para el 68% de los
casos
Rango
Datos
1
2
8
𝐷𝑎𝑡𝑜 𝑚𝑎𝑦𝑜𝑟 = 8
𝐷𝑎𝑡𝑜 𝑚𝑒𝑛𝑜𝑟 = 1
𝑅𝑎𝑛𝑔𝑜 = 8 − 1 = 7
El rango es de 7 mil cajas.
7
1
2
2
5
7
5
Desviación media
a) Media aritmética
40
1+2+8+7+1+2+2+5+7+5
=4
=
𝜇=
10
10
b) Desviación media
|𝑋 − 𝑋|
𝑀𝐷 =
𝑛
1−4 + 2−4 + 8−4 + 7−4 + 1−4 +
2 − 4 + 2 − 4 + 5 − 4 + 7 − 4 + |5 − 4|
𝑀𝐷 =
= 2.4
10
La desviación media es de 2.4 mil cajas por distribuidor.
Varianza
a) Media aritmética
40
𝜇=
10
=4
𝜎2 =
b) Varianza
𝜎2 =
1−4
2−4
(𝑥 − µ)2
𝑁
2
+ (2 − 4)2 +(8 − 4)2 + 7 − 4 2 + 1 − 4 2 +
2+ 2−4 2+ 5−4 2+ 7−4 2+ 5−4 2
10
66
𝜎 =
= 6.6
10
2
La varianza es de 6.6 mil cajas cuadradas.
Desviación estándar
𝜎 2 = 6.6
𝜎 = 6.6
𝜎 = 2.569
La desviación estándar es de 2.6 mil cajas
Teorema de Chevyshev
𝑘=3
1
1
𝑝=1−
= 1 − = 1 − 0.1111
2
3
9
𝑝 = 0.8889
El 89% de las entregas están en más o menos 3
desviaciones estándares de la media.
Regla empírica (68%)
𝜇=4
𝜎 = 2.569
68%
95%
99.7%
𝜇 ± 1𝜎
𝜇 ± 2𝜎
𝜇 ± 3𝜎
𝜇 ± 1𝜎 = 4 ± 1(2.569)
= 4 ± 2.569
4 − 2.569
=
4 + 2.569
1.431
=
6.569
El 68% de las entregas que se hacen están entre 1.4 y 6.6
mil cajas.
Distribuciones Astro es una empresa que vende
productos para el hogar y de las ventas del mes
pasado recolectó una muestra 8 vendedores para
estudiar la variación entre cada uno de ellos. Las
ventas (cientos de cajas) de cada vendedor fue la
siguiente:
1
2
6
7
2
2
5
7
Calcular:
• Medidas de dispersión
• Aplicar teorema de Chebychev para 3
desviaciones estándar.
• Aplicar la regla empírica para el 99.7% de los
casos
Rango
Datos
1
2
𝐷𝑎𝑡𝑜 𝑚𝑎𝑦𝑜𝑟 = 7
𝐷𝑎𝑡𝑜 𝑚𝑒𝑛𝑜𝑟 = 1
𝑅𝑎𝑛𝑔𝑜 = 7 − 1 = 6
El rango es de 600 cajas.
6
7
2
2
5
7
Desviación media
a) Media aritmética
1+2+6+7+2+2+5+7
𝑋=
8
32
=4
=
8
b) Desviación media
|𝑋 − 𝑋|
𝑀𝐷 =
𝑛
1−4 + 2−4 + 6−4 + 7−4 +
2−4 + 2−4 + 5−4 + 7−4
𝑀𝐷 =
= 2.25
8
La desviación media es de 225 cajas por vendedor.
Varianza
a) Media aritmética
32
=4
𝑋=
8
𝑠2 =
b) Varianza
𝑠2 =
1−4
2−4
(𝑥 − µ)2
𝑛−1
2
+ (2 − 4)2 +(6 − 4)2 + 7 − 4 2 +
2+ 2−4 2+ 5−4 2+ 7−4 2
8−1
44
𝑠 =
= 6.29
7
2
La varianza es de 629 cajas cuadradas.
Desviación estándar
𝑠 2 = 6.29
𝜎 = 6.29
𝜎 = 2.508
La desviación estándar es de 251 cajas
Teorema de Chevyshev
- Para 3 desviaciones estándar
1
𝑘=3
%=1− 2
𝑘
1
% = 1 − 2 = 0.889
3
Según el teorema de Chevyshev se tendrían cubiertos
el 89% de los casos.
Regla Empírica
- Para 3 desviaciones estándar
𝑋=4
68%
95%
99.7%
𝑠 = 2.508
𝑋 ± 3𝑠 = 4 ± 3(2.508)
𝑋 ± 1𝑠
𝑋 ± 2𝑠
𝑋 ± 3𝑠
= 4 ± 7.529
=
4 − 7.529
4 + 7.529
=
0
11.524
Según la regla empiríca las entregas se hacen entre 0 y
1152 cajas.
Para más información leer la página web
www.lbanegas.com
𝐵𝑖𝑏𝑙𝑖𝑜𝑔𝑟𝑎𝑓í𝑎
Lind, D.A., Marchal, W.G., Wathen, S.A. (15). (2012). Estadística Aplicada a los
Negocios y la Economía. México: McGrawHill
David M. Levine, Timothy C. Krehbiel, Mark L. Berenson. 2006. Estadística para
Administración. (4° edición). Naucalpan de Juárez, México.: Pearson Prentice Hall
45