Download Estadística para la toma de decisiones

Document related concepts

Medidas de dispersión wikipedia , lookup

Desviación típica wikipedia , lookup

Parámetro estadístico wikipedia , lookup

Varianza wikipedia , lookup

Prueba t de Student wikipedia , lookup

Transcript
Estadística para la toma de
decisiones
ESTADÍSTICA PARA LA TOMA DE DECISIONES.
Sesión No. 4
Nombre: Estadística descriptiva: Medidas numéricas. Parte II
Objetivo
Al término de la sesión el estudiante calculará las medidas de dispersión para
datos no agrupados, a través de la solución de ejercicios para practicar los
cálculos de rango, varianza, desviación estándar y coeficiente de correlación.
Contextualización
En esta sesión aprenderás a calcular las medidas estadísticas de dispersión y
concentración. A través de diferentes medidas de dispersión tales como el rango,
la varianza y la desviación estándar aprenderemos a interpretar el conjunto de
datos que se tiene para el estudio. Y con ello a interpretar la concentración de
datos que se tiene en la distribución.
Fuente: http://www.cetic.edu.ve/files/imagecache/imagen_CED/imagen_ficha/medidas_dispersion.gif
1
ESTADÍSTICA PARA LA TOMA DE DECISIONES.
Introducción al Tema
“Las medidas de tendencia central ofrecen una idea aproximada del
comportamiento de una serie estadística. No obstante, no resultan suficientes
para expresar sus características: una misma media puede provenir de valores
cercanos a la misma o resultar de la confluencia de datos estadísticos
enormemente dispares. Para conocer en qué grado las medidas de tendencia
central son representativas de la serie, se han de complementar con medidas de
dispersión como la varianza o la desviación típica.” 1
1
(s.f.). Medidas de dispersión. Recuperado de: http://www.hiru.com/matematicas/medidas-de-dispersion
2
ESTADÍSTICA PARA LA TOMA DE DECISIONES.
Explicación
Medidas de dispersión.
Además de las medidas de centralización y de posición, suele ser útil considerar
las medidas de dispersión, las cuales pueden definirse como los valores
numéricos cuyo objetivo es analizar el grado de separación de éstos de una
distribución estadística con respecto a las medidas de tendencia central
consideradas.
Ahora mostraremos el estudio de algunas medidas más usadas y sus fórmulas:
Rango: 𝑅 = 𝑉𝑎𝑙𝑜𝑟 𝑚𝑎𝑦𝑜𝑟 − 𝑉𝑎𝑙𝑜𝑟 𝑚𝑒𝑛𝑜𝑟
Rango intercuartílico: 𝐼𝑄𝑅 = 𝑄3 − 𝑄1
Varianza Poblacional: 𝜎 2 =
Varianza muestral: 𝑠 2 =
∑(𝑥𝑖 −𝜇)2
𝑁
∑(𝑥𝑖 −𝑥̅ )2
𝑛−1
Desviación estándar muestral: 𝑠 = √𝑠 2
Desviación estándar poblacional: 𝜎 = √𝜎 2
𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖𝑜𝑛 𝑒𝑠𝑡𝑎𝑛𝑑𝑎𝑟
Coeficiente de variación: 𝑐𝑣 = �
𝑚𝑒𝑑𝑖𝑎
� 𝑋100%
Ejemplo 1. Para la serie de números 27, 84, 9, 40, 49, 84, 70, 93. Calcular el
rango, varianza, desviación estándar y coeficiente de variación.
Rango: 𝑅 = 𝑉𝑎𝑙𝑜𝑟 𝑚𝑎𝑦𝑜𝑟 − 𝑉𝑎𝑙𝑜𝑟 𝑚𝑒𝑛𝑜𝑟 = 93 − 9 = 84
Para el cálculo de la varianza primeramente se calcula el promedio de los datos:
Media: 𝑥̅ =
27+84+9+40+49+84+70+93
8
= 57
3
ESTADÍSTICA PARA LA TOMA DE DECISIONES.
Varianza muestral:
𝑠2 =
∑(𝑥𝑖 −𝑥̅ )2
𝑛−1
s2= 925.71
=
(27−57)2 +(84−57)2 +(9−57)2 +(40−57)2 +(49−57)2 +(84−57)2 +(70−57)2 +(93−57)2
7
Desviación estándar.
Muestral: 𝑠 = √𝑠 2 = √925.71 = 30.4255
𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖𝑜𝑛 𝑒𝑠𝑡𝑎𝑛𝑑𝑎𝑟
Coeficiente de variación: 𝑐𝑣 = �
CV = 53.38%
𝑚𝑒𝑑𝑖𝑎
30.4255
� 100% = �
57
� 100
Ejemplo 2. Se tienen dos grupos universitarios de ocho personas y se desea
comparar dichos grupos en el número de errores obtenidos por
cada uno de sus ocho integrantes; al aplicarles una prueba que
consta de 20 reactivos.
Tabla 1
Grupo A Grupo B
x =5
x =5
~
x =5
~
x =5
xˆ = 5
xˆ = 5
Observe en la Tabla 1 que aparentemente no hay diferencia entre el Grupo A y
el Grupo B, pero si se observan detenidamente los datos iniciales que se
presentan en la Tabla 2 se observará que ambos grupos no son iguales.
4
ESTADÍSTICA PARA LA TOMA DE DECISIONES.
Tabla 2
Puntuación más baja
Puntuación más alta
Grupo A
Grupo B
1
3
1
4
2
5
5
5
5
5
5
5
9
6
12
7
Puntuación más baja
Puntuación más alta
En la Tabla 2 se observa que los errores del Grupo A se dispersan más que los
del Grupo B, que parecen concentrarse alrededor del valor promedio (5).
¿Qué ocurre? ¿Por qué la medida de tendencia central, en este caso la media
aritmética, no nos da suficiente información acerca de estos resultados? Porque
es necesario contar con algo que señale la dispersión o desviación respecto a la
media aritmética; en otras palabras, conocer la densidad de los datos, es decir,
cuán concentrados se encuentran, cuán homogéneos son, o qué variados están
dichos datos.
Rango (R)
Para el Grupo A es: R = 12 - 1 = 11 puntos de variación
Para el Grupo B es: R = 7 - 3 = 4 puntos de variación
5
ESTADÍSTICA PARA LA TOMA DE DECISIONES.
Grupo A
x−x
Grupo B
x−x
(x − x )2
(x − x )2
1–5=–4
(– 4)2 = 16
3–5=–2
(– 2)2 = 4
1–5=–4
(– 4)2 = 16
4–5=–1
(– 1)2 = 1
2–5=–3
(– 3)2 = 9
5–5=0
(0)2 = 0
5–5=0
(0)2 = 0
5–5=0
(0)2 = 0
5–5=0
(0)2 = 0
5–5=0
(0)2 = 0
5–5=0
(0)2 = 0
5–5=0
(0)2 = 0
9–5=4
(4)2 = 16
6–5=1
(1)2 = 1
12 – 5 = 7
(7)2 = 49
7–5=2
(2)2 = 4
106
2
10
(x − x)2
106
106
∑
=
=
= 15.14
=
n −1
8 −1
7
Varianza del grupo A es:
s
Varianza del grupo B es:
s2 =
10
10
=
= 1.42
8 −1
7
Desviación estándar del grupo A es: s =
s2 =
15.14 = 3.89
Desviación estándar del grupo B es: s =
1.42 = 1.19
Coeficiente de variación (CV)
El coeficiente de variación o de Pearson, expresa la proporción en la que la
media aritmética no es representativa del conjunto de datos de donde proviene.
6
ESTADÍSTICA PARA LA TOMA DE DECISIONES.
7
Coeficiente de variación para el Grupo A es:
CV =
s
3.89
(100) =
(100) = 77.8%
x
5
(Mayor porcentaje es menos representativa la media)
Es decir, se tiene un 77.8% de que la media no es representativa del Grupo A.
Coeficiente de variación para el Grupo B es:
CV =
s
1.19
(100) =
(100) = 23.8%
x
5
(Menor porcentaje es más representativa la media)
Es decir, se tiene un 23.8% de que la media no es representativa del Grupo B.
Confiabilidad de la media (CM)
Esta medida muestra la confiabilidad de la media, su fórmula: CM = 100% – CV
Confiabilidad de la media para el Grupo A es:
CM = 100% – CV = 100% – 77.8% = 22.2%. (Menor porcentaje es menos confiable la media)
Es decir, se tiene una confiabilidad del 22.2% de que la media es
representativa del Grupo A.
Confiabilidad de la media para el Grupo B es:
CM = 100% – 23.8% = 76.2%. (Mayor porcentaje es más confiable la media)
Es decir, se tiene una confiabilidad del 76.2% de que la media es
representativa del Grupo B.
ESTADÍSTICA PARA LA TOMA DE DECISIONES.
Medidas de concentración.
De acuerdo a lo que nos dice la Universidad Complutense de Madrid (2006):
Las medidas o índices de concentración tienen como objetivo fundamental
cuantificar el grado de desigualdad en el reparto o distribución de una magnitud
económica (rentas, negocio, beneficios, etc...), entre un número determinado de
“unidades” (individuos, familias, empresas, etc...).
La forma de la distribución de una magnitud, representada por una variable
estadística, ya se ha estudiado a través de diversas medidas de posición,
dispersión, asimetría y apuntamiento. Lo que ahora nos interesa es la mayor o
menor equidad en el reparto de la suma total observada de una magnitud entre
los integrantes del conjunto perceptor de dicha suma. Para ello, deberemos
recoger de cada elemento perteneciente al conjunto perceptor, la información
de la cuantía individual recibida en el reparto. La dificultad reside en que, en
muchas ocasiones, esa información viene agrupada en clases y, por tanto, el
estudio de la concentración no se podrá hacer con la precisión debida.
Es evidente que las dos situaciones extremas que podemos considerar,
respecto a la equidad en el reparto, son:
- Mínima concentración o máxima igualdad: cuando a todos los integrantes el
conjunto perceptor se les asigna la misma cantidad en el reparto del monto total.
- Máxima concentración o mínima igualdad: cuando un único perceptor
recibe la suma total a repartir y los demás no perciben nada.
Curva de Lorenz.
La curva de Lorenz o curva de concentración es una gráfica que se deduce a
partir de la información suministrada para el cálculo del índice de Gini y que, por
tanto, refleja la mayor o menor concentración en la distribución de una magnitud
Ejemplo:
8
ESTADÍSTICA PARA LA TOMA DE DECISIONES.
Fuente: http://4.bp.blogspot.com/_yRlfSW3MB1A/SHvmldARdOI/AAAAAAAAAvQ/3cDXNjqniM/s400/CurvaLorenz_CoeficienteGine.jpg
9
ESTADÍSTICA PARA LA TOMA DE DECISIONES.
Conclusión
En esta sesión aprendimos a calcular las medidas de dispersión para datos no
agrupados considerando que estas medidas son útiles, ya que se utilizan para
medir el grado de variabilidad que existe en la distribución o serie de datos.
En la siguiente sesión aprenderemos a calcular Probabilidades.
Fuente: http://nuneznjaimer.mex.tl/imagesnew2/0/0/0/1/1/7/3/8/8/6/loteria(1).jpg
10
ESTADÍSTICA PARA LA TOMA DE DECISIONES.
Para aprender más
En este apartado encontrarás más información acerca del tema para enriquecer
tu aprendizaje.
Puedes ampliar tu conocimiento visitando los siguientes sitios de Internet.
• Medidas de dispersión. http://brd.unid.edu.mx/medidas-de-dispersion-2/
• Medidas de dispersión. http://brd.unid.edu.mx/medidas-de-dispersion-3/
• Medidas de concentración. http://brd.unid.edu.mx/medidas-de-concentracion/
http://maestriapedagogia2013.files.wordpress.com/2013/05/hernandez-s2010-metodologia-de-la-investigacion.pdf
Es de gran utilidad visitar el apoyo correspondiente al tema, porque te permitirá
desarrollar los ejercicios con más éxito.
11
ESTADÍSTICA PARA LA TOMA DE DECISIONES.
Actividad de Aprendizaje
Con lo aprendido en esta sesión acerca de Medidas de dispersión y
concentración, deberás realizar los siguientes ejercicios:
1.- Considere una muestra con valores 27,25, 0, 15, 30, 34, 28 y 25. Calcule el
rango, la varianza y la desviación estándar.
2.- A home theater in a box es la manera más sencilla y económica de tener
sonido envolvente en un centro de entretenimiento en casa. A continuación se
presenta una muestra de precios que corresponden a modelos con y sin
reproductor de DVD.
Modelo con Reproductor Precio ($)
Modelo
DVD
DVD
sin
reproductor Precio ($)
Sony HT-1800DP
450
Pioneer HTP-230
300
Pioneer HTD-330DV
300
Sony HT-DDW750
300
Sony HT-C800DP
400
Kenwood HTB-306
360
Panasonic SC-HT900
500
RCA RT-2600
290
Panasonic SC-MTI
400
Kenwood HTB-206
300
a) Calcule el precio medio de los modelos de reproductor con DVD y el
precio medio de los modelos de reproductor sin DVD. ¿Cuánto es lo que
se paga de más por tener un reproductor de DVD en casa?
b) Calcule el rango, la varianza y la desviación estándar de las dos muestras.
¿Qué le dice esta información acerca de los precios de los modelos con y
sin reproductor de DVD?
Entregar esta actividad en formato de Práctica de Ejercicios y súbelo a la
plataforma. Recuerda que la actividad vale el 5% de la calificación final.
12
ESTADÍSTICA PARA LA TOMA DE DECISIONES.
Bibliografía
•
Anderson, D., Sweeney, D., Williams, T. (2008). Estadística para
administración y economía. (10ª ed.). México: Editorial Cengage Learning.
ISBN: 970-686-278-1
•
Hernández Sampieri Roberto, Fernández-Collado Carlos y Baptista Lucio
Pilar. (2010). Metodología de la investigación. México: McGraw-Hill.
•
Levine, David M., Krehbiel, Timothy C. y Berenson, Mark L. (2012):
Estadística descriptiva. México: Pearson Educación
•
Lind Douglas A., Marchal William G. y Wathen Samuel A. (2008):
Estadística aplicada a los negocios y la economía. México: McGraw-Hill.
Cibergrafía.
•
(s.f.). Medidas de dispersión. Recuperado
de: http://www.hiru.com/matematicas/medidas-de-dispersion
•
Universidad Complutense de Madrid (2006). Tema 7: Medidas de
concentración. Introducción a la econometría Recuperado
de: http://pendientedemigracion.ucm.es/info/eiop/licenciaturas/pdfs_econo
metria/tema_7_curso2006-07.pdf
13