Download STAT 555 Taller Dos Narrativo S2 2.3 ppt Medidas Descriptivas

Document related concepts

Parámetro estadístico wikipedia , lookup

Desviación típica wikipedia , lookup

Medidas de dispersión wikipedia , lookup

Medidas de tendencia central wikipedia , lookup

Asimetría estadística wikipedia , lookup

Transcript
STAT 555 Taller Dos Narrativo
S2 2.3 ppt
Medidas Descriptivas Numéricas
Diapositiva 1
Saludos:
En el Taller Dos se examinarán varios métodos estadísticos que ayudan a describir los valores típicos de
los datos, así como la medida en que estos se dispersan. Estos métodos presentan una forma efectiva
de exponer de manera sencilla y efectiva una situación compleja a través del resumen.
Diapositiva 2
El primer grupo de herramientas estadísticas que se estudiarán son las medidas de tendencia central.
Estas son: la media aritmética, la mediana y la moda. Las cuales permiten calcular el punto central de
valores observados. Por ejemplo, en un curso de estadística hay 30 estudiantes matriculados y en el
primer examen cada estudiante obtuvo una calificación, esto significa que hay 30 valores observados. A
través de las medidas de tendencia central se puede establecer cuál fue la calificación promedio en el
primer examen. En otras palabras, partiendo de los 30 valores observados ahora se obtiene un sólo
resultado que los resume y provee un punto de partida para establecer conclusiones y/o tomar
decisiones.
Diapositiva 3
La Media Aritmética es la medida de tendencia central más popular y útil. Se calcula sumado los valores
observados y dividiéndolos entre la cantidad de observaciones.
Se aprecia que hay dos fórmulas; la primera se utiliza para calcular la media aritmética de una muestra y
la segunda se aplica a la población.
Diapositiva 4
En este ejemplo se utilizó la fórmula de muestra porque se consideraron 10 entregas y no la cantidad
completa de entregas de ese proveedor en particular.
El resultado se puede interpretar de la siguiente manera: “en promedio el proveedor tarda 6 días en
realizar las entregas.”
Diapositiva 5
La segunda medida de tendencia central que se discutirá es la mediana, la cual se define como el valor
que tiene la misma cantidad de observaciones por encima y por debajo de este.
STAT555 S2 2.3 ppt_Medidas Descriptivas Numéricas
Page 1
En este punto hay que hacer una nota aclaratoria: cuando la cantidad de observaciones es impar la
mediana es el punto medio entre las mismas y para conocer su posición sólo hay que utilizar la fórmula
n+1 dividido entre dos. Sin embargo, cuando la cantidad de observaciones es par, la mediana es el punto
medio entre los dos valores que están a la mitad de los datos (en este ejemplo la posición de la mediana
es de 5.5 que cae entre los valor 8 y 9, por tanto ahora corresponde sumar ambos valores y dividirlos
entre dos para conocer el valor de la mediana que es 8.5.
Diapositiva 6
En este ejemplo la data es par, primero aplicamos la fórmula n+1 dividido entre dos para conocer la
posición de la mediana y es 5.5. Cae entre los valores 6 y 6, luego se suman y se divide entre 2. La
mediana es 6.
Diapositiva 7
La tercera medida de tendencia central que se discutirá es la moda, la cual se define como el valor con
mayor frecuencia dentro de un grupo de valores observados.
En ocasiones en un grupo de valores observados se pueden encontrar dos o más modas.
Diapositiva 8
En este ejemplo el valor que más se repite es el 6, por lo tanto esta es la moda.
Diapositiva 9
Supongo que usted se pregunta, en qué momento es pertinente usar una u otra medida de tendencia
central. Dependiendo del tipo de dato se decidirá qué herramienta aplicar.
Diapositiva 10
El segundo grupo de herramientas estadísticas que se estudiarán son las medidas de variación o
dispersión, donde se incluyen: el rango, la varianza y la desviación estándar. Las mismas permiten
calcular la cantidad de dispersión. Recordemos el ejemplo del curso de estadística con 30 estudiantes
matriculados y cada estudiante obtuvo una calificación en el primer examen. A través de las medidas de
variación se puede establecer cuál es la diferencia o dispersión entre las calificaciones de los
estudiantes. Nuevamente, partiendo de los 30 valores observados ahora se obtiene un sólo resultado
que los resume.
Diapositiva 11
La primera medida de variación a discutir es el rango, este es un método rápido, simple y superficial que
consiste en restar la observación con el valor mayor a la observación con el valor menor.
Su principal deficiencia es que sólo consideran los valores extremos de los valores observados y omite al
resto de los valores.
STAT555 S2 2.3 ppt_Medidas Descriptivas Numéricas
Page 2
Diapositiva 12
Recordando el ejemplo de las entregas de un proveedor, la observación mayor es 7 y la observación
menor es 5, por lo tanto el rango es de dos días.
Diapositiva 13
A diferencia del rango, esta es una medida común de la dispersión que incluye todos los valores
observados.
La fórmula a utilizar dependerá si estamos realizando el estudio a una muestra o a una población.
A continuación se resolverá un ejemplo de varianza para una muestra.
Diapositiva 14
Para resolver este problema el primer paso es calcular la media aritmética de los valores observados, el
resultado en este caso es de seis días. El segundo paso consiste en restar cada valor observado a la
media aritmética, elevarlos al cuadrado y sumar todos los resultados. El último paso es tomar la
sumatoria y dividirla entre el tamaño de la muestra menos 1. El resultado final es de .67.
Diapositiva 15
La última medida de variación a discutir en esta presentación es la desviación estándar. Este es el
método tradicional y usado ampliamente. Ayuda a establecer cuán lejos se encuentra una observación
respecto de la media aritmética. Se calcula mediante de la raíz cuadrada positiva de la varianza.
Diapositiva 16
Para resolver este ejemplo es necesario recordar el resultado de la varianza en el Diapositiva 14 que
tiene como resultado .67. Así que el cálculo de la desviación estándar es la raíz cuadrada de dicho
resultado y es .82. Esto representa cuanto se alejan los valores observados respecto a la media.
Diapositiva 17
El coeficiente de variación indica la cantidad relativa de variación de los datos, al expresar la desviación
como un porcentaje de la media aritmética.
Esto permite comparar con facilidad las dispersiones de dos conjuntos de datos que tienen diferentes
unidades de medición o magnitudes. Por ejemplo, el coeficiente de variación le permite comparar una
empresa grande con una pequeña para determinar cual empresa tiene una variación mayor a base de su
tamaño.
El coeficiente de variación no es aplicable cuando la media es igual a cero, porque esto implica dividir la
desviación estándar entre 0.
STAT555 S2 2.3 ppt_Medidas Descriptivas Numéricas
Page 3
Diapositiva 18
Para calcular el coeficiente de dispersión se tomó en consideración el resultado de la desviación
estándar (numerador) que es .82 y el resultado de la media aritmética (denominador) que es 6.
Resultado que se obtiene es .03 ó un 3%.
Diapositiva 19
La última medida que se discutirá en este taller para representar los valores observados de una manera
sencilla y resumida son los cuartiles. Los cuales representan una medida de posicionamiento relativo.
Así como la media divide un grupo de valores observados por la mitad (dos grupos del mismo tamaño).
Los cuartiles separan los datos en cuatro grupos de igual tamaño. Es importante que los datos estén
ordenados de menor a mayor al momento de crear los grupos.
Diapositiva 20
El gráfico que se presenta demuestra la división de los datos en cuatro grupos y cada uno de ellos
representa un 25% de los valores.
Para calcular los puntos de división entre los grupos: en el primer, segundo y tercer cuartil, se
demuestran las fórmulas a utilizar. A continuación se resolverá un ejemplo que le ayudará a
comprender mejor este tipo de herramienta.
Diapositiva 21
Una vez los valores son ordenados de forma ascendente, los cuartiles se calculan de la misma forma que
la mediana. Tal vez sea necesario interpolar (calcular una posición entre) dos valores para identificar la
posición de los datos que corresponde al cuartil.
Diapositiva 22
El diagrama de caja ayuda a presentar de forma gráfica cinco valores importantes: los dos valores
extremos y los tres cuartiles.
Este diagrama permite resaltar los valores relevantes de los datos así como la distribución de los
mismos.
Diapositiva 23
Le felicito, ahora puede seguir con las tareas del Taller Dos.
STAT555 S2 2.3 ppt_Medidas Descriptivas Numéricas
Page 4