Download Explicación: Varianza

Document related concepts

Desviación típica wikipedia , lookup

Varianza wikipedia , lookup

Medidas de dispersión wikipedia , lookup

Corrección de Bessel wikipedia , lookup

Parámetro estadístico wikipedia , lookup

Transcript
Estadística Descriptiva
SESIÓN 12
Medidas de dispersión
Contextualización de la sesión 12
 En la sesión anterior se explicaron los temas relacionados con
la desviación estándar, la cual es una medida para analizar la
incertidumbre de los datos de una muestra, además de la
manera correcta de llevar a cabo su cálculo para conjuntos
agrupados y no agrupados.
Contextualización de la sesión 12
 Ahora es necesario conocer la última de las medidas de
dispersión conocida como varianza y los temas relacionados
con esta medida.
 Al terminar esta sesión habrás comprendido el concepto de
varianza y calcular e interpretar la varianza para datos
agrupados y no agrupados.
Introducción a la sesión 12
 En la sesión anterior se estudió la desviación
estándar como una medida de dispersión que se
emplea para variables de razón y de intervalo. La
desviación estándar se considera una medida
cuadrática que representa el promedio de las
desviaciones (distancias) de los datos muestrales
respecto de su media aritmética, expresada en las
mismas unidades que la variable.
 En la presente sesión revisarás el concepto de
varianza, medida que guarda una
relación con la desviación estándar.
estrecha
Explicación: Varianza
 La varianza es una medida de dispersión que guarda
relación con la desviación típica o estándar ya que es el
cuadrado de la misma, razón por la cual se representa
como s2.
 La fórmula para calcular la varianza de datos no
agrupados está dada por la expresión:
Explicación: Varianza
 Dónde:
n=
Numero de datos o elementos de la muestra.
i=
Indice de la suma que toma los valores 1,2,3...n.
xi =
Valor del i-ésimo dato de la muestra.
=
Media aritmética de la muestra.
Explicación: Varianza
 Al igual que en el caso de la desviación estándar, en la
práctica es más común el uso de la fórmula que aplica la
corrección de Bessel:
Explicación: Varianza
 Calculemos la varianza para el siguiente conjunto de datos no
agrupados:
A = {2, 4, 6, 8, 10}
 De este conjunto se desprende que:
n=5
x1 = 2
x2 = 4
x3 = 6
x4 = 8
x5 = 10
Explicación: Varianza
 Con estos datos, procedemos a calcular la media aritmética del
conjunto:
 Y a continuación se sustituyen los valores anteriores en la
fórmula:
Explicación: Varianza
 Tal como se muestra a continuación:
Explicación: Varianza
 La fórmula para calcular la varianza de datos agrupados está
dada por la siguiente expresión:
 Dónde:
k =a
Número de intervalos de clase en la distribución de frecuencias.
n=
Número de datos o elementos de la muestra.
i=
Índice de la suma que toma los valores 1,2,3...k.
fi =
Frecuencia del i-ésimo intervalo de clase.
xi =
Marca de clase del i-ésimo intervalo de la muestra.
Media aritmética de la muestra.
Explicación: Varianza
 Para calcular la varianza en un conjunto de datos agrupados,
también empleamos la versión que incorpora la corrección de
Bessel. Como puede observarse, cada elemento de la fórmula
se toma directamente de la tabla de datos agrupados.
Considerando el caso práctico de una bebida, se toma de la
tabla de datos agrupados las columnas referentes a las
frecuencias de clase (fi) y a las marcas de clase (xi).
Explicación: Varianza
 De esta tabla se obtienen los siguientes valores para las
frecuencias de clase:
f1 = 5
f2 = 10
f3 = 30
f4 = 40
f5 = 15
Explicación: Varianza
 Asimismo, dado que hay cinco intervalos de clase y la muestra
tiene 100 elementos, los valores de k y n respectivamente son:
k=5
n = 100
 Y como ya se determinó en ejercicios anteriores:
= 20
Explicación: Varianza
 Al sustituir estos valores en la respectiva fórmula tenemos que:
Conclusión
 Las medidas de dispersión describen la variabilidad
o dispersión de los datos obtenidos mediante una
muestra, además, ofrecen información sobre hasta
qué punto las medidas de tendencia central son
representativas como síntesis de la información.
 Y por último, cuantifican la separación, dispersión y
variabilidad de los datos que se obtienen a partir de
las medidas de centralización.