Download continuación

Document related concepts

Parámetro estadístico wikipedia , lookup

Desviación típica wikipedia , lookup

Medidas de dispersión wikipedia , lookup

Varianza wikipedia , lookup

Rango intercuartílico wikipedia , lookup

Transcript
Estadística Descriptiva
continuación
Medidas de Dispersión
Concepto
Las medidas de dispersión son un
conjunto de valores que tienen por
objeto proporcionar, en un valor único
información sobre la variabilidad que
presenta la población o la muestra
con respecto a la variable de interés.
Rango
Es la variabilidad total de la variable
expresada como la diferencia entre el
valor máximo encontrado en la
población o muestra menos el valor
mínimo encontrado en la misma
colección de datos.
R = Vmax - Vmin
Desviación
Es la diferencia que se observa entre
el valor de la variable y la media
aritmética. La denotaremos por di .
No es una medida, son muchas
medidas, pues cada valor de la
variable lleva asociada su
correspondiente desviación, por lo
que precisaremos una medida que
resuma dicha información.
Desviación (cont.)
La primera solución puede ser
calcular la media de todas las
desviaciones, es decir, si
consideramos como muestra la de
todas las desviaciones y calculamos
su media. Pero esta solución es mala
pues como veremos siempre va a ser
0.
Desviación Media:
Es la media de los valores absolutos
de las desviaciones, y se puede
denotar como por dm.
Varianza
Es la media de los cuadrados de las
desviaciones, y la denotaremos por S2 o
también por σ 2.
O más sencillamente
Varianza (cont.)
La varianza es un parámetro de la
distribución normal que evalúa la diferencia
absoluta de cada valor con respecto a la
media aritmética.
La varianza hace uso de la propiedad de
todos los cuadrados de ser positivos para
establecer una medida unidireccional.
Este estadístico tiene el inconveniente de
ser poco significativo, pues se mide en el
cuadrado de la unidad de la variable, por
ejemplo, si la variable viene dada en cm.
La varianza vendrá en cm2.
Desviación Estándar
Es la raíz cuadrada de la varianza, se
denota por Sx o σx.
• Este estadístico se mide en la misma unidad que la variable por lo que se
puede interpretar mejor.
•Es un derivado de la varianza, gráficamente representa la distancia desde
la media de la distribución normal hasta el punto de inflexión de la curva
que representa la distribución.
Coeficiente de Variación
Es un estadístico de dispersión que tiene
la ventaja de que no lleva asociada
ninguna unidad, por lo que nos permitirá
decir entre dos muestras, cual es la que
presenta
mayor
dispersión.
La
denotaremos por C.V.
Error estándar
A veces llamado también desviación
estándar del estimador se define
como la desviación estándar divida
entre n-1
σx
E.S. =
√ n-1
Medidas de Localización
Las medidas de localización dividen la
distribución en partes iguales, sirven para
clasificar a un individuo o elemento dentro
de una determinada población o muestra..
Cuartiles
Medida de localización que divide la población o muestra en cuatro partes
iguales.
Q1= Valor de la variable que deja a la izquierda el 25% de la distribución.
Q2= Valor de la variable que deja a la izquierda el 50% de la distribución =
mediana.
Q3= Valor de la variable que deja a la izquierda el 75% de la distribución.
Al igual que ocurre con el cálculo de la mediana, el cálculo de estos
estadísticos, depende del tipo de variable.
Caso I: Variable cuantitativa discreta:
En este caso tendremos que observar el tamaño de la muestra: N y
para calcular Q1 o Q3 procederemos como si tuviésemos que calcular
la mediana de la correspondiente mitad de la muestra.
Caso II: Variable cuantitativa continua:
En este caso el cálculo es más simple:, sea la distribución que sigue:
[Li-2 -- Li-1) ni-1 Ni-1
[Li-1 -- Li)
ni Ni
Siendo el intervalo coloreado donde se encuentra el Cuartil
correspondiente:
Cuartil
y
Deciles
Medida de localización que divide la población o muestra en 10
partes iguales
No tiene mucho sentido calcularlas para variables cualitativas
discretas. Por lo que lo vamos a ver sólo para las variables
continuas.
k = 1 .. 9
dk = Decil k-simo es aquel valor de la variable que deja a su
izquierda el k·10 % de la distribución.
[Li-2 -- Li-1)ni-1Ni-1
[Li-1 -- Li) ni Ni
Intervalo donde se encuentra el Decil correspondiente:
Percentiles:
Medida de localización que divide la población o muestra en
100 partes iguales
No tiene mucho sentido calcularlas para variables
cualitativas discretas. Por lo que lo vamos a ver sólo para
las variables continuas.
pk = Percentil k-simo es aquel valor de la variable que deja a
su izquierda el k % de la distribución.
ni-1
Ni-1
[Li-2 -- Li-1)
[Li-1 -- Li)
Intervalo donde se encuentra el percentil corespondiente:
ni
Ni
k=1 .. 99
Medidas asociadas a las
medidas de localización.
Algunas medidas de Dispersión asociadas
Una vez estudiadas las medidas de localización surgen dos nuevas medidas de dispersión, que son:
•Recorrido intercuartílico:
•Semirecorrido intercuartílico:
•Recorrido interdecílico:
•Recorrido intercentilico: