Download TEMA 3 3.1. Las medidas de posición robustas También llamadas

Document related concepts
no text concepts found
Transcript
TEMA 3
3.1. Las medidas de posición robustas
También llamadas de localización o de posición central.
Entre ellas figuran: las medias, la mediana, la moda y los cuartiles.
Estas medidas cumplen dos requisitos como son el estar comprendidas entre los
valores extremos de la variable y el no coincidir siempre ambas, aplicándose según el caso.
Junto a las medidas de dispersión reciben el nombre de estadísticos.
Se dice que una medida es robusta cuando la inclusión de valores atípicos en su
cálculo no supone un cambio fuerte en su valor. Son robustas: la mediana, la moda y los
cuartiles.
Los procedimientos estadísticos robustos permiten efectuar inferencias válidas cuando
hay desviaciones a la normalidad y son, al mismo tiempo, altamente eficientes bajo datos
normales.
3.2. La mediana.
El principal defectos de la media es venir afectada por los valores extremos de la
variable. En estos casos será más conveniente la utilización de la mediana.
La mediana es la puntuación o la medida de posición que si ordenamos las variables
de menor a mayor deja tantos elementos con valores menores que ella como superiores a ella.
Es decir, será el valor de la variable en que si N es el total, la frecuencia acumulada de dicho
valor es N/2.
Su cálculo:
En variables discretas sin agrupar:
Nj-1 < N/2 < Nj
xj-1 < Md < xj
Md =
Web Estadístico de Navarra
[email protected]
x j -1 + x j
2
1
Tema 3 Estadística descriptiva
http://www.pwpamplona.com/opo
Web Estadístico de Navarra
[email protected]
2
Tema 3 Estadística descriptiva
http://www.pwpamplona.com/opo
En las distribuciones de frecuencias agrupadas por intervalos.
Vemos que ME=Li-1+m. Determinamos m en base a la hipótesis fijada (todos
los valores comprendidos dentro del intervalo mediano se encuentran distribuidos
uniformemente), que nos permite escribir:
AC
BC
=
, ya que
AC
BC


ABC = AB C 
Pero
AC = m
AC = ci
BC =
N
- N i -1
2
Por tanto:
BC  = N i - N i-1 = ni
Web Estadístico de Navarra
[email protected]
3
Tema 3 Estadística descriptiva
http://www.pwpamplona.com/opo
N
n j 2 N j -1
=
a
t
Md = x j -1 + t
N
- N j -1
Md = x j -1 + 2
a
Nj
Ventajas:
1.- Viene poco afectada por los valores extremos de la variable.
2.- Fácil de calcular.
3.- Fácil de interpretar.
4.- La suma de las desviaciones absolutas respecto de un punto se hace mínima
cuando esta es la mediana.
Inconvenientes:
1.- No es adaptable a cálculos posteriores.
Ejemplo:
Sea la serie xi = {1,2,5,7,9,10,13,14}; la mediana sería
Me =
7 +9
=8
2
Si la serie estadística presentase diferentes frecuencias, el método de cálculo más
cómodo y práctico sería:
xi
ni
Ni
1
2
5
7
10
13
3
4
9
10
7
2
3
7
16
26
33
35
35
Web Estadístico de Navarra
[email protected]
4
Tema 3 Estadística descriptiva
http://www.pwpamplona.com/opo
donde
N 35
= = 17,5
2
2
con lo que la mediana será
Me = 7
Ejemplo:
Sea la siguiente distribución de salarios
Clase
1
2
3
4
5
Salario anual
Nº de obreros
Nº de obreros
acumul.
100
150
200
180
41
100
250
450
630
671
20000 a 25000
25000 a 30000
30000 a 35000
35000 a 40000
40000 a 45000
671
N 671
=
= 335,5
2
2
Indica que el salario medio está comprendido en la clase tercera. La amplitud del
intervalo es ci = 5000.
Me = 30000 +
335,5 - 250
5000
200
Me = 30000 + 0,4275 5000 => Me = 32137,5
Web Estadístico de Navarra
[email protected]
5
Tema 3 Estadística descriptiva
http://www.pwpamplona.com/opo