Download Estadística: es una ciencia que recoge datos , los analiza , los

Document related concepts

Medidas de tendencia central wikipedia , lookup

Parámetro estadístico wikipedia , lookup

Histograma wikipedia , lookup

Distribución de frecuencias wikipedia , lookup

Mediana (estadística) wikipedia , lookup

Transcript
MATEMÁTICAS DE 1º DE BACHILLERATO C.C.S.S.
ESTADÍSTICA
TEMA 1 . INICIACIÓN A LA ESTADÍSTICA
La Estadística surge como un conjunto de actividades desarrolladas por el Estado para “censar“
, es decir , para conocer el número de habitantes y clasificar la población por edad y condición social.
Las primeras referencias nos llevan a China, Egipto y la Grecia Clásica. Ya en Roma se realizan los
censos de la práctica totalidad del Imperio y se conservan relaciones detalladas que ordena
Carlomagno, así como el “ Domesday Book “ de Guillermo el Conquistador , en el siglo XI.
En los siglos XVII y XVIII se aplica a cuestiones relacionadas con juegos de azar
(nacimiento de la teoría de la Probabilidad ) y es a partir del siglo XIX cuando se aplica al
tratamiento de problemas sociales .
Hoy en día los métodos estadísticos están presentes en la inmensa mayoría de los campos
del conocimiento y actividad humanos
Estadística: es una ciencia que recoge datos , los analiza , los describe y los sintetiza, tratando
de extraer conclusiones y realizar predicciones. Se puede clasificar en dos tipos :
a) Estadística Descriptiva : trata del recuento de datos, ordenación y clasificación de estos
construcción de tablas y gráficos para simplificar los datos y cálculo de parámetros que
caracterizan la distribución.
b) Estadística Inductiva o Inferencial: trata de obtener conclusiones generales y previsiones
sobre una población , a partir de los datos obtenidos de una muestra , utilizando el cálculo de
probabilidades.
En este bloque se va a trabajar la Estadística Descriptiva.
1.1- Conceptos Generales
Población : es el conjunto de elementos que poseen una característica en común que se va a
estudiar. Pueden ser personas , objetos , áreas geográficas , periodos temporales ect...
Individuo : es cada uno de los elementos ( real o abstracto ) que forman la población.
Muestra : es un subconjunto de elementos de la población sobre los que se realiza el estudio ,
bien porque la población es muy grande o bien porque se destruye el objeto de estudio. El nivel de
eficacia de la estadística depende de la selección correcta de la muestra. Deberá ser representativa de
toda la población y atender a su diversidad con criterios proporcionales .
Ejemplo: En una ciudad de 500000 habitantes, de los cuales 280000 son mujeres y el resto varones,
queremos seleccionar 1000 personas para un estudio en el cuál el sexo es un factor determinante
Carácter : es el aspecto , fenómeno , rasgo o cualidad que se va a estudiar en cada uno de los
individuos de la población. Podemos distinguir dos tipos de caracteres:
- Cualitativo o Atributo : Las respuestas no son números. Cada una de las respuestas es una
modalidad ( estado civil , profesión .. )
- Cuantitativo o Variable : Las respuestas son números. Cada respuesta es una variable estadística ,
que puede ser :
- Discreta : La variable toma valores aislados ( ejemplo : valores enteros )
- Continua : La variable toma o puede tomar todos los valores de un intervalo. ( A veces una
variable discreta se puede considerar continua si toma un gran número de valores
diferentes)
1.2..- Elaboración de una encuesta
a) Recogida de datos : Toda la eficacia de la encuesta depende de la fiabilidad de los datos
recogidos. La formulación de preguntas debe ser clara y concisa, evitando ambigüedades y
confusiones. Se debe garantizar la independencia en las respuestas.
b) Ordenación de datos : Se procede a la organización de los datos obtenidos y se tabulan en
“ tablas de frecuencias”
c) Elaboración de gráficos: Se representa la información recogida. Deben ser claros y
directos
d) Cálculo de parámetros : De centralización y de dispersión
1
MATEMÁTICAS DE 1º DE BACHILLERATO C.C.S.S.
ESTADÍSTICA
1.3.- Tablas
Si el carácter a estudiar es cualitativo, las modalidades se escriben sin importar el orden.
Si el carácter es cuantitativo discreto , los "k" valores de la variable , que representaremos por
x1 , x2 , x3 .....xk se ordenan de menor a mayor
Una vez que hemos observado y recogido los datos , resumiremos la información de forma
adecuada y útil para su posterior estudio. Esto se hace por medio de tablas de frecuencias y gráficos.
Frecuencia absoluta : es el número de individuos que presentan una modalidad o un valor . Se
representa con la letra fi . La suma de todas las frecuencias es el tamaño de la muestra ( N ) .
Frecuencia relativa : es el número de individuos que presentan una modalidad o un valor ,
dividido por el número total de individuos. Es por tanto la proporción de veces que aparece cada
f
valor o modalidad , respecto del total. Se representa por hi  i donde N es el total de individuos
N
de la muestra. La suma es 1.
Frecuencia absoluta acumulada del valor xj : es la suma de las frecuencias absolutas hasta la
j
que ocupa el lugar " j " . Se representa por F j   f i . La última coincide con el tamaño de la
i 1
muestra.
Frecuencia relativa acumulada : es la suma de las frecuencias relativas hasta la que ocupa el
j
lugar " j ". Se representa por H j   h j . La última vale 1.
i 1
Porcentaje : es la frecuencia relativa multiplicada por 100. Representa el tanto por ciento de
los individuos que presentan dicha modalidad o valor de la variable. Se representa por pi.
Ejemplo : Notas de 30 alumnos : 5 , 3 , 4 , 1 , 2 , 8 , 9 , 8 , 7 , 6 , 6 , 7 , 9 , 8 , 7 , 7 , 1 , 0 , 1 , 5
,9 , 9 , 8 , 0 , 8 , 8 , 8 , 9 , 5 , 7
Notas(xi)
0
1
2
3
4
5
6
7
8
9
Recuento
II
III
I
I
I
III
II
IIIII
IIIIIII
IIIII
Número de alumnos (fi)
2
3
1
1
1
3
2
5
7
5
hi
2/30 = 0,067
3/30 = 0,1
1/30 = 0,03
1/30 = 0,03
1/30 = 0,03
3/30 = 0,1
2/30 = 0,067
5/30 = 0,167
7/30 = 0,23
5/30 = 0,167
Fi
2
5
6
7
8
11
13
18
25
30
Hi
0,067
0,167
0,2
0,23
0,267
0,367
0,43
0,6
0,83
1
pi
6,67
10
3,33
3,33
3,33
10
6,67
16,67
23,33
16,67
Pi
6,67
16,67
20
23,33
26,67
36,67
43,33
60
83,33
100
Si el carácter es cuantitativo continuo o discreto con muchos valores distintos , se agrupan en
intervalos de clase que se construyen de la siguiente forma( un posible método ) :
a) Se calcula el recorrido que es la diferencia entre el mayor y menor valor de la muestra
2
MATEMÁTICAS DE 1º DE BACHILLERATO C.C.S.S.
ESTADÍSTICA
b) Se calcula la amplitud de cada intervalo , que es :
“ recorrido /( número de int ervalos que queremos que haya , entre 5 y10 ) ", y se redondea por exceso
al entero más próximo.
c) Se construye cada intervalo , empezando por el valor más pequeño de la muestra y sumándole la
amplitud . Los intervalos son semiabiertos.
d) En las frecuencias se cuentan los valores que están en el intervalo , incluyendo el extremo
inferior, y sin incluir el extremo superior.
Ejemplo: Edad de las personas que acuden a un parque a lo largo de una hora : 3 , 2 , 11 , 13 ,
4 , 3 , 2 , 4 , 5 , 6 , 7 , 3 , 4 , 5 , 3 , 2 , 5 , 6 , 27 , 15 , 4 , 21 , 12 , 4 , 1 , 6 , 29 , 13 , 6 ,
17 , 6 , 13 , 6 , 5 , 12 , 26
Intervalos de clase
[0 , 5 )
[5,10)
[10,15)
[15,20)
[20,25)
[25,30)
Marcas de clase Recuento fi Fi
2,5
IIIIIIIIIIIII 13 13
7,5
IIIIIIIIIII 11 24
12,5
IIIIII
6 30
17,5
II
2 32
22,5
I
1 33
27,5
III
3 36
hi
13/36 = 0,36
11/36 = 0,31
6/36 = 0,167
2/36 = 0,05
1/36 = 0,027
3/36 = 0,083
Hi
0,36
0,66
0,83
0,89
0,9167
1
pi
36,11
30,55
16,67
5,56
2,78
8,33
Pi
36,11
66,67
83,33
88,89
91,67
100
( f2 = 11 , el número de personas que tiene como mínimo 5 años y menos de 10 es 11 )
(F4 = 32 , el número de personas que tiene menos de 20 años es 32 )
1.3.- Representaciones Gráficas
Las representaciones gráficas de los resultados obtenidos se utilizan dependiendo del tipo de
carácter. Dan una rápida visión de conjunto de los valores de la variable.
Diagrama de Barras ( carácter cualitativo y variable discreta ) : Se representa en el eje
horizontal la variable xi o la modalidad y en el eje vertical las frecuencias absolutas o relativas . Se
alza sobre cada xi o modalidad una barra vertical de altura fi .También se pueden representar
diagramas de barras de frecuencias acumuladas , poniendo en el eje vertical las frecuencias
acumuladas ( No tienen sentido en los caracteres cualitativos )
Polígono de frecuencias ( carácter cualitativo , variable discreta) : En el caso de carácter
cualitativo o discreto , se construye uniendo los puntos superiores de las barras del diagrama de
barras , con trazos rectilíneo
Diagrama de barras con
Diagrama de barras con
frecuencias absolutas
frecuencias acumuladas
Ejemplo :
Nºalumnos 7
35
4
3
2
1
20
15
10
5
0 1 2 34 56 7 8 9
Nota del alumno
Diagrama de barras
0 1 2 34 5 67 8 9
Nota del alumno
Polígono de frecuencias
3
MATEMÁTICAS DE 1º DE BACHILLERATO C.C.S.S.
ESTADÍSTICA
Histograma ( variable continua ) : Se representan en el eje de abscisas los extremos de los
intervalos , y en el eje vertical , si los intervalos tienen todos la misma amplitud , la frecuencia
absoluta o relativa ; y si los intervalos no tienen la misma amplitud , la densidad de frecuencia , que
f
es d i  i . Se levanta sobre cada intervalo un rectángulo de altura fi o di . Con esto se
ai
consigue que las áreas de los rectángulos sean proporcionales a las frecuencias correspondientes a
dicho intervalo. También se puede construir el histograma de frecuencias acumuladas poniendo en
el eje vertical las frecuencias acumuladas.
Polígono de frecuencias (variable continua y discreta tratada como continua ) :En el caso de
variable continua, se construye uniendo los puntos medios de los lados superiores de los rectángulos
, con trazos rectilíneos. El primero se une con el extremo del primer intervalo y el último con el
extremo del último intervalo. El polígono de frecuencias acumuladas se obtiene uniendo con trazos
rectilíneos los siguientes puntos coordenados: (extremo inferior del primer intervalo , 0 ) ( extremo
superior del primer intervalo , F1 ) ,..., ( extremo superior del segundo intervalo , Fn)
Ejemplo :
13
8
7
4
2
0 5 10 15
Histograma
20
25 30
0
5 10 15 20 25
Polígono de frecuencias
Diagrama de Sectores. ( variable cualitativa y cuantitativa discreta ) : Son gráficos en los que
a cada valor o modalidad se le asigna un sector circular de ángulo proporcional a la frecuencia
absoluta. Ángulo = ( f i . 360 ) / N
Ejemplo :Clasificación de 30 alumnos según la comunidad autónoma donde han nacido
Andalucía = 19 alumnos..................................228º
Castilla-La Mancha
Castilla – La Mancha = 7 alumnos................... 84º
Cataluña = 2 alumnos........................................24º
Andalucía
Cataluña
Galicia = 1 alumno............................................12º
Galicia
País Vasco = 1 alumno......................................12º
País Vasco
Pictogramas: Utilizan dibujos alusivos a la distribución que se pretende estudiar ( variables
estadísticas , atributos etc.. ) , y aunque sean llamativos son poco precisos. Los dibujos son
proporcionales a la frecuencia que representan
Cartogramas : Se utilizan para comparar una cierta característica en distintas zonas
geográficas. Suelen utilizar mapas señalando en las distintas zonas lo que se quiera poner de
manifiesto mediante distintos colores , rayados u otros
4
MATEMÁTICAS DE 1º DE BACHILLERATO C.C.S.S.
ESTADÍSTICA
Diagramas de tallos y hojas : Son en realidad diagramas de frecuencias , ya que si unimos los
últimos números de cada fila obtenemos el polígono de frecuencias ( en horizontal )
Ejemplo: Las puntuaciones obtenidas por 21 alumnos en un test son las siguientes :41 . 57 ,
84 , 73 , 82 , 45 , 66 , 79 , 74 , 52 , 73 , 81 , 67 , 56 , 64 , 68 , 67 , 79 , 75 , 43 , 42
El proceso es en tres pasos: primero se observa entre qué valores están las cifras de
las decenas de todos los datos , se tiene que van de 4 a 8 y se ponen en los tallos; se
van leyendo uno a uno cada dato , anotando la cifra de las unidades de cada uno en
la fila correspondiente de las hojas ; se vuelve a escribir la tabla ordenando de menor
a mayor las unidades dentro de cada fila
Tallos
Hojas
Tallos Hojas
4
1532
4
1235
5
726
5
267
6
67487
6
46778
7
394395
7
334599
8
421
8
124
Diagramas lineales: Se utilizan para representar gráficamente las variaciones de uno o más
caracteres a lo largo del tiempo. En este tipo de diagramas interesa la altura de la línea referida a la
base del diagrama.
2120
2100
2080
2060
2040
2020
2000
1980
1960
1940
1920
Serie3
Serie2
Serie1
1
2
3
4
5
Pirámides de población . Consiste en representar gráficamente la población , clasificándola
según su edad ( variable ) y según el sexo ( atributo ). Trata de hacer un histograma para los
hombres y otro para las mujeres de la variable edad. En el eje horizontal se pone a la izquierda y a
la derecha las frecuencias tanto de los hombres como de las mujeres. En el eje vertical se ponen los
valores de la variables en intervalos de clase.
Según la forma de la pirámide se puede deducir si se trata de una población eminentemente
joven , madura o vieja.
valor
5
MATEMÁTICAS DE 1º DE BACHILLERATO C.C.S.S.
ESTADÍSTICA
TEMA 2. MEDIDAS DE CENTRALIZACIÓN , POSICIÓN Y DE DISPERSIÓN
Los parámetros son valores que sirven para caracterizar una distribución. Se pretende con
ellos sintetizar la información proporcionada por un conjunto de datos, de manera que se conserve
la mayor información posible del conjunto total de los datos y el comportamiento global de la
población o muestra en estudio.
Existen distintos parámetros según el papel que juegan :
--Parámetros de centralización o promedios : buscan características del centro de la distribución .
Son media , moda, mediana
--Parámetros de posición : indican una vez ordenados, cuántos elementos quedan a la izquierda o
derecha de uno dado. Son cuartiles , quintiles , deciles y percentiles
--Parámetros de dispersión : proporcionan una idea sobre la separación de los datos. Son rango o
recorrido , desviación media, varianza , desviación típica y coeficiente de variación
2.1.- Parámetros de centralización
2.1.1.- Media
Es el cociente entre la suma de todos los valores de la variable y el número total de valores.
N
Se representa por x .
x
x1  x2  ......... x N i 1 i

x=
N
N
Si los datos vienen acompañados de sus frecuencias respectivas entonces :
n
 xi f i
x f  x f  x f  ......... xn f n i 1
x 1 1 2 2 3 3

N
N
Si la variable es continua se toma como xi las marcas de clase que es la semisuma de los extremos
del intervalo.
Nota: - La media es el promedio más utilizado. Es el centro de gravedad de la distribución.
- Para variables cualitativas no tiene sentido calcular la media
- Cuando aparecen valores extremos y poco significativos la media puede que no sea
representativa
- Si se suma una constante a todos los valores de una variable la media aumenta en esa
constante
- Si se multiplican todos los valores de la variable por una constante , la media queda
multiplicada por esa constante
- Existen otras medias tales como : media geométrica , media armónica y media ponderada.
2.1.2.- Moda
La moda de una distribución es el valor de la variable que tiene mayor frecuencia. Se
representa por Mo
6
MATEMÁTICAS DE 1º DE BACHILLERATO C.C.S.S.
ESTADÍSTICA
Una distribución puede:
- no tener moda ( si todos los datos se repiten el mismo número de veces )
- tener 1 moda ( se dice que es unimodal )
- tener 2 modas ( se dice que es bimodal )
- tener más de 2 modas ( se dice que es plurimodal ) ect...
Al calcularla no intervienen todos los datos
Es una medida de centralización pero a veces está situada en los valores extremos o próxima a
En el caso de valores agrupados en intervalos , la moda está en el intervalo al que corresponde
mayor frecuencia , si la amplitud es constante , o mayor densidad de frecuencia si la amplitud no es
constante . Este intervalo se llama intervalo modal o clase modal . Para hallar exactamente el valor
de la moda se usa la siguiente expresión :
M o  Li 1  a i .
f i  f i 1
( f i  f i 1 )  ( f i  f i 1 )
donde Li-1 = extremo inferior del intervalo modal
ai = amplitud del intervalo
fi-1 = frecuencia absoluta del intervalo anterior al modal
fi+1 = frecuencia absoluta del intervalo posterior al modal
Si los intervalos no tienen la misma amplitud se cambia en la fórmula las frecuencias por las
densidades de frecuencias di = fi / ai.
También se puede hallar gráficamente la moda: en el intervalo de mayor altura se une el
extremo superior izquierdo con el extremo superior izquierdo de la clase posterior , y el extremo
superior derecho con el extremo superior derecho de la clase anterior ; la abscisa correspondiente al
punto donde se cruzan estas rectas es la moda.
2.1.3.- Mediana
Mediana de una distribución estadística es un valor de la variable tal que , una vez ordenados
los valores de menor a mayor , el número de datos mayores que él es igual al número de datos
menores que él. Ocupa el lugar central de la distribución. Se representa por Me
Su cálculo es el siguiente :
- Caso Discreto
------ Si el número de datos es impar , la mediana es el valor central , una vez ordenados de menor
a mayor.
------ Si el número de datos es par , la mediana es la semisuma de los dos valores centrales
------ Si los datos están en una tabla , se calcula la columna de las frecuencias acumuladas y
posteriormente N / 2:
------ Si este valor coincide con alguna frecuencia absoluta acumulada , la mediana será la
media entre el valor de la variable correspondiente a esa frecuencia absoluta acumulada y el valor
siguiente de la variable.
------ Si este valor no coincide con ninguna frecuencia absoluta acumulada , se mira la
primera frecuencia absoluta acumulada que supere a N/2 y la mediana será el valor de la variable
correspondiente a esa frecuencia absoluta acumulada
7
MATEMÁTICAS DE 1º DE BACHILLERATO C.C.S.S.
ESTADÍSTICA
- Caso Continuo
Se mira N/2 en la columna de las frecuencias acumuladas .
------ Si coincide con una frecuencia absoluta acumulada , la mediana será el extremo superior del
intervalo correspondiente a esa frecuencia absoluta acumulada.
------ Si no coincide con una frecuencia absoluta acumulada, se busca la primera que supere a N/2,
eso nos dará el intervalo mediano. La mediana se obtiene con la expresión :
N
 Fi 1
2
M e  Li 1  a i .
fi
- Gráficamente
La mediana se obtiene construyendo el polígono de frecuencias acumuladas; se busca N/2 en el
eje vertical , se traza una paralela al eje X hasta el polígono de frecuencias acumuladas , y en el
punto de corte se traza una paralela al eje Y hasta el eje de abscisas. El punto obtenido será la
mediana
Notas:-
-
La mediana depende del orden de los datos , no del valor de los mismos ( podemos
cambiar , por ejemplo , los valores anteriores y posteriores al valor mediano manteniendo
la misma cantidad y seguiría siendo la misma mediana )
Es interesante cuando hay algún dato anómalo o muy alto o muy bajo
Se puede calcular en distribuciones de tipo cualitativo, donde las modalidades se pueden
ordenar
No utiliza para su cálculo todos los valores de la variable, por lo tanto se puede calcular
en muchas ocasiones en las que los datos están incompletos
En variables con valores agrupados en intervalos , al representar el histograma , si
trazamos una recta vertical que pase por la mediana, el histograma queda dividido en dos
partes de igual área
2.2.- Medidas de posición
2.2.1.- Cuartiles
Así como la mediana es un valor que deja a cada lado el 50% de las observaciones , es decir
divide la distribución en dos partes iguales, podemos obtener valores que dividen la distribución en
un cierto número de partes iguales.
Los Cuartiles son medidas de posición. Dividen la distribución en intervalos de forma que
cada uno de ellos tenga la misma frecuencia. Según el número de partes en que se divide la
distribución , los valores tienen distintos nombres.
---Cuartiles : Dividen la distribución en cuatro partes iguales, es decir en 4 intervalos cada uno de
los cuales contiene el 25% de los datos. Son tres Q1 , Q2 , Q3 . Evidentemente Q2 es igual a Me. Se
calculan igual que la mediana sólo que sustituyendo en todos los cálculos N/2 por rN/4 si
queremos hallar Qr .
Se llama intervalo intercuartílico o rango intercuartílico a RQ = Q3 – Q1 , es la amplitud del
intervalo que comprende el 50% central de las observaciones
8
MATEMÁTICAS DE 1º DE BACHILLERATO C.C.S.S.
ESTADÍSTICA
---Deciles: Dividen la distribución en 10 partes iguales. Son D1 , D2 , ......, D9. Se calculan igual que
la mediana sólo que sustituyendo N/2 por rN/10 si queremos hallar Dr.
Se llama intervalo interdecílico o recorrido interdecílico a RD = D9 – D1 . Es la amplitud de un
intervalo que contiene el 80% central de la distribución de frecuencias.
--- Percentiles : Dividen la distribución en cien partes iguales . Son P1 , P2 , P3 , …. , P99 . Se
calculan igual que la mediana sólo que sustituyendo N/2 por rN/100 si queremos hallar Pr.
Se llama recorrido intercentílico a RP = P99 – P1 . Es la amplitud de un intervalo que contiene el
98% central de los datos.
2.3.- Medidas de dispersión
2.3.1.- Recorrido
Recorrido o rango es la diferencia entre el mayor y el menor valor de la variable. Se
representa por R. Es mayor cuando los valores están más dispersos . Sólo depende de los valores
extremos y puede ocurrir que el rango sea muy grande , aunque la mayoría de los valores estén
concentrados.
2.3.2.- Desviación media.
Una forma de ver si los datos están muy dispersos es calcular las desviaciones de los valores
respecto de la media , tomándolas en valor absoluto para poner todas las diferencias positivas y
promediarlas.
n
 xi  x f i
Dx  i 1
N
Si los datos están agrupados en intervalos se toma como xi la marca de clase.
2.3.3.- Varianza
Varianza de una distribución es la media aritmética de los cuadrados de las desviaciones
respecto de la media.
n
 ( xi  x )2 . f i
S 2  i 1
N
n
 xi2 . f i
 i 1
N
 x
2
Mientras mayor sea la varianza mayor es la dispersión
Su unidad de medida es el cuadrado de la unidad de medida de la variable.
Al estar elevadas al cuadrado las desviaciones , se marca más la dispersión de algunos valores de la
muestra respecto de la media.
2.3.4.- Desviación Típica
Es la raíz cuadrada positiva de la varianza .
S= S
Su unidad de medida es la de la variable.
Puede ser mayor que la media si la muestra está muy dispersa.
2
9
MATEMÁTICAS DE 1º DE BACHILLERATO C.C.S.S.
ESTADÍSTICA
Se verifica : - Si se suma una constante a todos los valores de la variable , la varianza y la
desviación típica no varían.
- Si se multiplican todos los valores de la variable por una constante ;
---- la varianza queda multiplicada por el cuadrado de dicha constante
---- la desviación típica queda multiplicada por el valor absoluto de dicha constante
2.3.5.- Coeficiente de Variación de Pearsón
Por sí sólo el dato de la varianza o la desviación típica o el recorrido o la desviación media ,
no indican si la dispersión es " grande " o " pequeña " ; depende de lo que estemos midiendo. Por
ello hay que comparar la medida de dispersión con un promedio de los valores de la variable.
El coeficiente de variación es el cociente entre la desviación típica y la media aritmética.
C.V. =
S
. ( 100 )
x
(Si se multiplica por 100 aparece expresado en %)
El coeficiente de variación es independiente de las unidades de medida.
Puede ser mayor que 1
Cuanto menor sea el coeficiente de variación , menor dispersión tiene la distribución , por lo tanto
más representativa es la media.
Desigualdad de Tchebicheff
Se demuestra que en las distribuciones unimodales simétricas o ligeramente asimétricas se
verifica que :
 xS , xS 
 x  2S , x  2S 
 x  3S , x  3S 
se encuentra el 68% de los datos.
se encuentra el 95 % de los datos
se encuentra el 99% de los datos.
La desigualdad de Tchebicheff indica que en cualquier tipo de distribuciones , la probabilidad
de que un dato esté en el intervalo x  k . S , x  k . S   1 
1
.
k2
10