Download ESTADÍSTICA

Document related concepts

Parámetro estadístico wikipedia , lookup

Histograma wikipedia , lookup

Medidas de tendencia central wikipedia , lookup

Nivel de medida wikipedia , lookup

Medidas de dispersión wikipedia , lookup

Transcript
ESTADÍSTICA
La ESTADÍSTICA es una rama de las Matemáticas que recoge, ordena, analiza
e interpreta datos relativos a un conjunto de personas o cosas ( POBLACIÓN ). La
población es FINITA cuando lo es el número de elementos que la componen. Y
es INFINITA cuando el número de elementos es infinito. Si el número de
elementos es muy grande, se consideran infinitos. Por ejemplo, el número de
niños en edad escolar en España, es un número finito, pero se considera una
población infinita.
MUESTRA: cuando la población es muy grande o infinita, se trabaja con una parte
pequeña de dicha población, llamada MUESTRA. Es imprescindible que dicha
muestra sea representativa. Ej: elecciones en España.
CARACTERES : Los caracteres de una población son las cualidades o
propiedades que poseen. Por ejemplo,para los alumnos de ESO de este centro
pueden ser : altura, peso, edad, color del pelo, deporte favorito,etc. Los caracteres
de una población pueden ser CUALITATIVOS o Atributos y CUANTITATIVOS o
Variables.
CUALITATIVOS ( atributos ) : son los que se describen mediante palabras, por
ejemplo, sexo, estado civil, lugar de nacimiento, profesión, color favorito, etc.
CUANTITATIVOS ( variables) :son aquellos que son medibles, es decir, se
pueden expresar mediante un número, por ejemplo, edad, peso, nº de hijos,
sueldo, tiempo que vemos la Tv, etc.
A su vez, las variables pueden ser :
DISCRETAS : si toman un número finito de valores, no pudiendo tomar valores
intermedios entre dos consecutivos,por ej : nº de hermanos, nº de asignaturas
suspensas, etc.
CONTINUAS : cuando pueden tomar infinitos valores dentro de un intervalo,es
decir, pueden tomar valores entre dos consecutivos por pequeños que sea su
diferencia,por ej: la altura, el peso, tiempo que se tarda en llegar de casa al
instituto, el sueldo entre los empleados de una empresa,etc.
ESTADÍSTICA DESCRIPTIVA : Tiene como objeto la recogida, recopilación y
redución de datos a unas pocas medidas descriptivas, permitiendo conocer las
características existentes en un conjunto de datos.Las medidas descriptivas que
se usan son las de CENTRALIZACIÓN, DISPERSIÓN. DEFORMACIÓN y las de
APUNTAMIENTO.
ESTADÍSTICA INDUCTIVA : Tiene por objeto conocer las propiedades sobre
ciertos conjuntos de datos o poblaciones a partir de observaciones relativas a una
muestra. Para ello se utiliza el Cálculo de Probabilidades.
FRECUENCIA ABSOLUTA
de la variable
= es el número de veces que se presenta el valor
FRECUENCIA ABSOLUTA ACUMULADA
: es la suma de las frecuencias
∑
absolutas hasta un valor determinado de la variable o sea :
FRECUENCIA RELATIVA
:
; siendo N el número total de datosl
EJEMPLO : Se lanza un dado 20 veces obteniéndose los siguientes resultados :
6
2 6
5
1
2
3
4
5
6
4
3
2
5
2
6
3
2
3
4
N = 20
1
2
3
5
2
8
11
13
16
20
2
6
6
2
2/20
6/20
3/20
2/20
3/20
4/20
2
1
3
4
2/20
8/20
11/20
13/20
16/20
1
Si el número de valores que toma la variable es grande, a veces es conveniente
agrupar los datos en intervalos, por ejemplo :
Preguntadas 100 familias de una ciudad sobre el precio del alquiler mensual de su
vivienda el resultado fué :
< 100
[100, 300)
[300, 500)
[500, 800)
[800, 1200)
[1200,1800)
[1800, )
15
18
25
22
9
8
3
N=100
15
33
58
80
89
97
100
15/100
18/100
25/100
22/100
9/100
8/100
3/100
15/100
33/100
58/100
80/100
89/100
97/100
1
Los intervalos no tienen porque ser de la misma amplitud. Se llama MARCA DE
LA CLASE al punto medio del intervalo, es decir,es el valor que representa a
todos los elementos de ese intervalo.
¿qué número de intervalos deben fijarse? : depende de las características de
cada variable.Fijar muchos intervalos dando gran detalle es conveniente si no se
pierde la visión del conjunto; fijar pocos intervalos facilita el trabajo estadístico,
pero se pierde demasiada información, por lo tanto deben reducirse los extremos.
¿qué amplitud deben tener los intervalos? : siempre que sea posible, es
aconsejable que tengan todos la misma amplitud. Si no es posible, y hay algunos
intervalos que agrupan muchos datos, y otros pocos, se debe dividir los primeros
y agrupar los segundos.
GRÁFICOS DE VARIABLES CUALITATIVAS
DIAGRAMA DE BARRAS:
DIAGRAMA DE SECTORES :
PICTOGRAMA :
CARTOGRAMA : suele utilizarse para estadísticas geográficas.Suelen ser mapas
indicando sobre cada área la variable estudiada mediante símbolos adecuados (
densidad de población, l/
de lluvia, etc,
PIRÁMIDE DE POBLACIÓN : muy usada en estadísticas demográficas, donde se
representa la población.
PERFIL ORTOGONAL : Muy usado en pedagogía y psicología.
PERFIL RADIAL: se obtiene tomando desde un mismo punto o centro tantos
radios(conservando una amplitud constante) como atributos tengan. Igual que la
anterior se usa en pedagogía y psicología.
GRÁFICOS DE UNA VARIABLE CUANTITATIVA DISCRETA :
DIAGRAMA DE BARRAS : en unos ejes de coordenadas, sobre el eje X se ponen
los valores de la variable y sobre cada valor, se levanta un segmento o barra de
altura igual a su frecuencia , que puede ser absoluta o relativa.
GRÁFICOS DE UNA VARIABLE CUANTITATIVA CONTINUA
HISTOGRAMAS : sobre el eje X se marcan los extremos de los intervalos y sobre
el eje Y se levantan rectángulos de altura que sea proporcional a la frecuencia
relativa o absoluta. Si todos los intervalos tienen la misma amplitud, la altura
coincide con su frecuencia, sino : altura =
MEDIDAS DE CENTRALIZACIÓN
∑
MEDIA ARITMÉTICA: ̅
( también hay la media geométrica, cuadrática y la armónica )
MEDIANA (
: es el valor que ocupa el lugar central, suponiendo que la variable
esté ordenada de forma creciente o decreciente. Si el número de datos es impar la
mediana es
.
Si el número de datos es par, la mediana es la media aritmética de los valores
anterior y posterior.
Para una variable discreta, calcular
y el primer valor de la variable cuya
frecuencia absoluta acumulada contenga a
,es la mediana. Si la variable es
continúa, o aparecen los datos agrupados en intervalos, determinar el intervalo
igual que antes.
MODA (
es el valor de la variable de mayor frecuencia absoluta. Puede haber
más de una moda.
CUARTILES. DECILES. PERCENTILES.
PRIMER CUARTIL
: es el valor de la variable de tal forma que la cuarta parte
(25%) son menores o iguales.
Ejemplo :
0
1
2
3
4
5
14
10
15
26
20
15
14
24
39
65
85
100
Luego
Evindentemente el segundo cuartil coincide con la mediana.
DECILES
: son los valores de la variable que dejan
PERCENTILES
“ “
“
“ “
“
“
“
RELACIÓN ENTRE MEDIA, MEDIANA Y MODA :
Si la distribución es simétrica : ̅
Si es aproximadamente simétrica : ̅
̅
se haría igual.
de los datos por debajo.
“ “
“
“
“
MEDIDAS DE DISPERSIÓN
RECORRIDO o RANGO :es la diferencia entre los valores máximo y mínimo de la
variable.
∑
DESVIACIÓN MEDIA:
|
̅|
VARIANZA ( var(x) =
) : es la media aritmética de los cuadrados de las
desviaciones de los datos repecto ala media aritmética. Se calcula :
∑
DESVIACIÓN TÍPICA

̅̅̅̅
=
∑
-̅
: es la raíz cuadrada de la varianza.
Como la varianza viene expresada en unidades diferentes a las de la
variable, es mejor usar la desviación típica ( se coge el signo+ de la raíz)

COEFICIENTE DE VARIACIÓN DE PEARSON:

̅
·100
para comparar la dispersión de dos o más distribuciones, en las que las
variables vienen expresadas en distintas unidades, no debe utilizarse la
desviación típica para medir la dispersión de ambas variables, para ello
utilizar el coeficiente de variación de Pearson.

EJEMPLO :los vecinos de un pueblo se ha medido y pes
TALLA
PESO
̅
̅
=
ado obteniendo :
= 9’49
Luego, hay mayor dispersión en las tallas, o sea, que los pesos están más
concentrados.