Download 13. ESTADÍSTICA UNIDIMENSIONAL

Document related concepts
no text concepts found
Transcript
4º ESO
13. ESTADÍSTICA UNIDIMENSIONAL
¿Qué es la estadística? Censo o recuento de la población, de la producción, del tráfico, o de cualquier otra entidad
colectiva.
Conjunto de datos numéricos sobre cualquier cuestión, presentadas en tablas o de forma sistemáticas.
¿Qué es la Estadística? Ciencia que se ocupa del estudio de los métodos y procedimientos para recoger, clasificar, analizar
datos y hacer predicciones científicas a partir de tales datos.
.
1. CONCEPTOS GENERALES
Población: conjunto de elementos sobre los que se realiza una investigación, los elementos de la población se llaman
individuos.
Muestra: subconjunto representativo de la población, se toma cuando la población es muy numerosa. El número de
elementos de la muestra se llama tamaño y se representa por N.
Variable estadística: es la característica que se valora sobre una población. Puede ser: cualitativa: no se puede medir
(nacionalidad, deporte, ...); cuantitativa: se puede medir (edad, gasto semanal, ...); discreta: si toma pocos valores
distintos (nº de hermanos, ...); continua: si toma muchos valores distintos (talla, peso, ...).
Si representamos por X la variable estadística y si toma n valores distintos, los representaremos por: x1, x2, x3, ..., xn.
Frecuencia absoluta: número de veces que se repite cada valor de la variable estadística. Se representa por f 1, f 2, …. fn.
n
Se verifica que f1 + f2 + ···· + f n = N, es decir
f
i
N
i 1
Frecuencia relativa: proporción que hay entre la frecuencia absoluta y el número total de individuos, es decir,
representa por
h1, h2, h3, ..., hn .
Se verifica que:
h1  h 2  h3  .....  hn  1 , es decir
n
h
i
h
f
, y se
N
 1.
i 1
Porcentaje: el tanto por cien de cada valor de la variable; es decir
% = (f/N) · 100 = h · 100.
Frecuencia absoluta acumulada: Fi = f 1 + f2 + ···· + fi . (F4 = f 1 + f 2 + f 3 + f 4 )
Frecuencia relativa acumulada:
Hi = h1 + h2 + ···· + hi
2. FORMACIÓN DE TABLAS
Una vez recogidos los datos se ordenan de forma creciente o decreciente. Se hace el recuento del número total de datos y de
la frecuencia absoluta.
Si la variable es discreta se construye una tabla donde la primera columna
recoge los valores que toma la variable (ordenados), la segunda sus respectivas
frecuencias absolutas, y en columnas sucesivas las frecuencias relativas, los
porcentajes, las frecuencias absolutas acumuladas y las frecuencias relativas
acumuladas.
Si la variable es continua, al ser muchos datos, se agrupan en intervalos
llamados intervalos de clase. El número de intervalos es una aproximación
natural de la raiz cuadrada de N, se redondea de modo que queden todos los
intervalos iguales. Al punto medio de cada intervalo de clase, se le llama marca de clase y será el representante de todos
los valores que están en esa clase. Se contruye la tabla cuya primera columna está formada por los intervalos de clase, la
segunda por la marca de clase y las siguientes por las frecuencias y los porcentajes.
IES Val Miñor
4º ESO
3. REPRESENTACIÓN GRÁFICA
Diagrama de barras: en un sistema de coordenadas, se considera en el eje X los valores que toma la variable y en el eje Y
la frecuencia absoluta. (Para variables aleatorias discretas). Está formada por barras con base en cada valor de la
variable y altura su correspondiente frecuencia absoluta o relativa.
Polígono de frecuencias: en las condiciones del diagrama de barras, se forma una línea poligonal uniendo los pares (x , f) o
bien (x , h).
Histograma: en un sistema de coordenadas, se consideran en el eje X los intervalos de clase y en el eje Y la frecuencia
absoluta. (Para variables continuas). Se construye un rectángulo de base el intervalo de clase y altura su
correspondiente frecuencia.
Diagrama de sectores: se hace un reparto proporcional de las frecuencias de los datos sobre un círculo,
asignando todos
los datos a la amplitud total (360º).
Pictograma: en un sistema de coordenadas, se consideran en el eje X los valores de la variable y en el eje Y las frecuencias
absolutas. Se realiza para cada valor de la variable un dibujo alusivo al tema y de tamaño la frecuencia absoluta de
ese valor.
Cartograma: representación en un mapa.
4. CÁLCULO DE MEDIDAS
Las tablas y las gráficas nos permiten decir intuitivamente de qué forma están
dispuestos los datos, sin embargo para hacer un estudio más riguroso definiremos
unas medidas cuantitativas.
Medidas de centralización: buscan la posición central de todos los datos.
Media aritmética: es el promedio de todos los valores, es decir, el cociente
entre la suma de los valores que toma y N,
n
xi fi
x1 f1  x 2 f2  .......... .  xn fn 
i 1
x

f1  f2  .......... .  fn
N
Moda: es el valor de la variable que más se repite (de mayor frecuencia absoluta). M0.
Mediana: ordenados los datos en forma creciente o decreciente, es el valor que queda en el centro.
Medidas de dispersión: miden si los datos están juntos o dispersos.
Recorrido: la diferencia entre el mayor y el menor valor de la variable.
Varianza: el promedio de los cuadrados de la distancia de los valores de la variable respecto a la media.
n
(x  x )f1 (x 2  x )f2  ........... (x n  x )fn
V 1

f1  f 2  ...........  fn
2
2
Desviación típica: la raíz cuadrada positiva de la varianza.
IES Val Miñor
2
(x
i 1
s V
i
n
2
 x)
fi
N
(x )f
i

i 1
N
2
i
 x 2