Download 3º ESO. T15 estadística

Document related concepts

Histograma wikipedia , lookup

Parámetro estadístico wikipedia , lookup

Medidas de tendencia central wikipedia , lookup

Desviación típica wikipedia , lookup

Medidas de dispersión wikipedia , lookup

Transcript
Tema 15. Estadística
1. Población y muestra. Tipos de muestreo.
Población es el conjunto de todos los elementos sobre los que se quiere
efectuar un estudio estadístico.
Muestra es un subconjunto de la población sobre la que se hace el
estudio.
Ejemplos
Si se quiere realizar un estudio sobre los habitantes de Alhaurín el Grande
y se decide elegir sólo algunos habitantes de cada uno de los barrios del
pueblo:
La población sería cada uno de los habitantes de Alhaurín y la muestra los
vecinos que elegimos de cada uno de los barrios.
Algunos de los motivos por los que es necesario elegir una muestra son:
- El tamaño de la población es muy elevado.
- La población no está localizada.
- La realización del estudios destruye la población.
1.1 Tipos de muestreo.
Las distintas formas de elegir una muestra de una población se denominan
tipos de muestreo.
Los tipos de muestreo más comunes son:
2. Variables estadísticas.
Las dos primeras variables se pueden expresar con números. Por este
motivo se le llaman variables cuantitativas (se pueden cuantificar).
La primera variable solo puede tomar valores naturales, mientras que la
segunda variable puede tomar cualquier valor dentro de un intervalo.
A la primera variable se le llama variable cuantitativa discreta y a la
segunda variable cuantitativa continua.
La tercera variable no se puede expresar mediante una cantidad. Por este
motivo se llama variable cualitativa.
2.1 Agrupación de datos en intervalos.
En las variables cuantitativas continuas o en las discretas con un número
elevado de datos, se suelen agrupar los datos por intervalos que tienen la
misma amplitud.
Un intervalo [a, b) o clase es el conjunto de todos los números mayores o
iguales que a y menores que b.
Un valor xi de la variable pertenece al intervalo [a, b) si xi es mayor o igual
que a y menor que b
El número de datos que pertenece a cada intervalo es la frecuencia
absoluta de ese intervalo y se representa fi.
Ejemplo
En este ejemplo se podría agrupar los datos en intervalos de amplitud 5:
Intervalo
Frecuencia fi
[0, 5)
1
[5, 10)
4
[10, 15) [15, 20) [20, 25) [25, 30)
5
5
4
1
En cada intervalo se toma como representante de todos los valores a un
único valor llamado marca de clase, que se representa por ci y es el valor
medio del intervalo [a, b).
Por ejemplo, la marca de clase en el intervalo [10, 15) del ejemplo sería:
2.1 Formación de un número determinado de intervalos.
Ejemplo
Agrupa las siguientes notas de los alumnos de una clase de 3º de ESO en 5
intervalos de igual amplitud:
Recorrido: 9,8 – 0,1 = 9,7
Amplitud:
La tabla de frecuencias quedaría:
Intervalos
[0, 2)
[2, 4)
[4, 6)
[6, 8)
[8, 10)
Marcas de clase (ci)
1
3
5
7
9
Frecuencia absoluta (fi)
6
3
7
4
4
3. Gráficos estadísticos.
Los datos obtenidos en un estudio estadístico se suelen representar en
gráficos para que a simple vista si puedan captar las características de su
distribución.
Ejemplo
El número de asignaturas suspensas en una clase de 3º de ESO viene
expresado en la siguiente tabla:
Dependiendo del tipo de variable, será conveniente recurrir a un tipo de
gráfico o a otro.
Los datos de este estudio estadístico se podrían representar, por ejemplo:
3.1 Diagrama de barras.
Se suele utilizar para representar variables cuantitativas discretas
mediante barras verticales estrechas situadas sobre los valores de la
variable.
En el eje de abscisas (eje X) se representan los valores de la variable, y en
el de ordenadas (eje Y), las frecuencias absolutas (fi).
También se usa el diagrama de barras para representar variables
cualitativas.
Ejemplos
3.2 Histograma.
Se utiliza para representar variables cuantitativas continuas. Se usan
rectángulos sobre los intervalos unidos entre sí.
En el eje de abscisas se marcan los extremos de los intervalos, y en el eje
de ordenadas se representan las frecuencias absolutas (fi)
Ejemplo
Para suavizar los escalones que aparecen en los diatramas de barras y en
los histogramas, se utilizan los polígonoes de frecuencias. Consiste en unir
los puntos medios de los rectángulos con una línea.
Ejemplos
3.3 Diagrama de sectores.
Se utiliza para representar cualquier tipo de variable. Cada valor se
representa en un sector circular.
La medida angular de cada sector se calcula mediante la siguiente
fórmula:
Ejemplo
Se estudia el grupo sanguíneo de los 25 alumnos de una clase y se
obtienen los resultados que aparecen en la tabla:
Grupo sanguíneo
A
B
AB
0
Total
Número de alumnos (fi)
14
3
1
7
25
Medida del sector
360º · 0,56
202º
360º · 0,12 43º
360º · 0,04
14º
360º · 0,28
101º
360 º
El diagrama de sectores sería
4. Parámetros de centralización.
Los parámetros de centralización son valores que representan de forma
global los datos estadísticos de una muestra y nos dan una idea de en
torna a qué valores están la mayoría de los datos de la variable.
4.1 Media aritmética.
Ejemplos
Notas xi
2
3
4
5
6
7
8
9
10
Total
Número de alumnos (fi)
1
2
5
8
5
3
2
3
1
n = 30
Xi · fi
2
6
20
40
30
21
16
27
10
172
La media es ̅
Hay 14 alumnos por encima de la media y 16 por debajo de la media.
4.2 Moda.
La moda, Mo, de una variable estadística es el valor que más se repite, es
decir, el que tiene mayor frecuencia absoluta.
En los ejemplos anteriores:
En el de Juan, la moda es 18.
Mo = 18
En el de las notas de educación física, Mo = 5
Para datos agrupados en intervalos, el que se repite se denomina
intervalo modal.
En el ejemplo de horas que dedican a la TV, Mo = [10, 13)
4.3 Mediana.
La mediana, Me, es el valor que se encuentra en la posición central una
vez ordenados los datos de menor a mayor. Si el número de datos es par,
la mediana es la media aritmética de los dos datos centrales.
Ejemplo:
1. Los siguientes datos corresponden al número de calzado utilizado por
siete alumnos: 44, 46, 41, 44, 46, 40 y 42. Ordena los datos y escribe el
dato central.
Datos ordenados 40, 41, 42, 44, 44, 46, 46
Me = 44
2. Las notas obtenidas por un alumno: 7, 5, 7, 8, 10, 7, 9, 6
Datos ordenados 5, 6, 7, 7, 7, 8, 9, 10
Me =
5. Parámetros de dispersión
Las medidas de dispersión nos dan una idea de lo alejados o separados
que se encuentran los datos alrededor de la media.
Ejemplo:
Antonio ha obtenido en cinco exámenes de matemáticas las notas 0, 2, 5,
6 y 10 y Juan: 3, 4, 5, 5 y 6. ¿Cuál es la media de ambos alumnos? ¿Qué
persona tiene los datos más alejados con respecto a su media?
Se observa que los valores de Antonio están más dispersos que los de Juan
con respecto a sus respectivas notas medias.
5.1 Recorrido
El rango o recorrido, R, de una variable es la diferencia entre el dato
mayor y menos de la variable:
R = dato mayor – dato menor
Ejemplo
En el ejemplo anterior las notas de Antonio tienen un recorrido de 10 – 0 =
0, y las de Juan 6 – 3 = 3
5.2 Varianza
La varianza, , es la media aritmética de los cuadrados de las diferencias
entre cada dato y la media.
Otra forma de calcular la varianza es:
̅
Ejemplo:
Para el ejemplo de las notas de Antonio y Juan:
Juan:
Antonio:
La varianza indica que las notas de Juan están más dispersas que las de
Antonio.
5.2 Desviación típica.
La desviación típica, σ, es la raíz cuadrada positiva de la varianza.
√
Ejemplo
El ejemplo anterior:
Antonio
√
Juan:
6. Interpretación conjunta de ̅
√
. Coeficiente de variación.
El coeficiente de variación, CV, es el cociente entre la desviación típica y la
media aritmética:
̅
A mayor coeficiente de variación, mayor dispersión tendrán los valores de
la distribución.
Ejemplo
La siguiente tabla muestra las velocidades (km/h) de varios coches
registrados en un poblado y en autovía.
a) Calcula la desviación típica de cada distribución
b) Calcula el coeficiente de variación de cada distribución
c) ¿Cuál de las dos distribuciones tiene menor dispersión?
Aunque las velocidades medias en la autovía presentan una desviación
típica mayor que en el poblado, su coeficiente de variación es menor.
Por lo tanto, presentan menor dispersión las velocidades medias en
una autovía.