Download 3º ESO. T15 estadística
Document related concepts
Transcript
Tema 15. Estadística 1. Población y muestra. Tipos de muestreo. Población es el conjunto de todos los elementos sobre los que se quiere efectuar un estudio estadístico. Muestra es un subconjunto de la población sobre la que se hace el estudio. Ejemplos Si se quiere realizar un estudio sobre los habitantes de Alhaurín el Grande y se decide elegir sólo algunos habitantes de cada uno de los barrios del pueblo: La población sería cada uno de los habitantes de Alhaurín y la muestra los vecinos que elegimos de cada uno de los barrios. Algunos de los motivos por los que es necesario elegir una muestra son: - El tamaño de la población es muy elevado. - La población no está localizada. - La realización del estudios destruye la población. 1.1 Tipos de muestreo. Las distintas formas de elegir una muestra de una población se denominan tipos de muestreo. Los tipos de muestreo más comunes son: 2. Variables estadísticas. Las dos primeras variables se pueden expresar con números. Por este motivo se le llaman variables cuantitativas (se pueden cuantificar). La primera variable solo puede tomar valores naturales, mientras que la segunda variable puede tomar cualquier valor dentro de un intervalo. A la primera variable se le llama variable cuantitativa discreta y a la segunda variable cuantitativa continua. La tercera variable no se puede expresar mediante una cantidad. Por este motivo se llama variable cualitativa. 2.1 Agrupación de datos en intervalos. En las variables cuantitativas continuas o en las discretas con un número elevado de datos, se suelen agrupar los datos por intervalos que tienen la misma amplitud. Un intervalo [a, b) o clase es el conjunto de todos los números mayores o iguales que a y menores que b. Un valor xi de la variable pertenece al intervalo [a, b) si xi es mayor o igual que a y menor que b El número de datos que pertenece a cada intervalo es la frecuencia absoluta de ese intervalo y se representa fi. Ejemplo En este ejemplo se podría agrupar los datos en intervalos de amplitud 5: Intervalo Frecuencia fi [0, 5) 1 [5, 10) 4 [10, 15) [15, 20) [20, 25) [25, 30) 5 5 4 1 En cada intervalo se toma como representante de todos los valores a un único valor llamado marca de clase, que se representa por ci y es el valor medio del intervalo [a, b). Por ejemplo, la marca de clase en el intervalo [10, 15) del ejemplo sería: 2.1 Formación de un número determinado de intervalos. Ejemplo Agrupa las siguientes notas de los alumnos de una clase de 3º de ESO en 5 intervalos de igual amplitud: Recorrido: 9,8 – 0,1 = 9,7 Amplitud: La tabla de frecuencias quedaría: Intervalos [0, 2) [2, 4) [4, 6) [6, 8) [8, 10) Marcas de clase (ci) 1 3 5 7 9 Frecuencia absoluta (fi) 6 3 7 4 4 3. Gráficos estadísticos. Los datos obtenidos en un estudio estadístico se suelen representar en gráficos para que a simple vista si puedan captar las características de su distribución. Ejemplo El número de asignaturas suspensas en una clase de 3º de ESO viene expresado en la siguiente tabla: Dependiendo del tipo de variable, será conveniente recurrir a un tipo de gráfico o a otro. Los datos de este estudio estadístico se podrían representar, por ejemplo: 3.1 Diagrama de barras. Se suele utilizar para representar variables cuantitativas discretas mediante barras verticales estrechas situadas sobre los valores de la variable. En el eje de abscisas (eje X) se representan los valores de la variable, y en el de ordenadas (eje Y), las frecuencias absolutas (fi). También se usa el diagrama de barras para representar variables cualitativas. Ejemplos 3.2 Histograma. Se utiliza para representar variables cuantitativas continuas. Se usan rectángulos sobre los intervalos unidos entre sí. En el eje de abscisas se marcan los extremos de los intervalos, y en el eje de ordenadas se representan las frecuencias absolutas (fi) Ejemplo Para suavizar los escalones que aparecen en los diatramas de barras y en los histogramas, se utilizan los polígonoes de frecuencias. Consiste en unir los puntos medios de los rectángulos con una línea. Ejemplos 3.3 Diagrama de sectores. Se utiliza para representar cualquier tipo de variable. Cada valor se representa en un sector circular. La medida angular de cada sector se calcula mediante la siguiente fórmula: Ejemplo Se estudia el grupo sanguíneo de los 25 alumnos de una clase y se obtienen los resultados que aparecen en la tabla: Grupo sanguíneo A B AB 0 Total Número de alumnos (fi) 14 3 1 7 25 Medida del sector 360º · 0,56 202º 360º · 0,12 43º 360º · 0,04 14º 360º · 0,28 101º 360 º El diagrama de sectores sería 4. Parámetros de centralización. Los parámetros de centralización son valores que representan de forma global los datos estadísticos de una muestra y nos dan una idea de en torna a qué valores están la mayoría de los datos de la variable. 4.1 Media aritmética. Ejemplos Notas xi 2 3 4 5 6 7 8 9 10 Total Número de alumnos (fi) 1 2 5 8 5 3 2 3 1 n = 30 Xi · fi 2 6 20 40 30 21 16 27 10 172 La media es ̅ Hay 14 alumnos por encima de la media y 16 por debajo de la media. 4.2 Moda. La moda, Mo, de una variable estadística es el valor que más se repite, es decir, el que tiene mayor frecuencia absoluta. En los ejemplos anteriores: En el de Juan, la moda es 18. Mo = 18 En el de las notas de educación física, Mo = 5 Para datos agrupados en intervalos, el que se repite se denomina intervalo modal. En el ejemplo de horas que dedican a la TV, Mo = [10, 13) 4.3 Mediana. La mediana, Me, es el valor que se encuentra en la posición central una vez ordenados los datos de menor a mayor. Si el número de datos es par, la mediana es la media aritmética de los dos datos centrales. Ejemplo: 1. Los siguientes datos corresponden al número de calzado utilizado por siete alumnos: 44, 46, 41, 44, 46, 40 y 42. Ordena los datos y escribe el dato central. Datos ordenados 40, 41, 42, 44, 44, 46, 46 Me = 44 2. Las notas obtenidas por un alumno: 7, 5, 7, 8, 10, 7, 9, 6 Datos ordenados 5, 6, 7, 7, 7, 8, 9, 10 Me = 5. Parámetros de dispersión Las medidas de dispersión nos dan una idea de lo alejados o separados que se encuentran los datos alrededor de la media. Ejemplo: Antonio ha obtenido en cinco exámenes de matemáticas las notas 0, 2, 5, 6 y 10 y Juan: 3, 4, 5, 5 y 6. ¿Cuál es la media de ambos alumnos? ¿Qué persona tiene los datos más alejados con respecto a su media? Se observa que los valores de Antonio están más dispersos que los de Juan con respecto a sus respectivas notas medias. 5.1 Recorrido El rango o recorrido, R, de una variable es la diferencia entre el dato mayor y menos de la variable: R = dato mayor – dato menor Ejemplo En el ejemplo anterior las notas de Antonio tienen un recorrido de 10 – 0 = 0, y las de Juan 6 – 3 = 3 5.2 Varianza La varianza, , es la media aritmética de los cuadrados de las diferencias entre cada dato y la media. Otra forma de calcular la varianza es: ̅ Ejemplo: Para el ejemplo de las notas de Antonio y Juan: Juan: Antonio: La varianza indica que las notas de Juan están más dispersas que las de Antonio. 5.2 Desviación típica. La desviación típica, σ, es la raíz cuadrada positiva de la varianza. √ Ejemplo El ejemplo anterior: Antonio √ Juan: 6. Interpretación conjunta de ̅ √ . Coeficiente de variación. El coeficiente de variación, CV, es el cociente entre la desviación típica y la media aritmética: ̅ A mayor coeficiente de variación, mayor dispersión tendrán los valores de la distribución. Ejemplo La siguiente tabla muestra las velocidades (km/h) de varios coches registrados en un poblado y en autovía. a) Calcula la desviación típica de cada distribución b) Calcula el coeficiente de variación de cada distribución c) ¿Cuál de las dos distribuciones tiene menor dispersión? Aunque las velocidades medias en la autovía presentan una desviación típica mayor que en el poblado, su coeficiente de variación es menor. Por lo tanto, presentan menor dispersión las velocidades medias en una autovía.