Download Estadística
Document related concepts
Transcript
Dep. Científico Técnico Unidad 7 Nivel III Estadística Estadística Definición de Estadística La Estadística trata del recuento, ordenación y clasificación de los datos obtenidos por las observaciones, para poder hacer comparaciones y sacar conclusiones. Un estudio estadístico consta de las siguientes fases: 1. Recogida de datos. 2. Organización y representación de datos. 3. Análisis de datos. 4. Obtención de conclusiones. Conceptos de Estadística Población: Una población es el conjunto de todos los elementos a los que se somete a un estudio estadístico. Individuo: Un individuo o unidad estadística es cada uno de los elementos que componen la población. Muestra:Una muestra es un conjunto representativo de la población de referencia, el número de individuos de una muestra es menor que el de la población. Muestreo: El muestreo es la reunión de datos que se desea estudiar, obtenidos de una proporción reducida y representativa de la población. Valor: Un valor es cada uno de los distintos resultados que se pueden obtener en un estudio estadístico. Si lanzamos una moneda al aire 5 veces obtenemos dos valores: cara y cruz. Dato: Un dato es cada uno de los valores que se ha obtenido al realizar un estudio estadístico. Si lanzamos una moneda al aire 5 veces obtenemos 5 datos: cara, cara, cruz, cara, cruz. Prof:Marta Carazo 1 Dep. Científico Técnico Unidad 7 Nivel III Estadística Definición de variable Una variable estadística es cada una de las características o cualidades que poseen los individuos de una población. Tipos de variable estadísticas Las variables cualitativas se refieren a características o cualidades que no pueden ser medidas con números. Podemos distinguir dos tipos: Una variable cuantitativa es la que se expresa mediante un número, por tanto se pueden realizar operaciones aritméticas con ella. Podemos distinguir dos tipos: Una variable discreta es aquella que toma valores aislados, es decir no admite valores intermedios entre dos valores específicos. Por ejemplo: El número de hermanos de 5 amigos: 2, 1, 0, 1, 3. Una variable continua es aquella que puede tomar valores comprendidos entre dos números. Por ejemplo: La altura de los 5 amigos: 1.73, 1.82, 1.77, 1.69, 1.75. Distribución de frecuencias La distribución de frecuencias o tabla de frecuencias es una ordenación en forma de tabla de los datos estadísticos, asignando a cada dato su frecuencia correspondiente. Tipos de frecuencias La frecuencia absoluta es el número de veces que aparece un determinado valor en un estudio estadístico. Se representa por fi. La suma de las frecuencias absolutas es igual al número total de datos, que se representa por N. (Para indicar resumidamente estas sumas se utiliza la letra griega Σ (sigma mayúscula) que se lee suma o sumatoria. ) La frecuencia relativa es el cociente entre la frecuencia absoluta de un determinado valor y el número total de datos. Se puede expresar en tantos por ciento y se representa por ni. La suma de las frecuencias relativas es igual a 1. La frecuencia acumulada es la suma de las frecuencias absolutas de todos los valores inferiores o iguales al valor considerado. Se representa por Fi. La frecuencia relativa acumulada es el cociente entre la frecuencia acumulada de un determinado valor y el número total de datos. Se puede expresar en tantos por ciento. Prof:Marta Carazo 2 Dep. Científico Técnico Unidad 7 Nivel III Estadística Ejemplo Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas máximas: 32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29. En la primera columna de la tabla colocamos la variable ordenada de menor a mayor, en la segunda hacemos el recuento y en la tercera anotamos la frecuencia absoluta. xi Recuento fi Fi ni Ni 27 I 1 1 0.032 0.032 28 II 2 3 0.065 0.097 29 6 9 0.194 0.290 30 7 16 0.226 0.516 31 8 24 0.258 0.774 32 III 3 27 0.097 0.871 33 III 3 30 0.097 0.968 34 I 1 31 0.032 1 31 1 Este tipo de tablas de frecuencias se utiliza con variables discretas. Representación o Elaboración de Diagramas Diagrama de barras Un diagrama de barras se utiliza para de presentar datos cualitativos o datos cuantitativos de tipo discreto. Se representan sobre unos ejes de coordenadas, en el eje de abscisas se colocan los valores de la variable, y sobre el eje de ordenadas las frecuencias absolutas o relativas o acumuladas. Los datos se representan mediante barras de una altura proporcional a la frecuencia. Prof:Marta Carazo 3 Dep. Científico Técnico Unidad 7 Nivel III Estadística Ejemplo Un estudio hecho al conjunto de los 20 alumnos de una clase para determinar su grupo sanguíneo ha dado el siguiente resultado: Grupo sanguíneo fi A 6 B 4 AB 1 0 9 20 Polígonos de frecuencia Un polígono de frecuencias se forma uniendo los extremos de las barras mediante segmentos. También se puede realizar trazando los puntos que representan las frecuencias y uniéndolos mediante segmentos. Diagrama de sectores Un diagrama de sectores se puede utilizar para todo tipo de variables, pero se usa frecuentemente para las variables cualitativas. Los datos se representan en un círculo, de modo que el ángulo de cada sector es proporcional a la frecuencia absoluta correspondiente. El diagrama circular se construye con la ayuda de un transportador de ángulos. Ejemplo En una clase de 30 alumnos, 12 juegan a baloncesto, 3 practican la natación, 4 juegan al fútbol y el resto no practica ningún deporte. Prof:Marta Carazo 4 Dep. Científico Técnico Unidad 7 Nivel III Estadística Alumnos Ángulo Baloncesto 12 144° Natación 3 36° Fútbol 9 108° Sin deporte 6 72° Total 30 360° Parámetros Estadísticos Un parámetro estadístico es un número que se obtiene a partir de los datos de una distribución estadística. Los parámetros estadísticos sirven para sintetizar la información dada por una tabla o por una gráfica. Tipos de parámetros estadísticos: Hay tres tipos parámetros estadísticos: De centralización, de posición y de dispersión. Medidas de centralización Nos indican en torno a qué valor (centro) se distribuyen los datos. Media aritmética La media aritmética es el valor obtenido al sumar todos los datos y dividir el resultado entre el número total de datos. es el símbolo de la media aritmética. Ejemplo Los pesos de seis amigos son: 84, 91, 72, 68, 87 y 78 kg. Hallar el peso medio. Prof:Marta Carazo 5 Dep. Científico Técnico Unidad 7 Nivel III Estadística Si los datos vienen agrupados en una tabla de frecuencias, la expresión de la media es: Ejemplo: En un test realizado a un grupo de 42 personas se han obtenido las puntuaciones que muestra la tabla. Calcula la puntuación media. X xi fi xi · fi 1 3 1x3=3 2 4 2x4=8 3 2 6 4 4 16 5 4 20 6 3 18 20 71 71 3,55 20 Mediana La mediana es la puntación de la escala que separa la mitad superior de la distribución y la inferior, es decir divide la serie de datos en dos partes iguales. Es el valor que ocupa el lugar central de todos los datos cuando éstos están ordenados de menor a mayor. Se representa por Me.. La mediana se puede hallar sólo para variables cuantitativas. Cálculo de la mediana 1 Ordenamos los datos de menor a mayor. 2 Si la serie tiene un número impar de medidas la mediana es la puntuación central de la misma. 2, 3, 4, 4, 5, 5, 5, 6, 6 Me= 5 3 Si la serie tiene un número par de puntuaciones la mediana es la media entre las dos puntuaciones centrales. 7, 8, 9, 10, 11, 12 Me= 9.5 Moda Prof:Marta Carazo 6 Dep. Científico Técnico Unidad 7 Nivel III Estadística La moda es el valor que tiene mayor frecuencia absoluta. Se representa por Mo. Se puede hallar la moda para variables cualitativas y cuantitativas. Ejemplo: Hallar la moda de la distribución: 2, 3, 3, 4, 4, 4, 5, 5 Mo= 4 Si en un grupo hay dos o varias puntuaciones con la misma frecuencia y esa frecuencia es la máxima, la distribución es bimodal o multimodal, es decir, tiene varias modas. Ejemplo: 1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9Mo= 1, 5, 9 Cuando todas las puntuaciones de un grupo tienen la misma frecuencia, no hay moda. Ejemplo : 2, 2, 3, 3, 6, 6, 9, 9 Medidas de dispersión Las medidas de dispersión nos informan sobre cuanto se alejan del centro los valores de la distribución. Rango o recorrido El rango es la diferencia entre el mayor y el menor de los datos de una distribución estadística. Varianza La varianza es la media aritmética del cuadrado de las desviaciones respecto a la media. Desviación típica La desviación típica es la raíz cuadrada de la varianza. Calculo de la VARIANZA y la DESVIACIÓN TÍPICA. La varianza se representa por Varianza para datos agrupados Para simplificar el cálculo de la varianza vamos o utilizar las siguientes expresiones que son equivalentes a las anteriores. Prof:Marta Carazo 7 Dep. Científico Técnico Unidad 7 Nivel III Estadística Varianza para datos agrupados Ejercicios de varianza Calcular la varianza de la distribución: 9, 3, 8, 8, 9, 8, 9, 18 Calcular la varianza de la distribución de la tabla: X 71 3,55 20 Prof:Marta Carazo xi fi xi · fi xi2 · fi 1 3 1x3=3 12x3=3 2 4 2x4=8 22x4=16 3 2 6 18 4 4 16 64 5 4 20 100 6 3 18 108 20 71 309 2 309 3.55 2 2.8475 20 8 var 2,8475 1.687 Dep. Científico Técnico Unidad 7 Nivel III Estadística Ejercicios 1.- Indica que variables son cualitativas y cuales cuantitativas: a) Comida Favorita. b) Profesión que te gusta. c) Número de goles marcados por tu equipo favorito en la última temporada. d) Número de alumnos de tu Instituto. e) El color de los ojos de tus compañeros de clase. f) Coeficiente intelectual de tus compañeros de clase. 2.- De las siguientes variables indica cuáles son discretas y cuales continuas. a) Número de acciones vendidas cada día en la Bolsa. b) Temperaturas registradas cada hora en un observatorio. c) Período de duración de un automóvil. d) El diámetro de las ruedas de varios coches. e) Número de hijos de 50 familias. f) Censo anual de los españoles. 3.- Clasificar las siguientes variables en cualitativas y cuantitativas discretas o continuas. a) La nacionalidad de una persona. b) Número de litros de agua contenidos en un depósito. c) Número de libros en un estante de librería. d) Suma de puntos tenidos en el lanzamiento de un par de dados. e) La profesión de una persona. f) El área de las distintas baldosas de un edificio. 4.-Las puntuaciones obtenidas por un grupo en una prueba han sido: 15, 20, 15, 18, 22, 13, 13, 16, 15, 19, 18, 15, 16, 20, 16, 15, 18, 16, 14, 13. Construir la tabla de distribución de frecuencias y dibuja el polígono de frecuencias. 5. -El número de estrellas de los hoteles de una ciudad viene dado por la siguiente serie: 3, 3, 4, 3, 4, 3, 1, 3, 4, 3, 3, 3, 2, 1, 3, 3, 3, 2, 3, 2, 2, 3, 3, 3, 2, 2, 2, 2, 2, 3, 2, 1, 1, 1, 2, 2, 4, 1. Prof:Marta Carazo 9 Dep. Científico Técnico Unidad 7 Nivel III Estadística Construir la tabla de distribución de frecuencias y dibuja el diagrama de barras. 6.- Las calificaciones de 50 alumnos en Matemáticas han sido las siguientes: 5, 2, 4, 9, 7, 4, 5, 6, 5, 7, 7, 5, 5, 2, 10, 5, 6, 5, 4, 5, 8, 8, 4, 0, 8, 4, 8, 6, 6, 3, 6, 7, 6, 6, 7, 6, 7, 3, 5, 6, 9, 6, 1, 4, 6, 3, 5, 5, 6, 7. Construir la tabla de distribución de frecuencias y dibuja el diagrama de barras. 7.-. Los 40 alumnos de una clase han obtenido las siguientes puntuaciones, sobre 50, en un examen de Física. 3, 15, 24, 28, 33, 35, 38, 42, 23, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13. a) Construir la tabla de frecuencias. b) Dibujar el histograma y el polígono de frecuencias. 8.-. Sea una distribución estadística que viene dada por la siguiente tabla: xi 61 64 67 70 73 fi 5 18 42 27 8 Calcular: a) La moda, mediana y media. b) El rango, desviación media, varianza y desviación típica. 9.-.Calcular la media, la mediana y la moda de la siguiente serie de números: 5, 3, 6, 5, 4, 5, 2, 8, 6, 5, 4, 8, 3, 4, 5, 4, 8, 2, 5, 4. 10.- Hallar la varianza y la desviación típica de la siguiente serie de datos: 12, 6, 7, 3, 15, 10, 18, 5. 11.- Hallar la media, mediana y moda de la siguiente serie de números: 3, 5, 2, 6, 5, 9, 5, 2, 8, 6. 12.-. Hallar la desviación media, la varianza y la desviación típica de la series de números siguientes: a) 2, 3, 6, 8, 11. b) 12, 6, 7, 3, 15, 10, 18, 5. 13.-. Dadas las series estadísticas: a) 3, 5, 2, 7, 6, 4, 9. b) 3, 5, 2, 7, 6, 4, 9, 1. Prof:Marta Carazo 10 Dep. Científico Técnico Unidad 7 Nivel III Estadística Calcular: La moda, la mediana y la media. La varianza y la desviación típica. 14.-. Se tiene el siguiente conjunto de 26 datos: 10, 13, 4, 7, 8, 11 10, 16, 18, 12, 3, 6, 9, 9, 4, 13, 20, 7, 5, 10, 17, 10, 16, 14, 8, 18 Obtener su mediana y moda. 15.-. Un pediatra obtuvo la siguiente tabla sobre los meses de edad de 50 niños de su consulta en el momento de andar por primera vez: Meses 9 10 11 12 13 14 15 Niños 1 4 9 16 11 8 1 a) Dibujar el polígono de frecuencias. b) Calcular la moda, la mediana, la media y la varianza. 16.-. Completar los datos que faltan en la siguiente tabla estadística: xi fi 1 4 2 4 3 7 5 5 6 ni 0.08 16 4 7 Fi 0.16 0.14 28 38 7 45 8 17.- Considérense los siguientes datos: 3, 8, 4, 10, 6, 2. Se pide: a) Calcular su media y su varianza. b) Si los todos los datos anteriores los multiplicamos por 3, cúal será la nueva media y desviación típica. 18.- El resultado de lanzar dos dados 120 veces viene dado por la tabla: Prof:Marta Carazo 11 Dep. Científico Técnico Unidad 7 Nivel III Estadística Sumas 2 3 4 5 6 7 8 9 10 11 12 Veces 3 8 9 11 20 19 16 13 11 6 4 Calcular la media y la desviación típica. 19.- El histograma de la distribución correspondiente al peso de 100 alumnos de Bachillerato es el siguiente: a) Formar la tabla de la distribución. b) Calcular la moda. c) Hallar la mediana. Prof:Marta Carazo 12