Download La moda
Document related concepts
Transcript
Historia de la Estadística Se cree que los orígenes de la estadística están ligados al antiguo Egipto y a los censos chinos hace unos 4000 años, aproximadamente. Desde esa época, diversos estados realizaron estudios sobre algunas características de sus poblaciones, sus riquezas, posesiones, etc. Q En 1662, John Graunt, un mercader Inglés, publicó un libro sobre los nacimientos y defunciones ocurridos en Londres; el libro tenia conclusiones acerca de ciertos aspectos relacionados con estos acontecimientos. Esta obra es considerada como el punto de partida de la estadística moderna. Historia de la Estadística La palabra estadística comenzó a usarse en el siglo XVIII, en Alemania, en relación a estudios donde los grandes números, que representaban datos, eran de importancia para el estado. Sin embargo, la estadística moderna se desarrolló en el siglo XX a partir de los estudios de Karl Pearson. Hoy la estadística tiene gran importancia, no sólo por que presenta información, sino que además permite inferir y y predecir lo que va a ocurrir, y por lo tanto, es una herramienta fundamental a la hora de tomar decisiones de importancia. Conceptos Básicos En muchas ocasiones, para llevar a cabo una investigación se hacen encuestas, las cuales son dirigidas a una muestra representativa de la población. Para comprender mejor este tipo de estudios es importante que conozcas los siguientes términos básicos: POBLACION Es un conjunto de personas, eventos o cosas de las cuales se desea hacer un estudio, y tienen una característica en común. MUESTRA Es un subconjunto cualquiera de la población; importante escoger la muestra en forma aleatoria azar), pues así se logra que sea representativa y puedan obtener conclusiones más afines acerca de características de la población. es (al se las Para estudiar alguna característica especifica de la población se pueden definir los siguientes tipos de variables: VARIABLES CUALITATIVAS Relacionadas con características no numéricas de un individuo. por ejemplo: Atributos de una persona Estado civil de una persona Estrato Gustos - hobies VARIABLES CUANTITATIVAS Relacionadas con las numéricas del individuo. características Las variables cuantitativas se dividen en: Discretas (aquellas que no admiten otro valor entre 2 valores distintos y consecutivos) o Continuas (aquellas que pueden tomar una infinidad de valores entre dos de ellos). EN UNA INVESTIGACION SE RECOLECTA LA INFORMACION Al ordenar datos muy numerosos, es usual agruparlos en clases o categorías. Al determinar cuantos pertenecen a cada clase, establecemos la frecuencia. Construimos así una tabla de datos llamada Tabla de frecuencias. EJEMPLO Los siguientes datos corresponden a las notas obtenidas por un curso de 24 alumnos en un trabajo de matemática: 4.2 5.0 5.6 5.0 3.2 4.2 5.6 6.0 2.8 3.9 4.2 4.2 50 50 3.9 3.9 3.2 3.2 4.2 5.6 6.0 6.0 3.2 6.0 Ordenemos estos datos en la siguiente tabla: Nota Frecuencia Absoluta (f i) Frecuencia Relativa (h i) 2.8 1 1/24 Frecuencia relativa porcentual (%) 4.2 3.2 4 4/24 16.7 3.9 3 3/24 12.5 4.2 5 5/24 20.8 5.0 4 4/24 16.7 5.6 3 3/24 12.5 6.0 4 4/24 16.7 La FRECUENCIA ABSOLUTA de una clase es el numero de datos que forma dicha clase La FRECUENCIA RELATIVA corresponde a la razón entre la frecuencia absoluta y el total de datos, la cual se puede expresar mediante el uso de porcentajes. Tabla de frecuencia de datos agrupados En ocasiones, el agrupar los datos en intervalos, nos puede ayudar para realizar un mejor análisis de ellos. Consideremos los siguientes datos, expresados en metros, correspondientes a las estaturas de 80 estudiantes de cuarto año de educación media. ESTATURAS DE 80 ESTUDIANTES (Unidad de medida metros) 1,67 1,72 1,81 1,72 1,74 1,83 1,84 1,88 1,92 1,75 1,84 1,86 1,73 1,84 1,87 1,83 1,81 1,77 1,73 1,75 1,78 1,77 1,67 1,83 1,83 1,72 1,71 1,85 1,84 1,93 1,82 1,69 1,70 1,81 1,66 1,76 1,75 1,80 1,79 1,84 1,86 1,80 1,77 1,80 1,76 1,88 1,75 1,79 1,87 1,79 1,77 1,67 1,74 1,75 1,78 1,77 1,74 1,73 1,83 1,76 1,83 1,77 1,75 1,77 1,77 1,84 1,83 1,79 1,82 1,76 1,76 1,76 1,79 1,88 1,63 1,80 1,72 1,75 1,79 1,77 Para construir una tabla de frecuencias para datos agrupados, determinamos el tamaño de cada intervalo, dividiendo el valor del rango por la cantidad de intervalos que se desea obtener. Importante recordar: El rango, está dado por la diferencia entre el máximo y el mínimo valor de la variable. El tamaño del intervalo se aproxima al impar más cercano. RANGO Mide la amplitud de los valores de la muestra y se calcula por diferencia entre el valor más elevado y el valor más bajo que se presenta en la agrupación de datos utilizados para realizar el análisis objeto de estudio. Notamos que la estatura mayor es 1,93 m y la estatura menor es 1,63m; El rango es de 0,30m = 30cm. Formaremos 9 intervalos. Para calcular el tamaño de cada uno dividimos 30 / 9 = 3,33 ≈ 4. si no da entero, lo aproximamos. EL TAMAÑO DEL INTERVALO SE CALCULA ASI: En nuestro ejercicio: √80= 8,94≈9, éste debe ser el número de intervalos. Notamos que la estatura mayor es 1,93 m y la estatura menor es 1,63m; El rango es de 0,30m = 30 cm. Formaremos 9 intervalos. Para calcular el tamaño de cada uno dividimos 30 : 9 = 3,33≈3. si no da entero, lo aproximamos. Intervalos 1,63 – 1,65 1,66 – 1,69 1,70 – 1,73 1,74 – 1,77 1,78 – 1,81 1,82 – 1,84 1,85 – 1,87 1,88 – 1,90 1,91 – 1,93 Frecuencia Absoluta Total : 80 EJEMPLO Los siguientes datos corresponden a las notas obtenidas por un curso de 50 alumnos en un trabajo de matemática: 4.2 5.0 5.6 8.0 3.6 3.2 4.2 5.6 6.0 2.8 3.9 4.2 4.2 50 50 3.9 3.9 3.2 3.2 4.2 5.6 4.2 1.0 5.0 6.0 5.6 3.2 5.0 1.0 3.6 8.2 4.2 5.6 6.0 2.8 3.9 4.2 4.2 50 50 3.9 3.9 3.2 3.2 2.2 1.6 6.0 6.0 3.2 9.0 MARCA DE CLASE La marca de clase es el punto medio de cada intervalo. La marca de clase es el valor que representa a todo el intervalo para el cálculo de algunos parámetros como la media aritmética o la desviación típica. Ejemplo : 163-193 = 30 / 2 = 15 MEDIDAS DE TENDENCIA CENTRAL • Las medidas de tendencia central tienen como objetivo el sintetizar los datos en un valor representativo, las medidas de dispersión nos dicen hasta que punto estas medidas de tendencia central son representativas como síntesis de la información. MEDIDAS DE TENDENCIA CENTRAL MEDIA: Media aritmética, es la que se obtiene sumando los datos y dividiéndolos por el número de ellos. Se aplica por ejemplo para resumir el número de pacientes promedio que se atiende en un turno. Otro ejemplo, es el número promedio de controles prenatales que tiene una gestante. Considérense los siguientes datos: 3, 8, 4, 10, 6, 2. Se pide: 1. Calcular su media. 2. Si los todos los datos anteriores los multiplicamos por 3, cúal será la nueva media. 2. A un conjunto de 5 números cuya media es 7.31 se le añaden los números 4.47 y 10.15. ¿Cuál es la media del nuevo conjunto de números? MEDIDAS DE TENDENCIA CENTRAL MEDIDAS DE TENDENCIA CENTRAL MEDIANA: Corresponde al percentil 50%. Es decir, la mediana divide a la población exactamente en dos. Por ejemplo el número mediana de hijos en el centro de salud “X” es dos hijos. Otro ejemplo es el número mediana de atenciones por paciente en un consultorio. 1 Ordenamos los datos de menor a mayor. 2 Si la serie tiene un número impar de medidas la mediana es la puntuación central de la misma. 2, 3, 4, 4, 5, 5, 5, 6, 6Me= 5 3 Si la serie tiene un número par de puntuaciones la mediana es la media entre las dos puntuaciones centrales. 7, 8, 9, 10, 11, 12Me= 9.5 MEDIDAS DE TENDENCIA CENTRAL MEDIDAS DE TENDENCIA CENTRAL MEDIDAS DE TENDENCIA CENTRAL MEDIDAS DE TENDENCIA CENTRAL MODA: Valor o (valores) que aparece(n) con mayor frecuencia. Una distribución unimodal tiene una sola moda y una distribución bimodal tiene dos. Útil como medida resumen para las variables nominales. Por ejemplo, el color del uniforme quirúrgico en sala de operaciones es el verde; por lo tanto es la moda en colores del uniforme quirúrgico. La moda es el valor que tiene mayor frecuencia absoluta. Se representa por Mo. Se puede hallar la moda para variables cualitativas y cuantitativas. Hallar la moda de la distribución: 2, 3, 3, 4, 4, 4, 5, 5 Mo= 4 Si en un grupo hay dos o varias puntuaciones con la misma frecuencia y esa frecuencia es la máxima, la distribución esbimodal o multimodal, es decir, tiene varias modas. 1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9Mo= 1, 5, 9 Cuando todas las puntuaciones de un grupo tienen la misma frecuencia, no hay moda. 2, 2, 3, 3, 6, 6, 9, 9 MEDIDAS DE TENDENCIA CENTRAL EJERCICIO El número de diás necesarios por 10 equipos de trabajadores para terminar 10 instalaciones de iguales características han sido: 21, 32, 15, 59, 60, 61, 64, 60, 71, y 80 días. Calcular la media, mediana, moda. SOLUCIÓN: La media: suma de todos los valores de una variable dividida entre el número total de datos de los que se dispone: La mediana: es el valor que deja a la mitad de los datos por encima de dicho valor y a la otra mitad por debajo. Si ordenamos los datos de mayor a menor observamos la secuencia: 15, 21, 32, 59, 60, 60,61, 64, 71, 80. Como quiera que en este ejemplo el número de observaciones es par (10 individuos), los dos valores que se encuentran en el medio son 60 y 60. Si realizamos el cálculo de la media de estos dos valores nos dará a su vez 60, que es el valor de la mediana. La moda: el valor de la variable que presenta una mayor frecuencia es 60 EL TAMAÑO DEL INTERVALO SE CALCULA ASI: En nuestro ejercicio: √100= 10, éste debe ser el número de intervalos. MEDIDAS DE TENDENCIA CENTRAL PARA DATOS AGRUPADOS 22905 LRC: Límites Reales de Clase. (Inferior- Superior) Xi = Marca de Clase fi = Frecuecia Absoluta fa. = Frecuencia Acumulada f rel% = Frecuencia Relativa % Frel%ac=Frecuencia Relativa porcentual acumulada MEDIDAS DE TENDENCIA CENTRAL PARA DATOS AGRUPADOS MEDIDAS DE TENDENCIA CENTRAL PARA DATOS AGRUPADOS MEDIDAS DE TENDENCIA CENTRAL PARA DATOS AGRUPADOS MEDIDAS DE TENDENCIA CENTRAL PARA DATOS AGRUPADOS Numero de observaciones que faltan para alcanzar la mediana MEDIDAS DE TENDENCIA CENTRAL PARA DATOS AGRUPADOS MEDIDAS DE TENDENCIA CENTRAL PARA DATOS AGRUPADOS MODA Li es el límite inferior de la clase modal. fi es la frecuencia absoluta de la clase modal. fi--1 es la frecuencia absoluta inmediatamente inferior a la clase modal. fi-+1 es la frecuencia absoluta inmediatamente posterior a la clase modal ai es la amplitud de la clase. MEDIDAS DE TENDENCIA CENTRAL EN EXCEL MEDIDAS DE TENDENCIA CENTRAL GRAFICADAS EN EXCEL MEDIDAS DE TENDENCIA CENTRAL 1Construya la tabla de frecuencia y calcule la media-mediana y moda. MEDIDAS DE TENDENCIA CENTRAL 1Construya la tabla de frecuencia y calcule la media-mediana y moda MEDIDAS DE DISPERSION • Las medidas de dispersión cuantifican la separación, la dispersión, la variabilidad de los valores de la distribución respecto al valor central. Distinguimos entre medidas de dispersión: • Absolutas, que no son comparables entre diferentes muestras • Relativas que nos permitirán comparar varias muestras. MEDIDAS DE DISPERSION MEDIDAS DE DISPERSION DESVIACION MEDIA. La desviación media es la media aritmética de los valores absolutos de las desviaciones respecto a la media La desviación media se representa por MEDIDAS DE DISPERSION DESVIACION MEDIA PARA DATOS AGRUPADOS: Si los datos vienen agrupados en una tabla de frecuencias, la expresión de la desviación media es: MEDIDAS DE DISPERSION Xi 10-15 15-20 20-25 25-30 30-35 fi 12,5 17,5 22,5 27,5 32,5 Xi *fi 3 5 7 4 2 Xm= Dm= |X - Xm| |(X - Xm)*fi| 37,5 9,286 27,858 87,5 4,286 21,43 157,5 0,714 4,998 110 5,714 22,856 65 10,714 21,428 457,5 98,57 457,5/21 =21,7857 98,57/21 =4,6938 MEDIDAS DE DISPERSION VARIANZA Mide la distancia existente entre los valores de la serie y la media. Sumatoria de las diferencias al cuadrado entre 1 valor y la Media por el número de veces que se ha repetido cada valor, la Sumatoria se divide por el tamaño de la muestra. VARIANZA Varianza para datos no agrupados MEDIDAS DE DISPERSION VARIANZA Propiedades de la varianza 1 La varianza será siempre un valor positivo o cero, en el caso de que las puntuaciones sean iguales. 2 Si a todos los valores de la variable se les suma un número la varianza no varía. 3 Si todos los valores de la variable se multiplican por un número la varianza queda multiplicada por el cuadrado de dicho número. 4 Si tenemos varias distribuciones con la misma media y conocemos sus respectivas varianzas se puede calcular la varianza total MEDIDAS DE DISPERSION Calculo de la varianza para datos agrupados X^2 = 1877,4889 MEDIDAS DE DISPERSION DESVIACION TIPICA La desviación típica es la raíz cuadrada de la varianza. Es decir, la raíz cuadrada de la media de los cuadrados de las puntuaciones de desviación. La desviación típica se representa por σ MEDIDAS DE DISPERSION Propiedades de la desviación típica 1 La desviación típica será siempre un valor positivo o cero, en el caso de que las puntuaciones sean iguales. 2 Si a todos los valores de la variable se les suma un número la desviación típica no varía. 3 Si todos los valores de la variable se multiplican por un número la desviación típica queda multiplicada por dicho número. 4 Si tenemos varias distribuciones con la misma media y conocemos sus respectivas desviaciones típicas se puede calcular la desviación típica total. MEDIDAS DE DISPERSION COEFICIENTE DE VARIACION COEFICIENTE DE VARIACION DE PEARSON El coeficiente de variación es la relación entre la desviación típica de una muestra y su media. El coeficiente de variación se suele expresar en porcentajes: El coeficiente de variación permite comparar las dispersiones de dos distribuciones distintas, siempre que sus medias sean positivas. Se calcula para cada una de las distribuciones y los valores que se obtienen se comparan entre sí. La mayor dispersión corresponderá al valor del coeficiente de variación mayor. MEDIDAS DE DISPERSION Gracias por tu atención Finnn