Download Estadistica Basica Sesion 4
Document related concepts
Transcript
Curso de Estadística Básica SESION 4 MEDIA Y DESVIACIÓN ESTÁNDAR DE DISTRIBUCIONES DE FRECUENCIA, MEDIDAS DE POSICIÓN MCC. Manuel Uribe Saldaña MCC. José Gonzalo Lugo Pérez Estadística Básica Objetivo Calcular la media y desviación estándar de diagramas de frecuencia. Conocer las medidas de posición y su interpretación. Estadística Básica Agenda Sesión 4 • • • Revisión del examen de la sesión 1 y 2 Media y desviación estándar en diagramas de frecuencia Medidas de Posición – Cuartil – Percentil – Puntaje estándar Estadística Básica Media y Desviación estándar de distribuciones de frecuencia • Calcular la media, varianza y desviación estándar para el siguiente conjunto de datos: 3 3 2 1 1 2 3 4 3 4 2 1 1 2 3 4 3 4 2 1 2 4 2 3 4 3 2 2 Estadística Básica Media y Desviación estándar de distribuciones de frecuencia • Del ejemplo anterior se obtiene una distribución de frecuencias: x 1 2 3 4 Suma f 5 9 8 6 28 • Para calcular la media y la varianza de la muestra, es necesaria la suma de los 28 valores x y la suma de los 28 valores de x al cuadrado, así: x= Estadística Básica Media y Desviación estándar de distribuciones de frecuencia Σx = 1 + 1 +…+ 1 + 2 + 2 +…+ 2 + 3 + 3 +…+ 3 + 4 + 4 +…+ 4 5 sumandos 8 sumandos 9 sumandos 6 sumandos Σx = (5)(1) + (9)(2) + (8)(3) + (6)(4) Σx = 5 + 18 + 24 + 24 = 71 Σx2 = 12 +…+ 12 + 22 +…+ 22 + 32 +…+ 32 + 42 +…+ 42 5 sumandos 9 sumandos 8 sumandos 6 sumandos Σx2 = (5)(1) + (9)(4) + (8)(9) + (6)(16) Σx2 = 5 + 36 + 72 + 96 = 209 Estadística Básica Media y Desviación estándar de distribuciones de frecuencia Se utilizará la distribución de frecuencias para determinar las sumatorias, obteniendo una tabla de extensiones: x 1 2 3 4 Suma f 5 9 8 6 28 Número de datos xf 5 18 24 24 71 Suma de x, Σxf, usando las frecuencias. x2f 5 36 72 96 209 Suma de x2, Σx2f, usando las frecuencias. Estadística Básica Media y Desviación estándar de distribuciones de frecuencia Estadística Básica Media y Desviación estándar de distribuciones de frecuencia Estadística Básica Media y Desviación estándar de distribuciones de frecuencia • Para encontrar la media de una distribución de frecuencias se tiene: x barra = x= suma de x, usando frecuencias número x= Σxf Σf Σxf Σf = En la fórmula para la media se utiliza n, 71 7 2.536 28 Estadística Básica Media y Desviación estándar de distribuciones de frecuencia Estadística Básica Media y Desviación estandar de distribuciones de frecuencia • Para encontrar la varianza de la distribución de frecuencias se tiene: (suma de x2, usando frecuencias) – (suma de x, usando frecuencias)2 s cuadrada = número número - 1 xf x f f f 1 2 2 s2 2 71 209 28 28.964 1.073 28 1 27 Estadística Básica Media y Desviación estándar de distribuciones de frecuencia Estadística Básica Media y Desviación estándar de distribuciones de frecuencia Estadística Básica Media y Desviación estándar de distribuciones de frecuencia • Para encontrar la Desviación estándar de la distribución de frecuencias se tiene: s s2 1.073 1.036 Estadística Básica Media y Desviación estándar de distribuciones de frecuencia Estadística Básica Media y Desviación estándar de distribuciones de frecuencia Estadística Básica Ejercicios 1. Encontrar la media, la varianza y la desviación estándar de la muestra de 50 puntajes de examen, usando la distribución de frecuencias agrupadas: Numero de clases 1 2 3 4 5 6 7 Marca de clase, x 40 50 60 70 80 90 100 f 2 2 7 13 11 11 4 Media: 75.6 Varianza: 221.1 Desviación Estándar: 14.9 Estadística Básica Ejercicios 2. Una empresa productora de láminas metálicas utiliza varios reparadores de problemas para hacer composturas de emergencia en los hornos. Por lo común, este personal realiza varios viajes cortos. Para efectos de estimar los gastos por viajes del año próximo, la empresa tomó una muestra de 20 cupones de gastos de viaje relacionados con la reparación de dichos problemas. Se obtuvo la siguiente información: Cantidad de dólares en cupones $0.00 - 10.00 $10.00 - 20.00 $20.00 - 30.00 $30.00 - 40.00 $40.00 - 50.00 Total de la muestra Número de cupones 2 8 7 2 1 20 Media: 21.00 Desviación Estándar: 9.95 Calcule la media y la desviación estándar de estas cantidades de gastos por viaje en dólares. Estadística Básica Estadística descriptiva Medidas de tendencia central Medidas de dispersión Medidas de posición Tipos de distribución Estadística Básica Cuartiles Son los valores de la variable que dividen en cuartos a los datos ordenados; cada conjunto de datos posee tres cuartiles. El primer cuartil, Q1,es el número tal que cuando mucho el 25% de los datos es menor en valor que Q1 y cuando mucho el 75% de los datos es mayor que Q1. El segundo cuartil es la media. El tercer cuartil, Q3 , es un número tal que cuando mucho el 75% de los datos es menor en valor que Q3 y cuando mucho el 25% de los datos es mayor que Q3 25% Mín 25% Q1 25% Q2 25% Q3 Máx Datos clasificados en orden creciente Estadística Básica Percentiles Son los valores de la variable que dividen a un conjunto de datos ordenados en 100 subconjuntos iguales; cada conjunto de datos tiene 99 percentiles. El k-ésimo percentil, Pk, es un valor tal que cuando mucho k% de los datos son más pequeños en valor que Pk y cuando mucho (100-k)% de los datos es mayor. 1% Mín 1% P1 1% P2 1% 1% P3 P5 1% P97 1% P98 1% P99 Máx Datos clasificados en orden creciente A lo más k Mín A lo más (100 – k)% Pk Máx Estadística Básica Percentiles Notas: 1. El primer cuartil y el 25avo percentil son iguales; es decir, Q1 = P25. También, Q3 = P75. 2. La mediana, el segundo cuartil, y el 50avo percentil son iguales. ~ x Q2 P50 De esta forma, cuando se pida encontrar P50 o Q2, se puede aplicar el procedimiento para encontrar la mediana. Estadística Básica Procedimiento para determinar el valor de cualquier k-ésimo percentil o cuartil Paso 1 Ordenar los datos, del más chico al más grande nk 100 Paso 2 Calcular Paso 3 Se obtiene un entero A d ( Pk ) A.5 Paso 4 Pk está a la mitad entre el valor del dato en la A-ésima posición y el valor del siguiente dato. Se obtiene un número con una fracción d ( Pk ) B Pk, es el valor del dato en la B-ésima posición Estadística Básica Ejemplo • Con la muestra de 50 puntajes del examen final del curso de estadística elemental que se observa en la tabla, determinar el primer cuartil, Q1, el 58avo percentil, P58, y el tercer cuartil, Q3. 60 90 77 58 72 47 77 39 78 86 82 86 90 89 50 95 58 63 44 94 88 64 68 55 92 72 95 97 85 80 67 74 70 82 91 66 72 64 83 75 68 88 70 72 76 98 74 70 77 78 Estadística Básica Ejemplo • Paso 1 – Ordenar los datos Datos ordenados: puntajes del examen de estadística 39 64 72 78 89 44 66 72 80 90 47 67 74 82 90 50 68 74 82 91 55 68 75 83 92 58 70 76 85 94 58 70 77 86 95 60 70 77 86 95 63 72 77 88 97 64 72 78 88 98 Estadística Básica Ejemplo Paso 2 Encontrar nk (50)( 25) 12.5 100 100 n = 50 y k = 25, ya que Q1 = P25 Paso 3 Encontrar la profundidad de Q1; d(Q1)=13 (Debido a que 12.5 contiene una fracción, B está más próximo al siguiente entero más grande, 13) Paso 4 Encontrar Q1: Q1 es el 13avo valor contando a partir del Mínimo. Q1 = 67 Estadística Básica P58 Paso 2 Encontrar nk (50)(58) 29 100 100 n = 50 y k = 58, debido a P58 Paso 3 Encontrar la profundidad de P58; d(P58) = 29.5 (Como A = 29 (un entero), se suma .5 y se usa 29.5) Paso 4 Encontrar P58: P58 es el valor que está a la mitad entre los valores de las porciones de datos 29ava y 30ava, contando a partir del Mínimo. P58 = (77 + 78)/2 = 77.5 Estadística Básica Q3 Estadística Básica Puntaje estándar (puntaje z) • Posición que tiene un valor particular de x con respecto a la media, medida en desviaciones estándar. El puntaje z se calcula con la fórmula: xx z s Estadística Básica Ejemplo • Encontrar los puntajes estándar para a) 92 y b) 72 con respecto a una muestra de puntajes de un examen que tiene como media de 74.9 y una desviación estándar de 14.19 x x 92 74.9 1.20 s 14.19 x x 72 74.9 x 72, x 74.9; s 14.19. Así , z 0.20 s 14.19 x 92, x 74.9; s 14.19. Así , z Lo anterior significa que el puntaje 92 está a 1.2 desviaciones estándar por arriba de la media, mientras que el puntaje 72 está a 0.2 desviaciones estándar por debajo de la media. Estadística Básica Notas 1. Normalmente, el valor calculado de z se redondea al centésimo más próximo 2. El intervalo de variación aproximado del valor de los puntajes z suele ir de -3.00 a +3.00 Estadística Básica Ejercicios 1. Una muestra tiene una media de 50 y una desviación estándar de 4. Encuentre el puntaje z para cada valor de x. • X=54 • X=50 • X=59 • X=45 Estadística Básica Ejercicios 2. Un examen que se administró a nivel nacional tuvo una media de 500 y una desviación estándar de 100. Si el puntaje z normal de un estudiante en este examen fue de 1.8, ¿cuál es su calificación en el examen? Estadística Básica Ejercicios 3. ¿Qué valor x tiene el mayor valor con respecto al conjunto de datos del que proviene? • X=85, donde la media = 72 y la desviación estándar = 8 • X=93, donde la media = 87 y la desviación estándar = 5 Estadística Básica Ejercicios 4. Considere el siguiente conjunto de tiempos de ignición que fueron registrados para una tela sintética 30,1 31,5 34,0 37,5 30,1 31,6 34,5 37,5 30,2 31,6 34,5 37,6 30,5 32,0 35,0 38,0 31,0 32,4 35,0 39,5 31,1 32,5 35,6 31,2 33,0 36,5 31,3 33,0 36,9 31,4 33,5 37,0 Encuentre: a) La mediana, b) El rango medio, c) El cuartil medio, c) Q2 Estadística Básica Ejercicios 5. ¿Qué valor x tiene la menor posición relativa con respecto al conjunto de datos del que proviene? • X=28, donde la media = 25.7 y la desviación estándar = 1.8 • X=39.2, donde la media = 34.1 y la desviación estándar = 4.3 Estadística Básica Teorema de Chebyshev La proporción de cualquier distribución que esté a menos de k desviaciones estándar de la media es por lo menos 1 1 2 k Donde k es cualquier número positivo mayor que 1. Este teorema es válido para todas las distribuciones de datos. Estadística Básica Teorema de Chebyshev Este teorema establece que a menos de dos desviaciones estándar de la media (k = 2) siempre se encontrará por lo menos el 75% (o más) de los datos. Por lo menos el 75% s X-2s x X+2s Estadística Básica