Download estadistica aplicada a la educacion
Document related concepts
Transcript
UNIVERSIDAD NACIONAL JORGE BASADRE GROHMANN FACULTAD DE CIENCIAS ESTADISTICA Y PROBABILIDAD TEMA: VARIABLES ,GRAFICOS Y MEDIDAS ESTADISTICAS Dr. PELAYO DELGADO TELLO DEFINICION DE ESTADISTICA Es la ciencia aplicada que nos proporciona un conjunto de métodos , técnicas o procedimientos para: • • • • - recopilar -organizar ( clasificar o agrupar) -presentar y - analizar Datos con el fin de describirlos o de realizar generalizaciones validas que permita la toma de decisiones. DDGGDDDDDDDDDDDIVISSSSSJJJDDDDDDJDDDDDDDIONSS • DIVISION: • ESTADISTICA DESCRIPTIVA.- Es el conjunto de métodos estadísticos que se encarga de la recolección, clasificación y la descripción de datos , para su interpretación análisis y toma de decisiones. INFERENCIA ESTADISTICA .- Es el conjunto de métodos y técnicas que permiten inducir, a partir de la información empírica proporcionada por una muestra, el comportamiento de una población con un riesgo de error medible en términos de probabilidad. I.- INFORMACION ESTADISTICA • I.1.- DATO • Es toda información cualitativa o cuantitativa acerca de una característica de un conjunto de entes materiales o inmateriales. La fuente de obtención de datos: • Las Estadísticas Vitales de los Países (Registro Civil). • Boletines de los distintos Ministerios de los Países. • Institutos Nacionales de Estadísticas. • Encuestas - Entrevistas. • Registro de importación y exportación de productos alimenticios • Reservas nacionales , balanza de pagos • Investigaciones diseñadas con un propósito específico. • Todas las posibilidades de búsqueda ofrecida hoy por internet, etc. FORMAS DE OBTENER INFORMACION: a) mediante una urna b) mediante una tómbola c) mediante números aleatorios • 1.2.- POBLACIÓN • Conjunto de datos, observaciones o medidas en un determinado universo del cual se desea estudiar una característica en particular y se denota por “ N ”. El número de elementos de la población. • • • • • Ejem. El rendimiento académico de los estudiantes de la UCV La estatura de los trabajadores de la Zona de Educación El número de votantes a favor de un candidato. etc. • 1.3.- MUESTRA • Cualquier subconjunto representativo de la población, requiere que las unidades o elementos sean seleccionados al azar. • se denotará por “n” el número de elementos de la muestra • 1.4.- ESTIMADOR • Es una estadística que se obtiene a partir de los datos muestrales ,describe alguna característica de la muestra, constituye una estimación de un parámetro, y se representa por letras minúsculas. • 1.5.- PARÁMETRO • Es un número que describe alguna característica de toda la población y para determinar su valor es necesario utilizar la información poblacional completa se representa por letras griegas o letras mayúsculas del idioma español. σ, P, µ, σ2 , S, S2 etc. Población µ, σ, σ2 inferencia Muestra ‾ x-,med,mod Análisis Relacional • ESTRUCTURA Y TIPOS DE DATOS ESTADISTICOS • DATOS CUALITATIVOS O ATRIBUTOS • Son aquellos susceptibles de ser expresados por una cualidad o atributo. • Ejemplos: • El lugar de procedencia de un estudiante • El estado civil de una persona • Alumnos aprobados y no aprobados DATOS CUANTITATIVO • Son aquellos susceptibles de ser expresados por una cantidad (variables), los cuales a su vez pueden ser DISCRETOS Y CONTINUOS. • • • • • • • • Ejemplos: El puntaje obtenido en un examen ( ) Número de aulas de un colegio ( ) Cantidad de alumnos aprobados en un examen ( ) Cantidad de libros defectuosos en una biblioteca.( ) El tiempo que dura una prueba de examen ( ) Peso o estatura de un estudiante ( ) Temperatura ambiental promedio etc. ( ) • Sin embargo existen variables que el valor observado expresa un cierto orden o jerarquía. Se le denomina Variable Ordinal. Tiene la característica de que el valor obtenido indica un orden o jerarquía, permitiendo indicar una posición relativa de los distintos elementos clasificados. •Rendimiento académico de un estudiante : Bueno, Regular, Malo. •Grado de dificultad de una examen: fácil o difícil . • Orden de meritos de un docente en la Universidad •Grado de desarrollo de un Centro Educativo •Etc. PRACTICA CALIFICADA NOMBRES Y APELLIDOS…………………………………………………… 1.- Clasifique las variables que aparecen a continuación identifique el tipo que le corresponde según la forma de expresar sus valores y la escala en que originalmente clasificaría un grupo de unidades de observación. 1. Numero de Hijos 2. Gestión Publica 3. Nivel de ingresos 4. Concentración de un contaminante 5. Género 6. Estatura del recién nacido 7. Porcentaje de días trabajados 8. Ciclos de la maestría 9. Velocidad de un vehículo 10. Dificultad de un examen 11. Peso del oxigeno 12. Gravedad de un accidente 13. Clasificación de las Regiones 14. Temperatura ambiental 15. Niveles de ansiedad 16. Edad en su último cumpleaños 17. Profesión de una persona 18. Temperaturas registradas en un observatorio cada hora 19. Cotización de las acciones de FedEx 20. Tiempo de descarga de un archivo. DESARROLLO • MATRIZ DE LOS DATOS • Cuando se realiza un estudio sobre un conjunto finito “n” sujetos, objetos, cosas, individuos, entidades etc., normalmente existe una variada gama de características y que se expresan en los términos vistos anteriores, digamos entonces de manera genérica, que determinan “p” variables”. • Lo anterior permite construir lo que se llama “Base de Datos”, que de manera muy general podemos decir que es un arreglo tipo matricial que tiene “n” filas y “p” columnas. Individuos 1 2 3 4 . . . . n Var.X1 Var.X2 Var.X3 Var.X4 …….. Var.xp • El propósito de la matriz de datos es presentar los datos de la manera “más depurada posible” para proceder al procesamiento de los datos y obtener información. • La primera preocupación es entonces aprender a estructurar una base de datos, utilizando un software para su posterior procesamiento. • Utilizaremos un software estadístico llamado “SPSS”. Es una versión para ambiente Windows 98 – 2000 y XP. SIM • Los datos se ingresan en una planilla, muy similar a la denominada planilla EXCEL. • Construiremos una pequeña base de datos, con antecedentes de persona. CONSTRUCCION DE UNA BASE DEDATOS • Considere una planilla de sueldos de una institución publica : • Código • Nombres y apellidos • Remuneración • Edad • Mes • SEXO GRAFICO : NUBE DE PUNTOS TEMPERATURA SEMANAL 20 TEMPERATURA 15 10 5 0 1 2 3 4 DIAS 5 6 7 GRAFICO: LINEAL TEMPERATURA SEMANAL TEMPERATURA 16 14 12 10 8 6 4 0 2 4 DIAS 6 8 GRAFICO DE BARRAS VERTICALES TEMPERATURA SEMANAL TEMPERATURA 16 12 8 4 0 1 2 3 4 DIAS 5 6 7 GRAFICO DE BARRAS HORIZONTALES TEMPERATURA SEMANAL 1 2 DIAS 3 4 5 6 7 0 4 8 TEMPERATURA 12 16 GRAFICO DE PARTES COMPONENTES DEFICIEN BUENAS OPTIMAS CLASIFICACIÓN SEGÚN NOTAS 23 1 5 458 406 4 357 CANTIDAD 22 18 28 26 3 5 7 2 30 25 20 15 10 5 0 OPTIMAS OPTIMA BUENAS BUENA DEFICIEN DEFIC 1 2 3 4 5 GRAFICO CIRCULAR RENDIMIENTO ACADEMICO 17.18% 71.78% APRO 11.04% RET 17.18% DESAP 11.04% 71.78% CAUSAS DEL BAJO RENDIMEINTO ACADEMICO CAUSAS Económicas Bibliografía Conocimiento Docente Sicológicas Drogas Otros TOTAL CANTIDAD 180 40 50 30 12 6 2 32 0 GRAFICO DE PARETO RENDIMIENTO ACDEMICO 400 frequency 300 200 100 0 eco doc bibl conc Other GRAFICO DE PARETO RENDIMIENTO ACADEMICO 2002 400 99.38 100.00 93.75 97.50 CANTIDAD 300 84.38 71.88 200 56.25 100 0 eco bibl doc sic conc otros dro II. PROCESAMIENTO ESTADISTICO DE DATOS • • • 2.1.1 MEDIDAS DE TENDENCIACENTRAL Son aquellos estimadores cuyos valores tienden a ubicarse en la PARTE CENTRAL del recorrido o rango de una variable, es decir más o menos la mitad del intervalo definido entre el valor mínimo y el valor máximo . n1 n2 µ n3 nk 2.1.2. MEDIA O PROMEDIO ARITMÉTICO Es una estadística que localiza el “ centro “ de la distribución en base a su centro de gravedad y se obtiene a partir de la siguientes fórmulas : PARA DATOS ORIGINALES.- Sean x1 , x 2 , x 3 ………Xn las variables matemáticas que representen los datos muestrales n xi x i 1 n PROPIEDADAES: 1. N (X I 1 2. Si yi = i x) 0 a ± b xi → y = a ±b X¯ 2.1.3. MEDIA PONDERADA : sean p1 , P2 , P 2 ......P k Los pesos asociados a las variables k w x i 1 k i p i 1 pi i x1 , x 2 , ......., xk , respectivamente. Entonces: Ejemplo 2 : Se desea determinar el promedio ponderado de los estudiantes del primer ciclo de la Escuela de Ing. Civil teniendo en cuenta los cursos y créditos TEORIA PRACTICA CREDITOS NOTA Matemáticas 3 2 4 14 Física 2 2 3 16 Estadística 3 2 4 18 Dibujo Técnico 3 2 4 12 ASIGNATURA SOLUCION Xi = Nota pi = Creditos k w x i 1 k i p i 1 pi = 228/15 i = 15.2 2.1.4 MEDIA GEOMÉTRICA .- Esta media corresponde al valor que tomaría la variable si se calculase la media aritmética de los logaritmos de los datos en lugar de los valores directos . g = Inv Log n LogX i i 1 n o g= n x1x 2 ........x n Este estadígrafo se utiliza principalmente en estudios de Economía , tales como distribución de ingresos, cálculo de índice de precio, tasas de interés ,en estudios de crecimiento de población . En términos generales donde los valores de las variables representan tasas o porcentajes de variación relativos al comportamiento de carácter exponencial. Ejemplo Las tasas de interés de tres bonos son 5%, 7% y 4%. La media geométrica es = 5.192. Por ejemplo, la media geométrica de la serie de números 34, 27, 45, 55,22, 34 (seis valores) es MEDIA O PROMEDIO ARMONICO Ma n n 1 ( ) i 1 xi EJEMPLO Calcular la media armónica de la tasa de interés de 3 bonos del ejemplo anterior : Ma 3 5.06 1/ 5 1/ 7 1/ 4 2.1.6 MEDIA GLOBAL : Sí una muestra de tamaño n se particiona en k submuestras y x x x 2 , 1 , …….. n son las medias de las k submuestras de tamaños n1 , n2 …..n respectivamente Entonces: k X ni xi = i 1 n Se denomina media global de la muestra particionada. Ejemplo1. Si a una sección de estudiantes se divide en tres grupos de practica A,B,C de 10,16,14 estudiantes, si su rendimiento académico de cada grupo es 15,14 y 12 respectivamente . Cuál será el rendimiento global de toda la sección. SOLUCION k ni xi i 1 n = 15 10 14 16 12 14 542 13,55 40 40 1.1.7 MEDIANA: Es una medida de tendencia central que divide a la información en dos partes iguales 50% a cada lado. Sean x1 , x 2 , x 3 ………Xn una muestra en orden creciente o decreciente de magnitud. Entonces la mediana se define de la siguiente manera: xn1 /2 med = impar xn x n 1 2 2 2 par En el caso que la cantidad de datos sea un número impar , la mediana se obtiene ubicando el valor que esta en el centro. En el caso de que la cantidad de datos sea un número par, la mediana se obtiene como el promedio de los dos valores centrales. Ejemplo 3: Las notas de 5 maestrantes fueron 11, 15, 17, 14, 13. Encontrar la la mediana de dichas notas: SOLUCIÓN Como la cantidad de datos es impar entonces la mediana será el valor central una vez ordenado los datos: 11, 13, 14, 15,17 luego la med=14 • 1.1..8 MODA : Esta medida se conoce también con el nombre de Promedio Industrial. Está representado por el valor o cantidad que más se repite o tiene una mayor frecuencia • La distribución de datos puede ser modal • bimodal o multimodal 1.2 MEDIDAS DE VARIABILIDAD : Estas medidas están orientadas a cuantificar el grado o magnitud de cómo los datos se dispersan entorno a una medida de tendencia central . Generalmente en torno a la media aritmética . Mucha dispersión es señal de poca uniformidad u homogeneidad en los datos. Por el contrario poca dispersión , es señal de homogeneidad en los datos. 1.2.1 RANGO: Es una mediada de variabilidad que se obtiene de la diferencia entre el mayor valor de la variable y el menor valor. R = X máximo - X mínimo 1.2.3 VARIANZA: Es el promedio aritmético de los desvíos cuadráticos de los valores de la variable respecto del promedio aritmético n s 2= ( xi i 1 x )2 n 1 ;σ2 N = ( xi x)2 i 1 N 1.2.3 DESVIACION ESTANDAR: Es la raíz cuadrada de la varianza tiene una gran importancia pues es la cuantificación de la precisión de la de la medición de la variable. 2 Se utiliza, entre otras aplicaciones para construir intervalos de confiabilidad en torno a los cuales ocilará un parámentro de una población en estudio Si la forma de la curva es una campana entonces el 68,27% de las veces la medición estará en el intervalo es decir : x y con las característica de la curva tipo campana, el intervalo x 2 Contendrá el 95% de los valores de la variable 1.2.4 ERROR ESTANDAR . Es la desviación estándar dividida por la raíz cuadrada del número de datos. e.e n 1.2.5.DESVIACION MEDIA . Es una mediad de variabilidad que no está incorporado en las rutinas de cálculo de Statgraphics. Su algoritmo de calculo es : n xi x DM = i 1 n Podemos definirla como el promedio aritmético de los valores absolutos de las desviaciones de los valores de la variable respecto del promedio aritmético . 2.1.7 COEFICIENTE DE VARIACIÓN .- Es la dispersión relativa de una variable, en relación con su promedio aritmético. Tiene la propiedad de ser adimensional. Por lo tanto sirve para comparar el menor o mayor grado de homogeneidad de una variable respecto a otra. CV = 100 X VARIANZA GLOBAL: Si una muestra de tamaño n se particiona en K submuestras de tamaño s n₁ , n ₂, n₃…….nk tales que k ni n i 1 x1 , x2 , x3 ,........xk s12 , s 2 2 ,..............s 2 son las medias , son las varianzas de las k submuestras respectivamente. entonces : k 2 2 n ( S X ) n X i i i i 1 S x 2 i 1 i 1 n n k 2 • • • CAPITULO II