Download Universidad Mariano Gálvez de Guatemala Centro Universitario de
Document related concepts
Transcript
Universidad Mariano Gálvez de Guatemala Centro Universitario de Escuintla Facultad de Ciencias de la Administración Maestría en Dirección y Gestión del Recurso Humano Curso Modelos para la Toma de Decisiones Ing. M.A. Claudia Esmeralda Marisol Villela Cervantes CAPÍTULO I ANÁLISIS Y APLICACIÓN DE ESTADÍSTICA DESCRIPTIVA - Estudiante: María del Carmen Acuta Chacón. Juan Francisco Alvarez Paz 2728-09-10190 2728- 02- 11488 Fecha: Escuintla, marzo de 2015 INDICE: Introducción……………………………………………………………………......……..03 1.- Análisis y aplicación de estadística descriptiva…………………………..……….04 1.1 Medidas de tendencia central 1.1.1 Media aritmética 1.2 Moda 1.3 Mediana 2. Medidas de forma……………………………………..……………………………...05 2.1 Asimetría 2.1.1 Tipos de asimetría 2.1 Curtosis o Apuntamiento 2.2.1 Tipos de Curtosis 3. Medidas de dispersión……………………….………………………………………07 3.1 Rango Estadístico 3.1.1 Medio rango o Rango medio 3.2. Varianza 3.3 Desviación Típica 3.4 Covarianza 3.5 Coeficiente de correlación de Pearson Conclusión…………………………………………………………………………… Bibliografía………………………………………………………………………… INTRODUCCIÓN: La estadística descriptiva es una gran parte de la estadística que se dedica a recolectar, ordenar, analizar y representar un conjunto de datos, con el fin de describir apropiadamente las características de este. La Estadística es la ciencia que se encarga de recolectar datos de una población o muestra. Los conceptos estadísticos se han trabajado intuitivamente desde la antigüedad, las primeras culturas recopilaban datos poblacionales por medio de censos. La investigación cuya finalidad es el análisis o experimentación de situaciones para el descubrimiento de nuevos hechos, la revisión o establecimiento de teorías y las aplicaciones prácticas de las mismas, se basa en los principios de Observación y Razonamiento y necesita en su carácter científico el análisis técnico de Datos para obtener de ellos información confiable y oportuna. Este análisis de Datos requiere de la Estadística como una de sus principales herramientas, por lo que los investigadores de profesión y las personas que de una y otra forma la realizan requieren además de los conocimientos especializados en su campo de actividades, del manejo eficiente de los conceptos, técnicas y procedimientos estadísticos. I ANÁLISIS Y APLICACIÓN DE ESTADÍSTICA DESCRIPTIVA 1. Medidas de Tendencia Central Corresponden a valores que generalmente se ubican en la parte central de un conjunto de datos. Las medidas estadísticas pretenden "resumir" la información de la "muestra" para poder tener así un mejor conocimiento de la Población. (Ellas permiten analizar los datos en torno a un valor central). Entre éstas están la media aritmética, la moda y la mediana.(EcuRed, s.f.) 1.1. Media Aritmética Es aquella medida que se obtiene al dividir la suma de todos los valores de una variable por la frecuencia total. En palabras más simples, corresponde a la suma de un conjunto de datos dividida por el número total de dichos datos.(EcuRed, s.f.) Ejemplo 1 En matemáticas, un alumno tiene las siguientes notas: 4, 7, 7, 2, 5, 3 n = 6 (número total de datos ) La media aritmética de las notas de esa Asignatura es 4,8. Este número representa el Promedio. Ejemplo 2 Cuando se tienen muchos datos es más conveniente agruparlos en una Tabla de frecuencias y luego calcular la media aritmética. El siguiente cuadro lo ilustra. Se debe recordar que la frecuencia absoluta indica cuántas veces se repite cada valor, por lo tanto, la tabla es una manera más corta de anotar los datos (si la frecuencia absoluta es 10, significa que el valor a que corresponde se repite 10 veces). 1.2. Moda (Mo) Es la medida que indica cual dato tiene la mayor frecuencia en un conjunto de datos, o sea, cual se repite más. (EcuRed, s.f.) Ejemplo 1 Determinar la moda en el siguiente conjunto de datos que corresponden a las edades de niñas de un Jardín Infantil. 5, 7, 3, 3, 7, 8, 3, 5, 9, 5, 3, 4, 3 La edad que más se repite es 3, por lo tanto, la Moda es 3 (Mo = 3) Ejemplo 2 20, 12, 14, 23, 78, 56, 96 En este conjunto de datos no existe ningún valor que se repita, por lo tanto, este conjunto de valores no tiene moda. 1.3. Mediana (Med) Es el valor central de un conjunto de valores ordenados en forma creciente o decreciente. Dicho en otras palabras, la Mediana corresponde al valor que deja igual número de valores antes y después de él en un conjunto de datos agrupados. Según el número de valores que se tengan se pueden presentar dos casos: - Si el número de valores es impar, la Mediana corresponderá al valor central de dicho conjunto de datos. - Si el número de valores es par, la Mediana corresponderá al Promedio de los dos valores centrales (los valores centrales se suman y se dividen por 2).(EcuRed, s.f.) Ejemplo 1 Se tienen los siguientes datos: 5, 4, 8, 10, 9, 1, 2 Al ordenarlos en forma creciente, es decir de menor a mayor, se tiene: 1, 2, 4, 5 , 8, 9, 10 El 5 corresponde a la Med, porque es el valor central en este conjunto de datos impares. Ejemplo 2 El siguiente conjunto de datos está ordenado en forma decreciente, de mayor a menor, y corresponde a un conjunto de valores pares, por lo tanto, la Med será el promedio de los valores centrales. En el gráfico de barras (que tiene un número par de columnas) los valores centrales son 72 y 77.(EcuRed, s.f.) 2. Medidas de Forma 2.1. Asimetría Es una medida de forma de una distribución que permite identificar y describir la manera como los datos tiende a reunirse de acuerdo con la frecuencia con que se hallen dentro de la distribución. Permite identificar las características de la distribución de datos sin necesidad de generar el gráfico.(Ibujes, 2011) 2.1.1. Tipos de Asimetría a. Asimetría Negativa o a la Izquierda: Se da cuando en una distribución la minoría de los datos está en la parte izquierda de la media. Este tipo de distribución presenta un alargamiento o sesgo hacia la izquierda, es decir, la distribución de los datos tiene a la izquierda una cola más larga que a la derecha. También se dice que una distribución es simétrica a la izquierda o tiene sesgo negativo cuando el valor de la media aritmética es menor que la mediana y éste valor de la mediana a su vez es menor que la moda, en símbolos .(Ibujes, 2011) Nota: Sesgo es el grado de asimetría de una distribución, es decir, cuánto se aparta de la simetría b. Simétrica: Se da cuando en una distribución se distribuyen aproximadamente la misma cantidad de los datos a ambos lados de la media aritmética. No tiene alargamiento o sesgo. Se representa por una curva normal en forma de campana llamada campana de Gauss (matemático Alemán 1777-1855) o también conocida como de Laplace (1749-1827). También se dice que una distribución es simétrica cuando su media aritmética, su mediana y su moda son iguales en símbolos Md=Mo. (Ibujes, 2011) c. Asimetría Positiva o a la Derecha:se da cuando en una distribución la minoría de los datos está en la parte derecha de la media aritmética. Este tipo de distribución presenta un alargamiento o sesgo hacia la derecha, es decir, la distribución de los datos tiene a la derecha una cola más larga que a la izquierda.(Ibujes, 2011) También se dice que una distribución es simétrica a la derecha o tiene sesgo positivo cuando el valor de la media aritmética es mayor que la mediana y éste a valor de la mediana a su vez es mayor que la moda, en símbolos .(Ibujes, 2011) 2.2. Curtosis o Apuntamiento La curtosis mide el grado de agudeza o achatamiento de una distribución con relación a la distribución normal, es decir, mide cuán puntiaguda es una distribución.(Ibujes, 2011) 2.2.1. Tipos de curtosis La curtosis determina el grado de concentración que presentan los valores en la región central de la distribución. Así puede ser: a. Leptocúrtica.- Existe una gran concentración. b. Mesocúrtica.- Existe una concentración normal. c. Platicúrtica.- Existe una baja concentración. (Ibujes, 2011) 3. Medidas de Dispersión Las medidas de dispersión, también llamadas medidas de variabilidad, muestran la variabilidad de una distribución, indicando por medio de un número, si las diferentes puntuaciones de una variable están muy alejadas de la media. Cuanto mayor sea ese valor, mayor será la variabilidad, cuanto menor sea, más homogénea será a la media. Así se sabe si todos los casos son parecidos o varían mucho entre ellos.(Wikipedia, 2014) Para calcular la variabilidad que una distribución tiene respecto de su media, se calcula la media de las desviaciones de las puntuaciones respecto a la media aritmética. Pero la suma de las desviaciones es siempre cero, así que se adoptan dos clases de estrategias para salvar este problema. Una es tomando las desviaciones en valor absoluto (desviación media) y otra es tomando las desviaciones al cuadrado (varianza).(Wikipedia, 2014) 3.1. Rango estadístico El rango o recorrido estadístico es la diferencia entre el valor máximo y el valor mínimo en un grupo de números aleatorios. Se le suele simbolizar con R.(Wikipedia, 2014) Requisitos del rango Ordenamos los números según su tamaño. Restamos el valor mínimo del valor máximo Ejemplo Para la muestra (8, 7, 6, 9, 4, 5), el dato menor es 4 y el dato mayor es 9. Sus valores se encuentran en un rango de: (Wikipedia, 2014) 3.1.1. Medio rango o Rango medio El medio rango o rango medio de un conjunto de valores numéricos es la media del mayor y menor valor, o la tercera parte del camino entre el dato de menor valor y el dato de mayor valor. En consecuencia, el medio rango es: Ejemplo Para una muestra de valores (3, 3, 5, 6, 8), el dato de menor valor Min= 3 y el dato de mayor valor Max= 8. El medio rango resolviéndolo mediante la correspondiente fórmula sería: Representación del medio rango: (Wikipedia, 2014) 3.2. Varianza La varianza es una medida estadística que mide la dispersión de los valores respecto a un valor central (media), es decir, es el cuadrado de las desviaciones: (Wikipedia, 2014) Propiedades La varianza es siempre positiva o 0: Si a los datos de la distribución les sumamos una cantidad constante la varianza no se modifica. 1 c Si a los datos de la distribución los multiplicamos una constante, la varianza queda multiplicada por el cuadrado de esa constante. 1. Propiedad distributiva: (Wikipedia, 2014) cov 3.3. Desviación típica La varianza a veces no se interpreta claramente, ya que se mide en unidades cuadráticas. Para evitar ese problema se define otra medida de dispersión, que es la desviación típica, o desviación estándar, que se halla como la raíz cuadrada positiva de la varianza. La desviación típica informa sobre la dispersión de los datos respecto al valor de la media; cuanto mayor sea su valor, más dispersos estarán los datos. Esta medida viene representada en la mayoría de los casos por S, dado que es su inicial de su nominación en inglés.(Wikipedia, 2014) 3.4. Covarianza La covarianza entre dos variables es un estadístico resumen indicador de si las puntuaciones están relacionadas entre sí. La formulación clásica, se simboliza por la letra griega sigma (σ) cuando ha sido calculada en la población. Si se obtiene sobre una muestra, se designa por la letra " ".(Wikipedia, 2014) La fórmula suele aparecer expresada como: Este tipo de estadístico puede utilizarse para medir el grado de relación de dos variables si ambas utilizan una escala de medida a nivel de intervalo/razón (variables cuantitativas). La expresión se resuelve promediando el producto de las puntuaciones diferenciales por su tamaño muestral (n pares de puntuaciones, n-1 en su forma insesgada). Este estadístico, refleja la relación lineal que existe entre dos variables. El resultado numérico fluctúa entre los rangos de +infinito a -infinito. Al no tener unos límites establecidos no puede determinarse el grado de relación lineal que existe entre las dos variables, solo es posible ver la tendencia. 3.5. Coeficiente de Correlación de Pearson El coeficiente de correlación de Pearson, r, permite saber si el ajuste de la nube de puntos a la recta de regresión obtenida es satisfactorio. Se define como el cociente entre la covarianza y el producto de las desviaciones típicas (raíz cuadrada de las varianzas). Teniendo en cuenta el valor de la covarianza y las varianzas, se puede evaluar mediante cualquiera de las dos expresiones siguientes: Ejemplo Para una muestra de valores (3, 3, 5, 6, 8), el dato de menor valor Min= 3 y el dato de mayor valor Max= 8. El medio rango resolviéndolo mediante la correspondiente fórmula sería: (Wikipedia, 2014) Propiedades El coeficiente de correlación, r, presenta valores entre –1 y +1. Cuando r es próximo a 0, no hay correlación lineal entre las variables. La nube de puntos está muy dispersa o bien no forma una línea recta. No se puede trazar una recta de regresión. Cuando r es cercano a +1, hay una buena correlación positiva entre las variables según un modelo lineal y la recta de regresión que se determine tendrá pendiente positiva, será creciente. Cuando r es cercano a -1, hay una buena correlación negativa entre las variables según un modelo lineal y la recta de regresión que se determine tendrá pendiente negativa: es decreciente. (Wikipedia, 2014) CONCLUSIÓN: Son métodos de enseñanza que permiten desarrollar actividades basadas en los indicadores de logro, para orientar el aprendizaje de los estudiantes, lo cual debe ir dentro del proceso de planificación. La sub área de Estadística Descriptiva, es una de las sub áreas de las matemáticas por lo tanto, es por naturaleza una multidisciplinaria. Ésta, constituye una herramienta útil a lo largo de la vida y la historia de la humanidad, puesto que a través de ella se puede llevar un registro de sucesos, históricos, investigaciones de tipo científico, social, cultural, etc. En el quinto grado, los estudiantes deben utilizar la estadística descriptiva con toda propiedad para: recolectar y ordenar datos de fenómenos que ocurren en el entorno, para luego, realizar representaciones gráficas, análisis de distribuciones, cálculo de medidas de tendencia central y posición, análisis de dispersión, distribución normal, sesgo y Curtosis; además, poder interpretar las causas y plantear probables estrategias de solución a diversas situaciones problema. BIBLIOGRAFÍA Cajal, H. U. (s.f.). Salud Madrid. Recuperado el 29 de enero de 2015, de http://www.hrc.es/bioest/Probabilidad_15.html Cordova, R. (21 de abril de 2011). Probabilidad y Estadistica. Obtenido de Blogger: http://rosebelprobabilidadyestadistica.blogspot.com/2011/04/eventosdependientes-independientes-y.html David M Levine, M. L. (29 de enero de 2015). Goggle Books. Obtenido de https://books.google.com.gt/books?id=Aw2NKbDJoZoC&pg=PA127&lpg=P A127&dq=probabilidad+conjunta+y+marginal&source=bl&ots=dWqaNhy9LI &sig=yo9N9mKT0kInJv8uISO5am322vI&hl=es419&sa=X&ei=b_fKVPrALoSZgwSeloL4Ag&ved=0CFMQ6AEwCQ#v=onep age&q=probabilidad%20conjunta% Ditutor. (s.f.). Recuperado el 29 de enero de 2015, de http://www.ditutor.com/probabilidad/espacio_muestral.html EcuRed. (s.f.). Recuperado el 29 de Enero de 2015, de http://www.ecured.cu/index.php/Medidas_de_Tendencia_Central Herrera, R. (11 de abril de 2006). Monografias.com. Obtenido de Introducción a la Teoría de Probabilidades: http://www.monografias.com/trabajos32/teoriaprobabilidades/teoria-probabilidades.shtml#eventdepen Ibujes, M. O. (30 de junio de 2011). Monografías.com. Recuperado el 29 de enero de 2015, de http://www.monografias.com/trabajos87/medidas-formaasimetria-curtosis/medidas-forma-asimetria-curtosis.shtml Litherland, N. (s.f.). eHow en Español. Obtenido de http://www.ehowenespanol.com/definicion-eventos-mutuamenteexcluyentes-sobre_138140/ Mendoza, H. B. (2002). Probabilidad y Estadistica. Universidad de Colombia. Obtenido de http://www.virtual.unal.edu.co/cursos/ciencias/2001065/ Olguín, I. P. (18 de febrero de 2013). Blogger. Recuperado el 29 de enero de 2015, de Temas de Estadística: http://tsuestadistica.blogspot.com/2013/02/eventos-aleatorios-y-espaciomuestral.html Suárez Ibujéz, M. O. (12 de octubre de 2011). Monografías.com. Obtenido de Probabilidad Total y Teorema de Bayes: http://www.monografias.com/trabajos89/probabilidad-total-y-teoremabayes/probabilidad-total-y-teorema-bayes.shtml Wikipedia. (30 de diciembre de 2014). Recuperado el 29 de enero de 2015, de http://es.wikipedia.org/wiki/Medidas_de_dispersi%C3%B3n Wikipedia. (21 de enero de 2015). Obtenido de http://es.wikipedia.org/wiki/Diagrama_de_%C3%A1rbol