Download Universidad Mariano Gálvez de Guatemala Centro Universitario de

Document related concepts

Parámetro estadístico wikipedia , lookup

Medidas de dispersión wikipedia , lookup

Desviación típica wikipedia , lookup

Asimetría estadística wikipedia , lookup

Curtosis wikipedia , lookup

Transcript
Universidad Mariano Gálvez de Guatemala
Centro Universitario de Escuintla
Facultad de Ciencias de la Administración
Maestría en Dirección y Gestión del Recurso Humano
Curso Modelos para la Toma de Decisiones
Ing. M.A. Claudia Esmeralda Marisol Villela Cervantes
CAPÍTULO I
ANÁLISIS Y APLICACIÓN DE ESTADÍSTICA DESCRIPTIVA
-
Estudiante:
María del Carmen Acuta Chacón.
Juan Francisco Alvarez Paz
2728-09-10190
2728- 02- 11488
Fecha: Escuintla, marzo de 2015
INDICE:
Introducción……………………………………………………………………......……..03
1.- Análisis y aplicación de estadística descriptiva…………………………..……….04
1.1 Medidas de tendencia central
1.1.1 Media aritmética
1.2 Moda
1.3 Mediana
2. Medidas de forma……………………………………..……………………………...05
2.1 Asimetría
2.1.1 Tipos de asimetría
2.1 Curtosis o Apuntamiento
2.2.1 Tipos de Curtosis
3. Medidas de dispersión……………………….………………………………………07
3.1 Rango Estadístico
3.1.1 Medio rango o Rango medio
3.2. Varianza
3.3 Desviación Típica
3.4 Covarianza
3.5 Coeficiente de correlación de Pearson
Conclusión……………………………………………………………………………
Bibliografía…………………………………………………………………………
INTRODUCCIÓN:
La estadística descriptiva es una gran parte de la estadística que se dedica a
recolectar, ordenar, analizar y representar un conjunto de datos, con el fin de
describir apropiadamente las características de este.
La Estadística es la ciencia que se encarga de recolectar datos de una población o
muestra. Los conceptos estadísticos se han trabajado intuitivamente desde la
antigüedad, las primeras culturas recopilaban datos poblacionales por medio de
censos.
La investigación cuya finalidad es el análisis o experimentación de situaciones para
el descubrimiento de nuevos hechos, la revisión o establecimiento de teorías y las
aplicaciones prácticas de las mismas, se basa en los principios de Observación y
Razonamiento y necesita en su carácter científico el análisis técnico de Datos para
obtener de ellos información confiable y oportuna.
Este análisis de Datos requiere de la Estadística como una de sus principales
herramientas, por lo que los investigadores de profesión y las personas que de una
y otra forma la realizan requieren además de los conocimientos especializados en
su campo de actividades, del manejo eficiente de los conceptos, técnicas y
procedimientos estadísticos.
I ANÁLISIS Y APLICACIÓN DE ESTADÍSTICA DESCRIPTIVA
1. Medidas de Tendencia Central
Corresponden a valores que generalmente se ubican en la parte central de un
conjunto de datos. Las medidas estadísticas pretenden "resumir" la información de
la "muestra" para poder tener así un mejor conocimiento de la Población. (Ellas
permiten analizar los datos en torno a un valor central). Entre éstas están la media
aritmética, la moda y la mediana.(EcuRed, s.f.)
1.1.
Media Aritmética
Es aquella medida que se obtiene al dividir la suma de todos los valores de
una variable por la frecuencia total. En palabras más simples, corresponde a
la suma de un conjunto de datos dividida por el número total de dichos
datos.(EcuRed, s.f.)
Ejemplo 1
En matemáticas, un alumno tiene las siguientes notas: 4, 7, 7, 2, 5, 3
n = 6 (número total de datos )
La media aritmética de las notas de esa Asignatura es 4,8. Este número
representa el Promedio.
Ejemplo 2
Cuando se tienen muchos datos es más conveniente agruparlos en una Tabla
de frecuencias y luego calcular la media aritmética. El siguiente cuadro lo
ilustra.
Se debe recordar que la frecuencia absoluta indica cuántas veces se repite
cada valor, por lo tanto, la tabla es una manera más corta de anotar los datos
(si la frecuencia absoluta es 10, significa que el valor a que corresponde se
repite 10 veces).
1.2.
Moda (Mo)
Es la medida que indica cual dato tiene la mayor frecuencia en un conjunto
de datos, o sea, cual se repite más. (EcuRed, s.f.)
Ejemplo 1
Determinar la moda en el siguiente conjunto de datos que corresponden a
las edades de niñas de un Jardín Infantil.
5, 7, 3, 3, 7, 8, 3, 5, 9, 5, 3, 4, 3
La edad que más se repite es 3, por lo tanto, la Moda es 3 (Mo = 3)
Ejemplo 2
20, 12, 14, 23, 78, 56, 96
En este conjunto de datos no existe ningún valor que se repita, por lo tanto,
este conjunto de valores no tiene moda.
1.3.
Mediana (Med)
Es el valor central de un conjunto de valores ordenados en forma creciente o
decreciente. Dicho en otras palabras, la Mediana corresponde al valor que
deja igual número de valores antes y después de él en un conjunto de datos
agrupados.
Según el número de valores que se tengan se pueden presentar dos casos:
- Si el número de valores es impar, la Mediana corresponderá al valor central
de
dicho
conjunto
de
datos.
- Si el número de valores es par, la Mediana corresponderá al Promedio de
los dos valores centrales (los valores centrales se suman y se dividen por
2).(EcuRed, s.f.)
Ejemplo 1
Se tienen los siguientes datos: 5, 4, 8, 10, 9, 1, 2
Al ordenarlos en forma creciente, es decir de menor a mayor, se tiene:
1, 2, 4, 5 , 8, 9, 10
El 5 corresponde a la Med, porque es el valor central en este conjunto de
datos impares.
Ejemplo 2
El siguiente conjunto de datos está ordenado en forma decreciente, de mayor
a menor, y corresponde a un conjunto de valores pares, por lo tanto, la Med
será el promedio de los valores centrales.
En el gráfico de barras (que tiene un número par de columnas) los valores
centrales son 72 y 77.(EcuRed, s.f.)
2. Medidas de Forma
2.1.
Asimetría
Es una medida de forma de una distribución que permite identificar y describir
la manera como los datos tiende a reunirse de acuerdo con la frecuencia con
que se hallen dentro de la distribución. Permite identificar las características
de la distribución de datos sin necesidad de generar el gráfico.(Ibujes, 2011)
2.1.1. Tipos de Asimetría
a. Asimetría Negativa o a la Izquierda: Se da cuando en una distribución la
minoría de los datos está en la parte izquierda de la media. Este tipo de
distribución presenta un alargamiento o sesgo hacia la izquierda, es decir, la
distribución de los datos tiene a la izquierda una cola más larga que a la
derecha. También se dice que una distribución es simétrica a la izquierda o
tiene sesgo negativo cuando el valor de la media aritmética es menor que la
mediana y éste valor de la mediana a su vez es menor que la moda, en
símbolos
.(Ibujes, 2011)
Nota: Sesgo es el grado de asimetría de una distribución, es decir, cuánto se
aparta de la simetría
b. Simétrica: Se da cuando en una distribución se distribuyen aproximadamente
la misma cantidad de los datos a ambos lados de la media aritmética. No
tiene alargamiento o sesgo. Se representa por una curva normal en forma de
campana llamada campana de Gauss (matemático Alemán 1777-1855) o
también conocida como de Laplace (1749-1827). También se dice que una
distribución es simétrica cuando su media aritmética, su mediana y su moda
son iguales en símbolos
Md=Mo. (Ibujes, 2011)
c. Asimetría Positiva o a la Derecha:se da cuando en una distribución la minoría
de los datos está en la parte derecha de la media aritmética. Este tipo de
distribución presenta un alargamiento o sesgo hacia la derecha, es decir, la
distribución de los datos tiene a la derecha una cola más larga que a la
izquierda.(Ibujes, 2011)
También se dice que una distribución es simétrica a la derecha o tiene sesgo
positivo cuando el valor de la media aritmética es mayor que la mediana y
éste a valor de la mediana a su vez es mayor que la moda, en símbolos
.(Ibujes, 2011)
2.2.
Curtosis o Apuntamiento
La curtosis mide el grado de agudeza o achatamiento de una distribución con
relación a la distribución normal, es decir, mide cuán puntiaguda es una
distribución.(Ibujes, 2011)
2.2.1. Tipos de curtosis
La curtosis determina el grado de concentración que presentan los valores en la
región central de la distribución. Así puede ser:
a. Leptocúrtica.- Existe una gran concentración.
b. Mesocúrtica.- Existe una concentración normal.
c. Platicúrtica.- Existe una baja concentración.
(Ibujes, 2011)
3. Medidas de Dispersión
Las medidas de dispersión, también llamadas medidas de variabilidad, muestran la
variabilidad de una distribución, indicando por medio de un número, si las diferentes
puntuaciones de una variable están muy alejadas de la media. Cuanto mayor sea
ese valor, mayor será la variabilidad, cuanto menor sea, más homogénea será a la
media. Así se sabe si todos los casos son parecidos o varían mucho entre
ellos.(Wikipedia, 2014)
Para calcular la variabilidad que una distribución tiene respecto de su media, se
calcula la media de las desviaciones de las puntuaciones respecto a la media
aritmética. Pero la suma de las desviaciones es siempre cero, así que se adoptan
dos clases de estrategias para salvar este problema. Una es tomando las
desviaciones en valor absoluto (desviación media) y otra es tomando las
desviaciones al cuadrado (varianza).(Wikipedia, 2014)
3.1.
Rango estadístico
El rango o recorrido estadístico es la diferencia entre el valor máximo y el
valor mínimo en un grupo de números aleatorios. Se le suele simbolizar con
R.(Wikipedia, 2014)
Requisitos del rango

Ordenamos los números según su tamaño.

Restamos el valor mínimo del valor máximo
Ejemplo
Para la muestra (8, 7, 6, 9, 4, 5), el dato menor es 4 y el dato mayor es 9.
Sus valores se encuentran en un rango de:
(Wikipedia, 2014)
3.1.1. Medio rango o Rango medio
El medio rango o rango medio de un conjunto de valores numéricos es la
media del mayor y menor valor, o la tercera parte del camino entre el dato
de menor valor y el dato de mayor valor. En consecuencia, el medio rango
es:
Ejemplo
Para una muestra de valores (3, 3, 5, 6, 8), el dato de menor valor Min= 3 y
el dato de mayor valor Max= 8. El medio rango resolviéndolo mediante la
correspondiente fórmula sería:
Representación del medio rango:
(Wikipedia, 2014)
3.2.
Varianza
La varianza es una medida estadística que mide la dispersión de los valores
respecto a un valor central (media), es decir, es el cuadrado de las
desviaciones:
(Wikipedia, 2014)
Propiedades

La varianza es siempre positiva o 0:

Si a los datos de la distribución les sumamos una cantidad constante la
varianza no se modifica.
1

c
Si a los datos de la distribución los multiplicamos una constante, la varianza
queda multiplicada por el cuadrado de esa constante.
1.
Propiedad distributiva:
(Wikipedia, 2014)
cov
3.3.
Desviación típica
La varianza a veces no se interpreta claramente, ya que se mide en unidades
cuadráticas. Para evitar ese problema se define otra medida de dispersión,
que es la desviación típica, o desviación estándar, que se halla como la raíz
cuadrada positiva de la varianza. La desviación típica informa sobre la
dispersión de los datos respecto al valor de la media; cuanto mayor sea su
valor, más dispersos estarán los datos. Esta medida viene representada en
la mayoría de los casos por S, dado que es su inicial de su nominación en
inglés.(Wikipedia, 2014)
3.4.
Covarianza
La covarianza entre dos variables es un estadístico resumen indicador de si
las puntuaciones están relacionadas entre sí. La formulación clásica, se
simboliza por la letra griega sigma (σ) cuando ha sido calculada en la
población. Si se obtiene sobre una muestra, se designa por la letra "
".(Wikipedia, 2014)
La fórmula suele aparecer expresada como:
Este tipo de estadístico puede utilizarse para medir el grado de relación de
dos variables si ambas utilizan una escala de medida a nivel de
intervalo/razón (variables cuantitativas).
La expresión se resuelve promediando el producto de las puntuaciones
diferenciales por su tamaño muestral (n pares de puntuaciones, n-1 en su
forma insesgada).
Este estadístico, refleja la relación lineal que existe entre dos variables. El
resultado numérico fluctúa entre los rangos de +infinito a -infinito. Al no
tener unos límites establecidos no puede determinarse el grado de relación
lineal que existe entre las dos variables, solo es posible ver la tendencia.
3.5.
Coeficiente de Correlación de Pearson
El coeficiente de correlación de Pearson, r, permite saber si el ajuste de la
nube de puntos a la recta de regresión obtenida es satisfactorio. Se define
como el cociente entre la covarianza y el producto de las desviaciones
típicas (raíz cuadrada de las varianzas).
Teniendo en cuenta el valor de la covarianza y las varianzas, se puede
evaluar mediante cualquiera de las dos expresiones siguientes:
Ejemplo Para una muestra de valores (3, 3, 5, 6, 8), el dato de menor valor
Min= 3 y el dato de mayor valor Max= 8. El medio rango resolviéndolo
mediante la correspondiente fórmula sería:
(Wikipedia,
2014)
Propiedades

El coeficiente de correlación, r, presenta valores entre –1 y +1.

Cuando r es próximo a 0, no hay correlación lineal entre las variables. La
nube de puntos está muy dispersa o bien no forma una línea recta. No se
puede trazar una recta de regresión.

Cuando r es cercano a +1, hay una buena correlación positiva entre las
variables según un modelo lineal y la recta de regresión que se determine
tendrá pendiente positiva, será creciente.

Cuando r es cercano a -1, hay una buena correlación negativa entre las
variables según un modelo lineal y la recta de regresión que se determine
tendrá pendiente negativa: es decreciente. (Wikipedia, 2014)
CONCLUSIÓN:
Son métodos de enseñanza que permiten desarrollar actividades basadas en los
indicadores de logro, para orientar el aprendizaje de los estudiantes, lo cual debe ir
dentro del proceso de planificación.
La sub área de Estadística Descriptiva, es una de las sub áreas de las matemáticas
por lo tanto, es por naturaleza una multidisciplinaria.
Ésta, constituye una herramienta útil a lo largo de la vida y la historia de la
humanidad, puesto que a través de ella se puede llevar un registro de sucesos,
históricos, investigaciones de tipo científico, social, cultural, etc.
En el quinto grado, los estudiantes deben utilizar la estadística descriptiva con toda
propiedad para: recolectar y ordenar datos de fenómenos que ocurren en el entorno,
para luego, realizar representaciones gráficas, análisis de distribuciones, cálculo de
medidas de tendencia central y posición, análisis de dispersión, distribución normal,
sesgo y Curtosis; además, poder interpretar las causas y plantear probables
estrategias de solución a diversas situaciones problema.
BIBLIOGRAFÍA
Cajal, H. U. (s.f.). Salud Madrid. Recuperado el 29 de enero de 2015, de
http://www.hrc.es/bioest/Probabilidad_15.html
Cordova, R. (21 de abril de 2011). Probabilidad y Estadistica. Obtenido de
Blogger:
http://rosebelprobabilidadyestadistica.blogspot.com/2011/04/eventosdependientes-independientes-y.html
David M Levine, M. L. (29 de enero de 2015). Goggle Books. Obtenido de
https://books.google.com.gt/books?id=Aw2NKbDJoZoC&pg=PA127&lpg=P
A127&dq=probabilidad+conjunta+y+marginal&source=bl&ots=dWqaNhy9LI
&sig=yo9N9mKT0kInJv8uISO5am322vI&hl=es419&sa=X&ei=b_fKVPrALoSZgwSeloL4Ag&ved=0CFMQ6AEwCQ#v=onep
age&q=probabilidad%20conjunta%
Ditutor. (s.f.). Recuperado el 29 de enero de 2015, de
http://www.ditutor.com/probabilidad/espacio_muestral.html
EcuRed. (s.f.). Recuperado el 29 de Enero de 2015, de
http://www.ecured.cu/index.php/Medidas_de_Tendencia_Central
Herrera, R. (11 de abril de 2006). Monografias.com. Obtenido de Introducción a la
Teoría de Probabilidades: http://www.monografias.com/trabajos32/teoriaprobabilidades/teoria-probabilidades.shtml#eventdepen
Ibujes, M. O. (30 de junio de 2011). Monografías.com. Recuperado el 29 de enero
de 2015, de http://www.monografias.com/trabajos87/medidas-formaasimetria-curtosis/medidas-forma-asimetria-curtosis.shtml
Litherland, N. (s.f.). eHow en Español. Obtenido de
http://www.ehowenespanol.com/definicion-eventos-mutuamenteexcluyentes-sobre_138140/
Mendoza, H. B. (2002). Probabilidad y Estadistica. Universidad de Colombia.
Obtenido de http://www.virtual.unal.edu.co/cursos/ciencias/2001065/
Olguín, I. P. (18 de febrero de 2013). Blogger. Recuperado el 29 de enero de
2015, de Temas de Estadística: http://tsuestadistica.blogspot.com/2013/02/eventos-aleatorios-y-espaciomuestral.html
Suárez Ibujéz, M. O. (12 de octubre de 2011). Monografías.com. Obtenido de
Probabilidad Total y Teorema de Bayes:
http://www.monografias.com/trabajos89/probabilidad-total-y-teoremabayes/probabilidad-total-y-teorema-bayes.shtml
Wikipedia. (30 de diciembre de 2014). Recuperado el 29 de enero de 2015, de
http://es.wikipedia.org/wiki/Medidas_de_dispersi%C3%B3n
Wikipedia. (21 de enero de 2015). Obtenido de
http://es.wikipedia.org/wiki/Diagrama_de_%C3%A1rbol