Download ESTADISTICA DESCRIPTIVA FINANZAS 2015 postgrado
Document related concepts
Transcript
UNIVERSIDAD NACIONAL AUTONOMA DE NICARAGUA UNAN-MANAGUA DEPARTAMENTO DE CONTADURÍA PÚBLICA Y FINANZAS POSTGRADO EN ESTUDIOS AVANZADOS EN FINANZAS TEMA I ESTADISTICA DESCRIPTIVA Msc. Sergio Martínez Villarreyna Abril 2015 FACULTAD DE CIENCIAS ECONOMICAS UNAN-MANAGUA CONTENIDO PROGRAMATICO TEMA1: ESTADISTICA DESCRIPTIVA TEMA2: PROBABILIDADES TEMA3: DISTRIBUCIONES DICRETAS DE PROB TEMA4: DISTRIBUCION NORMAL TEMA5: MUESTREO Y ESTIMACION TEMA 6: PRUEBA DE HIPOTESIS TEMA7: REGRESION LINEAL Y CORRELACION ESTADISTICA DESCRIPTIVA 1.1 INTRODUCCION 1.2 DEFINICION DE ESTADISTICA 1.3 CONCEPTOS BASICOS 1.4 RECOPILACION DE DATOS 1.5 PRESENTACION DE DATOS TABLAS DE FRECUENCIAS GRAFICAS ESTADISTICAS 1.6 MEDIDAS DE TENDENCIA CENTRAL 1.7 MEDIDAS DE DISPERSION 1.8 FORMAS DE LAS DISTRIBUCIONES DE FRECUENCIAS FACULTAD DE CIENCIAS ECONOMICAS UNAN- MANAGUA - Recolección La Estadística Moderna abarca - Presentación -Caracterización Análisis de datos y proceso de toma de decisiones APLICACIONES DE LA ESTADÍSTICA Contabilidad Selección de muestras con propósitos de auditoria Contabilidad de costos. c Finanzas Administración Mercadeo Medidas Financieras Pronóstico de valores de las medidas financieras Características de Empleados. Calidad de productos fabricados o servicios procurados Proporción de clientes que prefieren un producto Estrategias de publicidad La estadística se clasifica en dos tipos: Estadística Descriptiva Conjunto de métodos para recolectar, organizar, presentar y caracterizar un conjunto de datos el fin de describir las características de ese conjunto de datos. Estadística Inferencial Conjunto de métodos utilizados para estimar una característica de un población ( o la toma de una decisión), basándose sólo en los resultados de la muestra. Población o Universo (N) Es una colección de todos los posibles individuos, objetos o medidas (elementos) bajo consideración. Muestra (n) Es una parte , porción o subconjunto de la población que se selecciona para su análisis. Parámetro Característica medible de toda una población. Se simbolizan con letras griegas. Estadística Característica medible de una sola muestra de la población. Se simbolizan con letras latinas VARIABLE Es una característica de la muestra o de la población que se analiza en un estudio estadístico. Una variable puede ser cualitativa o cuantitativa. VARIABLE CUALITATIVA: Es aquella que se puede expresar normalmente por medio de palabras y no por números, por ejemplo, el estado civil, la nacionalidad, el sexo, la profesión, la raza, el color de la piel, etc. VARIABLE CUANTITATIVA: Es aquella que se expresa numéricamente, por ejemplo, las exportaciones de café, el ingreso per-cápita, la cantidad recaudada por el estado en un año, etc. Las variables cuantitativas pueden ser discretas o contínuas. VARIABLE DISCRETA: Es aquella que solo puede tomar determinados valores por lo general, números enteros, Por ejemplo, el número de hijos de una familia, número de empleados de una empresa, número de vacas en una hacienda, número de carros fabricados, etc. VARIABLE CONTINUA: Es aquella que toma cualquier valor dentro de un intervalo dado. Por muy cerca que estén dos observaciones siempre es posible hacer otra medición que caiga dentro de esas dos. Los valores de una variable continua provienen de las mediciones. Son ejemplos de variables continuas la estatura de un individuo, el peso, el salario, etc. LOS DATOS: Son los resultados observados de las variables aleatorias. Los datos discretos son respuestas numéricas que surgen de un proceso de conteo. Los datos continuos son respuestas numéricas que surgen de un proceso de medición Recolección de Datos ¿Porqué necesitamos recolectar datos? Proporcionan la introducción imprescindible para un estudio de investigación Miden el desempeño en un servicio o proceso de producción. Ayudan en la formulación de cursos alternativos de acción en un proceso de toma de decisiones. Satisfacen nuestra curiosidad. Obtención de datos 1. 2. 3. 4. Utilización de fuentes de datos publicados (gobierno, industria o individuos). Diseño de un experimento (se ejerce un control estricto sobre el tratamiento dado a los participantes). Conducción de una encuesta (se formulan preguntas a las personas respecto a sus opiniones, actitudes, comportamientos y otras características). Realización de un estudio observacional (grupos de focos, dinámicas de grupos, tormentas de ideas, la técnica de Delphi, método del grupo nominal, etc). a) Escala Nominal. En este nivel de medición se establecen categorías distintivas que no implican un orden específico. Por ejemplo, si la unidad de análisis es un grupo de personas, para clasificarlas se puede establecer la categoría sexo con dos niveles, masculino (M) y femenino (F), los respondientes solo tienen que señalar su género, no se requiere de un orden real. b) Escala Ordinal. Se establecen categorías con dos o mas niveles que implican un orden inherente entre si. La escala de medición ordinal es cuantitativa porque permite ordenar a los eventos en función de la mayor o menor posesión de un atributo o característica. Por ejemplo, en las instituciones escolares de nivel básico suelen formar por estatura a los estudiantes, se desarrolla un orden cuantitativo pero no suministra medidas de los sujetos. c) Escala de Intervalo. La medición de intervalo posee las características de la medición nominal y ordinal. Establece la distancia entre una medida y otra. La escala de intervalo se aplica a variables continuas pero carece de un punto cero absoluto. El ejemplo mas representativo de este tipo de medición es un termómetro. d) Escala de Razón. Una escala de medición de razón incluye las características de los tres anteriores niveles de medición (nominal, ordinal e intervalo). Determina la distancia exacta entre los intervalos de una categoría. Adicionalmente tiene un punto cero absoluto, es decir, en el punto cero no existe la característica o atributo que se mide. Las variables de ingreso, edad, número de hijos, etc. son ejemplos de este tipo de escala. El nivel de medición de razón se aplica tanto a variables continuas como discretas. ORGANIZACIÓN Y PRESENTACION DE LOS DATOS DATOS AGRUPADOS EN CLASES Un intervalo de clase o simplemente clase se denota y define como: Li ---- Ls : Desde Li hasta Ls donde Li el límite inferior y Ls es el límite superior de la clase. Número de clases : “g “ El investigador lo determina, por lo general se forman de 5 a 15 intervalos de clases Rango : Rng = Dato Mayor – Dato menor o bien: Rng = XM - Xm Amplitud o tamaño de un intervalo de clase c = Rango/ g Se toma un valor mayor pero cercano a R/g Punto medio de un intervalo de clase o marca de clase j Mj= (Li + Ls)/2 j = 1, 2, ....., g Organización de los datos EJEMPLO Los siguientes datos corresponden a consumos mensuales registrados (en cienes de córdobas) en 30 familias de un barrio de Managua. Datos originales de los consumos mensuales 24 16 26 31 17 25 17 23 23 19 21 17 13 20 30 24 19 22 21 18 25 14 29 20 26 15 27 21 22 23 Fuente: Encuesta realizada por INEC Se pide: Organice los datos recopilados anteriormente en 5 clases: 1.- Ordenar los datos 13 14 15 16 20 20 21 21 24 24 25 25 17 17 21 22 26 26 17 18 22 23 27 29 19 19 23 23 30 31 2. Determinar el rango R = Xmayor – Xmenor = Dato mayor - Dato menor 3. Determinar N clases '' g '' y tamaño de clase ''c''. Si g es dado , c > = 3.6 tomaremos c = 4 R = 31 - 13 = 18 Escribir las clases. El límite inferior de la primera clase debe ser un número menor y cercano al dato menor. El límite superior de la última clase debe ser mayor o igual, pero cercano, al dato mayor. DISTRIBUCION DE FRECUENCIAS Agrupamiento de datos en clases que muestren el número de observaciones en cada categoría Pasos para construir una tabla distribuciones de frecuencias: • Determinar el número de intervalos de clases o simplemente clases: “g” • Ubicar cada observación en el intervalo de clase apropiado (marcas) • Contar el número de observaciones en cada clase ( fj ) Ejemplo de distribución de frec. Tabla de Distribución de frecuencias Consumos 12 --- 16 16 --- 20 20 --- 24 24 --- 28 28 --- 32 Núm. de fam 4 8 10 5 3 _______ 30 Datos agrupados en clases. Distribuciones de Frecuencias Para presentar datos agrupados en clases necesitaremos introducir los siguientes conceptos: fj : frecuencia ( absoluta ) de la clase j. Número de datos en la clase j faj : frecuencia acumulada hasta la clase j. Número de datos cuyos valores son inferiores o iguales al límite superior de la clase j . faj = f1 + f2 + … + fj j=1,2,…,g frj : frecuencia relativa de la clase j. Proporción de datos que corresponde a la clase j . j=1,2,…,g fraj : frecuencia relativa acumulada hasta la clase j. Proporción de datos cuyos valores son inferiores o iguales al límite superior de la clase j j=1,2,…,g Cuando los datos están agrupados en clases diremos que forman una distribución de frecuencias la cual, puede ser presentada por una tabla estadística o una gráfica estadística. Distribuciones de frecuencia Con los datos de la tabla del ejemplo obtenemos la siguiente tabla. TITULO : Distribuciones de frecuencias de los consumos mensuales de 30 familias . mj Niveles de Consumo j 12 --- 16 16 --- 20 20 --- 24 24 --- 28 28 --- 32 fj N fam 10 14 18 22 26 30 34 4 8 10 5 3 30 frj %. Fam 0.13 0.27 0.33 0.17 0.10 1.00 faj N fam hasta clase j 4 12 22 27 30 fraj %.fam hasta clase 0.13 0.40 0.73 0.90 1.00 Gráficas Estadísticas Histogramas Polígonos de frecuencias Polígono de frecuencia acumulada (ojiva) Polígono de frecuencia acumulada porcentual (ojiva porcentual) Histograma F12 J 10 10 8 8 No. DE FAMILIAS 6 5 4 4 3 2 0 12 16 20 24 28 32 X CONSUMOS MENSUALES (CIENES DE CÓRDOBAS) Polígono de frecuencias f No. DE FAMILIAS 12 10 8 6 4 2 0 10 14 18 22 26 30 34 X CONSUMOS MENSUALES (CIENES DE CÓRDOBAS) Ojiva fa No. DE FAMILIAS 35 30 25 20 15 10 5 0 12 16 20 24 28 32 X CONSUMOS MENSUALES (CIENES DE CÓRDOBAS) Otros tipos de gráficos Producto Costa Rica El Salvador Guatemala Honduras Nicaragua Frijol (lb) 0.53 0.46 0.5 0.36 0.42 Pollo(lb) 0.94 0.97 1.06 0.63 0.78 Leche(lt) 0.51 0.91 0.76 0.52 0.53 Frijol (lb) Pollo(lb) Leche(lt) Precios promedio a nivel C.A. 1.2 1 0.8 0.6 0.4 0.2 0 Costa Rica El Salvador Guatemala Honduras Nicaragua Actividad Econòmica Monto en millones de dòlares Porcentaje Angulo de cada sector Agricultura Industria construcciòn Total 49 340.4 88.8 478.2 10.20% 71.20% 18.60% 100% 37 256 67 360 Monto en millones de córdobas construcciòn 19% Industria 71% Agricultura 10% Gráficos de líneas Años 1991 1992 1993 Salarios 400 500 600 1 994 700 1995 1996 1997 1998 1999 2000 800 1000 1050 850 900 950 BRECHA ENTRE CANASTA BASICA Y SALARIO Costo / Salario 1800 1700 1600 1500 1400 1300 1200 1100 1000 900 800 700 600 500 400 300 1991 1992 1993 1994 1995 1996 1997 Años Costo Salario 1998 1999 2000 DESCRIPCION DE LOS DATOS MEDIDAS DE TENDENCIA CENTRAL MEDIDAS DE TENDENCIA CENTRAL Contenido: 1 Cálculo e interpretación de medidas de Tendencia Central: -La media aritmética, la Mediana y la Moda. (Con datos no agrupados, ejemplos en SPSS) 2 Cálculo e interpretación de medidas de Tendencia Central: -La media aritmética, la Mediana y la Moda. (Con datos agrupados) Cálculo de medidas de tendencia central con DATOS NO AGRUPADOS: Ejemplo 2: Los siguientes datos representan los minutos durante los cuales una persona debió esperar el autobús hacia su trabajo en 15 días laborales: 10, 1, 13, 9, 5, 9, 2, 10, 3, 8, 6, 17, 2, 10 y 15. Determine: La media La mediana La Moda Media Aritmética Las principales medidas de posición central son las siguientes: 1.- Media: es el valor medio ponderado de la serie de datos. Se pueden calcular diversos tipos de media, siendo las más utilizadas: a) Media aritmética: Se calcula sumando todos los valores individuales y se divide por el total de datos de la muestra: Fórmula para datos no agrupados: Mediana 2.- Mediana: Es el valor de la serie de datos que se sitúa justamente en el centro de la muestra (un 50% de valores son inferiores y otro 50% son superiores). No presentan el problema de estar influido por los valores extremos, pero en cambio no utiliza en su cálculo toda la información de la serie de datos (no pondera cada valor por el número de veces que se ha repetido). Para encontrar la mediana ordenamos los datos 1 2 122 32 35 566 88 99 991010 101513 10 10 10 13 17 15 17 El valor central corresponde a la mediana, en este ejemplo la Me = 9 min Moda 3.- Moda: Es el valor que más se repite en la muestra. Para encontrar la moda ordenamos los datos 1 2 2 3 5 6 8 9 9 10 10 10 13 15 17 1 2 2 3 5 6 8 9 9 10 10 10 13 15 17 El valor que más se repite es la Moda, en este ejemplo la Mo = 10 min Media: Datos agrupados en una muestra Donde: X: Es la media aritmética n x M i 1 n j fj fj: Frecuencia absoluta Mj: Marcas de clase Σ: (Sumatoria) n: tamaño de la muestra Mediana: Datos agrupados en una muestra Donde: Me: Es la mediana Me = L i + n/2 - fa --------------- fi C Li: Límite real inferior de la clase mediana fa: Frecuencia acumulada antes de la clase mediana fi: Frecuencia absoluta de la clase mediana n: Tamaño de la muestra c: Amplitud de la clase mediana Moda: Datos agrupados Donde: Mo = Li + Δ1 ------------ c Δ1 + Δ2 Mo: Es la moda Li: Límite real inferior de la clase modal Δ1: Diferencia entre la frecuencia modal y la pre-modal Δ2: Diferencia entre la frecuencia modal y la post-modal c: Amplitud de la clase modal RELACION EMPIRICA MEDIDAS DE POSICION NO CENTRAL Percentiles Los percentiles son los 99 valores que dividen la serie de datos en 100 partes iguales. Los percentiles dan los valores correspondientes al 1%, al 2%... y al 99% de los datos. P50 coincide con la mediana. Cálculo de los percentiles En primer lugar buscamos la clase donde se encuentra, en la tabla de las frecuencias acumuladas. La fórmula para calcular es: nr /100 - fa Pr = Li + ( --------------- ) c fj r = 1, 2, 3, 4, …99 MEDIDAS DE VARIABILIDAD (DISPERSIÓN) SIMPLES Y AGRUPADAS 5.1Cálculo e interpretación de medidas de variabilidad Absoluta: -El Rango, La Desviación Media, La Varianza, la Desviación Estándar. 5.2 Medidas de variabilidad relativa: -El Coeficiente de Variación y El Coeficiente de Asimetría, (Con datos no agrupados y agrupados, ejemplos en SPSS) Varianza: Fórmula para datos no agrupados en una muestra. Donde: S2 : La varianza muestral Xi: Las observaciones individuales : La media aritmética muestral n: Tamaño de la muestra Desviación estándar: Fórmula para datos no agrupados. Donde: S : La desviación estándar muestral Xi: Las observaciones individuales : La media aritmética muestral n: Tamaño de la muestra Varianza: Fórmula para datos agrupados en una muestra. Donde: S2 : La varianza muestral Xi: Las observaciones individuales : La media aritmética muestral n: Tamaño de la muestra fi: Frecuencia absoluta Desviación estándar: Fórmula para datos agrupados. Donde: S : La desviación estándar muestral Coeficiente de variación: Fórmula para datos agrupados y no agrupados en una muestra. Donde: s CV (100%) x CV : Coeficiente de variación muestral. : La media aritmética muestral s: Desviación estándar de la muestra Coeficiente de variación: Fórmula para datos agrupados y no agrupados en una muestra. Donde: CV µ (100%) CV : Coeficiente de variación poblacional. µ: La media aritmética poblacional : Desviación estándar de la poblacional.