Download ESTADISTICA DESCRIPTIVA FINANZAS 2015 postgrado

Document related concepts

Medidas de tendencia central wikipedia , lookup

Parámetro estadístico wikipedia , lookup

Mediana (estadística) wikipedia , lookup

Distribución de frecuencias wikipedia , lookup

Desviación típica wikipedia , lookup

Transcript
UNIVERSIDAD NACIONAL AUTONOMA DE NICARAGUA
UNAN-MANAGUA
DEPARTAMENTO DE CONTADURÍA PÚBLICA Y FINANZAS
POSTGRADO EN ESTUDIOS AVANZADOS EN FINANZAS
TEMA I
ESTADISTICA DESCRIPTIVA
Msc. Sergio Martínez Villarreyna
Abril 2015
FACULTAD DE CIENCIAS ECONOMICAS
UNAN-MANAGUA
CONTENIDO PROGRAMATICO
 TEMA1: ESTADISTICA DESCRIPTIVA
 TEMA2: PROBABILIDADES
 TEMA3: DISTRIBUCIONES DICRETAS DE PROB
 TEMA4: DISTRIBUCION NORMAL
 TEMA5: MUESTREO Y ESTIMACION
 TEMA 6: PRUEBA DE HIPOTESIS
 TEMA7: REGRESION LINEAL Y CORRELACION
ESTADISTICA DESCRIPTIVA
1.1 INTRODUCCION
1.2 DEFINICION DE ESTADISTICA
1.3 CONCEPTOS BASICOS
1.4 RECOPILACION DE DATOS
1.5 PRESENTACION DE DATOS
TABLAS DE FRECUENCIAS
GRAFICAS ESTADISTICAS
1.6 MEDIDAS DE TENDENCIA CENTRAL
1.7 MEDIDAS DE DISPERSION
1.8 FORMAS DE LAS DISTRIBUCIONES DE
FRECUENCIAS
FACULTAD DE CIENCIAS ECONOMICAS
UNAN- MANAGUA
- Recolección
La Estadística Moderna
abarca
- Presentación
-Caracterización
Análisis de datos y
proceso de toma de
decisiones
APLICACIONES DE LA ESTADÍSTICA
Contabilidad
Selección de muestras con propósitos de auditoria
Contabilidad de costos.
c
Finanzas
Administración
Mercadeo
Medidas Financieras
Pronóstico de valores de las medidas financieras
Características de Empleados.
Calidad de productos fabricados o servicios
procurados
Proporción de clientes que prefieren un producto
Estrategias de publicidad
La estadística se clasifica en dos tipos:
Estadística Descriptiva
Conjunto de métodos
para recolectar,
organizar, presentar
y caracterizar un
conjunto de datos el
fin de describir las
características de
ese conjunto de
datos.
Estadística Inferencial
Conjunto de métodos
utilizados para
estimar una
característica de un
población ( o la toma
de una decisión),
basándose sólo en
los resultados de la
muestra.

Población o Universo (N)
Es una colección de todos los posibles individuos, objetos o
medidas (elementos) bajo consideración.

Muestra (n)
Es una parte , porción o subconjunto de la población que se
selecciona para su análisis.

Parámetro
Característica medible de toda una población.
Se simbolizan con letras griegas.

Estadística
Característica medible de una sola muestra de la población.
Se simbolizan con letras latinas
VARIABLE
Es una característica de la muestra o de la población que se
analiza en un estudio estadístico.
Una variable puede ser cualitativa o cuantitativa.
VARIABLE CUALITATIVA:
Es aquella que se puede expresar normalmente por medio de
palabras y no por números, por ejemplo, el estado civil, la
nacionalidad, el sexo, la profesión, la raza, el color de la piel,
etc.
VARIABLE CUANTITATIVA:
Es aquella que se expresa numéricamente, por ejemplo,
las
exportaciones de café, el ingreso per-cápita, la cantidad recaudada por el
estado en un año, etc.
Las variables cuantitativas pueden ser discretas o contínuas.
VARIABLE DISCRETA:
Es aquella que solo puede tomar determinados valores por lo general,
números enteros,
Por ejemplo, el número de hijos de una familia, número de empleados de
una empresa, número de vacas en una hacienda, número de carros
fabricados, etc.
VARIABLE CONTINUA: Es aquella que toma cualquier valor dentro
de un intervalo dado. Por muy cerca que estén dos observaciones siempre es
posible hacer otra medición que caiga dentro de esas dos. Los valores de una
variable continua provienen de las mediciones.
Son ejemplos de variables continuas la estatura de un individuo, el peso, el
salario, etc.
LOS DATOS: Son los resultados observados de las variables aleatorias. Los
datos discretos son respuestas numéricas que surgen de un proceso de conteo.
Los datos continuos son respuestas numéricas que surgen de un proceso de
medición
Recolección de Datos
¿Porqué necesitamos recolectar
datos?
 Proporcionan la introducción imprescindible para un
estudio de investigación
 Miden el desempeño en un servicio o proceso de
producción.
 Ayudan en la formulación de cursos alternativos de
acción en un proceso de toma de decisiones.
 Satisfacen nuestra curiosidad.
Obtención de datos
1.
2.
3.
4.
Utilización de fuentes de datos publicados (gobierno,
industria o individuos).
Diseño de un experimento (se ejerce un control
estricto sobre el tratamiento dado a los
participantes).
Conducción de una encuesta (se formulan preguntas
a las personas respecto a sus opiniones, actitudes,
comportamientos y otras características).
Realización de un estudio observacional (grupos de
focos, dinámicas de grupos, tormentas de ideas, la
técnica de Delphi, método del grupo nominal, etc).
a) Escala Nominal.
En este nivel de medición se establecen categorías distintivas que no
implican un orden específico. Por ejemplo, si la unidad de análisis es
un grupo de personas, para clasificarlas se puede establecer la
categoría sexo con dos niveles, masculino (M) y femenino (F), los
respondientes solo tienen que señalar su género, no se requiere de un
orden real.
b) Escala Ordinal.
Se establecen categorías con dos o mas niveles que implican un orden
inherente entre si. La escala de medición ordinal es cuantitativa
porque permite ordenar a los eventos en función de la mayor o menor
posesión de un atributo o característica. Por ejemplo, en las
instituciones escolares de nivel básico suelen formar por estatura a
los estudiantes, se desarrolla un orden cuantitativo pero no
suministra medidas de los sujetos.
c) Escala de Intervalo.
La medición de intervalo posee las características de la medición
nominal y ordinal. Establece la distancia entre una medida y otra. La
escala de intervalo se aplica a variables continuas pero carece de un
punto cero absoluto. El ejemplo mas representativo de este tipo de
medición es un termómetro.
d) Escala de Razón.
Una escala de medición de razón incluye las características de los tres
anteriores niveles de medición (nominal, ordinal e intervalo).
Determina la distancia exacta entre los intervalos de una categoría.
Adicionalmente tiene un punto cero absoluto, es decir, en el punto cero
no existe la característica o atributo que se mide. Las variables de
ingreso, edad, número de hijos, etc. son ejemplos de este tipo de escala.
El nivel de medición de razón se aplica tanto a variables continuas
como discretas.
ORGANIZACIÓN Y
PRESENTACION DE LOS
DATOS
DATOS AGRUPADOS EN CLASES
Un intervalo de clase o simplemente clase se denota y define como:

Li ---- Ls : Desde Li hasta Ls
donde Li el límite inferior y Ls es el límite superior de la clase.
Número de clases : “g “ El investigador lo determina, por lo general se
forman de 5 a 15 intervalos de clases
Rango : Rng = Dato Mayor – Dato menor o bien: Rng = XM - Xm
Amplitud o tamaño de un intervalo de clase
 c = Rango/ g
Se toma un valor mayor pero cercano a R/g
Punto medio de un intervalo de clase o marca de clase j
 Mj= (Li + Ls)/2
j = 1, 2, ....., g
Organización de los datos
EJEMPLO
Los siguientes datos corresponden a consumos mensuales registrados (en cienes de córdobas) en
30 familias de un barrio de Managua.
Datos originales de los consumos mensuales
24 16 26 31 17 25 17 23 23 19
21 17 13 20 30 24 19 22 21 18
25 14 29 20 26 15 27 21 22 23
Fuente: Encuesta realizada por INEC
Se pide: Organice los datos recopilados anteriormente en 5 clases:
1.- Ordenar los datos
13
14 15 16
20 20 21 21
24 24 25 25
17 17
21 22
26 26
17 18
22 23
27 29
19 19
23 23
30 31
2.
Determinar el rango
R = Xmayor – Xmenor = Dato mayor - Dato menor
3.
Determinar N clases '' g '' y tamaño de clase ''c''.
Si g es dado ,
c > = 3.6 tomaremos c = 4
R = 31 - 13 = 18
Escribir las clases.
El límite inferior de la primera clase debe ser un número menor y cercano al dato menor.
El límite superior de la última clase debe ser mayor o igual, pero cercano, al dato mayor.
DISTRIBUCION DE FRECUENCIAS
Agrupamiento de datos en clases que
muestren el número de observaciones en
cada categoría
Pasos para construir una tabla distribuciones de
frecuencias:
• Determinar el número de intervalos de clases o
simplemente clases: “g”
• Ubicar cada observación en el intervalo de clase
apropiado (marcas)
• Contar el número de observaciones en cada clase ( fj )
Ejemplo de distribución de frec.
Tabla de Distribución de frecuencias
Consumos
12 --- 16
16 --- 20
20 --- 24
24 --- 28
28 --- 32
Núm. de fam
4
8
10
5
3
_______
30
Datos agrupados en clases.
Distribuciones de Frecuencias
Para presentar datos agrupados en clases necesitaremos introducir los siguientes
conceptos:
fj : frecuencia ( absoluta ) de la clase j. Número de datos en la clase j
faj : frecuencia acumulada hasta la clase j. Número de datos cuyos valores son
inferiores o iguales al límite superior de la clase j .
faj = f1 + f2 + … + fj
j=1,2,…,g
frj : frecuencia relativa de la clase j.
Proporción de datos que corresponde a la
clase j .
j=1,2,…,g
fraj : frecuencia relativa acumulada hasta la clase j. Proporción de datos cuyos
valores son inferiores o iguales al límite superior de la clase j
j=1,2,…,g
Cuando los datos están agrupados en clases diremos que forman una
distribución de frecuencias la cual, puede ser presentada por una tabla
estadística o una gráfica estadística.
Distribuciones de frecuencia
Con los datos de la tabla del ejemplo obtenemos la siguiente tabla.
TITULO : Distribuciones de frecuencias de los consumos mensuales
de 30 familias .
mj
Niveles de
Consumo
j
12 --- 16
16 --- 20
20 --- 24
24 --- 28
28 --- 32
fj
N fam
10
14
18
22
26
30
34
4
8
10
5
3
30
frj
%. Fam
0.13
0.27
0.33
0.17
0.10
1.00
faj
N fam
hasta clase j
4
12
22
27
30
fraj
%.fam
hasta clase
0.13
0.40
0.73
0.90
1.00
Gráficas Estadísticas
 Histogramas
 Polígonos de frecuencias
 Polígono de frecuencia acumulada (ojiva)
 Polígono de frecuencia acumulada porcentual (ojiva
porcentual)
Histograma
F12
J
10
10
8
8
No.
DE
FAMILIAS
6
5
4
4
3
2
0
12
16
20
24
28
32
X
CONSUMOS MENSUALES (CIENES DE CÓRDOBAS)
Polígono de frecuencias
f
No.
DE
FAMILIAS
12
10
8
6
4
2
0
10
14
18
22
26
30
34
X
CONSUMOS MENSUALES (CIENES DE CÓRDOBAS)
Ojiva
fa
No.
DE
FAMILIAS
35
30
25
20
15
10
5
0
12
16
20
24
28
32
X
CONSUMOS MENSUALES (CIENES DE CÓRDOBAS)
Otros tipos de gráficos
Producto
Costa Rica
El Salvador
Guatemala
Honduras
Nicaragua
Frijol (lb)
0.53
0.46
0.5
0.36
0.42
Pollo(lb)
0.94
0.97
1.06
0.63
0.78
Leche(lt)
0.51
0.91
0.76
0.52
0.53
Frijol (lb)
Pollo(lb)
Leche(lt)
Precios promedio a nivel C.A.
1.2
1
0.8
0.6
0.4
0.2
0
Costa Rica
El Salvador
Guatemala
Honduras
Nicaragua
Actividad Econòmica
Monto en millones de dòlares
Porcentaje
Angulo de cada sector
Agricultura
Industria
construcciòn
Total
49
340.4
88.8
478.2
10.20%
71.20%
18.60%
100%
37
256
67
360
Monto en millones de córdobas
construcciòn
19%
Industria
71%
Agricultura
10%
Gráficos de líneas
Años
1991 1992 1993
Salarios
400
500
600
1 994
700
1995 1996 1997 1998
1999 2000
800
1000 1050
850
900
950
BRECHA ENTRE CANASTA BASICA Y SALARIO
Costo / Salario
1800
1700
1600
1500
1400
1300
1200
1100
1000
900
800
700
600
500
400
300
1991
1992
1993
1994
1995
1996
1997
Años
Costo
Salario
1998
1999
2000
DESCRIPCION DE LOS DATOS
MEDIDAS DE TENDENCIA CENTRAL
MEDIDAS DE TENDENCIA
CENTRAL
Contenido:
1 Cálculo e interpretación de medidas de Tendencia Central:
-La media aritmética, la Mediana y la Moda.
(Con datos no agrupados, ejemplos en SPSS)
2 Cálculo e interpretación de medidas de Tendencia Central:
-La media aritmética, la Mediana y la Moda.
(Con datos agrupados)
Cálculo de medidas de tendencia central con
DATOS NO AGRUPADOS:
Ejemplo 2: Los siguientes datos representan
los minutos durante los cuales una persona
debió esperar el autobús hacia su trabajo en
15 días laborales:
10, 1, 13, 9, 5, 9, 2, 10, 3, 8, 6, 17, 2, 10 y 15.
Determine:
La
media
La mediana
La Moda
Media Aritmética
Las principales medidas de posición central son las siguientes:
1.- Media: es el valor medio ponderado de la serie de datos.
Se pueden calcular diversos tipos de media, siendo las más
utilizadas:
a) Media aritmética: Se calcula sumando todos los valores
individuales y se divide por el total de datos de la muestra:
Fórmula para datos
no agrupados:
Mediana
2.- Mediana: Es el valor de la serie de datos que se sitúa justamente en el
centro de la muestra (un 50% de valores son inferiores y otro 50% son
superiores).
No presentan el problema de estar influido por los valores extremos, pero
en cambio no utiliza en su cálculo toda la información de la serie de datos
(no pondera cada valor por el número de veces que se ha repetido).
Para encontrar la mediana ordenamos los datos
1 2 122 32 35 566 88 99 991010
101513
10 10
10 13
17 15 17
El valor central corresponde a la mediana,
en este ejemplo la Me = 9 min
Moda
3.- Moda: Es el valor que más se repite en la muestra.
Para encontrar la moda ordenamos los datos
1 2 2 3 5 6 8 9 9 10 10 10 13 15 17
1 2 2 3 5 6 8 9 9 10 10 10 13 15 17
El valor que más se repite es la Moda, en
este ejemplo la Mo = 10 min
Media: Datos agrupados
en una muestra
Donde:
X: Es la media aritmética
n
x 
M
i 1
n
j
fj
fj: Frecuencia absoluta
Mj: Marcas de clase
Σ: (Sumatoria)
n: tamaño de la muestra
Mediana: Datos agrupados
en una muestra
Donde:
Me: Es la mediana
Me = L i +
n/2 - fa
---------------
fi
C
Li: Límite real inferior de la clase
mediana
fa: Frecuencia acumulada antes de
la clase mediana
fi: Frecuencia absoluta de la clase
mediana
n: Tamaño de la muestra
c: Amplitud de la clase mediana
Moda: Datos agrupados
Donde:
Mo = Li +
Δ1
------------ c
Δ1 + Δ2
Mo: Es la moda
Li: Límite real inferior de la clase modal
Δ1: Diferencia entre la frecuencia
modal y la pre-modal
Δ2: Diferencia entre la frecuencia
modal y la post-modal
c: Amplitud de la clase modal
RELACION EMPIRICA
MEDIDAS DE POSICION NO CENTRAL
Percentiles
Los percentiles son los 99 valores que dividen la serie de datos en 100 partes iguales.
Los percentiles dan los valores correspondientes al 1%, al 2%... y al 99% de los datos.
P50 coincide con la mediana.
Cálculo de los percentiles
En primer lugar buscamos la clase donde se encuentra, en la tabla de las frecuencias acumuladas.
La fórmula para calcular es:
nr /100 - fa
Pr = Li + ( --------------- ) c
fj
r = 1, 2, 3, 4, …99
MEDIDAS DE VARIABILIDAD
(DISPERSIÓN)
SIMPLES Y AGRUPADAS
5.1Cálculo e interpretación de medidas de
variabilidad Absoluta:
-El Rango, La Desviación Media, La Varianza, la Desviación
Estándar.
5.2 Medidas de variabilidad relativa:
-El Coeficiente de Variación y El Coeficiente de
Asimetría,
(Con datos no agrupados y agrupados, ejemplos en SPSS)
Varianza: Fórmula para datos no agrupados en una muestra.
Donde:
S2 : La varianza muestral
Xi: Las observaciones
individuales
: La media aritmética muestral
n: Tamaño de la muestra
Desviación estándar: Fórmula para datos no agrupados.
Donde:
S : La desviación estándar
muestral
Xi: Las observaciones
individuales
: La media aritmética muestral
n: Tamaño de la muestra
Varianza: Fórmula para datos agrupados
en una muestra.
Donde:
S2 : La varianza muestral
Xi: Las observaciones
individuales
: La media aritmética
muestral
n: Tamaño de la muestra
fi: Frecuencia absoluta
Desviación estándar: Fórmula para datos agrupados.
Donde:
S : La desviación estándar
muestral
Coeficiente de variación: Fórmula para datos agrupados y no
agrupados en una muestra.
Donde:
s
CV  (100%)
x
CV : Coeficiente de variación
muestral.
: La media aritmética
muestral
s: Desviación estándar de la
muestra
Coeficiente de variación: Fórmula para datos agrupados y no
agrupados en una muestra.
Donde:
CV 

µ
(100%)
CV : Coeficiente de variación
poblacional.
µ: La media aritmética
poblacional
 : Desviación estándar de la
poblacional.