Download Estadística_2

Document related concepts

Correlación wikipedia , lookup

Parámetro estadístico wikipedia , lookup

Propagación de errores wikipedia , lookup

Medidas de dispersión wikipedia , lookup

Curtosis wikipedia , lookup

Transcript
COMPORTAMIENTO DE LAS DISTRIBUCIONES DE
FRECUENCIA:
Preparadas las TABLAS DE FRECUENCIA de los valores
de una variable resulta interesante describir su comportamiento.
Hacia dónde tienden los datos?
Se agrupan en torno a un valor? o, se dispersan?
Su distribución se “parece” a alguna distribución teórica?
En esta sección trataremos los principales indicadores que
nos permiten describir una distribución.
1
ESTADIGRAFOS O PARAMETROS:
MEDIDAS DE CENTRALIZACION:
• LA MEDIA
• LA MODA
• LA MEDIANA
MEDIDAS DE DISPERSION:
• LA VARIANZA
• LA DESVIACION ESTANDAR
• EL SESGO
• LA CURTOSIS.
Estadígrafos si aplican sobre una muestra,
parámetros si aplican sobre una población.
2
MEDIANA:
Si tenemos n valores habiendo sido ordenados de
forma creciente se define la mediana como el valor que
deja a cada lado (por encima y por debajo) la mitad de
los valores de la muestra.
Matemáticamente toma por valor:
Si n es impar
Si n es par
3
ESPERANZA MATEMATICA:

También llamada: VALOR ESPERADO, ESPERANZA,
MEDIA ARITMETICA o MEDIA, se define como:
E ( x )  x1 P( x1 ) ... xn P( xn )
n
E ( x )   x j P( x j )  
j 1
La MEDIA da un valor típico o promedio de los
valores de la variable y por eso se llama
MEDIDA DE CENTRALIZACION.
4
LA VARIANZA:

2
La varianza es un número no negativo que mide la
VARIACION de los valores de la variable en torno a su
MEDIA.
Var ( X )  E[( X   ) ]  
2
2
Si los valores tienden a concentrarse CERCA
DE LA MEDIA , entonces la VARIANZA ES
PEQUEÑA, pero si los valores se distribuyen
LEJOS DE LA MEDIA, entonces la VARIANZA
GRANDE
5
LA DESVIACION ESTANDAR:

Corresponde a la raíz cuadrada de la VARIANZA.
  Var ( X )  E[( X   ) ]
2
La VARIANZA y la DESVIACION ESTANDAR tienen las
mismas unidades y por esta razón con frecuencia se
prefiere a la DESVIACION ESTANDAR que a la
VARIANZA para medir las dispersiones.
6
COEFICIENTE DE VARIACION:
CV
Para casos en los cuales se necesita comparar valores
en tamaño, muy diferentes, resulta útil establecer una
relación entre la desviación estándar y la media, conocida
como el coeficiente de variación:

CV 

El CV es una unidad de medida de la
dispersión relativa de los valores
7
COEFICIENTE DE SESGO o
de ASIMETRIA DE FISHER
1
( xi   ) 3

g1  n
3
1
( xi   ) 2

n
O sesgo, mide la asimetría de la distribución de
frecuencia con respecto a su MEDIA.
Si la “cola” mas larga se extiende a la derecha
se dice que la distribución esta sesgada a la
derecha, pero si se extiende a la izquierda se
dice que el sesgo es a la izquierda.
8
COEFICIENTE DE SESGO:
La asimetría positiva indica una distribución unilateral que
se extiende hacia valores más positivos. La asimetría
negativa indica una distribución unilateral que se extiende
hacia valores más negativos.
Sesgada a la derecha
Sesgo > 0
Sesgada a la Izquierda
Sesgo < 0
9
COEFICIENTE DE CURTOSIS o APUNTAMIENTO.
1
4
( xi   )

n
g2 
3
4

La CURTOSIS mide la CONCENTRACIÓN de
la distribución de frecuencia en torno a su
MEDIA.
Si la “campana” es puntuda se dice que hay
una alta concentración, (más apuntada que la
normal), pero si la campana es plana (menos
apuntada que la normal) se dice que hay una
baja concentración.
10
La CURTOSIS positiva indica una distribución MAS
puntuda que la distribución NORMAL. La CURTOSIS
negativa indica una distribución MENOS puntuda que
la NORMAL.
Puntuda
Curtosis > 0
Puntuda
Curtosis < 0
11
COMPORTAMIENTO DE LAS DISTRIBUCIONES
TALLER: Considere los valores de 87 facturas,
los cuales se asumen equiprobables.
Utilice la hoja estadística_3 del archivo
talleres_practica_1.xls
Calcule e interprete los parámetros
estadísticos indicados.
12
COMPORTAMIENTO DE LAS DISTRIBUCIONES
TALLER: Considere una inversión de $100 hoy
y de la cual se estiman los siguientes posibles
valores futuros a un año con la probabilidad
asociada, como se muestra a continuación:
Cuál es el valor futuro más probable?,
con qué desviación estándar (riesgo)?
13
COMPORTAMIENTO DE LAS DISTRIBUCIONES
TALLER: Durante los pasados 7 años, las
rentabilidades de un portafolio corporativo
fueron las siguientes:
Calcule la rentabilidad promedio del portafolio corporativo
durante este periodo.
Calcule la varianza y la desviación estándar de las
rentabilidades del portafolio corporativo durante este periodo.
14
COMPORTAMIENTO DE LAS DISTRIBUCIONES
Considere el siguiente flujo de caja, en el cual
las variables X et Y son variables aleatorias con la
distribución de probabilidad mostrada.
TALLER:
Cuál es el flujo de caja esperado con qué
desviación (riesgo)?
Interprete la desviación sobre cada flujo.
Usando una TIO del 40%, cuál es el valor
presente neto esperado del flujo de caja
dado?
Como el valor esperado de cada flujo tiene una
VARIANZA (asociada a su periodo), cuál es
le valor presente de dichanvarianza?2
Utilice:
t
2
VP( )  

2t
(
1

i
)
t 0
15
COMPORTAMIENTO DE LAS DISTRIBUCIONES
Suponga el siguiente proyecto en el cual los
flujos X et Y son variables aleatorias, con distribución:
TALLER:
Cuál es el valor esperado del Valor
presente del proyecto y su
desviación estándar si la tasa de
oportunidad se supone constante e
igual al 38%?
n
Utilice:
VP( 2 )  
t2
2t
(
1

i
)
t 0
16
COMPORTAMIENTO DE LAS DISTRIBUCIONES
En el estudio de un proyecto que requiere una
inversión de $100.000, se ha estimado la siguiente
distribución de probabilidad de los flujos de caja:
TALLER:
Cuál es el valor esperado del valor presente neto del
proyecto, cuál es el valor esperado de su riesgo
(varianza)? (Considere TIO del 25%)
17
COVARIANZA
S ( x, y )
En el estudio conjunto de dos variables, lo que interesa
principalmente es saber si existe algún tipo de relación
entre ellas.
Esto se ve gráficamente con el diagrama de dispersión.
18
COVARIANZA
S ( x, y )
La covarianza S(X,Y) de dos variables aleatorias X e Y
se define como:
n
S ( x, y )   Pi *[ x   ( x)] *[ y   ( y )]
i 1
Si Sxy > 0 hay dependencia directa (positiva), es decir, a
grandes valores de x corresponden grandes valores de y.
Si Sxy = 0 las variables están no correlacionadas, es decir
no hay relación lineal.
Si Sxy < 0 hay dependencia inversa o negativa, es decir, a
grandes valores de x corresponden pequeños valores de y.
19
COEFICIENTE DE CORRELACIÓN LINEAL
 ( x, y )
El coeficiente de correlación lineal mide el grado de
intensidad de la relación entre las dos variables. Este
coeficiente se aplica cuando la relación que puede
existir entre las variables es lineal (es decir, si
representáramos en un gráfico los pares de valores de
las dos variables la nube de puntos se aproximaría a
una recta).
20
COEFICIENTE DE CORRELACIÓN LINEAL
 ( x, y )
No obstante, puede que exista una relación que no
sea lineal, sino exponencial, parabólica, etc. En
estos casos, el coeficiente de correlación lineal
mediría mal la intensidad de la relación las
variables, por lo que convendría utilizar otro tipo de
coeficiente más apropiado.
21
COEFICIENTE DE CORRELACIÓN LINEAL
 ( x, y )
El coeficiente de Correlación  (X,Y) de dos variables
aleatorias X e Y se define como:
S ( x, y )
 ( x, y ) 
 ( x) *  ( y )
Con:
 1   ( x, y )  1
22
COEFICIENTE DE CORRELACIÓN LINEAL

 ( x, y )
Si
> 0, la correlación lineal es positiva (si sube el valor de una
variable sube el de la otra). La correlación es tanto más fuerte
cuanto más se aproxime a 1.
Por ejemplo: altura y peso: los alumnos más altos suelen
pesar más.

Si
< 0, la correlación lineal es negativa (si sube el valor de
una variable disminuye el de la otra). La correlación negativa es
tanto más fuerte cuanto más se aproxime a -1.
Por ejemplo: peso y velocidad: los alumnos más gordos
suelen correr menos.

Si
= 0, no existe correlación lineal entre las variables.
Aunque podría existir otro tipo de correlación (parabólica,
exponencial, etc.)
23
COEFICIENTE DE CORRELACIÓN LINEAL
 ( x, y )
TALLER: Considere los valores (ficticios) de
PESO Y ESTAURA de 30 alumnos y determine
el nivel de correlación entre estas dos variables.
Utilice la hoja CORRELACIÓN del
archivo talleres_practica_1.xls
Calcule e interprete los resultados.
24
COEFICIENTE DE CORRELACIÓN LINEAL
 ( x, y )
TALLER: Considere el TALLER2_EST.DOC y
resuelva los puntos 4 y 5.
Utilice Excel para resolver los
problemas planteados.
25