Download Estad stica_y_probabilidad_aplicada_a_los_negociosCap03

Document related concepts

Parámetro estadístico wikipedia , lookup

Medidas de dispersión wikipedia , lookup

Percentil wikipedia , lookup

Desviación típica wikipedia , lookup

Varianza wikipedia , lookup

Transcript
Estadística y probabilidad
aplicada a los negocios
Prof. Víctor Manuel Romero Medina
DCB e I
Enero de 2010
Unidad 3.
Estadística descriptiva:
Métodos numéricos
Hay varias medidas numéricas de
localización, dispersión y asociación; si se
calculan a partir de una muestra se llaman
estadísticos de la muestra, si se calculan a
partir de datos de una población se
denominan parámetros poblacionales.
3.1 .- Medidas de localización
Media o promedio. Es una medida de la
localización central.
x
Media de la muestra:
Media de la población:
3.1 .- Medidas de localización
Mediana. Es el valor intermedio cuando los
valores se ordenan de forma ascendente.
Depende de la cantidad de observaciones:
Impar: La mediana es el valor intermedio.
Par: Promedio de los dos valores intermedios.
3.1 .- Medidas de localización
Moda. Es el valor de los datos que se
presentan con más frecuencia.
Bimodal: Si los datos tienen exactamente dos
modas.
Multimodal: Si los datos tienen más de dos
modas.
3.1 .- Medidas de localización
Percentil. El p-ésimo percentil es un valor tal
que por lo menos p por ciento de las
observaciones son menores o iguales que p y
por lo menos (100 – p) por ciento de las
observaciones son mayores o iguales que p
3.1 .- Medidas de localización
Cálculo del p-ésimo Percentil.
1. Ordenar los datos de forma ascendente.
2. Calcular el índice i para el p de interés
3.
Si i no es entero, se determina el máximo
entero; si i es entero, p es el promedio de
los valores ubicados en las posiciones
i e i + 1.
3.1 .- Medidas de localización
Cuartiles. Son percentiles específicos que
dividen a los datos en cuatro partes en
intervalos de 25%.
1.
2.
3.
Q1 = primer cuartil, o percentil 25.
Q2 = segundo cuartil, o percentil 50. Mediana.
Q3 = tercer cuartil, o percentil 75.
25%
25%
Q1
25%
Q2
25%
Q3
3.2 .- Medidas de variabilidad
Rango. Es la diferencia entre los valores
máximo y mínimo.
Rango intercuartil. Es una medida de la
dispersión que elimina la influencia de los valores
extremos de los datos.
3.2 .- Medidas de variabilidad
Varianza. Es una medida de la dispersión que
emplea todos los datos. Se basa en la diferencia
entre cada observación (xi) y la media.
Varianza de la muestra:
Varianza de la población:
3.2 .- Medidas de variabilidad
Desviación estándar.
Varianza de la muestra:
Varianza de la población:
3.2 .- Medidas de variabilidad
Coeficiente de variación. Es una medida
estadística descriptiva que indica lo grande que
es la desviación estándar en comparación con la
media.
3.3 .- Medidas de localización
relativa y detección de
valores atípicos
Valor z. Se interpreta como el número de
desviaciones estándar que dista un dato con
respecto a la media.
3.3 .- Medidas de localización
relativa y detección de
valores atípicos
Teorema de Chebyshev. Cuando menos
de los datos debe estar a menos de z
desviaciones estandar de separación respecto
de la media, siendo z cualquier valor mayor a 1.
3.4 .- Análisis exploratorio
de datos
Trabajo en equipo.
Investigar el método DIAGRAMA DE CAJA
y presentar tres ejemplos de aplicación.
3.5 .- Medidas de asociación
entre dos variables
Covarianza.
Muestra:
Población:
3.5 .- Medidas de asociación
entre dos variables
Coeficiente de correlación.
Muestra:
Población:
3.5 .- Medidas de asociación
entre dos variables
Trabajo en equipo.
Investigar el tema MEDIA PONDERADA Y
MANEJO DE DATOS AGRUPADOS y
presentar tres ejemplos de aplicación.
Ejercicios (Anderson Cap. 3)
3, 8, 17, 18, 27, 40, 43, 47, 55, 56
Ejemplo
Semana
1
2
3
4
5
6
7
8
9
10
Cantidad de
comerciales
Volumen de ventas
(cientos de pesos)
x
y
2
5
1
3
4
1
5
3
4
2
50
57
41
54
54
38
63
48
59
46