Download 160 - RI UAEMex

Document related concepts

Parámetro estadístico wikipedia , lookup

Asimetría estadística wikipedia , lookup

Medidas de dispersión wikipedia , lookup

Desviación típica wikipedia , lookup

Varianza wikipedia , lookup

Transcript
Universidad Autónoma
del Estado de México
Facultad de Contaduría y Administración
1
Coordinación General de
Investigación y Estudios de
Postgrado
Cómputo Estadístico
M. I. César Enrique Estrada Gutiérrez
Agosto de 2016
2
Objetivo
 Proporcionar las herramientas fundamentales para
que sean capaz de organizar, analizar e interpretar
adecuadamente los cuadros estadísticos y gráficos;
establecer conclusiones a partir de la lectura de los
mismos y puedan identificar e interpretar los
principales estimadores estadísticos, así como
aplicar las técnicas estadísticas adecuadas,
establecer conclusiones a partir de resultados, cuya
finalidad es la toma de decisiones en aquellas
situaciones que se tiene incertidumbre de realidades
desconocidas.
Temario (I)
 Introducción al análisis estadístico
 Representaciones estadísticas y análisis de
gráficas
 Descripción de datos económicos y
administrativos (Medidas de posición y de
variabilidad)
 Probabilidad
 Introducción a SPSS
 Distribución de probabilidades para variables
aleatorias discretas
4
Temario (II)
 Distribuciones de probabilidad para variables
aleatorias continuas
 Distribuciones de muestreo e intervalos de
confianza para la media
 Pruebas de hipótesis referentes al valor de la
media de la población
 La prueba Chi cuadrada
 Análisis de varianza
 Análisis de regresión y correlación lineal
5
Bibliografía
 Estadística aplicada a la administración y a la
economía. Leonard J. Kazmier. Ed. Mc Graw Hill
 Estadística para Administración y Economía. Levin,
Rubin, Bohon, Ramos. Ed. Pearson
 Estadística con SPSS para Windows. Juan Camacho
Rosales. Ed. Alfaomega
 Análisis estadístico con SPSS para windows.
Visauta. Ed. Mc Graw Hill
6
Forma de evaluación
 40% trabajos y artículos de investigación
(durante el curso)
 20% examen practico (20 de octubre)
 40% proyecto de investigación (24 de
noviembre)
7
Introducción al análisis estadístico
 Estadística. Es el conjunto de técnicas que se
emplean para la recolección, organización,
análisis e interpretación de datos. Los datos
pueden ser cuantitativos o cualitativos
 Estadística aplicada. Sirve para tomar
mejores decisiones a partir de la
comprensión de las fuentes de variación y de
la detección de patrones
8
Estadística descriptiva
 Comprende las técnicas que se emplean
para resumir y describir datos numéricos.
(gráficas o análisis computacional)

Ejemplo 1

Volumen anual de ventas del año pasado, se
puede graficar en barras o de lineas
9
Estadística inferencial
 Comprende las técnicas con las que, con base
únicamente en una muestra sometida a observación
se toman decisiones sobre una población o proceso
estadístico (requiere de probabilidad)


Censo. Procedimiento para la medición de las
características de todos los miembros de la población
Estadísticas muestrales. Se refiere a las
características medidas de una muestra.

Ejemplo 2
 Muestra de focos y revisión de los mismos hasta poder
estimarse la probabilidad de falla
10
Variables discretas y continuas
 Una variable discreta puede tomar valores
observados únicamente en puntos aislados
(proceso de conteo).
 Una variable continua puede adoptar un valor
en cualquier punto fraccionario a lo largo de
un intervalo especificado

Ejemplo 3


Discretos. Número de personas por hogar en una
colonia
Continuas. Promedio de personas por hogar en
una colonia
11
Obtención de datos
 Observación directa. El investigador ejerce un control
deliberado de algunos o todos los factores que
pueden influir en la variable

Ejemplo 4

Una línea de ensamble para detectar
elementos defectuosos en base a un
criterio
 Encuesta. Cuando la información se debe obtener de
fuentes individuales mediante entrevistas personales,
entrevistas telefónicas o cuestionarios

Ejemplo 5

Nivel de empleo en diferentes empresas
mediante una encuesta a cada una de ellas
12
Muestreo aleatorio
 Es un tipo de muestreo en el que todos los
elementos de la población de interés, o
población objetivo tienen una oportunidad
conocida, usualmente igual de ser elegidos




Muestreo simple
Muestreo Sistemático
Muestreo Estratificado
Muestreo por conglomerados
13
Muestreo aleatorio simple
 Es aquel cuyos elementos se seleccionan
individualmente de la población objetivo
entera con base en el azar

Ejemplo 6

Uso de la función aleatorio de Excel
14
Muestreo sistemático
 Es una muestra aleatoria, cuyos elementos
se seleccionan de la población de un
intervalo uniforme en una lista ordenada

Ejemplo 7

Seleccionar al azar una cuenta bancaria y a partir
de ahí seleccionar las siguientes nueve
15
Muestreo estratificado
 Los elementos de la población son
primeramente clasificados por el investigador
en distintos subgrupos o estratos, sobre la
base de una o más características
importantes.

Ejemplo 8

Las elecciones pasadas antes de la votación
16
Muestreo por conglomerados
 Es un tipo de muestreo aleatorio en el que
los elementos de la población ocurren
naturalmente en subgrupos

Ejemplo 9

Un analista de un departamento estatal de
seguridad económica desea estudiar los índices
salariales por hora que se pagan en el área
metropolitana, sería complicado hacerlo
trabajador por trabajador, en cambio podría
obtenerse una lista de las empresas en esa zona.
El analista puede tomar una muestra simple de
ese conglomerado
17
Problemas
 En el área de las mediciones estadísticas,
como las representadas por cuestionarios, la
confiabilidad se refiere a la consistencia del
instrumento de medición y la validez a su
precisión. Si un cuestionario ofrece
resultados similares tras ser contestado por
dos grupos equivalentes de informantes,
puede describírsele como confiable. ¿El
hecho de que sea confiable garantiza por lo
tanto que sea valido?
18
Problemas
 En los siguientes tipos de valores, designe variables
discretas y variables continuas






A) El número de unidades de un artículo en existencia
B) Razón de activos circulantes contra pasivos
circulantes
C) Tonelaje total embarcado
D) Cantidad embarcada en unidades
E) Volumen de tráfico en una carretera de paga
F) Asistencia a la asamblea anual de una compañia
19
Problemas
 ¿Cuáles son muestra y cuales son una
población?




A) El universo completo
B) Aplicación de conceptos de probabilidad
C) Inspección de cada artículo ensamblado
D) Inspección de cada décimo artículo
ensamblado
20
Trabajo de investigación
 Un auditor desea tomar una muestra
aleatoria sistemática de tamaño 50 (5) de
5250 cuentas por cobrar de una gran
empresa. Las cuentas se enumeran
secuencialmente de la 0001 a la 5250.Use la
hoja de calculo Excel para obtener una lista
de los 50 números aleatorios requeridos y
mándela por correo electrónico
21
Correo electrónico
 [email protected][email protected]
22
Representaciones estadísticas y
análisis de gráficas
 Distribución de frecuencias. Es una tabla en
la cual se agrupan en clases valores posibles
de una variable y donde se registra el
número de valores observados
correspondientes a cada clase
23
Datos agrupados
 Son los datos organizados en una
distribución de frecuencias
 Ejemplo
10
Salario Semanal
$
Numero de trabajadores (f)
240-259
260-279
280-299
300-319
320-339
340-359
Total
7
20
33
25
11
4
100
24
Límites nominales
 Son los valores incluidos en cada clase
 Ejemplo 11
Salario Semanal
$
Numero de trabajadores (f)
240-259
260-279
280-299
300-319
320-339
340-359
Total
7
20
33
25
11
4
100
25
Limites exactos de clase
 Son los puntos específicos que sirven para separar
clases adyacentes en una escala de medición de
variables continuas

Ejemplo 12
Salario semanal
(límites nominales)
Limites exactos de
clase
$
$
240-259
260-279
280-299
300-319
320-339
340-359
239.50-259.50
259.50-279.50
279.50-299.50
299.50-319.50
319.50-339.50
339.50-359.50
26
Punto medio de clase
 Se refiere a la suma del límite inferior de la
clase con el límite superior dividido entre dos

Ejemplo 13
Salario semanal
Limites exactos de Punto
(límites nominales) clase
Medio
$
240-259
260-279
280-299
300-319
320-339
340-359
$
239.50-259.50
259.50-279.50
279.50-299.50
299.50-319.50
319.50-339.50
339.50-359.50
$249.50
269.50
289.50
309.50
329.50
349.50
27
Intervalo de clase
 Se identifica restando el limite exacto de
clase inferior del limite exacto de la clase
superior

Ejemplo 14

Intervalo de clase=259.50-239.50=20
28
Intervalo aproximado
Intervalo aproximado 
 mayor valor en datos   menor valor en datos

no agrupados  
no agrupados 
número de clases deseadas
 Ejemplo 15
 Intervalo aproximado=(360-240)/6=20
29
Histograma de frecuencias
 Un histograma es una gráfica de barras de
distribución de frecuencias, se acostumbra a colocar
los límites exactos

Ejemplo 16
35
30
25
20
15
10
5
0
239.50
259.50
279.50
299.50
319.50
339.50
359.50
30
Polígono de frecuencias
 Es una gráfica de líneas de distribución de
frecuencias, suele identificarse el punto medio de
cada clase

Ejemplo 17
35
30
25
20
15
10
5
0
229.5 249.5 269.5 289.5 309.5 329.5 349.5 369.5
31
Curva de frecuencias
 Es un polígono de frecuencias pero suavizado
 Ejemplo 18
35
30
25
20
15
10
5
0
229.5
249.5
269.5
289.5
309.5
329.5
349.5
369.5
32
Curtosis
 Platicurtica: Plana, con las observaciones
distribuidas en forma relativamente pareja
 Leptocurtica: Afilada, con las observaciones
concentradas en un estrecho rango de
valores
 Mesocurtica: Ni plana ni afilada
33
Asimetría
 Asimétrica negativa
 Simétrica
 Asimétrica positiva
34
Frecuencias acumuladas
 Identifica el número acumulado de observaciones
incluidas bajo el límite exacto superior de cada clase
de la distribución

Ejemplo 19
Salario semanal
(límites nominales)
Limites exactos
de clase
superior
$
$
240-259
260-279
280-299
300-319
320-339
340-359
259.50
279.50
299.50
319.50
339.50
359.50
Número de
trabajadores
7
20
33
25
11
4
Frecuencias
acumuladas
7
20+7=27
33+27=60
25+60=85
85+11=96
96+4=100
35
Ojiva
 Se le denomina a la gráfica de una
distribución de frecuencias acumuladas
120
100
80
60
40
20
0
239.5
259.5
279.5
299.5
319.5
339.5
359.5
36
Diagramas circulares
 Es una figura en forma de pastel cuyas
piezas representan divisiones de una
cantidad total, como podría ser la distribución
de las ventas de una compañia
25%
Principal
Nichos
En Desarrollo
En crecimiento
5%
5%
65%
37
Problemas
 En la siguiente tabla se enlistan los tiempos
requeridos para la conclusión de una tarea
de ensamble para una muestra de 30
empleados que presentaron su solicitud de
ascenso a un puesto de ensamble de
precisión
10
14
15
13
17
16
12
14
11
13
15
18
9
14
14
9
15
11
13
11
12
10
17
16
12
11
16
12
14
15
38
Problemas (2)
 Determine el tamaño del intervalo
correspondiente


Intervalo aproximado=(18-9)/5=1.80
Por lo que nuestro intervalo es conveniente
cerrarlo a 2.0, así que nuestra distribución de
frecuencias quedaría de la siguiente forma
Tiempo, en min.
9-10
11-12
13-14
15-16
17-18
Número de Empleados
4
8
8
7
3
Total 30 Emp.
39
Problemas (3)
 La tabla con límites exactos y punto medio para
cada clase quedaría de la siguiente forma
Tiempo, en min.
8.5-10.5
10.5-12.5
12.5-14.5
14.5-16.5
16.5-18.5
Punto Medio
9.5
11.5
13.5
15.5
17.5
Número de
Empleados
4
8
8
7
3
Total 30 Emp.
40
Problemas (4)
 Elaborar un histograma en Excel
 Elaborar el polígono de frecuencias en Excel
 Elaborar la curva de frecuencias en Excel
 Describir la curva de frecuencias
41
Problemas (5)
 Elaborar una distribución de frecuencias
acumuladas y



A) Trace la ojiva de porcentajes de esos datos
B) ¿En que punto percentil se encontraría un
tiempo de ensamble de 15.5 minutos?
C) haga una grafica circular de los empleados
con respecto a los tiempos
42
Problemas (6)
 Elaborar una distribución de frecuencias
acumuladas
Tiempo, en min. Frecuencia
8.5-10.5
10.5-12.5
12.5-14.5
14.5-16.5
16.5-18.5
4
8
8
7
3
Frecuencia
acumulada
4
12
20
27
30
% acumulado
4*100/30=13.3
12*100/30=40
66.7
90
100
43
Problemas (7)
 Ojiva de la frecuencia
acumulada y del
porcentaje acumulado
 El porcentaje percentil
en 15.5 minutos es 80
 La grafica circular se
muestra
120
100
80
60
40
20
0
8.5
10.5
10%
12.5
14.5
16.5
18.5
13%
23%
27%
8.5
10.5
12.5
14.5
16.5
27%
44
Trabajo de investigación 2
 En la tabla siguiente se presentan las cantidades de 40
préstamos personales (en dólares) utilizados para financiar la
compra de muebles y aparatos eléctricos. Ordene en una
distribución de frecuencias con un total de 7 clases
 A)¿Cuál sería el intervalo de clase más conveniente?
 B) Elabore una distribución de frecuencias iniciando con un
límite de clase inferior de 300 y aplicando el intervalo de
clase del inciso A
 C) Elabore un histograma de distribución de frecuencias
 D) Elabore un polígono de frecuencias y una curva de
frecuencias
 E) Describa la curva de frecuencias resultante
 F) Elabore una distribución de frecuencias acumuladas de la
distribución de frecuencias y trace la ojiva con esos datos
 G) Genere una grafica circular
 H) Entregue todos los resultados anteriores en Excel
45
Trabajo de investigación 2
$1200
515
452
1900
$1000
554
973
660
$356
1190
300
1610
$2227
954
2112
445
1200
1278
2540
720
1388
1000
1525
1000
1890
784
870
630
586
329
935
3000
1650
1219
1423
727
592
655
534
1590
46
Descripción de datos económicos y administrativos
(Medidas de posición y de variabilidad)
 Medida de posición. Es un valor calculado de
un grupo de datos que sirve para describir a
éstos de alguna manera
47
Media aritmética
 Es la suma de los valores del grupo de datos
dividida entre el número de valores
X

  N Media descriptiv a de una población
X

X  n Media descriptiv a de una muestra
48
Media aritmética
 Ejemplo 20
 Durante los meses del verano, ocho vendedores de
una empresa de servicios de calefacción y aire
acondicionado vendieron el siguiente número de
unidades centrales de aire acondicionado:
8,11,5,14,8,11,16,11
X

  N  848  10.5unidades
49
Media ponderada
 Es una media aritmética en donde cada uno de los
valores se pondera de acuerdo con su importancia
en el grupo general. Las formulas de la media
ponderada poblacional y muestral son idénticas
( wX )

w ó X w  w

50
Media ponderada
 Ejemplo 21
 El margen de utilidad en el último año fiscal de las
cuatro líneas de productos de una compañía
fabricante de múltiples bienes fue: Línea A=4.2%;
Línea B=5.5%; Línea C=7.4%; Línea D=10.1%
 Si sacamos la media con la formula anterior quedaría
X

 N 

27.2
4
 6.8%
Sin embargo, como las ventas de los 4 productos no
son iguales, éste promedio no ponderado es
incorrecto
51
Media ponderada
 Así que debemos observar la tabla de ventas
Línea de productos
Margen de
utilidad (X)
Ventas (w)
wX
A
B
C
D
4.2%
5.5%
7.4%
10.1%
$30,000,000
20,000,000
5,000,000
3,000,000
1,260,000
1,100,000
370,000
303,000
 Con respecto a la formula
( wX )
$3, 033, 000

w  w  $58,000,000  5.2%

52
Mediana
 La mediana de un grupo de elementos es el
valor del elemento inmediato cuando todos
los elementos de un grupo siguen, en
términos de valor, un orden ascendente o
descendente
Med  X ( n / 2 )  (1/ 2 ) 
 De nuestro ejemplo 20, al ordenar en forma
ascendente, quedaría 5,8,8,11,11,11,14,16,
el valor de la mediana es:
X(8/2+1/2)=X4.5=11
53
Moda
 Es el valor que ocurre más frecuentemente
en un conjunto de valores . Para nuestro
ejemplo anterior, la moda es 11
54
Relación entre media, mediana y moda
 Cuando la curva graficada es simétrica, la
moda, mediana y media son iguales, cuando
es asimétrica positiva, la media siempre es
mayor que la mediana y la moda, viceversa
en una asimétrica negativa
 ¿Cómo sería la curva para nuestro ejemplo
anterior?
55
Uso de media, mediana y moda
 Con respecto a población
 El valor de la moda indica la posición de la
mayoría de los valores observados. Puede ser
útil como medida descriptiva de un grupo de la
población, aunque solo si existe una moda
claramente perceptible
 La mediana siempre es una medida excelente
para representar el nivel “típico” de los valores
 La media también es un valor excelente
siempre y cuando la población sea simétrica,
por lo que para datos de población la mediana
es más significativa
56
Uso de media, mediana y moda
 Con respecto a Muestras



El valor de la moda no es aceptable
La mediana es más aceptable
La media para éste caso es mejor ya que es
más estable

Ejemplo 22
 Índices salariales de los 650 empleados de una
empresa
 Una muestra aleatoria de 100 trabajadores
57
Cuartiles, Deciles y Percentiles
 Es lo mismo que la mediana, solo que los
cuartiles dividen la muestra en cuartos, los
deciles en decimos y los percentiles en 100
partes
K *n / X
Q1 (primer cuartil)  1* n/4 ó (1* (n  1))/4
D3 (tercer decil)  3 * n/10 ó (3 * (n  1))/10
P70 (septuagesimo percentil)  70 * n/100 ó (70 * (n  1))/100
K es el percentil, cuartil o decil a obtener
58
Problemas
 En una muestra de las compras de 15 estudiantes en




la tienda de una escuela primaria se observan las
siguientes cantidades de ventas, dispuestas en
orden de magnitud ascendente: $ 1.00,1.00,2.50,
2.50,2.50,3.50,4.00,5.30,9.00,12.50,13.50,
24.50,27.10,30.90,41.00 Determine la media,
mediana y la moda
Media=$12.05
Mediana=X8=$5.30
Moda=$2.50
Dado que la media es sustancialmente mayor que la
mediana, la distribución de valores es claramente
asimétrica positiva
59
Problemas
 En referencia a la siguiente tabla, determine
el porcentaje global de artículos defectuosos
ensamblados durante la semana muestreada
Turno
1
2
3
Porcentaje de artículos Número de artículos
defectuosos (X)
en miles (w)
1.1%
1.5%
2.3%
210
120
50
wX
2.31
1.80
1.15
( wX )

$5.26
Xw 


1
.
4
%
$
380
w
60
Trabajo de investigación (3)
 El número de accidentes ocurridos en un mes dado en los 13
departamentos de manufactura de una planta industrial fue:
2,0,0,3,3,12,1,0,8,1,0,5,1. Calcule la media, la mediana y la
moda. Describa la distribución de índices de accidentes en
términos de asimetría
 Supongamos que los precios de menudeo de artículos
seleccionados cambian como se indica en la tabla siguiente.
Determine el cambio porcentual medio en precios al menudeo
sin referencia a los gastos promedio incluidos en la tabla y
posteriormente el cambio porcentual medio ponderado
Artículo
Incremento
Porcentual
Gastos promedio por
mes
Leche
Carne de res
Ropa
Gasolina
15%
6
-20
30
$400
600
1000
1600
61
Trabajo de investigación (3)
 De los siguientes valores, obtenga el 3er
cuartil, el 7° decil y el 65° percentil
0023455667789999
62
Medida de variabilidad en conjuntos de datos
 Las medidas de posición son útiles para la
identificación del valor representativo de un
grupo de valores. Por su parte, las medidas
de variabilidad o dispersión se ocupan de la
descripción de la variabilidad entre los
valores mediante diversas técnicas: Rango,
rangos modificados, desviación media,
varianza, desviación estándar y el coeficiente
de variación
63
Rango
 El Rango, o R, es la diferencia entre los
valores más alto y más bajo incluidos en un
conjunto de datos

Ejemplo 23


Durante un mes de verano, los ocho vendedores
de una empresa de equipos de calefacción y aire
acondicionado vendieron los siguientes números
de unidades:8,11,5,14,8,11,16,11
Rango=My-Mn=16-5=11 unidades
64
Rango modificado
 Es un rango que se construye eliminando
algunos de los valores extremos de cada una
de las porciones finales de la distribución. El
50% central es el rango entre los valores en
el 25º punto percentil y el 75º punto percentil
de la distribución. De este modo, también es
el rango entre el primer y tercer cuartiles de
la distribución. Por este motivo, el rango del
50% central suele llamársele rango
intercuartil (RIC)
 RIC=Q3-Q1
65
Rango modificado
 Ejemplo 24

Los datos de ventas de unidades centrales
presentados en el ejemplo anterior son en
orden ascendente los siguientes:
5,8,8,11,11,11,14,16. En consecuencia, el
número de observaciones es N=8



Q3=11
Q1=8
RIC=Q3-Q1=11-8=3
66
Desviación media
 Se basa en el valor absoluto de la diferencia entre
cada valor del conjunto de datos y la media del grupo
| X |

DMA de la población  N
|X  X |

DMA de la muestra  n
67
DMA
 Ejemplo 25
Durante un mes de verano, los ocho vendedores de una
empresa de equipos de calefacción y aire acondicionado
vendieron los siguientes números de
unidades:8,11,5,14,8,11,16,11
 La media aritmética o µ es 10.5 de acuerdo al ejemplo anterior

X
X-µ
|X-µ|
5
8
8
11
11
11
14
16
-5.5
-2.5
-2.5
0.5
0.5
0.5
3.5
5.5
5.5
2.5
2.5
0.5
0.5
0.5
3.5
5.5
21.0
21/8=2.6
unidades
68
DMA
 Por lo tanto podemos decir que en promedio,
la venta de unidades de equipo de aire
acondicionado de un vendedor difiere en 2.6
unidades respecto de la media grupal, en
cualquier dirección
69
Varianza
 La varianza se asemeja a la desviación
media absoluta en que se basa en la
diferencia entre cada valor del conjunto de
datos y la media del grupo, pero se distingue
de ella en un muy importante aspecto, cada
diferencia se eleva al cuadrado

V (X )   
2
( x )2
N
70
Varianza
 A diferencia de lo que ocurre con las demás
estadísticas muestrales, la varianza de una muestra
no equivale exactamente, en términos de cálculo, a
la varianza de una población. En esencia en esta
formula se incluye un factor de corrección, a fin de
que la varianza muestral sea un estimador insesgado
s
2
(X  X )


2
n 1
71
Desviación estándar
 En general es difícil interpretar el significado
de la varianza, porque las unidades en las
que se expresa son valores elevados al
cuadrado. Debido en parte a esta razón, es
más frecuente el uso de la raíz cuadrada de
la varianza, representada por la letra griega σ
o por “s” en el caso de una muestra. A esto
se le llama desviación estándar
72
Desviación estándar
 Las formulas son:

De la población  

De la muestra s 
( x )2
N
( x X )2
n 1
73
Desviación estándar
 Ejemplo 26
Durante un mes de verano, los ocho vendedores de una
empresa de equipos de calefacción y aire acondicionado
vendieron los siguientes números de
unidades:8,11,5,14,8,11,16,11
 La media aritmética o µ es 10.5 de acuerdo al ejemplo anterior

X
X-µ
(X-µ)2
5
8
8
11
11
11
14
16
-5.5
-2.5
-2.5
0.5
0.5
0.5
3.5
5.5
30.25
6.25
6.25
0.25
0.25
0.25
12.25
30.25
86.00
74
Desviación estándar
86
( x )2



 10.75  3.3
N
8
75
Cálculos simplificados
Varianza de la población  2 
2
2
x

N


N
X 2  N 2

Desviación estándar de la población  
N
Varianza de la muestra s 2 
 X 2  nX
2
n 1
2
X 2 n X

Desviación estandar de la muestra s 
n 1
76
Desviación estándar
 Ejemplo 27
Durante un mes de verano, los ocho vendedores de una
empresa de equipos de calefacción y aire acondicionado
vendieron los siguientes números de
unidades:8,11,5,14,8,11,16,11
 La media aritmética o µ es 10.5 de acuerdo al ejemplo anterior

X
X2
5
8
8
11
11
11
14
16
25
64
64
121
121
121
196
256
968
968  8(10.5) 2
X 2  N 2



 10.75  3.3
N
8
77
Uso de la desviación estándar
 Cuando existe una distribución de valores, tanto
simétrica como mesocurtica, la curva de frecuencias
de una distribución se le llama curva normal, siempre
que ocurre una curva semejante a esto, el 68% de
los valores quedan dentro del margen de la
desviación estándar y el 95% de los valores quedan
incluidos dentro de un margen de dos unidades de
desviación estándar
68
%
95%
78
Descripción de datos
 Ejemplo 28

Las cuentas de energía eléctrica de una zona
residencial correspondientes al mes de junio
tienen una distribución normal, si se calcula
que la media de estas cuentas es de $84.00
con una desviación estándar de $24.00, de
ello se desprende que el 68% de las
cantidades facturadas están entre $60.00 y
$108.00, así mismo se desprende que el 95%
de los valores están entre $36.00 y $132.00
79
Coeficiente de variación
 Indica la magnitud relativa de la desviación estándar
en comparación con la media de la distribución de las
medidas, expresada como porcentaje, es útil cuando
se desea comparar la variabilidad de dos conjuntos
de datos en relación con el nivel general de los
valores (y por lo tanto con la media)

Población CV   100

s
Muestra CV   100
X
80
Coeficiente de variación
 Ejemplo 29

En dos emisiones de acciones ordinarias de la industria
electrónica, durante el periodo de un mes fue de $150 con
una desviación estándar de $5 para las acciones A y de $50
con una desviación estándar de $3 para las acciones B. Con
base a la comparación absoluta, la variabilidad del precio de
las acciones A fue mayor a causa de una mayor desviación
estándar. Pero en cuanto al nivel de los precios se deben
comparan mediante el coeficiente de variación

5
100 
 100  3.3%

150

3
CV ( B )  100  100  6.0%

50
CV ( A) 
Concluimos que las acciones B fueron casi dos veces mas variables
que las acciones A
81
Coeficiente de asimetría de Pearson
 Mide la desviación respecto de la simetría
expresando la diferencia entre la media y la mediana
en relación con la desviación estándar del grupo de
medidas
Asimetría de la población 
3(   Med )

3( X  Med )
Asimetría de la muestra 
s
82
Pearson
 Ejemplo 30



Con respecto a los datos de ventas de
equipos de aire acondicionado, la media es
10.5, la mediana 11 y la desviación estándar
3.3 por lo que el coeficiente de asimetría es
Asimetría=3(µ-Med)/σ=3(10.5-11.0)/3.3=-0.45
Por lo que la distribución de cantidades de
ventas es en cierto modo asimétrica negativa
o sesgada a la derecha
83
Problemas
 Una muestra de 20 obreros obtuvo los siguientes
salarios por una semana dada, redondeados al dólar
más cercano y dispuestos en orden ascendente:
$240,240,240,240,240,240,240,240,255,255,265,265
,280,280,290,300,305,325,330,340. Determine:








A) El rango
B) EL RIC
C) DMA
D) Varianza
E) Desviación estándar
F) Varianza y desviación estándar con la formula
alternativa
G) El Coeficiente de variación
H) El coeficiente de asimetría de Pearson
84
Problemas
 A) Rango. R=My-
Mn=$340-240=$100
 B) 295-240=$55
 C) Se debe obtener
primero la media
muestral=X=$5410/20=
$270.50
X
X-X
|X-X|
(X-X)2
$
240.00
-$
30.50
$
30.50
$
930.25
$
240.00
-$
30.50
$
30.50
$
930.25
$
240.00
-$
30.50
$
30.50
$
930.25
$
240.00
-$
30.50
$
30.50
$
930.25
$
240.00
-$
30.50
$
30.50
$
930.25
$
240.00
-$
30.50
$
30.50
$
930.25
$
240.00
-$
30.50
$
30.50
$
930.25
$
240.00
-$
30.50
$
30.50
$
930.25
$
255.00
-$
15.50
$
15.50
$
240.25
$
255.00
-$
15.50
$
15.50
$
240.25
$
265.00
-$
5.50
$
5.50
$
30.25
$
265.00
-$
5.50
$
5.50
$
30.25
$
280.00
$
9.50
$
9.50
$
90.25
$
280.00
$
9.50
$
9.50
$
90.25
$
290.00
$
19.50
$
19.50
$
380.25
$
300.00
$
29.50
$
29.50
$
870.25
$
305.00
$
34.50
$
34.50
$ 1,190.25
$
325.00
$
54.50
$
54.50
$ 2,970.25
$
330.00
$
59.50
$
59.50
$ 3,540.25
$
340.00
$
69.50
$
69.50
$ 4,830.25
$
572.00
$21,945.00
85
Total
Problemas
 Por lo que el DMA de la muestra quedaría:
| X   |  $572.00  $28.60
N
20
 D) La Varianza sería
2
(
X

X
)
21945.00

2
s 

 1155.00
n 1
20  1
 E) La desviación estándar
s  1155.00  $33.99
86
Problemas
 F) ocupando las formulas obtenemos
X 2  nX
1485350  20(270.5) 2

2
Varianza de la muestra s 

 1155
n 1
19
2
X 2 n X

Desviación estandar de la muestra s 
 1155  33.9
2
n 1
 G) Dado que X=$270.50 y s=$33.99
 CV=s/X*100=33.99/270.50=.1256*100=12.6%
 H) Asimetría=3(X-Med)/s=3(270.5-260)/33.99=0.93
 Por lo que concluimos que la distribución de los datos
salariales es ligeramente asimétrica positiva
87
Trabajo de investigación 4
 Las siguientes calificaciones en examen dispuestas en orden
ascendente, fueron obtenidas por 20 estudiantes inscritos en un
curso de análisis de decisión:
40,47,58,66,70,72,72,75,77,79,81,81,84,84,84,87,93,94,
100,100. Determine
 A) El rango
 B) EL RIC
 C) DMA
 D) Varianza
 E) Desviación estándar
 F) Varianza y desviación estándar con la formula alternativa
 G) El Coeficiente de variación
 H) El coeficiente de asimetría de Pearson
88