Download • Víctor Manuel Sirgo Manrique

Document related concepts

Clasificador bayesiano ingenuo wikipedia , lookup

Transcript
• Víctor Manuel Sirgo Manrique
-1-
INDICE
Tema
Página
Contenido de la Estadística
Población y muestra
Variable
Distribución de frecuencias para datos no agrupados
Distribución de frecuencias para datos agrupados
Gráficos
Diagrama de tallo y hoja
Medidas de tendencia central a partir de datos no agrupados
Medidas de dispersión a partir de datos no agrupados
Medidas de posición
Medidas de tendencia central a partir de datos agrupados
Medidas de dispersión a partir de datos agrupados
Probabilidad
Uniones e intersecciones
Técnicas de conteo
Permutaciones y combinaciones
Tablas de probabilidad
Probabilidad condicional
Axiomas de probabilidad
Teorema de Bayes
Distribuciones de probabilidad
Distribución Binomial
Distribución de Poisson
Distribución normal
Aproximación normal a la distribución binomial
Muestreo
Números índice
Series de tiempo
Métodos de suavizamiento
Bibliografía
-2-
3
3
5
6
7
11
13
14
17
19
21
24
26
28
29
30
32
33
33
36
37
37
38
39
44
45
46
49
52
51
CONTENIDO DE LA ESTADISTICA1
Estadística.- Es la ciencia de reunir, analizar, presentar e interpretar datos.
Descriptiva: La organización y resumen de datos, así como las
características de dichos datos (media, desviación estándar).
Estadística
Teoría de la probabilidad: Nos proporciona una base racional
en problemas con factores aleatorios.
Inferencial: El análisis e interpretación de muestras, para
analizar el comportamiento de poblaciones.
POBLACIÓN Y MUESTRA
Población : Es el total de los elementos que se estudian.
Muestra : Es un conjunto de elementos extraídos de un conjunto mayor (población).
1
Anderson, Sweeney, Williams. Estadística para Administración y Economía. Thomson Editores. México 1999. Págs.
12-15
-3-
Población
Muestra
Estudio de una población
ƒ
ƒ
ƒ
Estudio de una muestra
ƒ
ƒ
ƒ
Conocimiento exacto
Mucho tiempo requerido
Alto costo
Conocimiento aproximado
Rápido
Económico
Finita.- El numero de elementos es limitado
Población
Infinita.- El numero de elementos es muy grande
Grande.- Convencionalmente 30 o más elementos
Muestra
Pequeña.- < 30
-4-
Variable2: Cualquier propiedad o característica de algún evento, objeto o persona, que puede
tener diversos valores en diferentes instantes, según las condiciones. La altura, el peso, el tiempo de
reacción y la dosis de un medicamento son ejemplos de variables. Una variable debe contrastarse
con una constante, la cual, por supuesto, no tiene diversos valores en diferentes instantes. Un
ejemplo de una constante es el símbolo matemático π; el cual siempre tiene el mismo valor
(3.1416).
Las variables de acuerdo a sus características se pueden clasificar de la siguiente manera:
•
•
•
•
Variable independiente La variable independiente de un experimento es aquella que es
controlada en forma sistemática por el investigador. Por ejemplo, un científico podría estar
interesado en el efecto del alcohol sobre el comportamiento social . Para investigar esto, es
probable que el investigador varié la cantidad de alcohol y mida sus consecuencias sobre la
conducta social de las personas. La cantidad de alcohol es la variable independiente.
Variable dependiente La variable dependiente en un experimento es la medida por un
investigador para determinar el efecto de la variable independiente. Por ejemplo, en el
experimento de los efectos del alcohol, la cantidad de alcohol es la variable independiente.
El comportamiento social de los sujetos se mide para ver si es afectado por la cantidad de
alcohol consumida. Así, el comportamiento social es la variable dependiente.
Variable continua Una variable continua es aquella que puede tomar cualquier valor
dentro de un rango dado. El peso, la altura y el tiempo son ejemplos de variables continuas.
Variable discreta Una variable discreta es aquella que esta limitada a ciertos valores,
generalmente números enteros. Con frecuencia son el resultado de la enumeración o del
conteo. El numero de hijos de una familia, la cantidad de estudiantes de una clase, son
ejemplos de variables discretas.
Datos. Medidas que se realizan sobre los sujetos de un experimento. Por lo general, los datos
constan de las medidas de la variable dependiente o de otras características del sujeto, como la edad,
el sexo, el numero de individuos, etc.
Estadístico Número calculado a partir de los datos de la muestra que cuantifica una característica
de ella. Así, el promedio de un conjunto de datos de la muestra seria un estadístico.
Parámetro Número calculado sobre los datos de una población, que cuantifica una característica
de la población. Por ejemplo, el valor promedio de un conjunto de datos poblacionales se llama
parámetro. Debe observarse que el estadístico y el parámetro son conceptos muy similares. La única
diferencia es que un estadístico se calcula sobre una muestra y un parámetro se calcula respecto a
una población.
2
Webster Allen L. Estadística aplicada a los negocios y la economía. McGraw-Hill, México 2000. Páginas 8-10
-5-
DISTRIBUCIÓN DE FRECUENCIAS
PARA DATOS NO AGRUPADOS3
Una distribución de frecuencias presenta los valores de los datos y su frecuencia de aparición. Al
ser presentados en una tabla, los valores de los datos se enumeran en orden, donde por lo general el
valor del dato menor aparece en la parte superior de la tabla.
Ordenaremos las calificaciones que aparecen en la siguiente tabla (n =70), en una distribución de
frecuencias, la cual aparece en otra tabla inmediatamente después.
95
76
65
67
72
82
87
58
86
82
57
76
79
79
88
96
65
54
81
92
76
63
60
71
84
87
77
82
63
75
93
74
56
77
70
69
72
82
46
76
86
94
72
52
83
89
56
66
62
90
3
80
96
82
76
93
77
78
73
99
74
89
77
70
68
76
81
78
79
93
67
Anderson, Sweeney, Williams. Estadística para Administración y Economía. Thomson Editores. México 1999. Pág.
25
-6-
Tabla de frecuencias:
Calificación
46
52
54
56
57
58
60
62
63
65
66
67
68
69
70
71
72
73
74
75
TOTAL
f
1
1
1
2
1
1
1
1
2
2
1
2
1
1
2
1
3
1
2
1
Calificación
76
77
78
79
80
81
82
83
84
86
87
88
89
90
92
93
94
95
96
99
f
6
4
2
3
1
2
5
1
1
2
2
1
2
1
1
3
1
1
2
1
70
Nótese que la suma de las frecuencias es igual al número de datos n
DISTRIBUCIÓN DE FRECUENCIAS
PARA DATOS AGRUPADOS4
Distribución de frecuencias .- Es un resumen tabular de un conjunto de datos que muestra la
frecuencia (o la cantidad) de artículos en cada una de varias clases que no se traslapan. Una
distribución de frecuencias (o tabla de frecuencias), ordenará los datos si estos se dividen en clases
y se registrará el número de observaciones de cada clase.
4
Anderson, Sweeney, Williams. Estadística para Administración y Economía. Thomson Editores. México 1999. Págs.
31-32
-7-
Resumen de datos cuantitativos.- Como ya se dijo una distribución de frecuencias es un resumen
tabular , pero hay que tener mas cuidado para los datos cuantitativos, para lo cual hay que definir
los tres pasos necesarios para definir las clases en una distribución de frecuencias con los datos
cuantitativos que se dan en la tabla siguiente:
68
72
50
70
65
83
77
78
80
93
71
74
60
84
72
84
73
81
84
92
77
57
70
59
85
74
78
79
91
102
83
67
66
75
79
82
93
90
101
80
79
69
76
94
71
97
95
83
86
69
1. Determinar el número de clases.
2. Determinar el ancho o intervalo de cada clase.
3. Determinar los límites de clase.
Número de clases5.- Las clases se forman al especificar los intervalos de los valores de los datos
que se usan para agrupar los elementos en el conjunto. El número de clases en una tabla de
frecuencias es algo arbitrario. En general, la tabla debería de tener entre 5 y 20 clases. Muy pocas
clases no revelarían ningún detalle sobre los datos, y demasiadas clases seria tan confuso como la
misma lista de datos originales.
Se puede seguir una regla simple para aproximar el número de clases a utilizar, c, es:
2c ≥ n
Determina el número de clases
en donde n es el número de observaciones. El número de clases es la menor potencia a la cual se
eleva 2, de manera que el resultado sea igual o mayor que el número de observaciones. En el
ejemplo, se tiene que n = 50 observaciones. Así,
2c ≥ 50
Despejando c, lo cual puede hacerse fácilmente con una calculadora manual, se encuentra que 26 =
64. Esta regla sugiere que debería haber seis clases en la tabla de frecuencias. Por razones de
conveniencia, puede utilizarse un número mayor o menor de clases.
5
Webster Allen L. Estadística aplicada a los negocios y la economía. McGraw-Hill, México 2000. Páginas 22-24
-8-
Ancho o intervalo de clase. Es el rango de valores encontrados dentro de una clase, y se
recomienda que dichos intervalos sean de igual tamaño, por lo tanto, el ancho o intervalo de clase
puede determinarse de la siguiente manera:
Ancho o intervalo de clase
para una tabla de frecuencias
valor máximo – valor mínimo
IC =
cantidad de clases
Ya que se decidieron seis clases en el ejemplo, entonces el intervalo de clase se convierte en:
IC =
102 − 50
= 8.7
6
Debido a que 8.7 es un número poco práctico, el intervalo o ancho de clase puede ajustarse
levemente hacia arriba o hacia abajo. Por razones de conveniencia el intervalo de clase se ajustó a
10.
Límites de clase. Se deben de escoger los límites de clase de tal manera que cada dato pertenezca a
una clase y solo a una.
Por lo tanto y de acuerdo a estos tres pasos, la tabla de frecuencia del ejemplo, quedaría de la
siguiente manera:
Clase
Frecuencia
50 a 59
3
60 a 69
7
70 a 79
18
80 a 89
12
90 a 99
8
100 a 109
2
Totales
50
Distribuciones de frecuencias relativas y de frecuencias porcentuales
Una distribución de frecuencias muestra la cantidad (frecuencia f) de datos correspondientes a cada
una de varias clases que no se traslapan. Sin embargo, muchas veces nos interesa conocer la
proporción, o porcentaje, de los artículos en cada clase. La frecuencia relativa (f.r.) de una clase es
-9-
la proporción de la cantidad total de datos que pertenecen a esa clase. Para un conjunto de datos con
n observaciones, la frecuencia relativa de cada clase se determina mediante la formula:
Frecuencia relativa de una clase =
Frecuencia de la clase
n
La frecuencia porcentual (f.r.%) de una clase es la frecuencia relativa multiplicada por 100
Tabla de distribución de frecuencias, frecuencias relativas y porcentuales:
Clase
Frecuencia
Frecuencia relativa
Frecuencia porcentual
50 a 59
3
0.06
6.00%
60 a 69
7
0.14
14.00%
70 a 79
18
0.36
36.00%
80 a 89
12
0.24
24.00%
90 a 99
8
0.16
16.00%
100 a 109
2
0.04
4.00%
50
1.00
100.00%
Totales
Distribuciones acumuladas
Una variación de la distribución de frecuencias, que proporciona otro resumen tabular de datos
cuantitativos, es la distribución de frecuencias acumuladas. En ella se usa la cantidad de clases,
anchos de clase y limites de clase que fueron definidos para la distribución de frecuencias. Sin
embargo, mas que mostrar la frecuencia de clase, la distribución de frecuencias acumuladas muestra
la cantidad de elementos menores que, o iguales al limite superior de clase para cada clase. En la
siguiente tabla se muestra ya con la frecuencia acumulada (f.a.).
Clase
Frecuencia
Frecuencia
Frecuencia porcentual acumulada
Frecuencia relativa
50 a 59
3
0.06
6.00%
3
60 a 69
7
0.14
14.00%
10
70 a 79
18
0.36
36.00%
28
80 a 89
12
0.24
24.00%
40
90 a 99
8
0.16
16.00%
48
100 a 109
2
0.04
4.00%
50
50
1.00
100.00%
Totales
- 10 -
GRAFICOS6
Gráficas de barra y diagramas de pastel
Frecuencia
Una gráfica de barras es una forma gráfica de representar datos cualitativos que se han resumido en
una distribución de frecuencias, de frecuencias relativas o de porcentuales. En el eje horizontal de la
gráfica se especifican los indicadores o nombres que se usan para cada una de las clases. En el eje
vertical puede representarse una escala de frecuencias, una de frecuencias relativas o una de
porcentuales. Entonces, con una barra de un ancho fijo trazada sobre cada indicador de clase
llegamos a la altura que corresponde a la frecuencia, frecuencia relativa o la porcentual de la clase,
indicada en el eje vertical. Las barras se separan a fin de señalar que cada clase es una categoría
diferente.
20
18
16
14
12
10
8
6
4
2
0
Coke
Classic
Diet
Coke
Dr.
Pepper
PepsiCola
Sprite
Marca
El diagrama de pastel es un método gráfico que se usa mucho para presentar distribuciones de
frecuencias relativas de datos cualitativos. Para trazarlo se dibuja primero un círculo, a
continuación, con las frecuencias relativas, se divide el circulo en sectores o partes, que
corresponden a la frecuencia relativa de cada clase. Por ejemplo, como hay 360° en un círculo, y
6
Webster Allen L. Estadística aplicada a los negocios y la economía. McGraw-Hill, México 2000. Páginas 27-29
- 11 -
como Coke Classic tiene .38 de frecuencia relativa, el sector de la gráfica de pastel que le
corresponde debe tener .38 x 360 = 136.8 grados. Se efectúan cálculos semejantes para las demás
clases.
Frecuencia Porcentual
10%
Coke Classic
Diet Coke
Dr. Pepper
Pepsi-Cola
38%
26%
Sprite
10%
16%
Histograma
Otra presentación gráfica común de datos cuantitativos es el histograma. Este resumen gráfico se
puede preparar con datos que se han resumido anteriormente en una distribución de frecuencias, de
frecuencias relativas o de frecuencias porcentuales. Un histograma se traza colocando la variable de
interés sobre el eje horizontal y la frecuencia, la frecuencia relativa o la frecuencia porcentual de
cada clase trazando un rectángulo cuya base es el intervalo de clase sobre el eje horizontal, y cuya
altura es la frecuencia correspondiente.
Frecuencia
20
50 - 59
60 - 69
70 - 79
80 - 89
90 - 99
100 - 109
15
10
5
0
Clases
- 12 -
Ojiva
Una gráfica de una distribución acumulada se llama ojiva. Los valores de los datos están en el eje
horizontal y las frecuencias acumuladas, frecuencias relativas acumuladas o frecuencias
porcentuales acumuladas se muestran en el eje vertical.
55
50
Fre cue ncia a cum ula da
45
40
35
30
25
20
15
10
5
0
50 a 59
60 a 69
70 a 79
80 a 89
90 a 99
100 a 109
Cla se s
Diagrama de tallo y hojas
Es una forma de mostrar tanto el orden de rangos como la forma de un conjunto de datos, en forma
simultanea.
Para ilustrar el uso del diagrama de tallo y hojas, considere los siguientes 20 datos: 112, 73, 84, 95,
68, 118, 86, 107, 100, 94, 81, 75, 66, 66, 104, 92, 77, 83, 75 y 69. A fin de desarrollar el diagrama
de tallo y hojas con los datos anteriores, primero los ordenamos, de acuerdo con los dígitos iniciales
de cada uno, en el lado izquierdo de una línea vertical. A la derecha de esta recta se anota el ultimo
- 13 -
dígito de cada dato, conforme al orden en que fueron anotadas. El ultimo dígito de cada dato se
coloca en el renglón de los primeros dígitos del numero correspondiente.
6
8 6 6 9
7
3 5 7 5
8
4 6 1 3
9
5 4 2
10
7 0 4
11
2 8
MEDIDAS DE TENDENCIA CENTRAL A PARTIR
DE DATOS NO AGRUPADOS7
Existen tres métodos comunes para identificar el centro de un conjunto de datos no agrupados: la
media, la mediana y la moda.
La media o media aritmética, es la medida de tendencia central que usualmente conocemos como
promedio.
La media de una población es el parámetro µ. Si hay N observaciones en el conjunto de datos de la
población, la media se calcula de la siguiente manera:
N
Media poblacional
7
∑1 xi
x1 + x2 + x3 + .....xN
µ =
=
N
N
Webster Allen L. Estadística aplicada a los negocios y la economía. McGraw-Hill, México 2000. Páginas 41-46
- 14 -
La media de una muestra es un estadístico x , con n observaciones en el conjunto de datos de la
muestra, la cual se determina de la siguiente manera:
n
xi
x 1 + x 2 + x 3 + ....... + xn ∑
1
x =
=
n
n
Media muestral
Ejemplo.- Se supone que una muestra de los ingresos por ventas mensuales en miles de dólares,
para cinco meses es de 56, 67, 52, 45 y 67. ¿Calcular la media?
x =
56 + 67 + 52 + 45 + 67
= 57.4
5
La mediana algunas veces es llamada media posicional, porque queda exactamente en la mitad del
conjunto de datos, después de que las observaciones se han colocado en serie ordenada.
Si el conjunto de datos tiene un número impar de observaciones, la posición de la mediana es:
Posición de la mediana =
n+1
2
En el ejemplo anterior, si ordenamos los datos nos queda:
45, 52, 56 ,67 ,67
- 15 -
Posición de la mediana =
5+1
=3
2
O sea la tercera posición 56
En un conjunto de datos que contiene un número par de observaciones, es necesario promediar los
dos valores medios. Si los ingresos para un sexto mes en el ejemplo anterior es 35 y se adiciona al
conjunto de datos, entonces la serie ordenada queda de la siguiente manera:
35, 45, 52, 56, 67, 67
Y la posición de la mediana queda:
Posición de la mediana =
6 +1
= 3.5
2
Es decir la posición tres y medio, o sea se saca un promedio de la tercera y cuarta posición que son
52 y 56 para sacar el valor de la mediana:
52 + 56
= 54 que es el valor de la mediana
2
La moda es la observación que ocurre con mayor frecuencia. En el ejemplo anterior la moda es 67.
Si la séptima observación fuera 56 y se agregara al conjunto de datos, entonces seria una
observación bimodal con modas 56 y 67
Ejemplo.- La emisión de la revista Fortune del 17 de Febrero de 1997, reporto que en 1996 las
utilidades en millones de dólares de 6 empresas fueron las siguientes:
Exxon
Philipp Morris
Intel
7,510
6,246
5,157
General Electric
I.B.M.
General Motors
¿Calcular las tres medidas de tendencia central?
Media:
x
=
7,510 + 7,280 + 6,246 + 5,429 + 5,157 + 4,289
= 5,985
6
- 16 -
7,280
5,429
4,289
Mediana: Primero hay que ordenar los datos.
4,289, 5,157, 5,429, 6,246, 7,280, 7,510
la posición de la mediana =
n +1 6 +1
=
= 3.5
2
2
o sea que hay que sacar el promedio entre la tercera y la cuarta posición
5,429 + 6,246
= 5,837.50
2
Moda: No tiene moda.
MEDIDAS DE DISPERSION A PARTIR DE DATOS NO
AGRUPADOS8
MEDIDAS DE DISPERSION : Miden que tanto se dispersan las observaciones alrededor de su
media, las cuales son: el rango, la varianza y la desviación estándar.
Rango.- La medida de dispersión mas simple (y menos útil) es el rango o recorrido. El rango es
simplemente la diferencia entre la observación mas alta y la mas baja.
Varianza y desviación estándar de una población.- La varianza y su raíz cuadrada, la desviación
estándar son medidas de dispersión mucho mas útiles. Proporcionan una medida mas significativa
sobre el punto hasta el cual se dispersan las observaciones alrededor de su media.
La varianza es el promedio de las observaciones respecto a su media elevadas al cuadrado, la cual
se denota como σ2 (se lee como sigma al cuadrado) y esta dada por la siguiente formula:
n
Varianza poblacional: σ 2 =
8
( x1 − µ ) + ( x2 − µ ) + ( x3 − µ )
2
2
2
N
+ ..... + ( xn − µ )
2
=
∑x
i =1
i
N
Webster Allen L. Estadística aplicada a los negocios y la economía. McGraw-Hill, México 2000. Páginas 47-52
- 17 -
En donde:
x1 , x2 , x3 ,....., xn
µ
N
son las observaciones individuales
es la media poblacional
es el número de observaciones
La desviación estándar, es la raíz cuadrada de la varianza, la cual se denota como σ y cuya formula
es:
Desviación estándar poblacional
σ = σ2
Ejemplo.- Una compañía de seguros para automóvil, vende 5 tipos diferentes de pólizas para el
Neón 1993. Sus respectivos costos en dólares son: $110, $145, $125, $95 y $150. Calcular la
varianza y la desviación estándar.
Primero se saca la media:
µ=
110 + 145 + 125 + 95 + 150
= $125
5
Después se calculan la varianza y la desviación estándar:
σ
2
(110 − 125)
=
2
+ (145 − 125 ) + (125 − 125 ) + (95 − 125 ) + (150 − 125 )
= 430
5
2
2
2
2
σ = 430 = $20.74
Varianza y desviación estándar para una muestra.- La varianza y desviación estándar para una
muestra representan medidas de dispersión alrededor de la media. Se calculan de manera parecida a
aquellas para una población. La varianza de la muestra s2 es :
Varianza de la muestra
s2
(
X − X)
∑
=
i
n−1
- 18 -
2
y la desviación estándar de la muestra es:
Desviación estándar de la muestra
s = s2
Medidas de posición.- Son aquellas que nos permiten identificar valores ubicados en diferentes
posiciones de un grupo de datos. Estas medidas se conocen como: cuartiles, deciles y percentiles.
Los cuartiles (primero, segundo y tercero) señalan el valor que está al 25,50 y 75% de la totalidad
de los datos (el segundo cuartil equivale a la mediana).
Los deciles (del primero al noveno) marcan el valor ubicado al 10,20,....,80 y 90% de los datos (el
quinto decil equivale a la mediana)
Los percentiles (del 1 al 99) indican el valor que está al 1,2,........98 y 99% de los datos. Observe
que los deciles primero, segundo, etc. Equivalen a los percentiles décimo, vigésimo, etc. Y los
cuartiles equivalen a los percentiles 25, 50 y 75.
Las fórmulas para obtener estas medidas se presentan a continuación. En ellas se señala entre
paréntesis la posición del elemento deseado, siendo n el número de datos. X indica el valor
correspondiente a la posición calculada.
Cuartiles:
⎛n 1⎞
Q1 = X ⎜ + ⎟
⎝ 4 2⎠
⎛ 2* n
+
Q2 = X ⎜
⎝ 4
⎛ 3* n 1⎞
+ ⎟
Q3 = X ⎜
2⎠
⎝ 4
1⎞
⎛ n + 1⎞
⎟ = X⎜
⎟ = Mediana
2⎠
⎝ 2 ⎠
- 19 -
Deciles:
⎛ n 1⎞
D1 = X ⎜ + ⎟
⎝ 10 2 ⎠
⎛ 3* n 1⎞
+ ⎟
D3 = X ⎜
2⎠
⎝ 10
⎛ 2* n 1⎞
D2 = X ⎜
+ ⎟
2⎠
⎝ 10
D4 = etc.
Percentiles:
1⎞
⎛ n
+ ⎟
P1 = X ⎜
⎝ 100 2 ⎠
⎛ 2* n 1⎞
P2 = X ⎜
+ ⎟
⎝ 100 2 ⎠
⎛ 3* n 1⎞
+ ⎟
P3 = X ⎜
⎝ 100 2 ⎠
P4 = etc.
Ejemplo.- determine el valor del tercer cuartil, del cuarto decil y del percentil 17 de los siguientes
26 valores ordenados: 3, 5, 6, 11, 14, 18, 20, 24, 25, 27, 27, 28, 28, 31, 33, 34, 36, 44, 45, 47, 48,
48, 50, 50, y 52
La posición del tercer cuartil es la siguiente:
Posición de Q 3 =
3 * 26 1 78 1
+ =
+ = 20
4
2 4 2
El valor que corresponde a la posición 20 es 45, por lo que el tercer cuartil es igual a 45
La posición del cuarto decil es la siguiente:
- 20 -
Posición de D4 =
4 * 26 1 104 1
+ =
+ = 10.9
10
2 10 2
Para determinar el valor que corresponde a la posición 10.9, debe sumarse al valor de la décima
posición (25), nueve décimas de la diferencia entre el valor de la décima posición y el de la
decimaprimera posición (27-25 = 2), es decir, 25 + 09 * 2 = 26.8 . El valor del cuarto decil es
26.8
La posición del percentil 17 es la siguiente:
Posición de P17 =
17 * 26 1 442 1
+ =
+ = 4.92
100
2 100 2
Para determinar el valor que corresponde a la posición 4.92, debe sumarse al valor de la cuarta
posición (11), 92 centésimas de la diferencia entre el valor de la cuarta posición y el de la quinta
posición (14 – 11 = 3), es decir, 11 + 0.92 * 3 = 13.76 . El valor del percentil 17 es 13.76
MEDIDAS DE TENDENCIA CENTRAL Y DE DISPERSIÓN A
PARTIR DE DATOS AGRUPADOS9
Al trabajar con datos que han sido agrupados en una distribución de frecuencias, no se conoce
cuáles son las observaciones individuales. Sin los valores específicos, los procedimientos mostrados
anteriormente para calcular las medidas descriptivas, simplemente no se aplican. Deben encontrarse
métodos alternativos. Debe tenerse en mente que los cálculos hechos utilizando datos agrupados son
sólo aproximaciones. Por tanto, las observaciones individuales no agrupadas deberían utilizarse
cuando sea posible.
La media.- Al calcular la media de datos agrupados, se supone que las observaciones en cada clase
son iguales al punto medio de la clase. Dada esta suposición, se debe de tener en cuenta la
frecuencia y los puntos medios de cada clase cuando se calcule la media utilizando datos agrupados.
La formula para el calculo de la media es:
Media con datos agrupados
9
Xg =
∑ fM = ∑ fM
n
∑f
Webster Allen L. Estadística aplicada a los negocios y la economía. McGraw-Hill, México 2000. Páginas 53-56
- 21 -
en donde:
f es la frecuencia o número de observaciones de cada clase
M es el punto medio de cada clase
n es el tamaño de la muestra y es igual a las frecuencias sumadas en
todas las clases
Ejemplo.- De acuerdo a la tabla de distribución de frecuencias para datos agrupados vista
anteriormente, se va a calcular la media:
Clase
50 - 59
60 - 69
70 - 79
80 - 89
90 - 99
100 - 109
Totales
Frecuencia (f )
3
7
18
12
8
2
50
M
54.5
64.5
74.5
84.5
94.5
104.5
fM
163.5
451.5
1341.0
1014.0
756.0
209.0
3935.0
3935
Xg =
= 78.7
50
La mediana.- Si se han registrado datos en una tabla de frecuencia, no pueden colocarse en un
arreglo ordenado para calcular la mediana, por lo que primero hay que hallar la clase de la
mediana de la distribución de frecuencia. La clase de la mediana es la clase cuya frecuencia
acumulada es mayor que o igual a n 2 .
Mediana para datos agrupados
⎡n 2 − F ⎤
xˆ g = Lmd + ⎢
⎥ (C )
⎣ f md ⎦
- 22 -
En donde:
Lmd
F
f md
C
es el límite inferior de la clase de la mediana
es la frecuencia acumulada de la clase que antecede a la clase de la mediana
es la frecuencia de la clase de la mediana
es el intervalo de clase de la clase de la mediana
Siguiendo con el ejemplo anterior, ahora hallaremos cual es la clase de la mediana en la tabla de
distribución de frecuencias:
Debido a que n es 50, se necesita localizar la primera clase con una frecuencia acumulada de 25 o
más, por lo que la tercera clase será la clase de la mediana.
Clase
50 - 59
60 - 69
70 - 79
80 - 89
90 - 99
100 - 109
Totales
Frecuencia
(f)
3
7
18
12
8
2
50
M
fM
54.5
64.5
74.5
84.5
94.5
104.5
F
163.5
451.5
1341.0
1014.0
756.0
209.0
3935.0
3
10
28
40
48
50
Por lo que la mediana se obtiene mediante la formula anterior:
⎡ 50 2 − 10 ⎤
xˆ g = 70 + ⎢
⎥ (10 ) = 78.33
⎣ 18 ⎦
La moda.- Ya que por definición la moda es la observación que ocurre con mayor frecuencia, esta
se hallará en la clase que tenga la frecuencia más alta, llamada la clase modal. Para estimar la moda
en el caso de datos agrupados, se utiliza la siguiente formula:
Moda para datos agrupados
⎡ Da ⎤
x~ = Lmo + ⎢
⎥ (C )
⎣ Db + Da ⎦
- 23 -
En donde:
Lmo
Da
Db
C
es el límite inferior de la clase modal.
es la diferencia entre la frecuencia de la clase modal y la clase que le antecede
es la diferencia entre la frecuencia de la clase modal y la clase que le sigue
es el intervalo de clase de la clase modal
Por lo tanto, y de acuerdo a lo anterior, en este ejemplo la clase modal es la misma que la de la clase
de la mediana
Clase
50 - 59
60 - 69
70 - 79
80 - 89
90 - 99
100 - 109
Totales
Frecuencia
(f)
3
7
18
12
8
2
50
M
fM
54.5
64.5
74.5
84.5
94.5
104.5
F
163.5
451.5
1341.0
1014.0
756.0
209.0
3935.0
3
10
28
40
48
50
Y la moda quedará como sigue:
⎡
18 − 7
⎤
x~ g = 70 + ⎢
⎥ (10 ) = 76.47
(
)
(
)
18
−
12
+
18
−
7
⎣
⎦
Varianza y desviación estándar.- Si los datos están agrupados en una tabla de
frecuencias, la varianza y la desviación estándar pueden calcularse mediante las
siguientes formulas:
Varianza para datos agrupados
sg
2
∑ fM
=
y
- 24 -
− nx 2
n−1
2
sg = s2
Desviación estándar para datos agrupados
Por lo que, y siguiendo con el ejemplo anterior, a la tabla de distribución de frecuencias,
2
2
habría que agregarle dos nuevas columnas, M y fM :
Clase
Frecuencia
(f)
50 - 59
60 - 69
70 - 79
80 - 89
90 - 99
100 - 109
Totales
M
3
7
18
12
8
2
50
fM
54.5
64.5
74.5
84.5
94.5
104.5
163.5
451.5
1341.0
1014.0
756.0
209.0
3935.0
M2
F
3
10
28
40
48
50
2,970.25
4,160.25
5,550.25
7,140.25
8,930.25
10,920.25
fM 2
8,910.75
29,121.75
99,904.50
85,683.00
71,442.00
21,840.50
316,902.50
Entonces, la varianza y la desviación estándar quedarían:
316,902.50 − 50(78.7 )
=
= 147.31
50 − 1
2
sg
2
s g = 147.31 = 12.14
Coeficiente de variación.- El coeficiente de variación (CV) es una sencilla medida que permite
comparar el grado de dispersión de un conjunto de datos relativo a su media. Se calcula dividiendo
la desviación estándar de una distribución por su media y multiplicando por 100.
Coeficiente de variación
CV =
sg
xg
(100)
Por lo que, y siguiendo con el ejemplo anterior, el coeficiente de variación será:
- 25 -
CV =
12.14
(100) = 15.43
78.70
Sesgo.- La asimetría o sesgo de una distribución de frecuencias expresa su deformación respecto al
eje vertical y puede medirse mediante el coeficiente de sesgo de Pearson.
Coeficiente de sesgo
P=
3( x g − xˆ g )
sg
Si P < 0 , los datos están sesgados a la izquierda, si P > 0 , entonces están sesgados a la derecha;
si P = 0 están distribuidos normalmente.
Utilizando el ejemplo anterior nuevamente, el coeficiente de sesgo será:
P=
3(78.7 − 78.3)
= 0.03
12.14
Por lo que los datos están sesgados a la derecha.
PROBABILIDAD10
La probabilidad es la posibilidad numérica de que ocurra un evento. La probabilidad de un evento
es medida por valores comprendidos entere 0 y 1:
P(evento cierto) = 1
P(evento imposible) = 0
Por tanto: 0 ≤ P ( E i ) ≤ 1 , en donde Ei es algún evento
El proceso que produce un evento es denominado experimento. Un experimento es toda acción bien
definida que conlleva a un resultado único bien definido.
El conjunto de todos los posibles resultados para un experimento es el espacio muestral. El espacio
muestral de lanzar un dado es:
10
Webster Allen L. Estadística aplicada a los negocios y la economía. McGraw-Hill, México 2000. Páginas 76-80
- 26 -
ss = (1,2,3,4,5,6 )
y para una moneda:
ss = (águila, sol )
La probabilidad de que al menos uno de los eventos que están en el espacio muestral ocurra es igual
a 1. Si se lanza un dado, el resultado debe ser un número entre 1 y 6. Debido a que esto es una
certeza puede decirse que:
∑ P (E ) = 1
i
MODELOS DE PROBABILIDAD.- Existen solamente tres modelos generalmente aceptados:
1. Modelo de frecuencia relativa (a posteriori).
2. Modelo subjetivo.
3. Modelo clásico (a priori).
El modelo de frecuencia relativa utiliza datos que se han observado empíricamente, registra la
frecuencia con que ha ocurrido algún evento en el pasado y estima la probabilidad de que el evento
ocurra nuevamente con base en estos datos históricos. La probabilidad de un evento con base en el
modelo de frecuencia relativa se determina mediante:
Fecuencia relativa P ( E ) =
Número de veces que ha ocurrido el evento en el pasado
Número de observaciones
Por ejemplo, asumiendo que durante el año anterior hubo 50 nacimientos en un hospital, de los
cuales 32 eran niñas. El modelo de frecuencia relativa revela que la probabilidad de que el siguiente
nacimiento sea una niña es:
P (niña ) =
Número de niñas que nació el año anterior 32
=
= 0.64
Número total de nacimientos
50
El modelo subjetivo se utiliza cuando se desea asignar probabilidad a un evento que nunca ha
ocurrido. La probabilidad de que una mujer sea elegida como presidente en México, es un ejemplo.
Debido a que no hay datos sobre los cuales confiar, se obtendrá una estimación subjetiva.
- 27 -
De los tres métodos para medir la probabilidad, el modelo clásico es el que se relaciona con mayor
frecuencia con las apuestas y juegos de azar. La probabilidad clásica de un evento se determina
mediante:
Modelo clásico
P (E ) =
Número de formas en las que puede ocurir un evento
Número total de posibles resultados
La probabilidad clásica implica la determinación de algún evento a priori (antes del hecho). Por
tanto, antes de sacar una carta de una baraja de 52 cartas, se puede determinar que la probabilidad
de sacar un as es:
P (as ) =
Número de formas en las que el evento puede ocurrir 4
=
= 0.077
Número total de posibles resultados
52
UNIONES, INTERSECCIONES Y RELACIONES ENTRE EVENTOS11.- Un conjunto es
toda reunión de objetos. Si se han identificado dos conjuntos A y B, es completamente posible que
algunos elementos estén en ambos conjuntos. Por ejemplo, se asume que el conjunto A consta de
todos los estudiantes de la clase de estadística, y el conjunto B consta de todos los estudiantes de la
carrera de Mercadotecnia. Aquellos elementos (estudiantes) que estén en ambos conjuntos
constituyen la intersección entre A y B. La intersección entre A y B, que se escribe A I B y se lee
como “A intersección B”, consta de los elementos que son comunes tanto a A como a B.
Intersección entre A y B: Es el conjunto de todos los elementos que están tanto en A como en B
Para que ocurra A I B , tanto “A como B” deben ocurrir. El estudiante debe estar en la clase de
estadística y en la carrera de Mercadotecnia.
La unión de A y B, que se escribe A U B y se lee “A unión B”, consta de tales elementos que
están o en A o en B o en ambos.
La unión de A y B: Es el conjunto de todos los elementos que están en A o en B
11
Webster Allen L. Estadística aplicada a los negocios y la economía. McGraw-Hill, México 2000. Páginas 80-82
- 28 -
Eventos mutuamente excluyentes.- Dos eventos son mutuamente excluyentes si la ocurrencia de
uno prohibe la ocurrencia del otro. Un ejemplo clásico de eventos mutuamente excluyentes es el de
sacar un águila o un sol al lanzar una moneda una vez. Si sale un águila, no puede ocurrir que salga
un sol.
Eventos colectivamente exhaustivos.- Son aquellos que constan de todos los posibles resultados
de un experimento y constituyen su espacio muestral. Los eventos colectivamente exhaustivos de
lanzar un dado son 1, 2, 3, 4, 5 y 6. Además, debido a que existe la certeza de que uno de los
eventos ocurrirá, su probabilidad combinada será igual a uno:
P (1 ó 2 ó 3 ó 4 ó 5 ó 6 ) = 1
Eventos independientes.- Son aquellos eventos en que la ocurrencia de uno no tiene que ver con la
ocurrencia del otro. Algunos ejemplos incluyen el resultado de un lanzamiento de una moneda y la
de un dado, el resultado del lanzamiento de una moneda no afecta al dado.
Eventos complementarios.- Son los eventos en los que si un evento no ocurre, el otro debe ocurrir
y se escribe como A , y se denomina “no A”.
P ( A) + P ( A ) = 1
P ( A) = 1 − P ( A )
TECNICAS DE CONTEO12
Para encontrar la probabilidad de muchos eventos es necesario determinar el número de resultados
posibles del experimento implicado. El determinar el número de resultados posibles se conoce como
conteo.
Regla de la multiplicación.- Para poder conocer el total de resultados posibles de un experimento
que esta integrado por dos ensayos, donde uno de ellos posee m resultados posibles y el otro tiene n
resultados posibles, entonces el número de resultados posibles esta dado por:
mxn
Que se conoce como “El principio fundamental de conteo”.
Si el experimento esta compuesto por k ensayos realizados en un orden definido, donde el primero
tiene n1 resultados posibles, el segundo posee n2 resultados, el tercero tiene n3 resultados posibles,
entonces el número total de resultados posibles esta dado por:
12
Johnson Robert, Kuby Patricia. Estadística elemental. Thomson editores. México, 1999. Páginas 461-463
- 29 -
n1 x n2 x n3 x ............................x n k
Que se conoce como “El principio general de conteo”.
Ejemplo 1 : Un vendedor de automóviles ofrece uno de sus modelos compactos con dos opciones
de transmisión (estándar o automática) y en uno de tres colores (negro, rojo o blanco). ¿Cuántas
elecciones posibles de transmisión y color son posibles?
Por el principio fundamental de conteo, tenemos:
m = 2 (opciones de transmisión)
n = 3 (opciones de color)
Por lo tanto el número total de resultados posibles será:
mxn=3x2=6
Ejemplo 2.- En muchos estados de la Unión Americana, se usan tres letras seguidas de tres dígitos,
para elaborar las placas de los automóviles. Si se pueden usar cualquiera de las 26 letras del alfabeto
y cualquier dígito del 0 al 9. ¿Cuántos números de placas diferentes son posibles?
Para la primera letra hay 26 opciones posibles (n1 = 26), 26 para la segunda (n2 = 26) y 26 para la
tercera (n3 = 26). De igual forma hay 10 opciones posibles para el primer dígito (n4 = 10), 10 para el
segundo (n5 = 10) y 10 para el tercero (n6 = 10). En consecuencia y de acuerdo al principio general
de conteo, tenemos:
n1 x n 2 x n 3 x n 4 x n 5 x n6 resultados posibles
26 * 26 * 26 * 10 * 10 * 10 = 17,576,00 números de placas.
PERMUTACIONES Y COMBINACIONES13
Permutaciones.- Cuando se elige más de un artículo (sin reemplazo) de una sola categoría y el
orden de selección es importante, los diversos resultados posibles reciben el nombre de
permutaciones. Por ejemplo, cuando se anuncian el primero, segundo y tercer lugar de un
concurso, el orden de elección es importante.
El número de permutaciones, o arreglos, de r artículos elegidos sin reemplazo de un conjunto de n
artículos (r ≤ n ) , el cual se denota n Pr , esta dado por la siguiente formula:
13
Webster Allen L. Estadística aplicada a los negocios y la economía. McGraw-Hill, México 2000. Páginas 93-95
- 30 -
Pr =
n
n!
(n − r )!
Las permutaciones se emplean siempre que se elija más de un artículo (sin reemplazo) de un
conjunto de artículos y si el orden de selección si es importante.
Ejemplo.- Una liga de boliche está conformada por diez equipos. ¿De cuántas formas diferentes
pueden acomodarse los equipos al final del torneo? (No se admiten empates)
En virtud de que el orden si tiene importancia, calcularemos entonces el número de permutaciones
de diez artículos ( r ), tomados de un conjunto de 10 artículos ( n ):
10
P10 =
10!
= 3,628.800
(10 − 10)!
recuerde que 0! es igual a 1
Combinaciones.- Cuando al elegir los artículos de un conjunto total y el orden no es importante,
los posibles resultados se denominan combinaciones.
El número de combinaciones, o arreglos, de r artículos, elegidos sin reemplazo de un conjunto de n
artículos (r ≤ n ) , el cual se denota n C r , esta dado por la siguiente formula:
Cr =
n
n!
r ! (n − r )!
Las combinaciones se emplean siempre que se eligen uno o más artículos (sin reemplazo) de un
conjunto de artículos, y si el orden de selección no es importante.
Ejemplo.- ¿Cuántas combinaciones son posibles en el concurso Mélate, si se tienen que escoger 6
números diferentes de un total de 49 números?
Como el orden no es importante, calcularemos entonces las combinaciones posibles para escoger 6
números ( r ), de un total de 49 números (n):
- 31 -
C 6=
49
49!
= 13,983,816
6! (49 − 6)!
TABLAS DE PROBABILIDAD14
Las Tablas de probabilidad son útiles al calcular la probabilidad de eventos. Pongamos por ejemplo
la siguiente tabla de los empleados de cierta compañía, en cuanto a género y clasificación:
Género
Hombres (H)
Mujeres (M)
Total
Personal (P)
120
50
170
Línea (L)
150
140
290
Auxiliar (A)
30
10
40
Total
300
200
500
La tabla muestra por ejemplo que de los 170 miembros del personal (P), 120 son hombres y 50 son
mujeres. Una tabla de probabilidad puede crearse dividiendo cada una de las entradas por el total,
500 trabajadores. Los resultados se ven a continuación:
Género
Hombres (H)
Mujeres (M)
Total
Personal (P)
120/500 = 0.24
50/500 = 0.10
170/500 = 0.34
Línea (L)
150/500 = 0.30
140/500 = 0.28
290/500 = 0.58
Auxiliar (A)
30/500 = 0.06
10/500 = 0.02
40/500 = 0.08
Total
300/500 = 0.60
200/500 = 0.40
500/500 = 1.00
Los valores en los márgenes de la tabla se llaman probabilidades marginales. Por ejemplo, la
probabilidad de seleccionar una trabajador de línea de manera aleatoria es P(L) = 0.58 y la
probabilidad de seleccionar un hombre P(H) = 0.60. Las probabilidades conjuntas en las celdas de
la tabla, muestran la probabilidad de la intersección entre dos eventos. Por ejemplo, la probabilidad
de seleccionar un miembro del personal hombre, es decir, un trabajador que sea parte del personal y
que sea hombre, es P ( H I P ) = 0.24 . Una probabilidad marginal se encuentra como la suma de las
probabilidades conjuntas correspondientes. Por tanto la probabilidad de que sea hombre será:
P ( H ) = P ( H I P ) + P ( H I L ) + P ( H I A ) = 0.24 + 0.30 + 0.06 = 0.60
14
Webster Allen L. Estadística aplicada a los negocios y la economía. McGraw-Hill, México 2000. Páginas 83-84
- 32 -
PROBABILIDAD CONDICIONAL15
La probabilidad condicional, es la probabilidad de que el evento A ocurra, dado que o a condición
de que el evento B ya haya ocurrido. Se denota como P ( A B ) y se lee como “la probabilidad de A
dado B”. Esta es la fórmula general para la probabilidad condicional del evento A dado que el
evento B ya haya ocurrido:
Pobabilid condicioal
de A dado B
P(A B) =
P(A I B)
P (B )
Ejemplo.- Si regresamos a la tabla anterior de trabajadores y quisiéramos calcular la probabilidad
de que el trabajador sea hombre dado que es de personal, entonces usaríamos la fórmula de la
probabilidad condicional de la siguiente manera:
P (H P ) =
P ( H I P ) 0.24
=
= 0.71
P (P )
0.34
AXIOMAS DE PROBABILIDAD16
Existen dos reglas básicas que deben seguirse para calcular la probabilidad de eventos más
complejos: la regla de la multiplicación y la regla de la adición. Cada una se utiliza para propósitos
específicos. La regla de la multiplicación se utiliza para determinar la probabilidad de “A y B”,
P ( A I B ) , y la regla de la adición se utiliza para calcular “A o B”, P ( A U B )
Regla de la multiplicación.- El propósito de esta regla es el de determinar la probabilidad del
evento conjunto P ( A I B ) . El procedimiento exacto depende de si A y B son dependientes o
independientes.
Para eventos independientes la probabilidad de dos eventos se calcula mediante la fórmula
siguiente:
15
Webster Allen L. Estadística aplicada a los negocios y la economía. McGraw-Hill, México 2000. Páginas 84-85
16
Webster Allen L. Estadística aplicada a los negocios y la economía. McGraw-Hill, México 2000. Páginas 86-90
- 33 -
Probabilid ad de eventos independietes
P ( A I B ) = P ( A) X P (B )
Ejemplo.- Calcular la probabilidad de sacar una carta de corazones de una baraja de 52 cartas y
sacar un número par con un dado.
Debido a que estos dos eventos son independientes, simplemente se multiplican sus probabilidades
individuales:
P (C I P ) = P (C ) X P ( P ) = 13 52 X 3 6 = 39 312 = 0.125
Si los eventos son dependientes, entonces, se debe considerar el primer evento al determinar la
probabilidad del segundo. Es decir, la probabilidad del evento B depende de la condición de que A
ya haya ocurrido, por lo que se necesita entonces del principio de probabilidad condicional, por lo
que la fórmula para calcular la probabilidad de dos eventos dependientes será:
Probabilidad de eventos dependientes
P ( A I B ) = P ( A) X P ( B A)
Ejemplo.- Volviendo al ejemplo de la tabla anterior, se puede calcular mediante esta fórmula la
probabilidad de que un empleado seleccionado al azar, sea hombre y personal administrativo.
P (H I P ) = P (H ) X P (P H )
Este último termino es la probabilidad condicional de que el empleado sea del departamento de
personal dado que o a condición de que sea hombre, y se calcula de la siguiente manera:
P (P H ) =
P ( P I H ) 0.24
=
= 0.40
P (H )
0.60
Por lo que:
P ( H I P ) = P ( H ) X P ( P H ) = (0.60) X (0.40) = 0.24
Regla de la adición.- La regla de la adición se utiliza para determinar la probabilidad de A o B,
P ( A U B ) . El procedimiento exacto depende de si A o B son o no son mutuamente excluyentes.
Si los eventos no son mutuamente excluyentes, quiere decir que ambos pueden ocurrir al mismo
tiempo, por lo que se requiere que en la fórmula se reste la probabilidad del evento conjunto. De
- 34 -
acuerdo a estas premisas, la fórmula para calcular la probabilidad de dos eventos cuando estos no
son mutuamente excluyentes, quedará como sigue:
La probabilidad del evento
P ( A U B ) = P ( A) + P (B ) − P ( A I B )
A o B (cuando los eventos
no son mutuamente excluyentes)
Ejemplo.- Siguiendo con la tabla anterior, calcular la probabilidad de que el trabajador escogido al
azar, sea un trabajador hombre o un trabajado de personal.
Debido a que estos eventos son mutuamente excluyentes, ya que si contamos todos los trabajadores
hombres y todos los trabajadores de personal, ocurre que sea trabajador hombre y de personal, por
lo que hay que restarle dicha probabilidad. Por lo tanto el cálculo de la probabilidad se hará de la
siguiente manera:
P ( H U P ) = P (H ) + P ( P ) − P ( H I P ) = (0.60 ) + (0.34 ) − (0.24 ) = 0.70
Si los eventos son mutuamente excluyentes, esto significa que no pueden ocurrir al mismo tiempo,
por lo que entonces la probabilidad conjunta será igual a 0. Entonces la fórmula para el cálculo de la
probabilidad para eventos que son mutuamente excluyentes, estará dada por:
Probabilid ad del evento A
P ( A U B ) = P ( A) + P (B )
o B (cuando los eventos son
mutuamente excluyentes)
Ejemplo.- Siguiendo con los mismos datos de la tabla anterior, calcularemos ahora la probabilidad
de que el trabajador sea de la línea (L) o auxiliar (A).
Ya que en este caso no puede ocurrir los dos eventos al mismo tiempo, o sea que el trabajador sea
de la línea o auxiliar, se trata de dos eventos que son mutuamente excluyentes, por lo tanto el
cálculo de la probabilidad respectiva es:
P ( L U A ) = P ( L ) + P ( A ) = (0.58 ) + (0.08 ) = 0.66
- 35 -
TEOREMA DE BAYES17
El teorema de Bayes es un concepto útil al calcular ciertas probabilidades. Primero escribiremos la
fórmula del teorema, y después mediante un ejemplo se verá la aplicación de la fórmula.
Teorema de Bayes
P(A D) =
P(A I D)
P ( A I D ) + P (B I D )
Ejemplo.- Una compañía manufacturera utiliza dos maquinas para elaborar su producto. La
maquina A produce el 60% de la producción total, y la maquina B el restante 40%. El 2% de las
unidades producidas por A son defectuosas, mientras que las unidades producidas por la maquina B
salen defectuosas en un 4%.
En el diagrama de árbol que se muestra abajo, se pueden ver todas las posibles probabilidades que
acompañan al problema.
17
Webster Allen L. Estadística aplicada a los negocios y la economía. McGraw-Hill, México 2000. Páginas 90-92
- 36 -
Suponiendo que la unidad producida es defectuosa, se desea saber la probabilidad de que provenga
de la máquina A. Aquí es donde se aplica el teorema de Bayes, ya que existen dos formas de que la
unidad sea defectuosa. Puede provenir de la máquina A o de la máquina B, por lo que aplicando el
Teorema de Bayes, la probabilidad sería:
P(A D) =
(0.012 )
P(A I D)
=
= 0.429
P ( A I D ) + P (B I D ) (0.012 ) + (0.016 )
DISTRIBUCIONES DE PROBABILIDAD18
Distribuciones de probabilidad
Distribuciones discretas
Distribución
Binomial
Distribuciones continuas
Distribución
normal
Distribución
de Poisson
La distribución binomial una distribución discreta de probabilidad.- El experimento de lanzar
una moneda tiene sólo dos posibles resultados: (1) águila y (2) sol. La probabilidad de cada uno es
conocida y constante de un lanzamiento al siguiente, y además el experimento puede repetirse
muchas veces. Los experimentos de este tipo siguen una distribución binomial, con base en el
proceso o ensayo de Bernouulli. Una distribución binomial presenta cuatro propiedades:
♦ Solo debe haber dos posibles resultados. A uno lo llamaremos éxito y al otro fracaso.
♦ La probabilidad de un éxito, π , sigue siendo constante de un ensayo al siguiente, al igual que lo
hace la probabilidad de fracaso, 1 − π .
♦ La probabilidad de un éxito en un ensayo es totalmente independiente de cualquier otro ensayo.
♦ El experimento puede repetirse muchas veces.
Si se conoce la probabilidad de que un ensayo determinado producirá un éxito, es posible estimar
cuántos éxitos habrá en un número dado de ensayos, de acuerdo a la siguiente fórmula:
18
Webster Allen L. Estadística aplicada a los negocios y la economía. McGraw-Hill, México 2000. Páginas 104-117
- 37 -
P(x) =
La fórmula
n!
n− x
x
n− x
π x (1 − π ) = n C n (π ) (1 − π )
x! (n − x )!
binomial
Ejemplo.- Un gerente de crédito de Amerucan Express ha descubierto que el 10% de los usuarios
de tarjeta no paga el monto completo de la deuda durante un mes dado. Desea determinar la
probabilidad de que en 20 cuentas seleccionadas aleatoriamente, 5 de la cuentas no sean pagadas.
Esto puede expresarse como P ( x = 5 n = 20,π = 0.10 ) , lo cual se lee como “la probabilidad de
cinco éxitos dado que hay 20 ensayos y la probabilidad de un éxito de cualquier ensayo es del 10%”
La probabilidad de que 5 cuentas de las 20 seleccionadas no paguen su deuda se puede calcular
utilizando la fórmula anterior:
Datos :
n = 20, x = 5 y π = 0.10
20!
(0.10)5 (1 − 0.10)20 − 5 = (15504)(0.00001)(0.2058911) = 0.0319 = 3.19%
P (5 ) =
5! (20 − 5 )!
P (5 )= 20 C 5 (0.10) (0.90) = 0.0319 = 3.19%
5
15
Si la probabilidad de que no se pague una cuenta cualquiera en su totalidad es del 10%, entonces
existe un 3.19% de oportunidad de que exactamente 5 de 20 cuentas seleccionadas no paguen su
saldo.
La distribución de Poisson, una distribución discreta de probabilidad.- La distribución de
Poisson mide la probabilidad de un evento aleatorio sobre algún intervalo de tiempo o espacio.
Son necesarios dos supuestos para la aplicación s de la distribución de Poisson:
♦ La probabilidad de ocurrencia del evento es constante para dos intervalos cualesquiera de
tiempo o espacio.
♦ La ocurrencia del evento en un intervalo es independiente de la ocurrencia de otro intervalo
cualquiera.
Dados estos supuestos, la función de probabilidad de Poisson puede expresarse como:
Función de probbilidad de Poisson
- 38 -
P(x) =
µ x e −µ
x!
Donde:
x = es el númeo de veces que ocurre el evento
µ = es el número promedio de ocurrencias por unidad de tiempo o espacio
e = 2.71828, la base del logaritmo natural
Ejemplo.- Calcular la probabilidad de que exactamente 5 clientes lleguen durante la siguiente hora
( o en cualquiera hora dada) laboral. La observación simple de las últimas 80 horas ha demostrado
que 800 clientes han entrado al negocio.
De acuerdo a estos datos, entonces el promedio de clientes por hora será: µ = 800 80 = 10 , por lo
que entonces y utilizando la fórmula anterior, la probabilidad será:
5
−10
(
10 ) (2.71828 )
P (5 ) =
5!
= 0.0378
LA DISTRIBUCION NORMAL DE
PROBABILIDAD19
Quizá la distribución más importante de probabilidad para describir una variable aleatoria continua
sea la distribución normal de probabilidad. Se ha usado en una gran variedad de aplicaciones
prácticas en las que las variables aleatorias son altura y peso de personas, coeficientes de
inteligencia, precipitaciones, etc. La forma de la distribución normal de probabilidad es la curva
acampanada de la figura siguiente:
19
Webster Allen L. Estadística aplicada a los negocios y la economía. McGraw-Hill, México 2000. Páginas 123-132
- 39 -
Puede existir un número infinito de distribuciones normales posibles, cada una con su propia media
y su desviación estándar. Ya que obviamente no se puede analizar un número tan grande de
posibilidades, es necesario convertir todas estas distribuciones normales a una forma estándar. Esta
conversión a la distribución normal estándar, se efectúa con la fórmula de conversión (o
fórmula Z)
L a desviación normal
o fórmula - Z
Z=
X −µ
σ
en donde Z es la desviación normal y X es algún valor específico de la variable aleatoria. Después
de este proceso de conversión, la media de la distribución es 0 y la desviación estándar es 1. Es
decir, sin considerar lo que valen la media y la desviación estándar, se miden en las unidades
originales en la distribución, después de que se ha aplicado la fórmula de conversión la media es 0 y
la desviación estándar es 1.
Cálculo de probabilidades con la distribución normal.- Estandarizar una distribución normal
permite determinar más fácilmente la probabilidad de que ocurra cierto evento. Como con otras
variables aleatorias continuas, los cálculos de probabilidad con cualquier distribución normal se
llevan a cabo determinando las áreas bajo la curva de la función de densidad de probabilidad. Así,
para determinar la probabilidad de que una variable aleatoria normal esté dentro de un intervalo
específico, debemos calcular el área bajo la curva normal en ese intervalo. Para la distribución
normal estándar de probabilidades se han determinado las áreas bajo la curva normal y se muestran
en la tabla siguiente:
- 40 -
- 41 -
Ejemplo.- Un gran fabricante de ropa , desea estudiar la distribución en la estatura de las personas.
Se supone que si el fabricante fuera a medir las estaturas de todos sus clientes potenciales,
encontrarían que las estaturas están distribuidas normalmente con una media de 67 pulgadas y una
desviación estándar de 2 pulgadas. El personal de la fabrica puede hallar la probabilidad de que un
cliente seleccionado al azar tenga entre 67 y 69 pulgadas de estatura, simplemente hallando el área
que esta bajo la curva normal entre 67 y 69. Es decir, si se conoce el área se conocerá la
probabilidad.
El área relacionada con un valor de Z dado puede hallarse en la tabla anterior . La siguiente figura
ilustra este proceso. Se desea saber el área que está entre 67 y 69. El valor de Z para 69 es:
Z=
69 − 67
= 1.00
2
La tabla proporciona el área bajo la curva desde la media hasta algún valor por encima o por
debajo de ésta. Esta es justamente el área que se quiere. En la tabla, se halla el valor de Z para 1.0.
Se va hacia la derecha a la siguiente columna que comienza con 0.00 para obtener Z = 1.00. Allí se
encontrará la entrada 0.3413. Es decir el 34.13% del área que está bajo la curva está entre 67 y 69
pulgadas. Hay un 34.13% de probabilidad de que un cliente seleccionado aleatoriamente mida entre
67 y 69 pulgadas.
Cálculo de un valor X a partir de una probabilidad conocida.- Algunas veces se puede saber
cuál probabilidad se requiere, y debe determinarse qué valor de X dará dicha probabilidad.
Ejemplo.- Se asume que los asesores económicos del presidente proponen un programa de
bienestar social para ayudar a los desfavorecidos, el cual consta de un pago monetario al 15% de los
más pobres. Entonces surge la pregunta sobre qué nivel de ingresos separa el 15% más pobre del
- 42 -
resto de la gente. En 1996, el ingreso promedio por persona, medido en dólares era de $13,812, con
una desviación estándar de $3,550. Se asume que los ingresos están distribuidos normalmente.
Como se muestra en la figura siguiente, se conoce el área y se busca el valor correspondiente para X
que está representado por un signo de interrogación
En esta oportunidad se tiene un área y se puede utilizar la tabla para buscar el valor correspondiente
de Z. Aunque se está interesado en el valor de 0.15, se busca 0.3500 (0.5-0.15), ya que sólo el área
de la media a algún valor por encima o por debajo de ella está dado en la tabla. Se busca en la
estructura interna de la tabla el área de 0.3500. Lo más próximo que se obtiene es 0.3508, lo que
corresponde a un valor de Z de 1.04. Debido a que
Z=
X −µ
σ
y a que se halló un valor de Z de 1.04, se tiene que
− 1.04 =
X − 13,812
3,550
Cuando se despeja X se encuentra un valor de $10,120, lo que significa que cualquier ingreso de
$10,120 o menos recibirá el subsidio del gobierno.
- 43 -
Aproximación normal a la distribución binomial.20- La distribución binomial involucra una serie
de n ensayos que pueden producir (1) un éxito o (2) un fracaso. La probabilidad de un éxito se
indica como π. Las respuestas pueden calcularse a menudo con la fórmula binomial. Sin embargo si
n es demasiado grande la fórmula puede ser demasiado engorrosa, por lo cual debe diseñarse un
método alternativo. La solución puede hallarse con el uso de la distribución normal para aproximar
la distribución binomial. Esta aproximación se considera lo suficientemente precisa si
nπ ≥ 5 y n(1 − π ) ≥ 5 y si π está próximo a 0.50
Ejemplo.- Se considera un sindicato laboral en el cual el 40% de los miembros está a favor de una
huelga. Si se seleccionan 15 miembros de manera aleatoria, ¿cuál es la probabilidad de que 10
miembros apoyen un paro?
Se puede encontrar el resultado utilizando la fórmula binomial, pero en este caso vamos a usar la
aproximación normal a la binomial. Primero se debe hallar la media µ y la desviación estándar σ de
la distribución normal, de la siguiente manera:
µ = nπ
y
σ = n(π )(1 − π )
En este caso, µ = (15 )(0.40 ) = 6 y σ = 15(0.40 )(0.60 ) = 1.897
Debido a que existe un número infinito de valores posibles en una distribución normal, la
probabilidad de que la variable aleatoria sea exactamente igual a algún valor específico como 10, es
cero. Cuando se utiliza una distribución continua para estimar una variable aleatoria discreta, es
necesario un leve ajuste. Este ajuste, llamado factor de corrección de continuidad, requiere que se
trate la probabilidad de exactamente 10 miembros como el intervalo entre 9.5 miembros y 10.5
miembros. Esto se ilustra en la figura siguiente, la cual muestra las probabilidades para cada valor
de la variable aleatoria (número de miembros) tomada de la tabla de distribución normal.
20
Webster Allen L. Estadística aplicada a los negocios y la economía. McGraw-Hill, México 2000. Páginas 132-133
- 44 -
La probabilidad de que exactamente 10 miembros estén a favor de la huelga está representado por el
área del rectángulo centrado en 10. Vale la pena destacar que el rectángulo se extiende de 9.5 a
10.5. La curva normal está superpuesta sobre los rectángulos.
Utilizando la distribución normal para hallar P (9.5 ≤ X ≤ 10.5 ) , se tiene:
Z=
9 .5 − 6
= 1.85
1.897
con un área de 0.4678
y
Z=
10.5 − 6
= 2.37 con un área de 0.4911
1.897
Entonces, P (9.5 ≤ X ≤ 10.5 ) = 0.4911 − 0.4678 = 0.0233
MUESTREO21
En repetidas ocasiones se ha enfatizado la necesidad de seleccionar una muestra representativa de
la población. Una muestra que tergiverse la población presentará un error de muestreo y producirá
estimados imprecisos de los parámetros de la población.
Hay dos fuentes básicas de error de muestreo. La primera es sencillamente mala suerte. Debido a la
“cuestión suerte”, la muestra puede contener elementos que no sean característicos de la población,
lo resultaría en una sobreestimación del parámetro. O quizás muchos de los elementos muestrales
tienden a ser más pequeños de lo que típicamente se encuentra en la población y en tal caso
resultaría una subestimación.
A continuación se dará una breve explicación de los principales métodos de muestreo:
Muestreo aleatorio simple.- Tomar una muestra aleatoria simple garantiza que cada muestra de
algún tamaño dado tenga la misma probabilidad de ser seleccionada. Se asume que una cadena
nacional de comidas rápidas desea seleccionar aleatoriamente 5 de los 50 estados para tomar
muestras sobre el gusto de los consumidores. Una muestra aleatoria simple garantizará que las
50 C 5 = 2118,760 muestras de tamaño 5 tengan la misma probabilidad de ser utilizadas en el
estudio. Además, también puede utilizarse una tabla de números aleatorios, la cual con frecuencia
21
Anderson, Sweeney, Williams. Estadística para Administración y Economía. Thomson Editores. México 1999.
Páginas 282-283
- 45 -
es generada por un computador y cada uno de los diez dígitos (0-9) tiene una probabilidad igual de
ser seleccionado.
Muestreo sistemático.- Una muestra sistemática se forma seleccionando cada iésimo dato de la
población. Si se determina que i es igual a 10, una muestra sistemática consta de cada décima
observación de la población. La población debe ordenarse o enumerarse en forma aleatoria.
Muestreo estratificado.- En este tipo de muestreo, primero se divide a la población en grupos de
elementos llamados estratos, de tal manera que cada elemento en la población pertenece a uno y
sólo a un estrato. La base de formación de los estratos, por ejemplo, por departamento, ubicación,
edad, etc., queda a discreción de quien diseña la muestra. Sin embargo los mejores resultados se
obtienen cuando los elementos dentro de cada estrato son tan semejantes como sea posible. Después
de formar los estratos se toma una muestra aleatoria simple de cada uno.
Muestreo por conglomerados.- En el muestreo por conglomerados, se divide primero a la
población en conjuntos separados de elementos, llamados conglomerados. Cada elemento de la
población pertenece a uno y sólo a un grupo. A continuación se toma una muestra aleatoria simple
de los conglomerados. El muestreo de conglomerados tiende a proporcionar los mejores resultados
cuando los elementos de los conglomerados son heterogéneos (desiguales).
NUMEROS INDICE22
El uso de números índice puede proporcionar, a quienes toman las decisiones, un panorama más
preciso del comportamiento de las variables económicas a través del tiempo y hacer comparaciones
a través de períodos más significativos. Un número índice relaciona un valor en un período de
tiempo, denominado período base, con un valor en otro período, denominado período de
referencia (o actual).
Los números índices se dividen en dos categorías: índice de precios simple e índice de precios
compuestos.
Indice de precios simple.- Indica el cambio relativo en el precio de un producto o servicio en el
período de referencia, con respecto al período base. Para calcular un índice simple se divide el
precio del producto en el periodo de referencia por su precio en el período base y se multiplica por
100.
Indice de precios simple
22
IP =
pn
X 100
po
Webster Allen L. Estadística aplicada a los negocios y la economía. McGraw-Hill, México 2000. Páginas 436-439
- 46 -
Donde:
p n = Precio de un artículo en el período de referencia
p0 = Precio de un artículo en el período base
Ejemplo.- El precio de la carne de res en 1995 era de $60.00 por kilo, mientras que en 1996 fue de
$66.00 por kilo. Encontrar el índice de precios simple tomando como referencia 1996
Datos :
p0 = 66.00
pn = 60.00
IP =
66.00
X 100 = 110
60.00
Indice de precios compuestos.- Se refieren a un conjunto de elementos o grupo de artículos. Son
interesantes porque regularmente el cambio en el precio o en las cantidades se dan asociadas a
otros. Son tres los índices de precios compuestos que mas se usan: Laspeyres, Paasche y Fisher.
Para el cálculo de estos índices de precios, se utilizarán siempre los siguientes símbolos:
po = Precio de un artículo en el período base.
qo = Cantidad de un artículo en el período base.
pn = Precio de un artículo en el período de referencia.
qn = Cantidad de un artículo en el período de referencia
Indice de Laspeyres
Indice de Paasche
L=
P=
∑(p
∑(p
∑(p
∑(p
- 47 -
qo )
X 100
)
o qo
n
qn )
X 100
)
o qn
n
F = PXL
Indice de Fisher
Ejemplo.- Los precios promedio al consumidor en pesos y las cantidades asociadas a estos en kilos,
para tres artículos en 1999 y 2000 se presentan en la siguiente tabla:
Artículo
Arroz
Lenteja
Frijol
Precio 1999
4.1
3.2
5.0
Precio 2000
8.3
4.5
5.5
Cantidad 1999
1
1
2
Cantidad 2000
1.5
1
1.3
Tomando como base el año 1999 obtenga los índices de Laspeyres, Paasche y Fisher para el 2000.
Identificaremos ahora las variables p0 , q0 , pn y qn , y añadiremos las columnas correspondientes a la
tabla para los cálculos necesarios
Artículo
Arroz
Lenteja
Frijol
Totales
$1999
( po )
4.1
3.2
5.0
$2000
( pn )
8.3
4.5
5.5
Kg.1999
(qo )
1
1
2
Kg.2000
(qn )
1.5
1
1.3
Indice de Laspeyres:
L=
∑ ( p q ) X 100 = 23.8 X 100 = 137.57
17.3
∑(p q )
n o
o o
- 48 -
pnqo
po qo
8.3
4.1
4.5
3.2
11.0
10.0
∑ = 23.8 ∑ = 17.3
pnqn
po qn
12.45
6.15
4.5
3.2
7.15
6.5
∑ = 11.65 ∑ = 15.85
Indice de Paasche:
P=
∑ ( p q ) X 100 = 11.65 X 100 = 73.50
15.85
∑(p q )
n n
o n
Indice de Fisher:
F =
P X L = 73.50 X 137.57 = 100.55
SERIES DE TIEMPO23
El proceso de desarrollar un pronóstico comienza con la recolección de datos anteriores durante
varios períodos. El conjunto de datos resultantes se denomina una serie de tiempo o serie temporal
porque contiene observaciones para alguna variable durante el tiempo. Los períodos de tiempo
varían en duración. Pueden ser anuales, trimestrales, mensuales o incluso diarios. Los períodos de
solo una hora pueden utilizarse para variables altamente volátiles como el precio o para las acciones
transadas en una bolsa de valores.
Los componentes de una serie de tiempo.- El patrón o comportamiento de los datos en una serie
de tiempo tiene diversos componentes. El supuesto normal es que se combinan cuatro componentes
separados: la tendencia, el cíclico, el estacional y el irregular, para definir valores específicos de la
serie de tiempo.
Componente de tendencia.- En el análisis de serie de tiempo, las mediciones pueden efectuarse
cada hora, día, semana, mes o año, o en cualquier otro intervalo regular periódico. Aunque los datos
de serie de tiempo presentan, por lo general, fluctuaciones aleatorias, este serie puede mostrar
también desplazamientos o movimientos graduales hacia valores relativamente mayores o menores
a lo largo de un lapso importante de tiempo. El desplazamiento gradual de la serie de tiempo se
llama tendencia de esa serie; este desplazamiento o tendencia es, por lo común, el resultado de
factores a largo plazo, como cambios en la población, las características demográficas de la misma,
la tecnología y/o las preferencias del consumidor.
23
Anderson, Sweeney, Williams. Estadística para Administración y Economía. Thomson Editores. México 1999.
Páginas 756-758
- 49 -
Componente cíclico.- Aunque una serie de tiempo puede presentar una tendencia a través de
periodos grandes, sus valores no caerán con exactitud sobre la línea de tendencia. De hecho, con
frecuencia estas series temporales presentan secuencias alternas de puntos abajo y arriba de la línea
de tendencia. Toda secuencia recurrente de puntos arriba y debajo de la línea de tendencia, que
duran más de un año, se pueden atribuir a un componente cíclico de la serie.
Componente estacional.- Mientras que la tendencia y los componentes cíclicos de una serie de
tiempo se identifican analizando los movimientos de datos históricos a través de varios años, hay
muchas series de tiempo que muestran un patrón regular dentro de un periodo de un año. Por
ejemplo, un fabricante de albercas inflables espera poca actividad de ventas durante los meses de
otoño e invierno, y máximas ventas en los de primavera y verano. No es de sorprender que el
componente de la serie de tiempo, que representa la variabilidad en los datos, debida a influencias
de las estaciones se llama componente estacional.
Componente irregular.- El componente irregular de la serie de tiempo es el factor residual, “mil
usos” que explica las desviaciones de la serie de tiempo real respecto a los factores determinados
por los efectos de la tendencia y los componentes cíclicos y estacionales. Se debe a factores a corto
plazo, imprevisibles y no recurrentes que afectan a la serie de tiempo.
METODOS DE SUAVIZAMIENTO24
Como el objetivo de los métodos es “suavizar” las fluctuaciones aleatorias causadas por el
componente irregular de la serie de tiempo, se llaman métodos de suavizamiento. Estos son
adecuados para una serie de tiempo estable; esto es, una que no presenta grandes efectos de
tendencia, cíclicos o estacionales, porque se adaptan bien a cambios en el nivel de la serie. Existen
varios métodos de suavizamiento, pero solamente explicaremos el más usado: método de promedios
móviles.
Método de promedios móviles. El método de promedios móviles emplea el promedio de los n
valores más recientes de datos en la serie de tiempo, como pronóstico para el siguiente periodo. El
cálculo matemático del promedio móvil es el siguiente:
Promedio móvil =
∑ (n
valores más recintes de datos )
n
24
Anderson, Sweeney, Williams. Estadística para Administración y Economía. Thomson Editores. México 1999.
Páginas 759-760
- 50 -
se usa el termino “móvil” porque cada vez que se dispone de una nueva observación para la serie de
tiempo, se reemplaza la observación más antigua en la fórmula anterior y se calcula un nuevo
promedio. En consecuencia, el promedio cambia o es mueve, a medida que se dispone de nuevas
observaciones.
Para ilustrar el método de los promedios móviles, examinemos los datos de la tabla siguiente. Esos
datos representan la cantidad de galones de gasolina vendidos por una determinada gasolinera
durante las últimas 12 semanas
Semana
1
2
3
4
5
6
7
8
9
10
11
12
Ventas (miles
de galones)
17
21
19
23
18
16
20
18
22
20
15
22
Para aplicar los promedios móviles en el pronóstico de ventas de gasolina se debe seleccionar
primero la cantidad de valores de datos que se incluyen en el promedio móvil. Por ejemplo,
haremos los cálculos con un promedio móvil de tres semanas. Para las primeras tres semanas de la
serie de ventas de gasolina, el promedio móvil se calcula como sigue:
Promedio móvil (semanas 1-3) =
17 + 21 + 19
= 19
3
A continuación empleamos este promedio móvil como pronóstico para la cuarta semana. Como el
valor real observado de esta semana es 23, el error de pronóstico correspondiente es 23-19=4. En
general, el error asociado con cualquier pronóstico es la diferencia entre el valor observado de la
serie y el pronóstico.
- 51 -
BIBLIOGRAFIA
‰
‰
‰
Anderson Sweeney, Williams, Estadística para administración y economía,
Thomson Editores, México, 1999
Johnson Robert., Kuby, Estadística elemental, Thomson Editores, México, 1999
Webster Allen L., Estadística aplicada a los negocios y la economía, McGrawHill, México, 2000
- 52 -