Download • Víctor Manuel Sirgo Manrique
Transcript
• Víctor Manuel Sirgo Manrique -1- INDICE Tema Página Contenido de la Estadística Población y muestra Variable Distribución de frecuencias para datos no agrupados Distribución de frecuencias para datos agrupados Gráficos Diagrama de tallo y hoja Medidas de tendencia central a partir de datos no agrupados Medidas de dispersión a partir de datos no agrupados Medidas de posición Medidas de tendencia central a partir de datos agrupados Medidas de dispersión a partir de datos agrupados Probabilidad Uniones e intersecciones Técnicas de conteo Permutaciones y combinaciones Tablas de probabilidad Probabilidad condicional Axiomas de probabilidad Teorema de Bayes Distribuciones de probabilidad Distribución Binomial Distribución de Poisson Distribución normal Aproximación normal a la distribución binomial Muestreo Números índice Series de tiempo Métodos de suavizamiento Bibliografía -2- 3 3 5 6 7 11 13 14 17 19 21 24 26 28 29 30 32 33 33 36 37 37 38 39 44 45 46 49 52 51 CONTENIDO DE LA ESTADISTICA1 Estadística.- Es la ciencia de reunir, analizar, presentar e interpretar datos. Descriptiva: La organización y resumen de datos, así como las características de dichos datos (media, desviación estándar). Estadística Teoría de la probabilidad: Nos proporciona una base racional en problemas con factores aleatorios. Inferencial: El análisis e interpretación de muestras, para analizar el comportamiento de poblaciones. POBLACIÓN Y MUESTRA Población : Es el total de los elementos que se estudian. Muestra : Es un conjunto de elementos extraídos de un conjunto mayor (población). 1 Anderson, Sweeney, Williams. Estadística para Administración y Economía. Thomson Editores. México 1999. Págs. 12-15 -3- Población Muestra Estudio de una población Estudio de una muestra Conocimiento exacto Mucho tiempo requerido Alto costo Conocimiento aproximado Rápido Económico Finita.- El numero de elementos es limitado Población Infinita.- El numero de elementos es muy grande Grande.- Convencionalmente 30 o más elementos Muestra Pequeña.- < 30 -4- Variable2: Cualquier propiedad o característica de algún evento, objeto o persona, que puede tener diversos valores en diferentes instantes, según las condiciones. La altura, el peso, el tiempo de reacción y la dosis de un medicamento son ejemplos de variables. Una variable debe contrastarse con una constante, la cual, por supuesto, no tiene diversos valores en diferentes instantes. Un ejemplo de una constante es el símbolo matemático π; el cual siempre tiene el mismo valor (3.1416). Las variables de acuerdo a sus características se pueden clasificar de la siguiente manera: • • • • Variable independiente La variable independiente de un experimento es aquella que es controlada en forma sistemática por el investigador. Por ejemplo, un científico podría estar interesado en el efecto del alcohol sobre el comportamiento social . Para investigar esto, es probable que el investigador varié la cantidad de alcohol y mida sus consecuencias sobre la conducta social de las personas. La cantidad de alcohol es la variable independiente. Variable dependiente La variable dependiente en un experimento es la medida por un investigador para determinar el efecto de la variable independiente. Por ejemplo, en el experimento de los efectos del alcohol, la cantidad de alcohol es la variable independiente. El comportamiento social de los sujetos se mide para ver si es afectado por la cantidad de alcohol consumida. Así, el comportamiento social es la variable dependiente. Variable continua Una variable continua es aquella que puede tomar cualquier valor dentro de un rango dado. El peso, la altura y el tiempo son ejemplos de variables continuas. Variable discreta Una variable discreta es aquella que esta limitada a ciertos valores, generalmente números enteros. Con frecuencia son el resultado de la enumeración o del conteo. El numero de hijos de una familia, la cantidad de estudiantes de una clase, son ejemplos de variables discretas. Datos. Medidas que se realizan sobre los sujetos de un experimento. Por lo general, los datos constan de las medidas de la variable dependiente o de otras características del sujeto, como la edad, el sexo, el numero de individuos, etc. Estadístico Número calculado a partir de los datos de la muestra que cuantifica una característica de ella. Así, el promedio de un conjunto de datos de la muestra seria un estadístico. Parámetro Número calculado sobre los datos de una población, que cuantifica una característica de la población. Por ejemplo, el valor promedio de un conjunto de datos poblacionales se llama parámetro. Debe observarse que el estadístico y el parámetro son conceptos muy similares. La única diferencia es que un estadístico se calcula sobre una muestra y un parámetro se calcula respecto a una población. 2 Webster Allen L. Estadística aplicada a los negocios y la economía. McGraw-Hill, México 2000. Páginas 8-10 -5- DISTRIBUCIÓN DE FRECUENCIAS PARA DATOS NO AGRUPADOS3 Una distribución de frecuencias presenta los valores de los datos y su frecuencia de aparición. Al ser presentados en una tabla, los valores de los datos se enumeran en orden, donde por lo general el valor del dato menor aparece en la parte superior de la tabla. Ordenaremos las calificaciones que aparecen en la siguiente tabla (n =70), en una distribución de frecuencias, la cual aparece en otra tabla inmediatamente después. 95 76 65 67 72 82 87 58 86 82 57 76 79 79 88 96 65 54 81 92 76 63 60 71 84 87 77 82 63 75 93 74 56 77 70 69 72 82 46 76 86 94 72 52 83 89 56 66 62 90 3 80 96 82 76 93 77 78 73 99 74 89 77 70 68 76 81 78 79 93 67 Anderson, Sweeney, Williams. Estadística para Administración y Economía. Thomson Editores. México 1999. Pág. 25 -6- Tabla de frecuencias: Calificación 46 52 54 56 57 58 60 62 63 65 66 67 68 69 70 71 72 73 74 75 TOTAL f 1 1 1 2 1 1 1 1 2 2 1 2 1 1 2 1 3 1 2 1 Calificación 76 77 78 79 80 81 82 83 84 86 87 88 89 90 92 93 94 95 96 99 f 6 4 2 3 1 2 5 1 1 2 2 1 2 1 1 3 1 1 2 1 70 Nótese que la suma de las frecuencias es igual al número de datos n DISTRIBUCIÓN DE FRECUENCIAS PARA DATOS AGRUPADOS4 Distribución de frecuencias .- Es un resumen tabular de un conjunto de datos que muestra la frecuencia (o la cantidad) de artículos en cada una de varias clases que no se traslapan. Una distribución de frecuencias (o tabla de frecuencias), ordenará los datos si estos se dividen en clases y se registrará el número de observaciones de cada clase. 4 Anderson, Sweeney, Williams. Estadística para Administración y Economía. Thomson Editores. México 1999. Págs. 31-32 -7- Resumen de datos cuantitativos.- Como ya se dijo una distribución de frecuencias es un resumen tabular , pero hay que tener mas cuidado para los datos cuantitativos, para lo cual hay que definir los tres pasos necesarios para definir las clases en una distribución de frecuencias con los datos cuantitativos que se dan en la tabla siguiente: 68 72 50 70 65 83 77 78 80 93 71 74 60 84 72 84 73 81 84 92 77 57 70 59 85 74 78 79 91 102 83 67 66 75 79 82 93 90 101 80 79 69 76 94 71 97 95 83 86 69 1. Determinar el número de clases. 2. Determinar el ancho o intervalo de cada clase. 3. Determinar los límites de clase. Número de clases5.- Las clases se forman al especificar los intervalos de los valores de los datos que se usan para agrupar los elementos en el conjunto. El número de clases en una tabla de frecuencias es algo arbitrario. En general, la tabla debería de tener entre 5 y 20 clases. Muy pocas clases no revelarían ningún detalle sobre los datos, y demasiadas clases seria tan confuso como la misma lista de datos originales. Se puede seguir una regla simple para aproximar el número de clases a utilizar, c, es: 2c ≥ n Determina el número de clases en donde n es el número de observaciones. El número de clases es la menor potencia a la cual se eleva 2, de manera que el resultado sea igual o mayor que el número de observaciones. En el ejemplo, se tiene que n = 50 observaciones. Así, 2c ≥ 50 Despejando c, lo cual puede hacerse fácilmente con una calculadora manual, se encuentra que 26 = 64. Esta regla sugiere que debería haber seis clases en la tabla de frecuencias. Por razones de conveniencia, puede utilizarse un número mayor o menor de clases. 5 Webster Allen L. Estadística aplicada a los negocios y la economía. McGraw-Hill, México 2000. Páginas 22-24 -8- Ancho o intervalo de clase. Es el rango de valores encontrados dentro de una clase, y se recomienda que dichos intervalos sean de igual tamaño, por lo tanto, el ancho o intervalo de clase puede determinarse de la siguiente manera: Ancho o intervalo de clase para una tabla de frecuencias valor máximo – valor mínimo IC = cantidad de clases Ya que se decidieron seis clases en el ejemplo, entonces el intervalo de clase se convierte en: IC = 102 − 50 = 8.7 6 Debido a que 8.7 es un número poco práctico, el intervalo o ancho de clase puede ajustarse levemente hacia arriba o hacia abajo. Por razones de conveniencia el intervalo de clase se ajustó a 10. Límites de clase. Se deben de escoger los límites de clase de tal manera que cada dato pertenezca a una clase y solo a una. Por lo tanto y de acuerdo a estos tres pasos, la tabla de frecuencia del ejemplo, quedaría de la siguiente manera: Clase Frecuencia 50 a 59 3 60 a 69 7 70 a 79 18 80 a 89 12 90 a 99 8 100 a 109 2 Totales 50 Distribuciones de frecuencias relativas y de frecuencias porcentuales Una distribución de frecuencias muestra la cantidad (frecuencia f) de datos correspondientes a cada una de varias clases que no se traslapan. Sin embargo, muchas veces nos interesa conocer la proporción, o porcentaje, de los artículos en cada clase. La frecuencia relativa (f.r.) de una clase es -9- la proporción de la cantidad total de datos que pertenecen a esa clase. Para un conjunto de datos con n observaciones, la frecuencia relativa de cada clase se determina mediante la formula: Frecuencia relativa de una clase = Frecuencia de la clase n La frecuencia porcentual (f.r.%) de una clase es la frecuencia relativa multiplicada por 100 Tabla de distribución de frecuencias, frecuencias relativas y porcentuales: Clase Frecuencia Frecuencia relativa Frecuencia porcentual 50 a 59 3 0.06 6.00% 60 a 69 7 0.14 14.00% 70 a 79 18 0.36 36.00% 80 a 89 12 0.24 24.00% 90 a 99 8 0.16 16.00% 100 a 109 2 0.04 4.00% 50 1.00 100.00% Totales Distribuciones acumuladas Una variación de la distribución de frecuencias, que proporciona otro resumen tabular de datos cuantitativos, es la distribución de frecuencias acumuladas. En ella se usa la cantidad de clases, anchos de clase y limites de clase que fueron definidos para la distribución de frecuencias. Sin embargo, mas que mostrar la frecuencia de clase, la distribución de frecuencias acumuladas muestra la cantidad de elementos menores que, o iguales al limite superior de clase para cada clase. En la siguiente tabla se muestra ya con la frecuencia acumulada (f.a.). Clase Frecuencia Frecuencia Frecuencia porcentual acumulada Frecuencia relativa 50 a 59 3 0.06 6.00% 3 60 a 69 7 0.14 14.00% 10 70 a 79 18 0.36 36.00% 28 80 a 89 12 0.24 24.00% 40 90 a 99 8 0.16 16.00% 48 100 a 109 2 0.04 4.00% 50 50 1.00 100.00% Totales - 10 - GRAFICOS6 Gráficas de barra y diagramas de pastel Frecuencia Una gráfica de barras es una forma gráfica de representar datos cualitativos que se han resumido en una distribución de frecuencias, de frecuencias relativas o de porcentuales. En el eje horizontal de la gráfica se especifican los indicadores o nombres que se usan para cada una de las clases. En el eje vertical puede representarse una escala de frecuencias, una de frecuencias relativas o una de porcentuales. Entonces, con una barra de un ancho fijo trazada sobre cada indicador de clase llegamos a la altura que corresponde a la frecuencia, frecuencia relativa o la porcentual de la clase, indicada en el eje vertical. Las barras se separan a fin de señalar que cada clase es una categoría diferente. 20 18 16 14 12 10 8 6 4 2 0 Coke Classic Diet Coke Dr. Pepper PepsiCola Sprite Marca El diagrama de pastel es un método gráfico que se usa mucho para presentar distribuciones de frecuencias relativas de datos cualitativos. Para trazarlo se dibuja primero un círculo, a continuación, con las frecuencias relativas, se divide el circulo en sectores o partes, que corresponden a la frecuencia relativa de cada clase. Por ejemplo, como hay 360° en un círculo, y 6 Webster Allen L. Estadística aplicada a los negocios y la economía. McGraw-Hill, México 2000. Páginas 27-29 - 11 - como Coke Classic tiene .38 de frecuencia relativa, el sector de la gráfica de pastel que le corresponde debe tener .38 x 360 = 136.8 grados. Se efectúan cálculos semejantes para las demás clases. Frecuencia Porcentual 10% Coke Classic Diet Coke Dr. Pepper Pepsi-Cola 38% 26% Sprite 10% 16% Histograma Otra presentación gráfica común de datos cuantitativos es el histograma. Este resumen gráfico se puede preparar con datos que se han resumido anteriormente en una distribución de frecuencias, de frecuencias relativas o de frecuencias porcentuales. Un histograma se traza colocando la variable de interés sobre el eje horizontal y la frecuencia, la frecuencia relativa o la frecuencia porcentual de cada clase trazando un rectángulo cuya base es el intervalo de clase sobre el eje horizontal, y cuya altura es la frecuencia correspondiente. Frecuencia 20 50 - 59 60 - 69 70 - 79 80 - 89 90 - 99 100 - 109 15 10 5 0 Clases - 12 - Ojiva Una gráfica de una distribución acumulada se llama ojiva. Los valores de los datos están en el eje horizontal y las frecuencias acumuladas, frecuencias relativas acumuladas o frecuencias porcentuales acumuladas se muestran en el eje vertical. 55 50 Fre cue ncia a cum ula da 45 40 35 30 25 20 15 10 5 0 50 a 59 60 a 69 70 a 79 80 a 89 90 a 99 100 a 109 Cla se s Diagrama de tallo y hojas Es una forma de mostrar tanto el orden de rangos como la forma de un conjunto de datos, en forma simultanea. Para ilustrar el uso del diagrama de tallo y hojas, considere los siguientes 20 datos: 112, 73, 84, 95, 68, 118, 86, 107, 100, 94, 81, 75, 66, 66, 104, 92, 77, 83, 75 y 69. A fin de desarrollar el diagrama de tallo y hojas con los datos anteriores, primero los ordenamos, de acuerdo con los dígitos iniciales de cada uno, en el lado izquierdo de una línea vertical. A la derecha de esta recta se anota el ultimo - 13 - dígito de cada dato, conforme al orden en que fueron anotadas. El ultimo dígito de cada dato se coloca en el renglón de los primeros dígitos del numero correspondiente. 6 8 6 6 9 7 3 5 7 5 8 4 6 1 3 9 5 4 2 10 7 0 4 11 2 8 MEDIDAS DE TENDENCIA CENTRAL A PARTIR DE DATOS NO AGRUPADOS7 Existen tres métodos comunes para identificar el centro de un conjunto de datos no agrupados: la media, la mediana y la moda. La media o media aritmética, es la medida de tendencia central que usualmente conocemos como promedio. La media de una población es el parámetro µ. Si hay N observaciones en el conjunto de datos de la población, la media se calcula de la siguiente manera: N Media poblacional 7 ∑1 xi x1 + x2 + x3 + .....xN µ = = N N Webster Allen L. Estadística aplicada a los negocios y la economía. McGraw-Hill, México 2000. Páginas 41-46 - 14 - La media de una muestra es un estadístico x , con n observaciones en el conjunto de datos de la muestra, la cual se determina de la siguiente manera: n xi x 1 + x 2 + x 3 + ....... + xn ∑ 1 x = = n n Media muestral Ejemplo.- Se supone que una muestra de los ingresos por ventas mensuales en miles de dólares, para cinco meses es de 56, 67, 52, 45 y 67. ¿Calcular la media? x = 56 + 67 + 52 + 45 + 67 = 57.4 5 La mediana algunas veces es llamada media posicional, porque queda exactamente en la mitad del conjunto de datos, después de que las observaciones se han colocado en serie ordenada. Si el conjunto de datos tiene un número impar de observaciones, la posición de la mediana es: Posición de la mediana = n+1 2 En el ejemplo anterior, si ordenamos los datos nos queda: 45, 52, 56 ,67 ,67 - 15 - Posición de la mediana = 5+1 =3 2 O sea la tercera posición 56 En un conjunto de datos que contiene un número par de observaciones, es necesario promediar los dos valores medios. Si los ingresos para un sexto mes en el ejemplo anterior es 35 y se adiciona al conjunto de datos, entonces la serie ordenada queda de la siguiente manera: 35, 45, 52, 56, 67, 67 Y la posición de la mediana queda: Posición de la mediana = 6 +1 = 3.5 2 Es decir la posición tres y medio, o sea se saca un promedio de la tercera y cuarta posición que son 52 y 56 para sacar el valor de la mediana: 52 + 56 = 54 que es el valor de la mediana 2 La moda es la observación que ocurre con mayor frecuencia. En el ejemplo anterior la moda es 67. Si la séptima observación fuera 56 y se agregara al conjunto de datos, entonces seria una observación bimodal con modas 56 y 67 Ejemplo.- La emisión de la revista Fortune del 17 de Febrero de 1997, reporto que en 1996 las utilidades en millones de dólares de 6 empresas fueron las siguientes: Exxon Philipp Morris Intel 7,510 6,246 5,157 General Electric I.B.M. General Motors ¿Calcular las tres medidas de tendencia central? Media: x = 7,510 + 7,280 + 6,246 + 5,429 + 5,157 + 4,289 = 5,985 6 - 16 - 7,280 5,429 4,289 Mediana: Primero hay que ordenar los datos. 4,289, 5,157, 5,429, 6,246, 7,280, 7,510 la posición de la mediana = n +1 6 +1 = = 3.5 2 2 o sea que hay que sacar el promedio entre la tercera y la cuarta posición 5,429 + 6,246 = 5,837.50 2 Moda: No tiene moda. MEDIDAS DE DISPERSION A PARTIR DE DATOS NO AGRUPADOS8 MEDIDAS DE DISPERSION : Miden que tanto se dispersan las observaciones alrededor de su media, las cuales son: el rango, la varianza y la desviación estándar. Rango.- La medida de dispersión mas simple (y menos útil) es el rango o recorrido. El rango es simplemente la diferencia entre la observación mas alta y la mas baja. Varianza y desviación estándar de una población.- La varianza y su raíz cuadrada, la desviación estándar son medidas de dispersión mucho mas útiles. Proporcionan una medida mas significativa sobre el punto hasta el cual se dispersan las observaciones alrededor de su media. La varianza es el promedio de las observaciones respecto a su media elevadas al cuadrado, la cual se denota como σ2 (se lee como sigma al cuadrado) y esta dada por la siguiente formula: n Varianza poblacional: σ 2 = 8 ( x1 − µ ) + ( x2 − µ ) + ( x3 − µ ) 2 2 2 N + ..... + ( xn − µ ) 2 = ∑x i =1 i N Webster Allen L. Estadística aplicada a los negocios y la economía. McGraw-Hill, México 2000. Páginas 47-52 - 17 - En donde: x1 , x2 , x3 ,....., xn µ N son las observaciones individuales es la media poblacional es el número de observaciones La desviación estándar, es la raíz cuadrada de la varianza, la cual se denota como σ y cuya formula es: Desviación estándar poblacional σ = σ2 Ejemplo.- Una compañía de seguros para automóvil, vende 5 tipos diferentes de pólizas para el Neón 1993. Sus respectivos costos en dólares son: $110, $145, $125, $95 y $150. Calcular la varianza y la desviación estándar. Primero se saca la media: µ= 110 + 145 + 125 + 95 + 150 = $125 5 Después se calculan la varianza y la desviación estándar: σ 2 (110 − 125) = 2 + (145 − 125 ) + (125 − 125 ) + (95 − 125 ) + (150 − 125 ) = 430 5 2 2 2 2 σ = 430 = $20.74 Varianza y desviación estándar para una muestra.- La varianza y desviación estándar para una muestra representan medidas de dispersión alrededor de la media. Se calculan de manera parecida a aquellas para una población. La varianza de la muestra s2 es : Varianza de la muestra s2 ( X − X) ∑ = i n−1 - 18 - 2 y la desviación estándar de la muestra es: Desviación estándar de la muestra s = s2 Medidas de posición.- Son aquellas que nos permiten identificar valores ubicados en diferentes posiciones de un grupo de datos. Estas medidas se conocen como: cuartiles, deciles y percentiles. Los cuartiles (primero, segundo y tercero) señalan el valor que está al 25,50 y 75% de la totalidad de los datos (el segundo cuartil equivale a la mediana). Los deciles (del primero al noveno) marcan el valor ubicado al 10,20,....,80 y 90% de los datos (el quinto decil equivale a la mediana) Los percentiles (del 1 al 99) indican el valor que está al 1,2,........98 y 99% de los datos. Observe que los deciles primero, segundo, etc. Equivalen a los percentiles décimo, vigésimo, etc. Y los cuartiles equivalen a los percentiles 25, 50 y 75. Las fórmulas para obtener estas medidas se presentan a continuación. En ellas se señala entre paréntesis la posición del elemento deseado, siendo n el número de datos. X indica el valor correspondiente a la posición calculada. Cuartiles: ⎛n 1⎞ Q1 = X ⎜ + ⎟ ⎝ 4 2⎠ ⎛ 2* n + Q2 = X ⎜ ⎝ 4 ⎛ 3* n 1⎞ + ⎟ Q3 = X ⎜ 2⎠ ⎝ 4 1⎞ ⎛ n + 1⎞ ⎟ = X⎜ ⎟ = Mediana 2⎠ ⎝ 2 ⎠ - 19 - Deciles: ⎛ n 1⎞ D1 = X ⎜ + ⎟ ⎝ 10 2 ⎠ ⎛ 3* n 1⎞ + ⎟ D3 = X ⎜ 2⎠ ⎝ 10 ⎛ 2* n 1⎞ D2 = X ⎜ + ⎟ 2⎠ ⎝ 10 D4 = etc. Percentiles: 1⎞ ⎛ n + ⎟ P1 = X ⎜ ⎝ 100 2 ⎠ ⎛ 2* n 1⎞ P2 = X ⎜ + ⎟ ⎝ 100 2 ⎠ ⎛ 3* n 1⎞ + ⎟ P3 = X ⎜ ⎝ 100 2 ⎠ P4 = etc. Ejemplo.- determine el valor del tercer cuartil, del cuarto decil y del percentil 17 de los siguientes 26 valores ordenados: 3, 5, 6, 11, 14, 18, 20, 24, 25, 27, 27, 28, 28, 31, 33, 34, 36, 44, 45, 47, 48, 48, 50, 50, y 52 La posición del tercer cuartil es la siguiente: Posición de Q 3 = 3 * 26 1 78 1 + = + = 20 4 2 4 2 El valor que corresponde a la posición 20 es 45, por lo que el tercer cuartil es igual a 45 La posición del cuarto decil es la siguiente: - 20 - Posición de D4 = 4 * 26 1 104 1 + = + = 10.9 10 2 10 2 Para determinar el valor que corresponde a la posición 10.9, debe sumarse al valor de la décima posición (25), nueve décimas de la diferencia entre el valor de la décima posición y el de la decimaprimera posición (27-25 = 2), es decir, 25 + 09 * 2 = 26.8 . El valor del cuarto decil es 26.8 La posición del percentil 17 es la siguiente: Posición de P17 = 17 * 26 1 442 1 + = + = 4.92 100 2 100 2 Para determinar el valor que corresponde a la posición 4.92, debe sumarse al valor de la cuarta posición (11), 92 centésimas de la diferencia entre el valor de la cuarta posición y el de la quinta posición (14 – 11 = 3), es decir, 11 + 0.92 * 3 = 13.76 . El valor del percentil 17 es 13.76 MEDIDAS DE TENDENCIA CENTRAL Y DE DISPERSIÓN A PARTIR DE DATOS AGRUPADOS9 Al trabajar con datos que han sido agrupados en una distribución de frecuencias, no se conoce cuáles son las observaciones individuales. Sin los valores específicos, los procedimientos mostrados anteriormente para calcular las medidas descriptivas, simplemente no se aplican. Deben encontrarse métodos alternativos. Debe tenerse en mente que los cálculos hechos utilizando datos agrupados son sólo aproximaciones. Por tanto, las observaciones individuales no agrupadas deberían utilizarse cuando sea posible. La media.- Al calcular la media de datos agrupados, se supone que las observaciones en cada clase son iguales al punto medio de la clase. Dada esta suposición, se debe de tener en cuenta la frecuencia y los puntos medios de cada clase cuando se calcule la media utilizando datos agrupados. La formula para el calculo de la media es: Media con datos agrupados 9 Xg = ∑ fM = ∑ fM n ∑f Webster Allen L. Estadística aplicada a los negocios y la economía. McGraw-Hill, México 2000. Páginas 53-56 - 21 - en donde: f es la frecuencia o número de observaciones de cada clase M es el punto medio de cada clase n es el tamaño de la muestra y es igual a las frecuencias sumadas en todas las clases Ejemplo.- De acuerdo a la tabla de distribución de frecuencias para datos agrupados vista anteriormente, se va a calcular la media: Clase 50 - 59 60 - 69 70 - 79 80 - 89 90 - 99 100 - 109 Totales Frecuencia (f ) 3 7 18 12 8 2 50 M 54.5 64.5 74.5 84.5 94.5 104.5 fM 163.5 451.5 1341.0 1014.0 756.0 209.0 3935.0 3935 Xg = = 78.7 50 La mediana.- Si se han registrado datos en una tabla de frecuencia, no pueden colocarse en un arreglo ordenado para calcular la mediana, por lo que primero hay que hallar la clase de la mediana de la distribución de frecuencia. La clase de la mediana es la clase cuya frecuencia acumulada es mayor que o igual a n 2 . Mediana para datos agrupados ⎡n 2 − F ⎤ xˆ g = Lmd + ⎢ ⎥ (C ) ⎣ f md ⎦ - 22 - En donde: Lmd F f md C es el límite inferior de la clase de la mediana es la frecuencia acumulada de la clase que antecede a la clase de la mediana es la frecuencia de la clase de la mediana es el intervalo de clase de la clase de la mediana Siguiendo con el ejemplo anterior, ahora hallaremos cual es la clase de la mediana en la tabla de distribución de frecuencias: Debido a que n es 50, se necesita localizar la primera clase con una frecuencia acumulada de 25 o más, por lo que la tercera clase será la clase de la mediana. Clase 50 - 59 60 - 69 70 - 79 80 - 89 90 - 99 100 - 109 Totales Frecuencia (f) 3 7 18 12 8 2 50 M fM 54.5 64.5 74.5 84.5 94.5 104.5 F 163.5 451.5 1341.0 1014.0 756.0 209.0 3935.0 3 10 28 40 48 50 Por lo que la mediana se obtiene mediante la formula anterior: ⎡ 50 2 − 10 ⎤ xˆ g = 70 + ⎢ ⎥ (10 ) = 78.33 ⎣ 18 ⎦ La moda.- Ya que por definición la moda es la observación que ocurre con mayor frecuencia, esta se hallará en la clase que tenga la frecuencia más alta, llamada la clase modal. Para estimar la moda en el caso de datos agrupados, se utiliza la siguiente formula: Moda para datos agrupados ⎡ Da ⎤ x~ = Lmo + ⎢ ⎥ (C ) ⎣ Db + Da ⎦ - 23 - En donde: Lmo Da Db C es el límite inferior de la clase modal. es la diferencia entre la frecuencia de la clase modal y la clase que le antecede es la diferencia entre la frecuencia de la clase modal y la clase que le sigue es el intervalo de clase de la clase modal Por lo tanto, y de acuerdo a lo anterior, en este ejemplo la clase modal es la misma que la de la clase de la mediana Clase 50 - 59 60 - 69 70 - 79 80 - 89 90 - 99 100 - 109 Totales Frecuencia (f) 3 7 18 12 8 2 50 M fM 54.5 64.5 74.5 84.5 94.5 104.5 F 163.5 451.5 1341.0 1014.0 756.0 209.0 3935.0 3 10 28 40 48 50 Y la moda quedará como sigue: ⎡ 18 − 7 ⎤ x~ g = 70 + ⎢ ⎥ (10 ) = 76.47 ( ) ( ) 18 − 12 + 18 − 7 ⎣ ⎦ Varianza y desviación estándar.- Si los datos están agrupados en una tabla de frecuencias, la varianza y la desviación estándar pueden calcularse mediante las siguientes formulas: Varianza para datos agrupados sg 2 ∑ fM = y - 24 - − nx 2 n−1 2 sg = s2 Desviación estándar para datos agrupados Por lo que, y siguiendo con el ejemplo anterior, a la tabla de distribución de frecuencias, 2 2 habría que agregarle dos nuevas columnas, M y fM : Clase Frecuencia (f) 50 - 59 60 - 69 70 - 79 80 - 89 90 - 99 100 - 109 Totales M 3 7 18 12 8 2 50 fM 54.5 64.5 74.5 84.5 94.5 104.5 163.5 451.5 1341.0 1014.0 756.0 209.0 3935.0 M2 F 3 10 28 40 48 50 2,970.25 4,160.25 5,550.25 7,140.25 8,930.25 10,920.25 fM 2 8,910.75 29,121.75 99,904.50 85,683.00 71,442.00 21,840.50 316,902.50 Entonces, la varianza y la desviación estándar quedarían: 316,902.50 − 50(78.7 ) = = 147.31 50 − 1 2 sg 2 s g = 147.31 = 12.14 Coeficiente de variación.- El coeficiente de variación (CV) es una sencilla medida que permite comparar el grado de dispersión de un conjunto de datos relativo a su media. Se calcula dividiendo la desviación estándar de una distribución por su media y multiplicando por 100. Coeficiente de variación CV = sg xg (100) Por lo que, y siguiendo con el ejemplo anterior, el coeficiente de variación será: - 25 - CV = 12.14 (100) = 15.43 78.70 Sesgo.- La asimetría o sesgo de una distribución de frecuencias expresa su deformación respecto al eje vertical y puede medirse mediante el coeficiente de sesgo de Pearson. Coeficiente de sesgo P= 3( x g − xˆ g ) sg Si P < 0 , los datos están sesgados a la izquierda, si P > 0 , entonces están sesgados a la derecha; si P = 0 están distribuidos normalmente. Utilizando el ejemplo anterior nuevamente, el coeficiente de sesgo será: P= 3(78.7 − 78.3) = 0.03 12.14 Por lo que los datos están sesgados a la derecha. PROBABILIDAD10 La probabilidad es la posibilidad numérica de que ocurra un evento. La probabilidad de un evento es medida por valores comprendidos entere 0 y 1: P(evento cierto) = 1 P(evento imposible) = 0 Por tanto: 0 ≤ P ( E i ) ≤ 1 , en donde Ei es algún evento El proceso que produce un evento es denominado experimento. Un experimento es toda acción bien definida que conlleva a un resultado único bien definido. El conjunto de todos los posibles resultados para un experimento es el espacio muestral. El espacio muestral de lanzar un dado es: 10 Webster Allen L. Estadística aplicada a los negocios y la economía. McGraw-Hill, México 2000. Páginas 76-80 - 26 - ss = (1,2,3,4,5,6 ) y para una moneda: ss = (águila, sol ) La probabilidad de que al menos uno de los eventos que están en el espacio muestral ocurra es igual a 1. Si se lanza un dado, el resultado debe ser un número entre 1 y 6. Debido a que esto es una certeza puede decirse que: ∑ P (E ) = 1 i MODELOS DE PROBABILIDAD.- Existen solamente tres modelos generalmente aceptados: 1. Modelo de frecuencia relativa (a posteriori). 2. Modelo subjetivo. 3. Modelo clásico (a priori). El modelo de frecuencia relativa utiliza datos que se han observado empíricamente, registra la frecuencia con que ha ocurrido algún evento en el pasado y estima la probabilidad de que el evento ocurra nuevamente con base en estos datos históricos. La probabilidad de un evento con base en el modelo de frecuencia relativa se determina mediante: Fecuencia relativa P ( E ) = Número de veces que ha ocurrido el evento en el pasado Número de observaciones Por ejemplo, asumiendo que durante el año anterior hubo 50 nacimientos en un hospital, de los cuales 32 eran niñas. El modelo de frecuencia relativa revela que la probabilidad de que el siguiente nacimiento sea una niña es: P (niña ) = Número de niñas que nació el año anterior 32 = = 0.64 Número total de nacimientos 50 El modelo subjetivo se utiliza cuando se desea asignar probabilidad a un evento que nunca ha ocurrido. La probabilidad de que una mujer sea elegida como presidente en México, es un ejemplo. Debido a que no hay datos sobre los cuales confiar, se obtendrá una estimación subjetiva. - 27 - De los tres métodos para medir la probabilidad, el modelo clásico es el que se relaciona con mayor frecuencia con las apuestas y juegos de azar. La probabilidad clásica de un evento se determina mediante: Modelo clásico P (E ) = Número de formas en las que puede ocurir un evento Número total de posibles resultados La probabilidad clásica implica la determinación de algún evento a priori (antes del hecho). Por tanto, antes de sacar una carta de una baraja de 52 cartas, se puede determinar que la probabilidad de sacar un as es: P (as ) = Número de formas en las que el evento puede ocurrir 4 = = 0.077 Número total de posibles resultados 52 UNIONES, INTERSECCIONES Y RELACIONES ENTRE EVENTOS11.- Un conjunto es toda reunión de objetos. Si se han identificado dos conjuntos A y B, es completamente posible que algunos elementos estén en ambos conjuntos. Por ejemplo, se asume que el conjunto A consta de todos los estudiantes de la clase de estadística, y el conjunto B consta de todos los estudiantes de la carrera de Mercadotecnia. Aquellos elementos (estudiantes) que estén en ambos conjuntos constituyen la intersección entre A y B. La intersección entre A y B, que se escribe A I B y se lee como “A intersección B”, consta de los elementos que son comunes tanto a A como a B. Intersección entre A y B: Es el conjunto de todos los elementos que están tanto en A como en B Para que ocurra A I B , tanto “A como B” deben ocurrir. El estudiante debe estar en la clase de estadística y en la carrera de Mercadotecnia. La unión de A y B, que se escribe A U B y se lee “A unión B”, consta de tales elementos que están o en A o en B o en ambos. La unión de A y B: Es el conjunto de todos los elementos que están en A o en B 11 Webster Allen L. Estadística aplicada a los negocios y la economía. McGraw-Hill, México 2000. Páginas 80-82 - 28 - Eventos mutuamente excluyentes.- Dos eventos son mutuamente excluyentes si la ocurrencia de uno prohibe la ocurrencia del otro. Un ejemplo clásico de eventos mutuamente excluyentes es el de sacar un águila o un sol al lanzar una moneda una vez. Si sale un águila, no puede ocurrir que salga un sol. Eventos colectivamente exhaustivos.- Son aquellos que constan de todos los posibles resultados de un experimento y constituyen su espacio muestral. Los eventos colectivamente exhaustivos de lanzar un dado son 1, 2, 3, 4, 5 y 6. Además, debido a que existe la certeza de que uno de los eventos ocurrirá, su probabilidad combinada será igual a uno: P (1 ó 2 ó 3 ó 4 ó 5 ó 6 ) = 1 Eventos independientes.- Son aquellos eventos en que la ocurrencia de uno no tiene que ver con la ocurrencia del otro. Algunos ejemplos incluyen el resultado de un lanzamiento de una moneda y la de un dado, el resultado del lanzamiento de una moneda no afecta al dado. Eventos complementarios.- Son los eventos en los que si un evento no ocurre, el otro debe ocurrir y se escribe como A , y se denomina “no A”. P ( A) + P ( A ) = 1 P ( A) = 1 − P ( A ) TECNICAS DE CONTEO12 Para encontrar la probabilidad de muchos eventos es necesario determinar el número de resultados posibles del experimento implicado. El determinar el número de resultados posibles se conoce como conteo. Regla de la multiplicación.- Para poder conocer el total de resultados posibles de un experimento que esta integrado por dos ensayos, donde uno de ellos posee m resultados posibles y el otro tiene n resultados posibles, entonces el número de resultados posibles esta dado por: mxn Que se conoce como “El principio fundamental de conteo”. Si el experimento esta compuesto por k ensayos realizados en un orden definido, donde el primero tiene n1 resultados posibles, el segundo posee n2 resultados, el tercero tiene n3 resultados posibles, entonces el número total de resultados posibles esta dado por: 12 Johnson Robert, Kuby Patricia. Estadística elemental. Thomson editores. México, 1999. Páginas 461-463 - 29 - n1 x n2 x n3 x ............................x n k Que se conoce como “El principio general de conteo”. Ejemplo 1 : Un vendedor de automóviles ofrece uno de sus modelos compactos con dos opciones de transmisión (estándar o automática) y en uno de tres colores (negro, rojo o blanco). ¿Cuántas elecciones posibles de transmisión y color son posibles? Por el principio fundamental de conteo, tenemos: m = 2 (opciones de transmisión) n = 3 (opciones de color) Por lo tanto el número total de resultados posibles será: mxn=3x2=6 Ejemplo 2.- En muchos estados de la Unión Americana, se usan tres letras seguidas de tres dígitos, para elaborar las placas de los automóviles. Si se pueden usar cualquiera de las 26 letras del alfabeto y cualquier dígito del 0 al 9. ¿Cuántos números de placas diferentes son posibles? Para la primera letra hay 26 opciones posibles (n1 = 26), 26 para la segunda (n2 = 26) y 26 para la tercera (n3 = 26). De igual forma hay 10 opciones posibles para el primer dígito (n4 = 10), 10 para el segundo (n5 = 10) y 10 para el tercero (n6 = 10). En consecuencia y de acuerdo al principio general de conteo, tenemos: n1 x n 2 x n 3 x n 4 x n 5 x n6 resultados posibles 26 * 26 * 26 * 10 * 10 * 10 = 17,576,00 números de placas. PERMUTACIONES Y COMBINACIONES13 Permutaciones.- Cuando se elige más de un artículo (sin reemplazo) de una sola categoría y el orden de selección es importante, los diversos resultados posibles reciben el nombre de permutaciones. Por ejemplo, cuando se anuncian el primero, segundo y tercer lugar de un concurso, el orden de elección es importante. El número de permutaciones, o arreglos, de r artículos elegidos sin reemplazo de un conjunto de n artículos (r ≤ n ) , el cual se denota n Pr , esta dado por la siguiente formula: 13 Webster Allen L. Estadística aplicada a los negocios y la economía. McGraw-Hill, México 2000. Páginas 93-95 - 30 - Pr = n n! (n − r )! Las permutaciones se emplean siempre que se elija más de un artículo (sin reemplazo) de un conjunto de artículos y si el orden de selección si es importante. Ejemplo.- Una liga de boliche está conformada por diez equipos. ¿De cuántas formas diferentes pueden acomodarse los equipos al final del torneo? (No se admiten empates) En virtud de que el orden si tiene importancia, calcularemos entonces el número de permutaciones de diez artículos ( r ), tomados de un conjunto de 10 artículos ( n ): 10 P10 = 10! = 3,628.800 (10 − 10)! recuerde que 0! es igual a 1 Combinaciones.- Cuando al elegir los artículos de un conjunto total y el orden no es importante, los posibles resultados se denominan combinaciones. El número de combinaciones, o arreglos, de r artículos, elegidos sin reemplazo de un conjunto de n artículos (r ≤ n ) , el cual se denota n C r , esta dado por la siguiente formula: Cr = n n! r ! (n − r )! Las combinaciones se emplean siempre que se eligen uno o más artículos (sin reemplazo) de un conjunto de artículos, y si el orden de selección no es importante. Ejemplo.- ¿Cuántas combinaciones son posibles en el concurso Mélate, si se tienen que escoger 6 números diferentes de un total de 49 números? Como el orden no es importante, calcularemos entonces las combinaciones posibles para escoger 6 números ( r ), de un total de 49 números (n): - 31 - C 6= 49 49! = 13,983,816 6! (49 − 6)! TABLAS DE PROBABILIDAD14 Las Tablas de probabilidad son útiles al calcular la probabilidad de eventos. Pongamos por ejemplo la siguiente tabla de los empleados de cierta compañía, en cuanto a género y clasificación: Género Hombres (H) Mujeres (M) Total Personal (P) 120 50 170 Línea (L) 150 140 290 Auxiliar (A) 30 10 40 Total 300 200 500 La tabla muestra por ejemplo que de los 170 miembros del personal (P), 120 son hombres y 50 son mujeres. Una tabla de probabilidad puede crearse dividiendo cada una de las entradas por el total, 500 trabajadores. Los resultados se ven a continuación: Género Hombres (H) Mujeres (M) Total Personal (P) 120/500 = 0.24 50/500 = 0.10 170/500 = 0.34 Línea (L) 150/500 = 0.30 140/500 = 0.28 290/500 = 0.58 Auxiliar (A) 30/500 = 0.06 10/500 = 0.02 40/500 = 0.08 Total 300/500 = 0.60 200/500 = 0.40 500/500 = 1.00 Los valores en los márgenes de la tabla se llaman probabilidades marginales. Por ejemplo, la probabilidad de seleccionar una trabajador de línea de manera aleatoria es P(L) = 0.58 y la probabilidad de seleccionar un hombre P(H) = 0.60. Las probabilidades conjuntas en las celdas de la tabla, muestran la probabilidad de la intersección entre dos eventos. Por ejemplo, la probabilidad de seleccionar un miembro del personal hombre, es decir, un trabajador que sea parte del personal y que sea hombre, es P ( H I P ) = 0.24 . Una probabilidad marginal se encuentra como la suma de las probabilidades conjuntas correspondientes. Por tanto la probabilidad de que sea hombre será: P ( H ) = P ( H I P ) + P ( H I L ) + P ( H I A ) = 0.24 + 0.30 + 0.06 = 0.60 14 Webster Allen L. Estadística aplicada a los negocios y la economía. McGraw-Hill, México 2000. Páginas 83-84 - 32 - PROBABILIDAD CONDICIONAL15 La probabilidad condicional, es la probabilidad de que el evento A ocurra, dado que o a condición de que el evento B ya haya ocurrido. Se denota como P ( A B ) y se lee como “la probabilidad de A dado B”. Esta es la fórmula general para la probabilidad condicional del evento A dado que el evento B ya haya ocurrido: Pobabilid condicioal de A dado B P(A B) = P(A I B) P (B ) Ejemplo.- Si regresamos a la tabla anterior de trabajadores y quisiéramos calcular la probabilidad de que el trabajador sea hombre dado que es de personal, entonces usaríamos la fórmula de la probabilidad condicional de la siguiente manera: P (H P ) = P ( H I P ) 0.24 = = 0.71 P (P ) 0.34 AXIOMAS DE PROBABILIDAD16 Existen dos reglas básicas que deben seguirse para calcular la probabilidad de eventos más complejos: la regla de la multiplicación y la regla de la adición. Cada una se utiliza para propósitos específicos. La regla de la multiplicación se utiliza para determinar la probabilidad de “A y B”, P ( A I B ) , y la regla de la adición se utiliza para calcular “A o B”, P ( A U B ) Regla de la multiplicación.- El propósito de esta regla es el de determinar la probabilidad del evento conjunto P ( A I B ) . El procedimiento exacto depende de si A y B son dependientes o independientes. Para eventos independientes la probabilidad de dos eventos se calcula mediante la fórmula siguiente: 15 Webster Allen L. Estadística aplicada a los negocios y la economía. McGraw-Hill, México 2000. Páginas 84-85 16 Webster Allen L. Estadística aplicada a los negocios y la economía. McGraw-Hill, México 2000. Páginas 86-90 - 33 - Probabilid ad de eventos independietes P ( A I B ) = P ( A) X P (B ) Ejemplo.- Calcular la probabilidad de sacar una carta de corazones de una baraja de 52 cartas y sacar un número par con un dado. Debido a que estos dos eventos son independientes, simplemente se multiplican sus probabilidades individuales: P (C I P ) = P (C ) X P ( P ) = 13 52 X 3 6 = 39 312 = 0.125 Si los eventos son dependientes, entonces, se debe considerar el primer evento al determinar la probabilidad del segundo. Es decir, la probabilidad del evento B depende de la condición de que A ya haya ocurrido, por lo que se necesita entonces del principio de probabilidad condicional, por lo que la fórmula para calcular la probabilidad de dos eventos dependientes será: Probabilidad de eventos dependientes P ( A I B ) = P ( A) X P ( B A) Ejemplo.- Volviendo al ejemplo de la tabla anterior, se puede calcular mediante esta fórmula la probabilidad de que un empleado seleccionado al azar, sea hombre y personal administrativo. P (H I P ) = P (H ) X P (P H ) Este último termino es la probabilidad condicional de que el empleado sea del departamento de personal dado que o a condición de que sea hombre, y se calcula de la siguiente manera: P (P H ) = P ( P I H ) 0.24 = = 0.40 P (H ) 0.60 Por lo que: P ( H I P ) = P ( H ) X P ( P H ) = (0.60) X (0.40) = 0.24 Regla de la adición.- La regla de la adición se utiliza para determinar la probabilidad de A o B, P ( A U B ) . El procedimiento exacto depende de si A o B son o no son mutuamente excluyentes. Si los eventos no son mutuamente excluyentes, quiere decir que ambos pueden ocurrir al mismo tiempo, por lo que se requiere que en la fórmula se reste la probabilidad del evento conjunto. De - 34 - acuerdo a estas premisas, la fórmula para calcular la probabilidad de dos eventos cuando estos no son mutuamente excluyentes, quedará como sigue: La probabilidad del evento P ( A U B ) = P ( A) + P (B ) − P ( A I B ) A o B (cuando los eventos no son mutuamente excluyentes) Ejemplo.- Siguiendo con la tabla anterior, calcular la probabilidad de que el trabajador escogido al azar, sea un trabajador hombre o un trabajado de personal. Debido a que estos eventos son mutuamente excluyentes, ya que si contamos todos los trabajadores hombres y todos los trabajadores de personal, ocurre que sea trabajador hombre y de personal, por lo que hay que restarle dicha probabilidad. Por lo tanto el cálculo de la probabilidad se hará de la siguiente manera: P ( H U P ) = P (H ) + P ( P ) − P ( H I P ) = (0.60 ) + (0.34 ) − (0.24 ) = 0.70 Si los eventos son mutuamente excluyentes, esto significa que no pueden ocurrir al mismo tiempo, por lo que entonces la probabilidad conjunta será igual a 0. Entonces la fórmula para el cálculo de la probabilidad para eventos que son mutuamente excluyentes, estará dada por: Probabilid ad del evento A P ( A U B ) = P ( A) + P (B ) o B (cuando los eventos son mutuamente excluyentes) Ejemplo.- Siguiendo con los mismos datos de la tabla anterior, calcularemos ahora la probabilidad de que el trabajador sea de la línea (L) o auxiliar (A). Ya que en este caso no puede ocurrir los dos eventos al mismo tiempo, o sea que el trabajador sea de la línea o auxiliar, se trata de dos eventos que son mutuamente excluyentes, por lo tanto el cálculo de la probabilidad respectiva es: P ( L U A ) = P ( L ) + P ( A ) = (0.58 ) + (0.08 ) = 0.66 - 35 - TEOREMA DE BAYES17 El teorema de Bayes es un concepto útil al calcular ciertas probabilidades. Primero escribiremos la fórmula del teorema, y después mediante un ejemplo se verá la aplicación de la fórmula. Teorema de Bayes P(A D) = P(A I D) P ( A I D ) + P (B I D ) Ejemplo.- Una compañía manufacturera utiliza dos maquinas para elaborar su producto. La maquina A produce el 60% de la producción total, y la maquina B el restante 40%. El 2% de las unidades producidas por A son defectuosas, mientras que las unidades producidas por la maquina B salen defectuosas en un 4%. En el diagrama de árbol que se muestra abajo, se pueden ver todas las posibles probabilidades que acompañan al problema. 17 Webster Allen L. Estadística aplicada a los negocios y la economía. McGraw-Hill, México 2000. Páginas 90-92 - 36 - Suponiendo que la unidad producida es defectuosa, se desea saber la probabilidad de que provenga de la máquina A. Aquí es donde se aplica el teorema de Bayes, ya que existen dos formas de que la unidad sea defectuosa. Puede provenir de la máquina A o de la máquina B, por lo que aplicando el Teorema de Bayes, la probabilidad sería: P(A D) = (0.012 ) P(A I D) = = 0.429 P ( A I D ) + P (B I D ) (0.012 ) + (0.016 ) DISTRIBUCIONES DE PROBABILIDAD18 Distribuciones de probabilidad Distribuciones discretas Distribución Binomial Distribuciones continuas Distribución normal Distribución de Poisson La distribución binomial una distribución discreta de probabilidad.- El experimento de lanzar una moneda tiene sólo dos posibles resultados: (1) águila y (2) sol. La probabilidad de cada uno es conocida y constante de un lanzamiento al siguiente, y además el experimento puede repetirse muchas veces. Los experimentos de este tipo siguen una distribución binomial, con base en el proceso o ensayo de Bernouulli. Una distribución binomial presenta cuatro propiedades: ♦ Solo debe haber dos posibles resultados. A uno lo llamaremos éxito y al otro fracaso. ♦ La probabilidad de un éxito, π , sigue siendo constante de un ensayo al siguiente, al igual que lo hace la probabilidad de fracaso, 1 − π . ♦ La probabilidad de un éxito en un ensayo es totalmente independiente de cualquier otro ensayo. ♦ El experimento puede repetirse muchas veces. Si se conoce la probabilidad de que un ensayo determinado producirá un éxito, es posible estimar cuántos éxitos habrá en un número dado de ensayos, de acuerdo a la siguiente fórmula: 18 Webster Allen L. Estadística aplicada a los negocios y la economía. McGraw-Hill, México 2000. Páginas 104-117 - 37 - P(x) = La fórmula n! n− x x n− x π x (1 − π ) = n C n (π ) (1 − π ) x! (n − x )! binomial Ejemplo.- Un gerente de crédito de Amerucan Express ha descubierto que el 10% de los usuarios de tarjeta no paga el monto completo de la deuda durante un mes dado. Desea determinar la probabilidad de que en 20 cuentas seleccionadas aleatoriamente, 5 de la cuentas no sean pagadas. Esto puede expresarse como P ( x = 5 n = 20,π = 0.10 ) , lo cual se lee como “la probabilidad de cinco éxitos dado que hay 20 ensayos y la probabilidad de un éxito de cualquier ensayo es del 10%” La probabilidad de que 5 cuentas de las 20 seleccionadas no paguen su deuda se puede calcular utilizando la fórmula anterior: Datos : n = 20, x = 5 y π = 0.10 20! (0.10)5 (1 − 0.10)20 − 5 = (15504)(0.00001)(0.2058911) = 0.0319 = 3.19% P (5 ) = 5! (20 − 5 )! P (5 )= 20 C 5 (0.10) (0.90) = 0.0319 = 3.19% 5 15 Si la probabilidad de que no se pague una cuenta cualquiera en su totalidad es del 10%, entonces existe un 3.19% de oportunidad de que exactamente 5 de 20 cuentas seleccionadas no paguen su saldo. La distribución de Poisson, una distribución discreta de probabilidad.- La distribución de Poisson mide la probabilidad de un evento aleatorio sobre algún intervalo de tiempo o espacio. Son necesarios dos supuestos para la aplicación s de la distribución de Poisson: ♦ La probabilidad de ocurrencia del evento es constante para dos intervalos cualesquiera de tiempo o espacio. ♦ La ocurrencia del evento en un intervalo es independiente de la ocurrencia de otro intervalo cualquiera. Dados estos supuestos, la función de probabilidad de Poisson puede expresarse como: Función de probbilidad de Poisson - 38 - P(x) = µ x e −µ x! Donde: x = es el númeo de veces que ocurre el evento µ = es el número promedio de ocurrencias por unidad de tiempo o espacio e = 2.71828, la base del logaritmo natural Ejemplo.- Calcular la probabilidad de que exactamente 5 clientes lleguen durante la siguiente hora ( o en cualquiera hora dada) laboral. La observación simple de las últimas 80 horas ha demostrado que 800 clientes han entrado al negocio. De acuerdo a estos datos, entonces el promedio de clientes por hora será: µ = 800 80 = 10 , por lo que entonces y utilizando la fórmula anterior, la probabilidad será: 5 −10 ( 10 ) (2.71828 ) P (5 ) = 5! = 0.0378 LA DISTRIBUCION NORMAL DE PROBABILIDAD19 Quizá la distribución más importante de probabilidad para describir una variable aleatoria continua sea la distribución normal de probabilidad. Se ha usado en una gran variedad de aplicaciones prácticas en las que las variables aleatorias son altura y peso de personas, coeficientes de inteligencia, precipitaciones, etc. La forma de la distribución normal de probabilidad es la curva acampanada de la figura siguiente: 19 Webster Allen L. Estadística aplicada a los negocios y la economía. McGraw-Hill, México 2000. Páginas 123-132 - 39 - Puede existir un número infinito de distribuciones normales posibles, cada una con su propia media y su desviación estándar. Ya que obviamente no se puede analizar un número tan grande de posibilidades, es necesario convertir todas estas distribuciones normales a una forma estándar. Esta conversión a la distribución normal estándar, se efectúa con la fórmula de conversión (o fórmula Z) L a desviación normal o fórmula - Z Z= X −µ σ en donde Z es la desviación normal y X es algún valor específico de la variable aleatoria. Después de este proceso de conversión, la media de la distribución es 0 y la desviación estándar es 1. Es decir, sin considerar lo que valen la media y la desviación estándar, se miden en las unidades originales en la distribución, después de que se ha aplicado la fórmula de conversión la media es 0 y la desviación estándar es 1. Cálculo de probabilidades con la distribución normal.- Estandarizar una distribución normal permite determinar más fácilmente la probabilidad de que ocurra cierto evento. Como con otras variables aleatorias continuas, los cálculos de probabilidad con cualquier distribución normal se llevan a cabo determinando las áreas bajo la curva de la función de densidad de probabilidad. Así, para determinar la probabilidad de que una variable aleatoria normal esté dentro de un intervalo específico, debemos calcular el área bajo la curva normal en ese intervalo. Para la distribución normal estándar de probabilidades se han determinado las áreas bajo la curva normal y se muestran en la tabla siguiente: - 40 - - 41 - Ejemplo.- Un gran fabricante de ropa , desea estudiar la distribución en la estatura de las personas. Se supone que si el fabricante fuera a medir las estaturas de todos sus clientes potenciales, encontrarían que las estaturas están distribuidas normalmente con una media de 67 pulgadas y una desviación estándar de 2 pulgadas. El personal de la fabrica puede hallar la probabilidad de que un cliente seleccionado al azar tenga entre 67 y 69 pulgadas de estatura, simplemente hallando el área que esta bajo la curva normal entre 67 y 69. Es decir, si se conoce el área se conocerá la probabilidad. El área relacionada con un valor de Z dado puede hallarse en la tabla anterior . La siguiente figura ilustra este proceso. Se desea saber el área que está entre 67 y 69. El valor de Z para 69 es: Z= 69 − 67 = 1.00 2 La tabla proporciona el área bajo la curva desde la media hasta algún valor por encima o por debajo de ésta. Esta es justamente el área que se quiere. En la tabla, se halla el valor de Z para 1.0. Se va hacia la derecha a la siguiente columna que comienza con 0.00 para obtener Z = 1.00. Allí se encontrará la entrada 0.3413. Es decir el 34.13% del área que está bajo la curva está entre 67 y 69 pulgadas. Hay un 34.13% de probabilidad de que un cliente seleccionado aleatoriamente mida entre 67 y 69 pulgadas. Cálculo de un valor X a partir de una probabilidad conocida.- Algunas veces se puede saber cuál probabilidad se requiere, y debe determinarse qué valor de X dará dicha probabilidad. Ejemplo.- Se asume que los asesores económicos del presidente proponen un programa de bienestar social para ayudar a los desfavorecidos, el cual consta de un pago monetario al 15% de los más pobres. Entonces surge la pregunta sobre qué nivel de ingresos separa el 15% más pobre del - 42 - resto de la gente. En 1996, el ingreso promedio por persona, medido en dólares era de $13,812, con una desviación estándar de $3,550. Se asume que los ingresos están distribuidos normalmente. Como se muestra en la figura siguiente, se conoce el área y se busca el valor correspondiente para X que está representado por un signo de interrogación En esta oportunidad se tiene un área y se puede utilizar la tabla para buscar el valor correspondiente de Z. Aunque se está interesado en el valor de 0.15, se busca 0.3500 (0.5-0.15), ya que sólo el área de la media a algún valor por encima o por debajo de ella está dado en la tabla. Se busca en la estructura interna de la tabla el área de 0.3500. Lo más próximo que se obtiene es 0.3508, lo que corresponde a un valor de Z de 1.04. Debido a que Z= X −µ σ y a que se halló un valor de Z de 1.04, se tiene que − 1.04 = X − 13,812 3,550 Cuando se despeja X se encuentra un valor de $10,120, lo que significa que cualquier ingreso de $10,120 o menos recibirá el subsidio del gobierno. - 43 - Aproximación normal a la distribución binomial.20- La distribución binomial involucra una serie de n ensayos que pueden producir (1) un éxito o (2) un fracaso. La probabilidad de un éxito se indica como π. Las respuestas pueden calcularse a menudo con la fórmula binomial. Sin embargo si n es demasiado grande la fórmula puede ser demasiado engorrosa, por lo cual debe diseñarse un método alternativo. La solución puede hallarse con el uso de la distribución normal para aproximar la distribución binomial. Esta aproximación se considera lo suficientemente precisa si nπ ≥ 5 y n(1 − π ) ≥ 5 y si π está próximo a 0.50 Ejemplo.- Se considera un sindicato laboral en el cual el 40% de los miembros está a favor de una huelga. Si se seleccionan 15 miembros de manera aleatoria, ¿cuál es la probabilidad de que 10 miembros apoyen un paro? Se puede encontrar el resultado utilizando la fórmula binomial, pero en este caso vamos a usar la aproximación normal a la binomial. Primero se debe hallar la media µ y la desviación estándar σ de la distribución normal, de la siguiente manera: µ = nπ y σ = n(π )(1 − π ) En este caso, µ = (15 )(0.40 ) = 6 y σ = 15(0.40 )(0.60 ) = 1.897 Debido a que existe un número infinito de valores posibles en una distribución normal, la probabilidad de que la variable aleatoria sea exactamente igual a algún valor específico como 10, es cero. Cuando se utiliza una distribución continua para estimar una variable aleatoria discreta, es necesario un leve ajuste. Este ajuste, llamado factor de corrección de continuidad, requiere que se trate la probabilidad de exactamente 10 miembros como el intervalo entre 9.5 miembros y 10.5 miembros. Esto se ilustra en la figura siguiente, la cual muestra las probabilidades para cada valor de la variable aleatoria (número de miembros) tomada de la tabla de distribución normal. 20 Webster Allen L. Estadística aplicada a los negocios y la economía. McGraw-Hill, México 2000. Páginas 132-133 - 44 - La probabilidad de que exactamente 10 miembros estén a favor de la huelga está representado por el área del rectángulo centrado en 10. Vale la pena destacar que el rectángulo se extiende de 9.5 a 10.5. La curva normal está superpuesta sobre los rectángulos. Utilizando la distribución normal para hallar P (9.5 ≤ X ≤ 10.5 ) , se tiene: Z= 9 .5 − 6 = 1.85 1.897 con un área de 0.4678 y Z= 10.5 − 6 = 2.37 con un área de 0.4911 1.897 Entonces, P (9.5 ≤ X ≤ 10.5 ) = 0.4911 − 0.4678 = 0.0233 MUESTREO21 En repetidas ocasiones se ha enfatizado la necesidad de seleccionar una muestra representativa de la población. Una muestra que tergiverse la población presentará un error de muestreo y producirá estimados imprecisos de los parámetros de la población. Hay dos fuentes básicas de error de muestreo. La primera es sencillamente mala suerte. Debido a la “cuestión suerte”, la muestra puede contener elementos que no sean característicos de la población, lo resultaría en una sobreestimación del parámetro. O quizás muchos de los elementos muestrales tienden a ser más pequeños de lo que típicamente se encuentra en la población y en tal caso resultaría una subestimación. A continuación se dará una breve explicación de los principales métodos de muestreo: Muestreo aleatorio simple.- Tomar una muestra aleatoria simple garantiza que cada muestra de algún tamaño dado tenga la misma probabilidad de ser seleccionada. Se asume que una cadena nacional de comidas rápidas desea seleccionar aleatoriamente 5 de los 50 estados para tomar muestras sobre el gusto de los consumidores. Una muestra aleatoria simple garantizará que las 50 C 5 = 2118,760 muestras de tamaño 5 tengan la misma probabilidad de ser utilizadas en el estudio. Además, también puede utilizarse una tabla de números aleatorios, la cual con frecuencia 21 Anderson, Sweeney, Williams. Estadística para Administración y Economía. Thomson Editores. México 1999. Páginas 282-283 - 45 - es generada por un computador y cada uno de los diez dígitos (0-9) tiene una probabilidad igual de ser seleccionado. Muestreo sistemático.- Una muestra sistemática se forma seleccionando cada iésimo dato de la población. Si se determina que i es igual a 10, una muestra sistemática consta de cada décima observación de la población. La población debe ordenarse o enumerarse en forma aleatoria. Muestreo estratificado.- En este tipo de muestreo, primero se divide a la población en grupos de elementos llamados estratos, de tal manera que cada elemento en la población pertenece a uno y sólo a un estrato. La base de formación de los estratos, por ejemplo, por departamento, ubicación, edad, etc., queda a discreción de quien diseña la muestra. Sin embargo los mejores resultados se obtienen cuando los elementos dentro de cada estrato son tan semejantes como sea posible. Después de formar los estratos se toma una muestra aleatoria simple de cada uno. Muestreo por conglomerados.- En el muestreo por conglomerados, se divide primero a la población en conjuntos separados de elementos, llamados conglomerados. Cada elemento de la población pertenece a uno y sólo a un grupo. A continuación se toma una muestra aleatoria simple de los conglomerados. El muestreo de conglomerados tiende a proporcionar los mejores resultados cuando los elementos de los conglomerados son heterogéneos (desiguales). NUMEROS INDICE22 El uso de números índice puede proporcionar, a quienes toman las decisiones, un panorama más preciso del comportamiento de las variables económicas a través del tiempo y hacer comparaciones a través de períodos más significativos. Un número índice relaciona un valor en un período de tiempo, denominado período base, con un valor en otro período, denominado período de referencia (o actual). Los números índices se dividen en dos categorías: índice de precios simple e índice de precios compuestos. Indice de precios simple.- Indica el cambio relativo en el precio de un producto o servicio en el período de referencia, con respecto al período base. Para calcular un índice simple se divide el precio del producto en el periodo de referencia por su precio en el período base y se multiplica por 100. Indice de precios simple 22 IP = pn X 100 po Webster Allen L. Estadística aplicada a los negocios y la economía. McGraw-Hill, México 2000. Páginas 436-439 - 46 - Donde: p n = Precio de un artículo en el período de referencia p0 = Precio de un artículo en el período base Ejemplo.- El precio de la carne de res en 1995 era de $60.00 por kilo, mientras que en 1996 fue de $66.00 por kilo. Encontrar el índice de precios simple tomando como referencia 1996 Datos : p0 = 66.00 pn = 60.00 IP = 66.00 X 100 = 110 60.00 Indice de precios compuestos.- Se refieren a un conjunto de elementos o grupo de artículos. Son interesantes porque regularmente el cambio en el precio o en las cantidades se dan asociadas a otros. Son tres los índices de precios compuestos que mas se usan: Laspeyres, Paasche y Fisher. Para el cálculo de estos índices de precios, se utilizarán siempre los siguientes símbolos: po = Precio de un artículo en el período base. qo = Cantidad de un artículo en el período base. pn = Precio de un artículo en el período de referencia. qn = Cantidad de un artículo en el período de referencia Indice de Laspeyres Indice de Paasche L= P= ∑(p ∑(p ∑(p ∑(p - 47 - qo ) X 100 ) o qo n qn ) X 100 ) o qn n F = PXL Indice de Fisher Ejemplo.- Los precios promedio al consumidor en pesos y las cantidades asociadas a estos en kilos, para tres artículos en 1999 y 2000 se presentan en la siguiente tabla: Artículo Arroz Lenteja Frijol Precio 1999 4.1 3.2 5.0 Precio 2000 8.3 4.5 5.5 Cantidad 1999 1 1 2 Cantidad 2000 1.5 1 1.3 Tomando como base el año 1999 obtenga los índices de Laspeyres, Paasche y Fisher para el 2000. Identificaremos ahora las variables p0 , q0 , pn y qn , y añadiremos las columnas correspondientes a la tabla para los cálculos necesarios Artículo Arroz Lenteja Frijol Totales $1999 ( po ) 4.1 3.2 5.0 $2000 ( pn ) 8.3 4.5 5.5 Kg.1999 (qo ) 1 1 2 Kg.2000 (qn ) 1.5 1 1.3 Indice de Laspeyres: L= ∑ ( p q ) X 100 = 23.8 X 100 = 137.57 17.3 ∑(p q ) n o o o - 48 - pnqo po qo 8.3 4.1 4.5 3.2 11.0 10.0 ∑ = 23.8 ∑ = 17.3 pnqn po qn 12.45 6.15 4.5 3.2 7.15 6.5 ∑ = 11.65 ∑ = 15.85 Indice de Paasche: P= ∑ ( p q ) X 100 = 11.65 X 100 = 73.50 15.85 ∑(p q ) n n o n Indice de Fisher: F = P X L = 73.50 X 137.57 = 100.55 SERIES DE TIEMPO23 El proceso de desarrollar un pronóstico comienza con la recolección de datos anteriores durante varios períodos. El conjunto de datos resultantes se denomina una serie de tiempo o serie temporal porque contiene observaciones para alguna variable durante el tiempo. Los períodos de tiempo varían en duración. Pueden ser anuales, trimestrales, mensuales o incluso diarios. Los períodos de solo una hora pueden utilizarse para variables altamente volátiles como el precio o para las acciones transadas en una bolsa de valores. Los componentes de una serie de tiempo.- El patrón o comportamiento de los datos en una serie de tiempo tiene diversos componentes. El supuesto normal es que se combinan cuatro componentes separados: la tendencia, el cíclico, el estacional y el irregular, para definir valores específicos de la serie de tiempo. Componente de tendencia.- En el análisis de serie de tiempo, las mediciones pueden efectuarse cada hora, día, semana, mes o año, o en cualquier otro intervalo regular periódico. Aunque los datos de serie de tiempo presentan, por lo general, fluctuaciones aleatorias, este serie puede mostrar también desplazamientos o movimientos graduales hacia valores relativamente mayores o menores a lo largo de un lapso importante de tiempo. El desplazamiento gradual de la serie de tiempo se llama tendencia de esa serie; este desplazamiento o tendencia es, por lo común, el resultado de factores a largo plazo, como cambios en la población, las características demográficas de la misma, la tecnología y/o las preferencias del consumidor. 23 Anderson, Sweeney, Williams. Estadística para Administración y Economía. Thomson Editores. México 1999. Páginas 756-758 - 49 - Componente cíclico.- Aunque una serie de tiempo puede presentar una tendencia a través de periodos grandes, sus valores no caerán con exactitud sobre la línea de tendencia. De hecho, con frecuencia estas series temporales presentan secuencias alternas de puntos abajo y arriba de la línea de tendencia. Toda secuencia recurrente de puntos arriba y debajo de la línea de tendencia, que duran más de un año, se pueden atribuir a un componente cíclico de la serie. Componente estacional.- Mientras que la tendencia y los componentes cíclicos de una serie de tiempo se identifican analizando los movimientos de datos históricos a través de varios años, hay muchas series de tiempo que muestran un patrón regular dentro de un periodo de un año. Por ejemplo, un fabricante de albercas inflables espera poca actividad de ventas durante los meses de otoño e invierno, y máximas ventas en los de primavera y verano. No es de sorprender que el componente de la serie de tiempo, que representa la variabilidad en los datos, debida a influencias de las estaciones se llama componente estacional. Componente irregular.- El componente irregular de la serie de tiempo es el factor residual, “mil usos” que explica las desviaciones de la serie de tiempo real respecto a los factores determinados por los efectos de la tendencia y los componentes cíclicos y estacionales. Se debe a factores a corto plazo, imprevisibles y no recurrentes que afectan a la serie de tiempo. METODOS DE SUAVIZAMIENTO24 Como el objetivo de los métodos es “suavizar” las fluctuaciones aleatorias causadas por el componente irregular de la serie de tiempo, se llaman métodos de suavizamiento. Estos son adecuados para una serie de tiempo estable; esto es, una que no presenta grandes efectos de tendencia, cíclicos o estacionales, porque se adaptan bien a cambios en el nivel de la serie. Existen varios métodos de suavizamiento, pero solamente explicaremos el más usado: método de promedios móviles. Método de promedios móviles. El método de promedios móviles emplea el promedio de los n valores más recientes de datos en la serie de tiempo, como pronóstico para el siguiente periodo. El cálculo matemático del promedio móvil es el siguiente: Promedio móvil = ∑ (n valores más recintes de datos ) n 24 Anderson, Sweeney, Williams. Estadística para Administración y Economía. Thomson Editores. México 1999. Páginas 759-760 - 50 - se usa el termino “móvil” porque cada vez que se dispone de una nueva observación para la serie de tiempo, se reemplaza la observación más antigua en la fórmula anterior y se calcula un nuevo promedio. En consecuencia, el promedio cambia o es mueve, a medida que se dispone de nuevas observaciones. Para ilustrar el método de los promedios móviles, examinemos los datos de la tabla siguiente. Esos datos representan la cantidad de galones de gasolina vendidos por una determinada gasolinera durante las últimas 12 semanas Semana 1 2 3 4 5 6 7 8 9 10 11 12 Ventas (miles de galones) 17 21 19 23 18 16 20 18 22 20 15 22 Para aplicar los promedios móviles en el pronóstico de ventas de gasolina se debe seleccionar primero la cantidad de valores de datos que se incluyen en el promedio móvil. Por ejemplo, haremos los cálculos con un promedio móvil de tres semanas. Para las primeras tres semanas de la serie de ventas de gasolina, el promedio móvil se calcula como sigue: Promedio móvil (semanas 1-3) = 17 + 21 + 19 = 19 3 A continuación empleamos este promedio móvil como pronóstico para la cuarta semana. Como el valor real observado de esta semana es 23, el error de pronóstico correspondiente es 23-19=4. En general, el error asociado con cualquier pronóstico es la diferencia entre el valor observado de la serie y el pronóstico. - 51 - BIBLIOGRAFIA Anderson Sweeney, Williams, Estadística para administración y economía, Thomson Editores, México, 1999 Johnson Robert., Kuby, Estadística elemental, Thomson Editores, México, 1999 Webster Allen L., Estadística aplicada a los negocios y la economía, McGrawHill, México, 2000 - 52 -