Download inferencia estadistica
Document related concepts
Transcript
6. Estimación, DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1 INFERENCIA ESTADISTICA La estadística está dividida en descriptiva e inferencial donde La estadística Descriptiva se relaciona principalmente con la recopilación, presentación y descripción de datos. Y la estadística Inferencial esta formada por un conjunto de métodos o técnicas utilizadas para la toma de decisiones o establecer conclusiones de una población. Para que la estadística inferencial sea efectiva sobre las conclusiones de una población, se requiere que las muestras seleccionadas de dicha población, sean muestras aleatorias. Los métodos estadísticos hacen uso de la información contenida en la muestra aleatoria y con base a esa información, se interpreta, se infiere y se toman las decisiones de la población. La inferencia estadística puede dividirse en dos grandes áreas: estimación de parámetros y prueba de hipótesis. 6.2 POBLACION, MUESTRA Y MUESTREO En este capítulo se hará un recordatorio de la definición de lo que es muestra, población y muestreo como se vio en el capítulo 2. Una población es el conjunto de todos los elementos a los que se somete a un estudio estadístico; es decir, está formada por la totalidad de las observaciones en las cuales se tiene cierto interés. Una muestra es un conjunto representativo de la población de referencia, el número de individuos de una muestra es menor que el de la población. O también es un subconjunto, extraído de la población (mediante técnicas de muestreo), cuyo estudio sirve para inferir características de toda la población, (Ver fig. 6.1). Figura. 6.1. Población y Espacio muestral El muestreo es la técnica o método con que se extraen los elementos de la población a estudiar. Existen dos tipos de muestreo Probabilístico y no probabilístico. En este último (no probabilístico) puede haber clara influencia de la persona o personas que seleccionan la muestra o simplemente se realiza atendiendo a razones de comodidad. Salvo en situaciones muy concretas, en la que los errores cometidos no son grandes, debido a la homogeneidad de la población, en general no es un tipo de muestreo riguroso y científico, dado que no todos los elementos de la población pueden formar parte de la muestra. Por ejemplo, si hacemos una encuesta telefónica por la mañana, las personas que no tienen teléfono o que están trabajando, no podrán formar parte de la muestra. Muestreo probabilístico: En este tipo de muestreo es en el que todos los individuos de la población, tienen la misma probabilidad de ser parte de la muestra. 6.3 ESTADISTICOS Y DISTRIBUCIONES DE MUESTREO Las inferencias estadísticas se hacen mediante los estadísticos. Los estadísticos son funciones derivadas de las observaciones contenidas en una muestra aleatoria. Una distribución de muestreo es una distribución de probabilidad de un estadístico, por ejemplo la distribución de probabilidad de 𝑋̅, se le conoce como distribución de muestreo de la media. La distribución de muestreo de un estadístico depende de la distribución de la población, del tamaño de la muestra y del método de muestreo seleccionado. 6.4 DISTRIBUCION DE MUESTREO DE MEDIAS Sea 𝑥1 , 𝑥2 , 𝑥3 , ⋯ , 𝑥𝑛 un conjunto de observaciones de una muestra aleatoria de tamaño 𝑛 tomada de una población (finita o infinita) normal con media 𝜇 y varianza 𝜎 2 . Cada observación en esta muestra es una variable aleatoria distribuida normal e independiente, con media 𝜇 y varianza 𝜎 2 . Entonces 𝑥̅ = 𝑥1 +𝑥2 +𝑥3 +⋯+𝑥𝑛 , 𝑛 tiene una distribución normal con media 𝜇𝑥̅ = 𝜇, y varianza 𝜎𝑥̅2 = 𝜎2 . 𝑛 Esta afirmación se puede verificar con el siguiente teorema. Teorema del Límite Central: Si 𝑥1 , 𝑥2 , 𝑥3 , ⋯ , 𝑥𝑛 es una muestra aleatoria de tamaño 𝑛 tomada de una población (finita o infinita) con media 𝜇 y varianza 𝜎 2 , y si 𝑥̅ es la media muestral, entonces la forma límite de la distribución de 𝑍= 𝑥̅ − 𝜇 𝜎 √𝑛 Cuando 𝑛 → ∞, es la distribución normal estándar. Aun cuando la distribución de la población no es normal, el Teorema del Límite Central permite afirmar que “prácticamente” 𝑥̅ es normal para muestras grandes tomadas de cualquier población. 6.5 ESTIMADORES Y SU PROPIEDADES Un estimador es una regla, a menudo expresada como una fórmula, que indica cómo calcular el valor de una estimación con base en las mediciones contenidas en una muestra. Existen dos tipos de estimaciones concernientes a una población: la estimación por intervalo y la estimación puntual. Una estimación puntual, es un solo valor o número que se utiliza para estimar un parámetro de población desconocido. A menudo una estimación puntual es insuficiente debido a que ya en resultado, solo se tienen dos opciones: el valor de estimador es correcta o no. Por ejemplo, mediante una estimación puntual se afirmara que para el año 2030, la proporción de enfermos de sida a nivel mundial será 0.70, pudiera ser cierta o no. Un estimador puntual es una variable aleatoria con una distribución de muestreo que depende de la población y de su parámetro. Un buen estimador debe de contener dos propiedades muy importantes, para evaluar la bondad del estimador, que son que el estimador sea insesgado respecto al parámetro a 1 estimar y que tenga varianza mínima. Por ejemplo la media muestral 𝑥̅ = 𝑛 ∑𝑛𝑖=1 𝑥𝑖 es un estimador puntual de la media de la población 𝜇. Los estimadores puntuales más usuales son los de la distribución binomial (𝑝), de la distribución de Poisson del parámetro 𝜆 y la distribución normal (𝜇, 𝜎). Antes de utilizar un estadístico muestral como estimador puntual, se verifica si el estimador puntual tiene ciertas propiedades que corresponden a un buen estimador puntual. Como hay distintos estadísticos muéstrales que se usan como estimadores puntual es de sus correspondientes parámetros poblacionales, se usará la notación general siguiente: 𝜃: es el parámetro poblacional de interés. 𝜃̂: es el estadístico muestral o estimador puntual de 𝜃. En general 𝜃 representa cualquier parámetro poblacional como, por ejemplo, la media poblacional, la desviación estándar poblacional, etc.; y 𝜃̂ representa el correspondiente estadístico muestral, por ejemplo la media muestral, la desviación estándar muestral y la proporción muestral. Las propiedades de un buen estimador son: Insesgadez: Si el valor del estadístico muestral es igual al parámetro poblacional que se estudia, se dice que el estudio muestral es un estimador insesgado del parámetro poblacional. El estadístico muestral 𝜃̂ es un estimador insesgado del parámetro poblacional 𝜃 si 𝐸(𝜃̂) = 𝜃, donde 𝐸(𝜃̂) valor esperado del estadístico muestral. Por lo tanto, el valor esperado, o media, de todos los posibles valores de un estadístico muestral insesgado es igual al parámetro poblacional de interés. Eficiencia: Se dice que el estimador puntual con menor error estándar tiene mayor eficiencia relativa que los otros. Cuando se muestrean poblaciones normales, el error estándar de la media muestral es menor que el error estándar de la mediana muestral. Por tanto, la media muestral es más eficiente que la mediana muestral. Consistencia: Un estimador puntual es consistente si el valor del estimador puntual tiende a estar más cerca del parámetro poblacional a medida que el tamaño de la muestra aumenta. En otras palabras, una muestra grande tiende a proporcionar mejor estimación puntual que una pequeña. Los estimadores 𝑥̅ , 𝑠 y 𝑝̂ son estimadores insesgado de 𝜇, 𝜎 y 𝑝, respectivamente (Walpole, Ronald E., 2007). 6.6 ERROR ESTÁNDAR DE UN ESTADISTICO Debido a que un estadístico es una variable aleatoria derivada de las observaciones de un muestreo aleatorio, el valor del estadístico puede variar de una muestra a otra muestra aleatoria, dependiendo de la variación población de interés. de la De esta forma El error estándar de un estadístico depende de la desviación estándar de su distribución de muestreo. Por ejemplo, si la media muestral 𝑋̅ se utiliza como estimados puntual de la media poblacional 𝜇, el error estándar de 𝑋̅ mide que también 𝑋̅ estima a 𝜇. Si 𝑥1 , 𝑥2 , 𝑥3 , ⋯ , 𝑥𝑛 es una muestra aleatoria de tamaño 𝑛 tomada de una población normal con media 𝜇 y varianza 𝜎2 , √𝑛 de modo que el error estándar de 𝑥̅ es 𝜎𝑥̅ = 𝜎 √𝑛 (6.1) Si se desconoce el valor de 𝜎, éste se puede sustituir por la deviación estándar muestral de 𝑥̅ en la expresión 6.1, por consiguiente el error estándar estimado de 𝑥̅ es 𝜎𝑥̅ = 𝑆 √𝑛 (6.2) 6.7 ESTIMACION POR INTERVALOS Tomando en cuenta que la mayoría de las veces el parámetro poblacional es desconocido, conveniente obtener límites entre los cuales se encuentre el dicho parámetro con un cierto nivel de confianza estadística, en este caso se trata de la estimación por intervalos. Es decir, la estimación por intervalos da por consecuencia un intervalo de confianza en el que se espera que se encuentre el parámetro poblacional con una alta probabilidad de certeza. Por ejemplo, el intervalo de confianza para la media poblacional es el intervalo de valores que tiene una alta probabilidad de contener a la media de la población como se ilustra en la figura 6.2. En la estimación por intervalos de un parámetro población, resulta adecuado hablar en términos de probabilidad de que el estimador cubra el verdadero valor del parámetro, como se muestra en la figura 6.2. Por lo tanto, si se seleccionan 100 muestras de una población y se calcula cada media de las muestras, de las cuales se les estima sus correspondiente intervalos de confianza del 95%, se tendría que aproximadamente 95 de los 100 intervalos de confianza contienen la media poblacional. Figura 6.2 Distribución de muestreo para estimador por intervalos. El nivel de confianza 𝛼 (alfa) es el valor de la probabilidad de que el parámetro poblacional se encuentre dentro del intervalo; los niveles de confianza más ampliamente usados son: 𝛼 = 0.10, 𝛼 = 0.05 𝑦 𝛼 = 0.01 correspondientes al 90%, 95% y 99% de confianza estadística, respectivamente. 6.8 ESTIMACION POR INTERVALO DE UNA MEDIA CON n > 30 Sea 𝑥1 , 𝑥2 , 𝑥3 , ⋯ , 𝑥𝑛 es una muestra aleatoria de tamaño 𝑛 > 30 tomada de una población normal con media 𝜇 y varianza 𝜎 2 conocida. Entonces un intervalo de confianza del 100%(1- 𝛼) para 𝜇 esta dada por 𝑥̅ − 𝑍∝⁄2 𝜎 √𝑛 ≤ 𝜇 ≤ 𝑥̅ + 𝑍∝⁄2 𝜎 (6.3) √𝑛 Donde 𝑍∝⁄2 es el punto de la distribución normal estándar, que corresponde al nivel de confianza dado 𝛼. En la tabla 6.1, se pueden ver algunos valores de 𝑍𝛼⁄2 para diferentes valores de 𝛼. 𝛼 𝑍𝛼⁄2 0.10 𝑍0.05 = 1.645 0.05 𝑍0.025 = 1.96 0.01 𝑦 𝑍0.005 = 2.575 Tabla 6.1 Valores de 𝑍𝛼⁄2 para distintos valores 𝛼 (alfa) Ejemplo 6.1. Los datos de la tabla 6.2 se encuentran una muestra aleatoria de las estaturas en centímetros de 45 estudiantes de la licenciatura de ingeniería de alguna universidad. Se sabe que la muestra aleatoria de tamaño 𝑛 = 45 proviene de una población normal con la varianza poblacional 𝜎 2 = 9 . Construya un intervalo de confianza del 95% para la estatura media poblacional 𝜇. 164 168 163 166 160 165 162 165 158 165 162 165 164 164 163 167 166 161 165 169 165 165 160 169 160 162 165 170 160 165 163 169 167 163 168 164 166 164 167 162 165 167 160 171 167 Tabla 6.2 Estaturas de 45 estudiantes La media de la muestra de los 45 estudiantes es 𝑥̅ = 164.578 De la tabla I del apéndice y para un 𝛼 = 0.05 se tiene que 𝑍0,025 = 1.96. La obtención del intervalo de confianza al 95% de las estaturas de los estudiantes es la siguiente 164.578 − 1.96 3 ≤ 𝜇 ≤ 164.578 + 1.96 3 √45 √45 3 3 164.578 − 1.96 ≤ 𝜇 ≤ 164.578 + 1.96 6.708 6.708 164.578 − 1.96(0.447) ≤ 𝜇 ≤ 164.578 + 1.96(0.447) 164.578 − 0.876 ≤ 𝜇 ≤ 164.578 + 0.876 𝟏𝟔𝟑. 𝟕𝟎𝟐 ≤ 𝝁 ≤ 𝟏𝟔𝟓. 𝟒𝟓𝟒 Por lo tanto la estatura media poblacional de los estudiantes esta entre 163.702 y 165.454. Ahora consideremos lo siguiente, dado que se seleccionó una confianza estadística del 95%. ¿Qué hubiera pasado si se hubiera escogido una confianza estadística mayor, por ejemplo 99%? ¿Cómo será el intervalo de confianza para la estatura media poblacional de los estudiantes? Para un 𝛼 = 0.01, y de la tabla I del apéndice se tiene que 𝑍𝛼⁄2 = 𝑍0.01⁄2 = 𝑍0.005 = 2.58, entonces el intervalo de confianza al 99% es 164.578 − 2.58 3 ≤ 𝜇 ≤ 164.578 + 2.58 3 √45 √45 3 3 164.578 − 2.58 ≤ 𝜇 ≤ 164.578 + 2.58 6.708 6.708 164.578 − 2.58(0.447) ≤ 𝜇 ≤ 164.578 + 2.58(0.447) 164.578 − 1.153 ≤ 𝜇 ≤ 164.578 + 1.153 𝟏𝟔𝟑. 𝟒𝟐𝟓 ≤ 𝝁 ≤ 𝟏𝟔𝟓. 𝟕𝟑𝟏 Por lo tanto, para una confianza estadística del 99%, la estatura media poblacional de los estudiantes esta entre 163.425 y 165.731. Nótese que la longitud el intervalo de confianza al 99% es mayor que la longitud del intervalo de confianza al 95%. En general, para un tamaño de muestra fijo y una desviación estándar 𝜎 , entre mas grande sea la confianza estadística, mas grande será el intervalo de confianza resultante. 6.9 ESTIMACION POR INTERVALO DE UNA PROPORCION Si 𝑥 es una variable aleatoria binomial con los parámetros 𝑛 y 𝑝, y 𝑛 es grande 𝑥 y 𝑝̂ = 𝑛, entonces la expresión 6.4 es un intervalo de confianza aproximadamente del (1 − 𝛼)100% para 𝑝, 𝑝̂ (1 − 𝑝̂ ) 𝑝̂ (1 − 𝑝̂ ) 𝑝̂ − 𝑍𝛼⁄2 ∙ √ < 𝑝 < 𝑝̂ + 𝑍𝛼⁄2 ∙ √ 𝑛 𝑛 (6.4) Ejemplo 6.2. En una muestra aleatoria, 145 personas de 450, a quienes se aplicó una vacuna contra la influenza, experimentaron cierto síntoma de incomodidad. Construir un intervalo de confianza del 95% para la proporción poblacional de personas que experimentaron algún síntoma de incomodidad por la vacuna. 145 Sustituyendo 𝑛 = 450, 𝑝̂ = 450 = 0.32 apéndice se tiene que y para 𝛼 = 0.05 y de la tabla I del 𝑍0.025 = 1.96, en la expresión 6.4 del intervalo de confianza, se obtiene que 0.32 − 1.96 ∙ √ 0.32(1 − 0.32) 0.32(1 − 0.32) < 𝑝 < 0.32 + 1.96 ∙ √ 450 450 0.32 − (1.96)(0.02199) < 𝑝 < 0.32 + (1.96)(0.02199) 𝟎. 𝟐𝟕𝟔𝟗 < 𝑝 < 0.3631 Por lo tanto, la proporción poblacional de personas que experimentaron algún síntoma de incomodidad por la vacuna está entre 0.2769 y 0.3631. 6.10 DISTRIBUCION t (t- Student) Sea Z una variable aleatoria con distribución normal con 𝜇 = 0 y varianza 𝜎 2 = 1 y sea V una variable aleatoria ji-cuadrada con k grados de libertad. Si Z y V son independientes, entonces la variable aleatoria 𝑇= 𝑍 √ 𝑉 𝑘 tiene una función de densidad de probabilidad 𝑓(𝑥) = Γ[(𝑘 + 1)/2] √𝜋𝑘Γ(𝑘/2)[(𝑥 2 /𝑘) + 1](𝑘+1)/2 −∞<𝑥 <∞ y se dice que sigue una distribución t con k grados de libertad. Su media y varianza de la distribución t son 𝜇 = 0 y 𝜎 = 𝑘/(𝑘 − 2) para 𝑘 > 2, respectivamente. En la figura 6.3 se presenta la grafica de varias distribuciones t. t de Student 0.4 G. L. 2 3 10 densidad 0.3 0.2 0.1 0 -9 -6 -3 0 x 3 6 9 Figura 6.3 Grafica de varias distribuciones t 6.11 DISTRIBUCION MUESTRAL t (t- Student) Por lo general en muchas ocasiones no se conoce la desviación estándar de la población, estándar sino que se cuenta con solo la estimación de la desviación obtenida de una muestra aleatoria de dicha población, por consiguiente no es posible obtener el valor de Z de una distribución normal estándar. En este caso, se obtiene el estadístico t (t-Student), definido como la expresión 6.5. 𝑡= 𝑥̅ − 𝜇 𝑆 (6.5) Donde t sigue una distribución t (t-Student) con n-1 grados de libertad y ∑(𝑥−𝑥𝑖 )2 √ 𝑛−1 𝑆= es la desviación estándar muestral. La distribución 𝑡 tiene una curva más ancha que la distribución normal estandarizada cuando el número de grados de libertad es pequeño. Cuando los grados de libertad tienden a infinito, la distribución t tiende a una distribución normal estándar. Es significa que a medida que se incrementa el tamaño de la muestra, la desviación estándar muestral se aproxima a la desviación estándar poblacional y en consecuencia la distribución de t se a próxima a la distribución normal estándar (ver figura 6.4) Figura 6.4 Distribución t de Student y normal. 6.12 ESTIMACION POR INTERVALO DE UNA MEDIA CON 𝒏 ≤ 𝟑𝟎 Sea 𝑥̅ y S la media y desviación estándar, respectivamente, de una muestra aleatoria tomada de una población normal con media 𝜇 y varianza 𝜎 2 desconocida. Entonces un intervalo de confianza del 100%(1- 𝛼) para 𝜇 esta dos por 𝑥̅ − 𝑡∝⁄2,𝑛−1 𝑠 √𝑛 ≤ 𝜇 ≤ 𝑥̅ + 𝑡∝⁄2,𝑛−1 𝑠 (6.6) √𝑛 Donde 𝑡∝⁄2,𝑛−1 es un punto critico superior de la t-Student con n-1 grados de libertad, correspondiente al nivel de confianza 𝛼. Ejemplo 6.3. Los siguientes datos de la tabla 6.3 corresponden a la estatura en centímetros de una muestra aleatoria de 10 estudiantes del grupo A de la licenciatura de ingeniería. Encontrar un intervalo de confianza del 95% para la estatura media. 168 165 168 157 164 165 Tabla 6.3 Estaturas en centímetros de 10 estudiantes 160 164 171 165 Supongas que la estatura de los estudiantes sigue una distribución normal. La media y desviación estándar de la muestra son 𝑥̅ = 164.7 S=4.00139 De la tabla II del apéndice y para un 𝛼 = 0.05 y para n-1=10-1=9 grados de libertad se tiene que 𝑡0,025,9 = 2.262. El intervalo de confianza al 95% de las estaturas de los estudiantes es 164.7 − 2.262 4.00139 √9 ≤ 𝜇 ≤ 164.7 + 2.262 4.00139 √9 164.7 − 2.262(1.333) ≤ 𝜇 ≤ 164.7 + 2.262(1.333) 𝟏𝟔𝟏. 𝟏𝟓 ≤ 𝝁 ≤ 𝟏𝟔𝟕. 𝟕𝟏 Por lo tanto, se tiene una confianza estadística del 95% de que el promedio de estatura de los estudiantes se encuentra entre 161.15 y 167.71. 6.13 DISTRIBUCION JI-CUADRADA Sean 𝑍1 , 𝑍2 , 𝑍3 , ⋯ , 𝑍𝑣 variables aleatorias con distribución normal e independiente, con media 𝜇 = 0 y varianza 𝜎 2 = 1, entonces, la variable aleatoria definida como (6.7) 𝜒 = 𝑍12 + 𝑍22 + ⋯ + 𝑍𝑣2 Tiene la función de densidad de probabilidad 𝑓(𝑥) = 𝑥 (𝑣⁄2)−1 𝑒 −𝑥⁄2 2𝑣⁄2 Γ(𝑣 ⁄2) 𝑝𝑎𝑟𝑎 𝑥 > 0 y por consiguiente 𝜒 sigue una distribución ji-cuadrada con v grados de libertad, y se simboliza con 𝜒𝑣2 . La media y la varianza de la distribución 𝜒𝑣2 son 𝜇=𝑣 𝜎 2 = 2𝑣 En la figura 6.5 se pueden ver la distribución 𝜒𝑣2 con v=1, v=5, v=10, grados de libertad. La distribución de ji-cuadrada es una de las distribuciones de muestreo con mayor utilidad. Chi-Cuadrada 0.6 G. L. 2 5 10 densidad 0.5 0.4 v=2 0.3 0.2 v=5 v=10 0.1 0 0 10 20 x 30 40 Figura 6.5 Gráficas de la distribución 𝜒 2 con distintos grados de libertad Supóngase que 𝑋1 , 𝑋2 , 𝑋3 , ⋯ , 𝑋𝑛 es una muestra aleatoria de tamaño, tomada de una población normal, con media 𝜇 y 𝜎 2 , entonces el estadístico jicuadrada dado por 𝜒2 = (𝑛 − 1)𝑆 2 𝜎2 (6.8) Tiene una distribuida como 𝜒 2 con n-1 grados de libertad y se le conoce como la distribución de muestreo ji-cuadrada, donde 𝑛 es el tamaño de la muestra aleatoria, 𝑠 2 la varianza muestral. Con la distribución de muestreo ji-cuadrada se puede construir estimaciones de intervalo de confianza y hacer pruebas de hipótesis estadísticas sobre la varianza de una población normal. El estadístico ji-cuadrada también se puede dar con la siguiente expresión ∑𝑛𝑖=1(𝑋𝑖 − 𝑋̅)2 𝜒 = 𝜎2 2 (6.9) Propiedades de las distribuciones ji-cuadrada 1. Los valores de 𝜒 2 son mayores o iguales que 0. 2. La forma de una distribución 𝜒 2 depende de 𝑛 − 1 𝑔𝑟𝑎𝑑𝑜𝑠 𝑑𝑒 𝑙𝑖𝑏𝑒𝑟𝑡𝑎𝑑. En consecuencia, hay un número infinito de distribuciones 𝜒 2 . 3. El área bajo una curva ji-cuadrada y sobre el eje horizontal es 1. 4. Las distribuciones 𝜒 2 no son simétricas. Tienen colas estrechas que se extienden a la derecha; esto es, están sesgadas a la derecha. 5. Cuando 𝑛 > 2, la media de una distribución 𝜒 2 es 𝑛 − 1 y la varianza es 2(𝑛 − 1). 6. El valor modal de una distribución 𝜒 2 se da en el valor (𝑛 − 3). 6.14 INTERVALO DE CONFIANZA DE LA VARIANZA Sea 𝑋1 , 𝑋2 , 𝑋3 , ⋯ , 𝑋𝑛 una muestra aleatoria de tamaño n población normal, sea 𝑆 2 la varianza muestral tomada de una y por consiguiente sea 𝑆 2 el estimador puntual de 𝜎 2 . En la sección 6.13 se mostró que la expresión 𝜒2 = (𝑛 − 1)𝑆 2 𝜎2 es una ji- cuadrada con n-1 grados de libertad. Esta distribución se muestra en la figura 6.6. Para el desarrollo del intervalo de confianza de 𝜎 2 , de la figura 6.4 se tiene la siguiente expresión (6.10) 2 𝑝 (𝜒1−(𝛼 ⁄2) ≤ (𝑛 − 1)𝑆 2 2 ≤ 𝜒(𝛼 ⁄2) ) = 1 − 𝛼 𝜎2 (6.10) y haciendo un reordenamiento la expresión 6.10 puede escribirse como 𝑃( (𝑛 − 1)𝑆 2 2 𝜒(𝛼 ⁄2, 𝑛−1) ≤ 𝜎2 ≤ (𝑛 − 1)𝑆 2 ) 2 𝜒(1−𝛼 ⁄2, 𝑛−1) =1−𝛼 (6.11) Figura 6.6 Derivación de un intervalo de confianza para 𝜎 2 en una distribución normal y por lo tanto, de la expresión 6.11, concluimos que el intervalo de confianza del 100(1 − 𝛼)% para 𝜎 2 esta dado por ( (𝑛 − 1)𝑆 2 , 2 𝜒(𝛼 ⁄2, 𝑛−1) (6.12) (𝑛 − 1)𝑆 2 ) 2 𝜒(1−𝛼 ⁄2, 𝑛−1) Ejemplo 6.4. Considerando los datos del ejemplo 6.3, de las estaturas de los estudiantes, encontrar un intervalo de confianza bilateral al 95% para la varianza poblacional 𝜎 2 de las estaturas de los estudiantes. Supongas que la estatura de los estudiantes sigue una distribución normal. La desviación estándar y la varianza de la muestra son S=4.00139 S2=16.011 De la tabla III del apéndice y para un 𝛼 = 0.05 y para n-1=10-1=9 grados de 2 libertad se tiene que 𝜒(𝛼 ⁄2, 𝑛−1) 2 = 𝜒(0.025, 9) 2 = 19.02 y 𝜒(1−𝛼 ⁄2, 𝑛−1) 2 = 𝜒(0.975, 9) = 2.70, sustituyendo estos valores en la expresión 6.9, se tiene que el intervalo de confianza para 𝜎 2 al 95% de las estaturas de los estudiantes es (9)(16.011) (9)(16.011) ( , ) 19.02 2.70 ( 144.099 144.099 , ) 19.02 2.70 (7.57, 53.37) Por lo tanto, se estima que la varianza poblacional 𝜎 2 de las estaturas de los estudiantes esta entre 7.57 y 53.37. 6.15 PRUEBA DE HIPOTESIS En muchos problemas de la ciencia, de la ingeniería y de la administración, se requiere que se toma una decisión entre aceptar y rechazar una proposición sobre algún parámetro. Esta proposición recibe el nombre de hipótesis. Y el procedimiento sobre la toma de decisión sobre la hipótesis, se le conoce como prueba de hipótesis. Una hipótesis estadística es una proposición o supuesto sobre los parámetros de una o más poblaciones. Ejemplo 6.5. Considerando los datos del ejemplo 6.1, de las estaturas en centímetros de los estudiantes de alguna universidad. El interés se centra sobre la estatura promedio de los estudiantes, de manera específica, el interés recae en decir si la estatura promedio es o no de 165 centímetros, esto lo podemos expresar simbólicamente como 𝐻0 : 𝜇 = 165 centímetros (𝐻0 : 𝐿𝑎 𝑒𝑠𝑡𝑎𝑡𝑢𝑟𝑎 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 𝑑𝑒 𝑙𝑜𝑠 𝑒𝑠𝑡𝑢𝑑𝑖𝑎𝑛𝑡𝑒𝑠 𝑒𝑠 𝑑𝑒 165 𝑐𝑒𝑛𝑡𝑖𝑚𝑒𝑛𝑡𝑟𝑜𝑠) 𝐻𝑎 : 𝜇 ≠ 165 centímetros (𝐻𝑎 : 𝐿𝑎 𝑒𝑠𝑡𝑎𝑡𝑢𝑟𝑎 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 𝑑𝑒 𝑙𝑜𝑠 𝑒𝑠𝑡𝑢𝑑𝑖𝑎𝑛𝑡𝑒𝑠 𝑒𝑠 𝑑𝑖𝑓𝑒𝑟𝑒𝑛𝑡𝑒 𝑑𝑒 165 𝑐𝑒𝑛𝑡𝑖𝑚𝑒𝑛𝑡𝑟𝑜𝑠) La proposición𝐻0 : 𝜇 = 165 centímetros, se conoce como Hipótesis nula, mientras que la proposición 𝐻𝑎 : 𝜇 ≠ 165 centímetros, recibe el nombre de Hipótesis alternativa. En la hipótesis alternativa se especifican los valores de 𝜇 que pueden ser mayores o menores que 165 centímetros, también se conoce como Hipótesis alternativa bilateral. En algunas situaciones, lo que se desea es formular una Hipótesis alternativa unilateral, como pudieran ser, 𝐻0 : 𝜇 = 165 𝑐𝑒𝑛𝑡𝑖𝑚𝑒𝑡𝑟𝑜𝑠; 𝐻𝑎 : 𝜇 < 165 𝑐𝑒𝑛𝑡𝑖𝑚𝑒𝑡𝑟𝑜𝑠. ó 𝐻0 : 𝜇 = 165 𝑐𝑒𝑛𝑡𝑖𝑚𝑒𝑡𝑟𝑜𝑠; 𝐻𝑎 : 𝜇 > 165 𝑐𝑒𝑛𝑡𝑖𝑚𝑒𝑡𝑟𝑜𝑠. De este modo, en forma general podemos decir que la Hipótesis nula, representada por 𝐻0 , es la afirmación sobre una o más características de poblaciones que al inicio se supone cierta (es decir, una "creencia a priori"). La Hipótesis alternativa, representada por 𝐻𝑎 , es la afirmación contradictoria a 𝐻0 , y ésta es la hipótesis del investigador. Es importante señalar que las hipótesis siempre son proposiciones sobre la población o distribución bajo estudio, no proposiciones sobre la muestra. Por lo general, el valor del parámetro de la población especificado en la hipótesis nula se determina en una de tres maneras diferentes: 1. Puede ser resultado de la experiencia pasada o del conocimiento del proceso, entonces el objetivo de la prueba de hipótesis usualmente es determinar si ha cambiado el valor del parámetro. 2. Puede obtenerse a partir de alguna teoría, modelo o diseño experimental, que se relaciona con el proceso bajo estudio. En este caso, el objetivo de la prueba de hipótesis es verificar la teoría o modelo. 3. Cuando el valor del parámetro proviene de consideraciones externas, tales como las especificaciones de diseño o ingeniería, o de obligaciones contractuales. En esta situación, el objetivo usual de la prueba de hipótesis es probar el cumplimiento de las especificaciones. Los procedimientos de prueba de hipótesis dependen del empleo de la información contenida en la muestra aleatoria de la población de interés. Si esta información es consistente con la hipótesis, se concluye que ésta es verdadera; sin embargo si esta información es inconsistente con la hipótesis, se concluye que esta es falsa. Debe hacerse hincapié en que la verdad o falsedad de una hipótesis en particular nunca puede conocerse con certidumbre, a menos que pueda examinarse a toda la población. Usualmente esto es imposible en muchas situaciones prácticas. Por tanto, es necesario desarrollar un procedimiento de prueba de hipótesis teniendo en cuenta la probabilidad de llegar a una conclusión equivocada. La hipótesis nula se rechaza en favor de la hipótesis alternativa, sólo si la evidencia muestral sugiere que 𝐻0 es falsa. Si la muestra no contradice decididamente a 𝐻0 , se continúa creyendo en la validez de la hipótesis nula. Entonces, las dos conclusiones posibles de un análisis por prueba de hipótesis son rechazar 𝑯𝟎 o no rechazar 𝑯𝟎 . 6.16 ERRORES DEL TIPO I Y TIPO II. El procedimiento de contrastar la alternativa con base de hipótesis nula contra la hipótesis la información obtenida en una muestra aleatoria, puede llevar a cometer dos posibles errores, debido a fluctuaciones o variaciones del azar en el muestreo. Si la hipótesis nula es en realidad verdadera, pero los datos de la muestra aleatoria la contradicen entonces la hipótesis nula es rechazada y entonces se estará cometiendo el Error Tipo I. Por otro lado, si la hipótesis nula es falsa y los datos de la muestra conllevan a no rechazarla, se estará cometiendo el Error Tipo II. En otras palabras, El Error tipo I se define como el rechazo de la hipótesis nula H0 cuando esta es verdadera y el Error tipo II se define como la aceptación de la hipótesis nula H0 cuando esta es falsa. Por lo tanto, al probar cualquier hipótesis estadística, existen cuatro situaciones diferentes que determinan si la decisión final es correcta o errónea. Estas situaciones aparecen en la tabla 6.4 Decisión Eventos No se rechaza 𝐻0 Rechazar 𝐻0 𝐻0 es Verdadera No hay error con Error Tipo I probabilidad 𝐻0 es Falsa 1−𝛼 con probabilidad 𝛼 Error Tipo II No hay error con probabilidad 𝛽 (potencia) Con probabilidad 1− 𝛽 Tabla 6.4 Situaciones que determinan si la decisión final fue correcta o errónea. Algunas veces, la probabilidad del error tipo I recibe el nombre de nivel de significancia de la prueba y se denota con 𝛼 y La probabilidad de cometer un error Tipo II se denota por . La probabilidad de no rechazar una hipótesis nula verdadera es la confianza 1 − 𝛼, con la cual se trabajó para hacer estimaciones por intervalo. Cuando se rechaza una hipótesis nula falsa se ha tomado una decisión correcta y la probabilidad de hacerlo se denomina potencia o poder de la prueba y es denotada por 1 . En símbolos esto se expresa de la siguiente manera: P(Error tipo I) = P(Rechazar H0H0 es verdadera) = P(No rechazar H0H0 es verdadera) = 1 P(Error Tipo II)=P(No rechazar H0H0 es falsa) = P(Rechazar H0H0 es falsa) = Potencia = 1 El nivel de significancia lo fija el investigador, y en la práctica se suelen usar valores de 0.01, 0.05 o el 0.1 En la figura 6.7 se ilustra las reglas de decisión y los tipos de error: Figura 6.7 Reglas de decisión. 6.17 PROCEDIMIENTO GENERAL PARA LA PRUEBA DE HIPOTESIS Una vez que se han formulado las hipótesis nula, 𝐻0 y la hipótesis alternativa, 𝐻𝑎 , se debe realizar un procedimiento de comparación‚ por medio del cual se toma una decisión basada en la muestra aleatoria seleccionada de la población en estudio. Para llevar a cabo este procedimiento es necesario seleccionar el estadístico de prueba adecuado, calcularlo con base en la muestra y luego tomar la decisión de rechazar o no 𝐻0 con respecto a un nivel de significancia 𝛼. Se recomienda utilizar los siguientes pasos al aplicar la metodología de prueba de hipótesis Los pasos a seguir en una prueba de hipótesis son: 1. Identificar el parámetro de interés, el cual se deriva del problema. 2. Formular las hipótesis nula H0 y la hipótesis alternativa Ha. 3. Escoger un nivel de significancia . 4. Seleccionar el estadístico de prueba adecuado a la distribución muestral. 5. Determinar la región crítica o de rechazo para el estadístico de prueba. 6. Calcular el estadístico de prueba. 7. Tomar una decisión de rechazar H0 o no rechazarla. 8. Dar una conclusión al problema. 6.18 PRUEBA DE HIPOTESIS SOBRE LA MEDIA DE UNA DISTRIBUCION NORMAL Y VARIANZA CONOCIDA CASO I Supongas que se desea probar la hipótesis 𝐻0 : 𝜇 = 𝜇0 𝐻𝑎 : 𝜇 ≠ 𝜇0 Donde 𝜇0 es un valor especifico. Sea 𝑥1 , 𝑥2 , 𝑥3 , ⋯ , 𝑥𝑛 una muestra aleatoria de tamaño 𝑛, y sea 𝑋̅ la media muestral con distribución normal con media 𝜇 y varianza 𝜎 2 entonces el estadístico de prueba para la media esta en la expresión 6.13, 𝑍0 = 𝑥̅ − 𝜇0 (6.13) 𝜎 √𝑛 Donde 𝜇0 es el valor que supuesto en la hipótesis nula (𝐻0 ). REGLA DE DECISION Si se ha planteado la hipótesis alternativa como, 𝐻𝑎 : 𝜇 ≠ 𝜇0 , donde 𝜇0 es un valor especifico, se tiene una prueba de hipótesis bilateral, es decir a dos colas, por lo tanto, el nivel de significancia 𝛼 se divide en dos partes iguales, quedando estos valores en los extremos de la distribución como se aprecia en la figura 6.8. En consecuencia, si 𝐻0 : 𝜇 = 𝜇0 es cierta, la probabilidad de que el estadístico de prueba 𝑍0 este entre −𝑍𝛼⁄2 y 𝑍𝛼⁄2 es 1 − 𝛼. Los valores de −𝑍𝛼⁄2 y 𝑍𝛼⁄2 pertenecen a una distribución Normal estándar. Nótese en la figura 6.8 que la probabilidad del estadístico de prueba este en la región 𝑍0 > 𝑍𝛼⁄2 o 𝑍0 < −𝑍𝛼⁄2 cuando 𝐻0 : 𝜇 = 𝜇0 es verdadera, es 𝛼. En consecuencia, la hipótesis 𝐻0 debe rechazarse si se cumple que 𝑍0 > 𝑍𝛼⁄2 o 𝑍0 < −𝑍𝛼⁄2 De otra forma si el valor del estadístico de prueba 𝑍0 está entre −𝑍𝛼⁄2 y 𝑍𝛼⁄2 no se rechaza la hipótesis H0. Figura 6.8 Distribución de Z0 cuando 𝐻0 : 𝜇 = 𝜇0 es verdadera, con región critica para 𝐻𝑎 : 𝜇 ≠ 𝜇0 . Ejemplo 6.6. Se esta estudiando el rendimiento de un proceso químico. De la experiencia, se sabe que la desviación estándar del rendimiento es de 3.2. En la tabla 6.5 están los resultados del rendimiento obtenidas los últimos 40 días en la planta de operación ¿Existe evidencia de que el rendimiento no es del 90%? Utilizar 𝛼 = 0.05. 86.74 81.58 87.68 84.84 91.88 87.38 87.32 81.72 89.66 82.66 83.81 88.30 85.00 80.67 81.84 92.51 88.22 76.78 86.18 79.35 85.33 89.65 81.76 90.84 83.75 87.04 89.33 82.97 88.31 85.22 86.33 86.04 86.86 83.26 82.97 86.74 90.39 92.32 88.45 88.11 Tabla 6.5 Rendimiento de un proceso químico Siguiendo los pasos de la prueba de hipótesis tenemos 1. El parámetro de interés es 𝜇, el promedio del rendimiento de un proceso. 2. La hipótesis nula es 𝐻0 : 𝜇 = 90 La hipótesis alternativa es 𝐻𝑎 : 𝜇 ≠ 90 3. El nivel de significancia es 𝛼 = 0.05 4. El estadístico de prueba es 𝑍0 = 𝑥̅ −𝜇0 𝜎 √𝑛 5. Rechazar H0 si se cumple que 𝑍0 > 𝑍𝛼⁄2 o 𝑍0 < −𝑍𝛼⁄2 , de la tabla I del apéndice se tiene que 𝑍0.025 = 1.96 y −𝑍0.025 = −1.96 . 6. Considerando que el promedio muestral 𝑥̅ = 85.99, n=40, 𝜎 = 3.2 y 𝜇0 = 90 el valor del estadístico de prueba es 𝑍0 = 85.99 − 90 3.2 √40 𝑍0 = −7.99 7. Dado que 𝑍0 < −𝑍0.025 , como se ilustra en la figura 6.9, se rechazar la hipótesis H0. 8. Por lo tanto se concluye, con una confianza estadística del 95%, de que el promedio del rendimiento de un proceso químico no es de 90%. Figura 6.9 Regla de decisión para una prueba de hipótesis a dos colas CASO II Si se ha planteado la hipótesis alternativa como: 𝐻𝑎 : 𝜇 > 𝜇0 , se tiene una prueba de hipótesis a una cola superior, quedando el nivel de significancia 𝛼 en la parte superior de la distribución, como se aprecia en la figura 6.10, donde 𝑍𝛼 pertenece a una distribución Normal estándar Figura 6.10 Regla de decisión para una prueba de hipótesis a una cola superior Si el valor del estadístico de prueba 𝑍0 es mayor que 𝑍𝛼 se rechaza la hipótesis nula, en caso contrario no se rechaza 𝐻0 . Ejemplo 6.7. Un proceso manufacturero usado por una fábrica durante los últimos años da una producción media de 100 unidades por hora con una desviación estándar de 8 unidades. Se acaba de introducir en el mercado una nueva máquina para realizar ese tipo de producto. Aunque es muy cara comparada con la que está ahora en uso, si la media de producción de la nueva máquina es de más de 150 unidades por hora, su adopción daría bastantes beneficios. Para decidir si se debiera comprar la nueva máquina, a la gerencia de la fábrica se le permite hacer un ensayo durante 35 horas, hallándose un promedio de 160 unidades por hora. Con ésta información qué decisión se debe tomar si se asume un nivel de confianza del 𝛼 = 0.01. Siguiendo los pasos de la prueba de hipótesis tenemos 1. El parámetro de interés es 𝜇, el promedio de producción de unidades. 2. La hipótesis nula es 𝐻0 : 𝜇 = 150 La hipótesis alternativa es 𝐻𝑎 : 𝜇 > 150 3. El nivel de significancia es 𝛼 = 0.01 4. El estadístico de prueba es 𝑍0 = 𝑥̅ −𝜇0 𝜎 √𝑛 5. Rechazar H0 si se cumple que 𝑍0 > 𝑍𝛼 de la tabla I del apéndice se tiene que 𝑍0.01 = 2.33 6. Considerando que el promedio muestral 𝑥̅ = 160, n=35, 𝜎 = 8 y 𝜇0 = 150 el valor del estadístico de prueba es 𝑍0 = 160 − 150 8 √35 𝑍0 = 7.395 7. Dado que 𝑍0 > 𝑍0.01 se rechazar la hipótesis H0. 8. En consecuencia, como puede observarse en la figura 6.11, el valor del estadístico de prueba está en la zona de rechazo de la hipótesis nula, por lo tanto, se acepta que la producción promedio por hora es superior a las 150 unidades y asumiendo un riesgo del 1%, se puede comprar la nueva máquina. Figura 6.11 Regla de decisión para una prueba de hipótesis a una cola inferior CASO III Si se ha planteado la hipótesis alternativa como, 𝐻𝑎 : 𝜇 < 𝑘, se tiene una prueba de hipótesis a una cola inferior, quedando el nivel de significancia 𝛼 en la parte inferior de la distribución, como se aprecia en la figura 6.12, 𝑍∝ pertenece a una distribución Normal estándar. Figura 6.12 Regla de decisión para una prueba de hipótesis a una cola inferior Si el valor del estadístico de prueba 𝑍0 es menor que 𝑍𝛼 se rechaza la hipótesis nula, en caso contrario no se rechaza 𝐻0 . Ejemplo 6.8. Considerando los datos del ejemplo 6.6 con respecto al rendimiento de un proceso químico, plantearemos la hipótesis alternativa de que el rendimiento del proceso químico es menor que el 90%, es decir 𝐻𝑎 : 𝜇 < 90, utilizar 𝛼 = 0.05. Siguiendo los pasos de la prueba de hipótesis tenemos 1. El parámetro de interés es 𝜇, el promedio del rendimiento de un proceso químico. 2. La hipótesis nula es 𝐻0 : 𝜇 = 90 La hipótesis alternativa es 𝐻𝑎 : 𝜇 < 90 3. El nivel de significancia es 𝛼 = 0.05 4. El estadístico de prueba es 𝑍0 = 5. Rechazar H0 si se cumple que 𝑥̅ −𝜇0 𝜎 √𝑛 𝑍0 < 𝑍𝛼 , de la tabla I del apéndice se tiene que 𝑍0.05 = 1.96. 6. Considerando que el promedio muestral 𝑥̅ = 85.99, n=40, 𝜎 = 3.2 y 𝜇0 = 90 el valor del estadístico de prueba es −7.99 𝑍0 = 85.99−90 3.2 √40 𝑍0 = 7. Dado que 𝑍0 < 𝑍0.05 se rechazar la hipótesis H0. 8. Por lo tanto se concluye, con una confianza estadística del 95%, de que el promedio del rendimiento de un proceso químico no es de 90%, dado el resultado de la prueba se puede afirmar que el promedio del rendimiento es menor a 90%. 6.19 PRUEBA DE HIPÓTESIS SOBRE IGUALDAD DE DOS MEDIAS, VARIANZAS CONOCIDAS En algunos problemas de investigación, se tiene el interés en comparar las medias de dos poblaciones distintas con muestras aleatorias independientes de tamaños 𝑛1 y 𝑛2 . Por ejemplo, comparar el rendimiento de dos maquinas de ensamble, comparar una encuesta de opinión sobre que opinan lo hombres con respecto a que opinan las mujeres, la calidad de un producto de un proveedor con respecto a otro proveedor, etc. Supóngase que se tienen dos poblaciones de interés, donde la primera tiene una media poblacional desconocida 𝜇1 y varianza conocida 𝜎12 y la segunda tiene una media poblacional desconocida 𝜇2 y varianza conocida 𝜎22 . Supóngase que las dos poblaciones son normales, y sino se aplican las condiciones del teorema del limite central. Un planteamiento de las hipótesis para la diferencia de medias en dos poblaciones se puede ver en la tabla 6.6. - Prueba de hipótesis a - Prueba de hipótesis a - Prueba de hipótesis a dos colas una cola superior una cola inferior 𝐻0 : 𝜇1 = 𝜇2 ó 𝐻0 : 𝜇1 − 𝜇2 = 𝑘 𝐻0 : 𝜇1 = 𝜇2 ó 𝐻0 : 𝜇1 − 𝜇2 = 𝑘 𝐻0 : 𝜇1 = 𝜇2 ó 𝐻0 : 𝜇1 − 𝜇2 = 𝑘 𝐻𝑎 : 𝜇1 ≠ 𝜇2 ó 𝐻𝑎 : 𝜇1 − 𝜇2 ≠ 𝑘 𝐻𝑎 : 𝜇1 > 𝜇2 ó 𝐻𝑎 : 𝜇1 − 𝜇2 > 𝑘 𝐻𝑎 : 𝜇1 < 𝜇2 ó 𝐻𝑎 : 𝜇1 − 𝜇2 < 𝑘 Tabla 6.6 Diversas formas de plantear las hipótesis, donde k es un valor específico. El procedimiento de prueba se basa en la distribución de la diferencia de las medias muestrales 𝑋̅1 − 𝑋̅2 . En general, si la hipótesis nula 𝐻0 : 𝜇1 = 𝜇2 es verdadera, la distribución de 𝑋̅1 − 𝑋̅2 es una distribución normal con media 𝜇1 − 𝜇2 y varianza 𝜎12 𝑛1 + 𝜎22 , 𝑛2 por lo tanto el estadístico de prueba, se puede ver en la expresión 6.14 𝑍0 = (6.14) (𝑥̅1 − 𝑥̅2 ) − (𝜇1 − 𝜇2 ) 𝜎12 √ 𝑛1 𝜎22 +𝑛 2 El estadístico 𝑍0 tiene una distribución normal estándar. Por consiguiente si la hipótesis alternativa es definida como 𝐻𝑎 : 𝜇1 ≠ 𝜇2 , entonces es una prueba de hipótesis es bilateral, por consiguiente la hipótesis nula 𝐻0 se rechaza si 𝑍0 > 𝑍𝛼⁄2 o 𝑍0 < −𝑍𝛼⁄2 Si la hipótesis alternativa es definida como 𝐻𝑎 : 𝜇1 > 𝜇2 , corresponde a una prueba de hipótesis unilateral a una cola superior, en consecuencia la hipótesis nula 𝐻0 se rechaza si 𝑍0 > 𝑍𝛼 Si la hipótesis alternativa es definida como 𝐻𝑎 : 𝜇1 < 𝜇2 , corresponde a una prueba de hipótesis unilateral a una cola inferior, en consecuencia la hipótesis nula 𝐻0 se rechaza si 𝑍0 < 𝑍𝛼 . Ejemplo 6.9 Un constructor está considerando dos lugares alternativos para construir un centro comercial. Como los ingresos de los hogares de la comunidad son una consideración importante en ésta selección, desea probar que el ingreso promedio de la primera comunidad excede al promedio de la segunda comunidad en cuando menos $1,500 diarios. Con la información de un censo realizado el año anterior se sabe que la desviación estándar del ingreso diario de la primera comunidad es de $1,800 y la desviación estándar de la segunda es de $2,400. Se toma una muestra aleatoria de 30 hogares de la primera comunidad, encuentra que el ingreso promedio es de $35,500 y con una muestra de 40 hogares de la segunda comunidad el ingreso promedio es de $34,600. Pruebe la hipótesis con un nivel de significancia 𝛼 = 0.05. Solución: Se desea probar si la diferencia entre los ingresos de la comunidad 1 y la 2 es de $1,500 o más, por lo tanto: 𝐻0 : 𝜇1 − 𝜇2 = 1,500 𝑯𝒂 : 𝝁𝟏 − 𝝁𝟐 > 𝟏, 𝟓𝟎𝟎 El tamaño de las muestras es grande y las varianzas poblacionales son conocidas, por consiguiente la estadística de trabajo a utilizar es la expresión 6.14 𝑛1 = 30 𝑥̅1 = 35,500 𝜎1 = 1,800 𝑛2 = 40 𝑥̅2 = 34,600 𝜎2 = 2,400 𝛼 = 0.05 𝑍0 = (𝑥̅1 − 𝑥̅2 ) − (𝜇1 − 𝜇2 ) 𝜎2 √ 1 𝑛1 + 𝜎22 𝑛2 = (35,500 − 34,600) − (1,500) 1,8002 √ 30 + 2,4002 40 = −1.195 Para un nivel de significancia 𝛼 = 0.05, en la tabla I de la distribución normal del apéndice se tiene un valor de 𝑍0.05 es 1.96. Por consiguiente 𝑍0 < 𝑍0.05 , lo que significa que no es posible rechazar la hipótesis nula, con lo que podemos por lo tanto, con una confiabilidad del 95%, la diferencia entre el ingreso promedio por hogar en las dos comunidades no es mayor a $1,500. 6.20 PRUEBA DE HIPÓTESIS SOBRE IGUALDAD DE DOS MEDIAS, VARIANZAS DESCONOCIDAS CON (𝒏𝟏 ≥ 𝟑𝟎 𝐲 𝒏𝟐 ≥ 𝟑𝟎) Para la diferencia de dos medias si las muestras se obtienen de poblaciones con distribuciones normales, pero 𝑛1 ≥ 30 y 𝑛2 ≥ 30 y varianzas poblacionales desconocidas, el estadístico de prueba de la expresión 6.14 es modificado al sustituir las varianzas muestrales 𝑠12 y 𝑠22 por sus respectivas varianzas poblacionales 𝜎12 y 𝜎22 , como se ilustra en la expresión 6.15 𝑍0 = (6.15) (𝑥̅1 − 𝑥̅2 ) − (𝜇1 − 𝜇2 ) √ 𝑆12 𝑛1 𝑆22 +𝑛 2 Las reglas de rechazo para la hipótesis nula, son las mismas que se describen en la sección 6.19. Ejemplo 6.10 Una muestra de 80 alambres de acero producidos por la fábrica A presenta una resistencia promedio a la ruptura de 1,230 lbs. Con una desviación estándar de 120 lbs. Una muestra de 100 alambres de acero producidos por la fábrica B presenta una resistencia promedio a la ruptura de 1,110 lbs. Con una desviación estándar de 90 lbs. Con base en ésta información pruebe si la resistencia promedio a la rotura de los alambres de acero de la marca A es significativamente mayor que la de los alambres de acero de la marca B. Utilizar un nivel de significancia de 𝛼 = 0.01. Solución Las hipótesis a probar son 𝐻0 : 𝜇𝐴 = 𝜇𝐵 𝐻𝑎 : 𝜇𝐴 > 𝜇𝐵 El tamaño de las muestras es grande, las varianzas poblacionales son desconocidas, y asumiendo que las medias poblacionales son iguales y sustituyendo 𝑥̅𝐴 = 1,230, 𝑠𝐴 = 120, 𝑥̅𝐵 = 1,190, 𝑠𝐵 = 90, 𝑛𝐵 = 100 y 𝑛𝐴 = 80 en el estadístico de prueba de la expresión 6.15, se tiene 𝑍0 = ̅2 ) − (𝜇1 − 𝜇2 ) (̅ 𝑥1 − 𝑥 𝑠2 √ 1 𝑛1 𝑠2 + 𝑛2 2 = (1,230 − 1,190) − (0) 2 √120 80 902 + 100 = 2.476 Para un nivel de significancia 𝛼 = 0.01, en la tabla de la distribución normal el valor de 𝑍0.05 es 2.33. Se tiene que 𝑍0 > 𝑍0.05, como se aprecia en la figura 6.13, El estadístico de prueba 𝑍0 está en la zona de rechazo de la hipótesis nula, por consiguiente, con una confiabilidad del 99% se acepta que la resistencia promedio de los alambres de la marca A es significativamente mayor que la resistencia promedio de los alambres de la marca B. Figura 6.13 Regla de decisión para una prueba de hipótesis a una cola superior 6.21 PRUEBAS DE HIPÓTESIS SOBRE LA MEDIA DE UNA DISTRIBUCION NORMAL, VARIANZA DESCONOCIDA (𝒏 ≤ 𝟑𝟎). Cuando se prueban hipótesis sobre la media 𝜇 de una población normal cuando 𝜎 2 es desconocida, es posible aplicar los procedimientos de la sección 6.18, al sustituir la desviación estándar muestral S por la desviación estándar poblacional 𝜎, siempre y cuando el tamaño de muestra sea grande, es decir 𝑛 ≥ 30. Sin embargo, cuando la muestra es pequeña, digamos 𝑛 ≤ 30, y 𝜎 2 es desconocida se requiere de otra distribución de muestreo. Sea 𝑥1 , 𝑥2 , 𝑥3 , ⋯ , 𝑥𝑛 una muestra aleatoria de tamaño 𝑛, y sea 𝑋̅ y S la media y desviación estándar muestral, respectivamente, se desea probar la hipótesis alternativa bilateral 𝐻0 : 𝜇 = 𝜇0 𝐻𝑎 : 𝜇 ≠ 𝜇0 Donde 𝜇0 es un valor especifico. El estadístico de prueba es 𝑡0 = 𝑥̅ − 𝜇0 (6.16) 𝑆 √𝑛 El estadístico 𝑡0 tiene una distribución t con n-1 grados de libertad, si la hipótesis nula 𝐻0 : 𝜇 = 𝜇0 , es verdadera, para una hipótesis alternativa bilateral 𝐻𝑎 : 𝜇 ≠ 𝜇0 , la hipótesis nula 𝐻0 se rechaza si 𝑡0 > 𝑡𝛼⁄2,𝑛−1 o 𝑡0 < −𝑡𝛼⁄2,𝑛−1 donde 𝑡𝛼⁄ 2,𝑛−1 y −𝑡𝛼⁄ 2,𝑛−1 son los puntos superior e inferior, respectivamente, de la distribución t con n-1 grados de libertad. Si la hipótesis alternativa unilateral superior 𝐻𝑎 : 𝜇 > 𝜇0 , se calcula el estadístico de prueba 𝑡0 de la expresión 6.16, la hipótesis nula 𝐻0 , se rechaza si 𝑡0 > 𝑡𝛼,𝑛−1 y por lo contrario no se rechaza 𝐻0 . Para una hipótesis alternativa unilateral inferior 𝐻𝑎 : 𝜇 < 𝜇0 , se calcula el estadístico de prueba 𝑡0 de la expresión 6.16, la hipótesis nula 𝐻0 , se rechaza si 𝑡0 < −𝑡𝛼,𝑛−1 y por lo contrario no se rechaza 𝐻0 . Ejemplo 6.11 En su calidad de comprador comercial para un supermercado, se toma una muestra aleatoria de 12 sobres de café de una empacadora. Se encuentra que el peso promedio muestral del contenido de café de cada sobre es 15.97 grs. con una desviación estándar de 0.15. La compañía empacadora afirma que el peso promedio mínimo del café es de 16 grs. por sobre. ¿Puede aceptarse ésta afirmación si se asume un nivel de confianza del 90%? Solución. Se desea probar si el peso mínimo es de 16 grs., es decir mayor o igual a 16 grs., así que las hipótesis adecuadas son: 𝐻0 : 𝜇 = 16 𝐻𝑎 : 𝜇 > 16 Teniendo en cuenta que el tamaño de la muestra es pequeño 𝑛 = 12, la media muestra es 𝑥̅ = 15.97 y su desviación estándar muestral es S=0.15, el calculo del estadístico de prueba 𝑡0 = 𝑥̅ − 𝜇0 𝑆 √𝑛 = 15.97 − 16 0.15 √12 = −0.697 Como lo indica la hipótesis alternativa, se trabaja a una cola superior y para 𝛼 = 0.10 en la tabla II, de la distribución 𝑡 del apéndice, con 11 grados de libertad el valor de 𝑡0.10,11 es 1.363. Por consiguiente 𝑡0 < 𝑡0.10,11 , y en consecuencia no se puede rechazar la hipótesis nula y se puede concluir que la compañía de café tiene la razón de que el peso promedio mínimo de los sobres de café es de 16 grs. 6.22 PRUEBAS DE HIPÓTESIS SOBRE LAS MEDIAS DE DOS DISTRIBUCIONES NORMALES, VARIANZAS DESCONOCIDAS Supóngase que se tienen dos poblaciones de interés, donde la primera tiene una media poblacional desconocida 𝜇1 y varianza desconocida 𝜎12 y la segunda tiene una media poblacional desconocida 𝜇2 y varianza desconocida 𝜎22 . Supóngase que las dos poblaciones son normales. Un planteamiento de las hipótesis para la diferencia de medias en dos poblaciones se puede ver en la tabla 6.6. Para probar las hipótesis que se plantean en la tabla 6.6 se usara el estadístico de prueba t. Pero para esto, es necesario considerar dos situaciones diferentes. En el primer caso, se supondrá que las varianzas de las dos distribuciones normales son desconocidas pero iguales, esto es 𝜎12 = 𝜎22 = 𝜎 2 y en un segundo caso, se supondrá que 𝜎12 ≠ 𝜎22 y desconocidas. Caso I 𝝈𝟐𝟏 = 𝝈𝟐𝟐 Sea 𝑥11 , 𝑥12 , 𝑥13 , ⋯ , 𝑥1𝑛1 una muestra aleatoria de 𝑛1 observaciones tomadas de la primera población y sea 𝑥21 , 𝑥22 , 𝑥23 , ⋯ , 𝑥2𝑛2 una muestra aleatoria observaciones de la segunda población. Sean 𝑋̅1 , 𝑋̅2 , 𝑆12 , 𝑆22 de 𝑛2 las medias muestrales y varianzas muestrales, respectivamente. Supongamos que 𝑆12 𝑦 𝑆22 son estimaciones de la varianza común 𝜎 2 , en consecuencia ambas varianzas muestrales pueden combinarse para formar un solo estimador, como se ilustra en la expresión 𝑆𝑝2 = (6.17) (𝑛1 − 1)𝑆12 + (𝑛2 − 1)𝑆22 𝑛1 + 𝑛2 − 2 Por lo tanto el estadístico de prueba para la comparación de dos medias es 𝑡0 = 𝑥̅1 − 𝑥̅2 1 𝑆𝑝 √𝑛 1 + (6.18) 1 𝑛2 Donde 𝑆𝑝 es, (6.19) (𝑛1 − 1)𝑆12 + (𝑛2 − 1)𝑆22 𝑆𝑝 = √ 𝑛1 + 𝑛2 − 2 Si 𝐻0 : 𝜇1 = 𝜇2 es verdadera 𝑡0 tiene una distribución 𝑡𝑛1 +𝑛2 −2. Si la hipótesis alternativa es bilateral 𝐻𝑎 : 𝜇1 ≠ 𝜇2 , entonces si 𝑡0 > 𝑡𝛼⁄ 2,𝑛1 +𝑛2 −2 o 𝑡0 < −𝑡𝛼⁄ se debe rechazar la hipótesis nula 𝐻0 : 𝜇1 = 𝜇2 . 2,𝑛1+𝑛2 −2 Si la hipótesis alternativa es unilateral superior 𝐻𝑎 : 𝜇1 > 𝜇2 , entonces si 𝑡0 > 𝑡𝛼⁄ 2,𝑛1 +𝑛2 −2 se debe rechazar la hipótesis nula 𝐻0 : 𝜇1 = 𝜇2 . Si la hipótesis alternativa es unilateral inferior 𝐻𝑎 : 𝜇1 < 𝜇2 , entonces si 𝑡0 < −𝑡𝛼⁄2,𝑛1 +𝑛2 −2 se debe rechazar la hipótesis nula 𝐻0 : 𝜇1 = 𝜇2 . Ejemplo 6.12 Caso II 𝝈𝟐𝟏 ≠ 𝝈𝟐𝟐 En algunos casos no es recomendable suponer que la varianzas desconocidas 𝜎12 𝑦 𝜎22 sean iguales. En tal situación, no existe un estadístico t exacto para probar la hipótesis nula 𝐻0 : 𝜇1 = 𝜇2 . Pero el estadístico 𝑥̅1 − 𝑥̅2 𝑡0∗ = 𝑆2 √1 𝑛1 + (6.20) 𝑆22 𝑛2 tiene una distribución que es aproximadamente una distribución t con v grados libertad, donde 𝑣 esta dado por 𝑆2 𝑣= 1 2 2 2 𝑆2 𝑆2 ( 1⁄𝑛1 ) ( 2⁄𝑛2 ) 𝑛1 +1 (6.21) 2 𝑆2 (𝑛1 +𝑛2 ) + - 2 𝑛2 +1 El procedimiento de prueba de hipótesis es el mismo, que en caso I, solo que ahora los grados de libertad están determinados por la expresión 6.21. Ejemplo 6.13 6.23 PRUEBA DE HIPÓTESIS PARA PARA UNA PROPORCION En muchos problemas que surgen en la práctica tienen una variable aleatoria que sigue una distribución binomial, por ejemplo, la proporción de productos defectuosos, la proporción de personas que están de acuerdo con una nueva política en la empresa, la proporción de personas que presentan cierto síntoma de enfermedad, etc. En este caso el parámetro de interés es p, por consiguiente las hipótesis para considerar en la prueba están en la tabla 6.7 - Prueba de hipótesis a - Prueba de hipótesis a - Prueba de hipótesis a dos colas una cola superior una cola inferior 𝐻0 : 𝑝 = 𝑝0 𝐻0 : 𝑝 = 𝑝0 𝐻0 : 𝑝 = 𝑝0 𝐻𝑎 : 𝑝 ≠ 𝑝0 𝐻𝑎 : 𝑝 > 𝑝0 𝐻𝑎 : 𝑝 < 𝑝0 Tabla 6.7 Hipótesis a considera en la prueba, donde 𝑝0 es un valor especifico Si la hipótesis nula 𝐻0 : 𝑝 = 𝑝0 es verdadera, el estadístico de prueba es 𝑍0 = 𝑝 − 𝑝0 (6.22) 𝑝(1−𝑝) √ 𝑛 Para una hipótesis alternativa bilateral 𝐻𝑎 : 𝑝 ≠ 𝑝0 , la hipótesis nula 𝐻0 : 𝑝 = 𝑝0 se rechazará si 𝑍0 > 𝑍𝛼⁄2 o 𝑍0 < −𝑍𝛼⁄2 Para una hipótesis alternativa unilateral superior 𝐻𝑎 : 𝑝 > 𝑝0 , la hipótesis nula 𝐻0 : 𝑝 = 𝑝0 se rechazará si 𝑍0 > 𝑍𝛼 Para una hipótesis alternativa unilateral inferior 𝐻𝑎 : 𝑝 < 𝑝0 , la hipótesis nula 𝐻0 : 𝑝 = 𝑝0 se rechazará si 𝑍0 < −𝑍𝛼 Es importante señalar que el estadístico de prueba es valido siempre y cuando no sea muy próximo a 1 o a cero, y si el tamaño de muestra es relativamente grande, digamos 𝑛 ≥ 30. Ejemplo 6.14 Un fabricante afirma que por lo menos el 90% de las piezas de una maquinaria que se fabrican en una empresa cumplen con las especificaciones del producto. Una inspección de 200 de esas piezas reveló que 160 de ellas cumplían con las especificaciones. Pruebe si lo que afirma el fabricante es cierto. Utilizar 𝛼 = 0.05. Solución: 𝐻0 : 𝑝 = 0.9 𝐻𝑎 : 𝑃 < 0.9 Para realizar una prueba de hipótesis para la proporción se utiliza la expresión 6.22 𝑛 = 200 𝑝= 𝑍0 = 160 = 0.8 200 𝑝 − 𝑝0 𝑝(1−𝑝) √ 𝑛 = 1 − 𝑝 = 0.2 0.8 − 0.9 𝛼 = 0.05 = −3.536 (0.8)(0.2) √ 200 Para 𝛼 = 0.05 y de la tabla I de la distribución normal estándar del apéndice el valor de −𝑍𝛼 = −1.64, de este modo 𝑍0 < −𝑍𝛼 , por consecuencia El valor del estadístico de prueba se encuentra en la zona de rechazo, como se puede observar en la figura 6.14, por consiguiente, con una confiabilidad del 95% se concluye que la afirmación del fabricante no es cierta. Figura 6.14 Regla de decisión para una prueba de hipótesis a una cola inferior 6.24 PRUEBA DE HIPÓTESIS PARA UNA VARIANZA Supóngase que se quiere probar la hipótesis de que la varianza de una población normal 𝜎 2 es igual un valor específico, digamos, 𝜎02 . Para probar 𝐻0 : 𝜎 2 = 𝜎02 𝐻𝑎 : 𝜎 2 ≠ 𝜎02 Se utiliza el estadístico de prueba 𝜒02 = (𝑛 − 1)𝑠 2 (6.23) 𝜎02 donde 𝑠 2 es la varianza muestral. Si la hipótesis nula 𝐻0 : 𝜎 2 = 𝜎02 es verdadera, entonces el estadístico 𝜒02 se distribuye ji-cuadrada con n-1 grados de libertad. Si se plantea como hipótesis alternativa 𝐻𝑎 : 𝜎 2 ≠ 𝜎02 , entonces se trata una prueba de hipótesis bilateral. Por consiguiente, la hipótesis nula 𝐻0 : 𝜎 2 = 𝜎02 , será rechazada si se cumple que 𝜒02 > 𝜒𝛼2,𝑛−1 o 2 2 𝜒02 < 𝜒1− 𝛼 ,𝑛−1 2 2 donde 𝜒𝛼2,𝑛−1 y 𝜒1− son los puntos que corresponden a los porcentajes 100𝛼/2 𝛼 ,𝑛−1 2 2 inferior y superior, respectivamente, de la distribución ji-cuadrada con n-1 grados de libertad. Si se plantea como hipótesis alternativa 𝐻𝑎 : 𝜎 2 > 𝜎02 , entonces se trata una prueba de hipótesis unilateral superior. Por consiguiente, la hipótesis nula 𝐻0 : 𝜎 2 = 𝜎02 , será rechazada si se cumple que 2 𝜒02 > 𝜒𝛼,𝑛−1 Si se plantea como hipótesis alternativa 𝐻𝑎 : 𝜎 2 < 𝜎02 , entonces se trata una prueba de hipótesis unilateral inferior. Por consiguiente, la hipótesis nula 𝐻0 : 𝜎 2 = 𝜎02 , será rechazada si se cumple que 2 𝜒02 < 𝜒1−𝛼,𝑛−1 Ejemplo 6.15 Se afirma que un pieza para un semiconductor es producido por una compañía, tiene una varianza del diámetro no mayor que 0.0002 pulgadas. Una muestra aleatoria de 10 piezas arrojó una varianza muestral de 0.0003, pruébese que la varianza del diámetro de la pieza es mayor que 0.0002, utilícese 𝛼 = 0.05. Solución. Las hipótesis a probar son 𝐻0 : 𝜎 2 = 0.0002 𝐻𝑎 : 𝜎 2 > 0.0002 Es una prueba de hipótesis unilateral superior. Supongamos que las mediciones de los diámetros tienen una distribución normal, por consiguiente el valor del estadístico de prueba es 𝜒02 = (𝑛 − 1)𝑠 2 𝜎02 = (9)(0.0003) = 13.5 0.0002 Para un 𝛼 = 0.05 y de la tabla III de los valores de la distribución ji-cuadrada, se 2 2 tiene que 𝜒0.05,9 = 16.919. Por consiguiente se tiene que 𝜒02 < 𝜒𝛼,𝑛−1 , por lo tanto no es posible rechazar 𝐻0 : 𝜎 2 = 0.0002 , lo que significa que no hay suficiente evidencia para afirmar que 𝜎 2 sea mayor que 0.0002. 6.25 DISTRIBUCION MUESTRAL F DE SNEDECOR Si 𝑆12 𝑦 𝑆22 son las varianzas de muestras aleatorias independientes de tamaño 𝑛1 𝑦 𝑛2, respectivamente, tomadas de dos poblaciones normales que tienen la misma varianza, entonces 𝐹0 = 𝑆12 𝑆22 (6.24) Es un valor de una variable aleatoria que tiene distribución 𝐹 con parámetros 𝑣1 = 𝑛1 − 1 𝑦 𝑣2 = 𝑛2 − 1. En la figura 6.15 se puede ver la grafica de esta distribución. La distribución 𝐹 se usa en situaciones de dos muestras para realizar inferencias sobre la población. Sin embargo, la distribución 𝐹 se aplica a muchos otros tipos de problemas en los cuales están relacionadas las varianzas muestrales. De hecho la distribución 𝐹 se llama distribución de razón de varianzas. Fig. 6.15. Distribución 𝐹. 6.26 COMPARACION DE DOS VARIANZAS POBLACIONALES Las características son: Continua, es decir valores infinitos. Positivamente sesgada (derecha). Asintótica (aumenta 𝑥 pero no toca el eje) Existe una familia de distribuciones 𝐹 (grados de libertad) Pasos para comparar dos varianzas poblacionales 1. Hipótesis nula vs hipótesis alternativa: 𝐻0 : 𝜎12 = 𝜎22 𝐻𝑎 : 𝜎12 ≠ 𝜎22 𝐻0 : 𝜎12 = 𝜎22 𝐻𝑎 : 𝜎12 > 𝜎22 𝐻0 : 𝜎12 = 𝜎22 𝐻𝑎 : 𝜎12 < 𝜎22 2. Nivel de confianza 𝛼: Probabilidad de rechazar la hipótesis nula. usualmente 0.05 y 0.01 3. Grados de Libertad y Valor Crítico (𝑛 − 1). Según los grados de libertad se ubica el valor crítico en la tabla 𝐹. 4. Se extrae el valor de prueba: 𝐹 = 𝑆12 𝑆22 el valor resultante se compara con el valor crítico (𝐹), si es mayor se rechaza la hipótesis nula. Ejemplo 6.16 Una compañía produce piezas maquinadas para motor que se supone tienen una varianza en diámetro no mayor que 0.0002 pulgadas. Una muestra aleatoria de 𝑛 = 10 piezas dio 𝑠12 = 0.0003 pulgadas. Suponga que deseamos comparar la variación en los diámetros de las piezas producidas por la empresa, con la variación en los diámetros de las piezas producidas por un competidor donde para 𝑛 = 20 piezas la 𝑠22 = 0.0001 ¿los datos proporcionan suficiente información para indicar una variación mas pequeña en diámetros para el competidor? Prueba usando 𝛼 = 0.05. Solución: Estamos probando 𝐻0 : 𝜎12 = 𝜎22 𝑣𝑠 𝐻𝑎 : 𝜎12 > 𝜎22 𝑆2 El estadístico de prueba, 𝐹 = 𝑆12 esta basado en 𝑣1 = 9 𝑔𝑙 en el numerador 2 y 𝑣2 = 19 𝑔𝑙 en el denominador y 𝐹0.05 = 2.42 (véase la tabla IV del apéndice) como el valor observado del estadístico de prueba es 𝑆12 0.0003 𝐹= 2= =3 𝑆2 0.0001 Vemos que 𝐹 > 𝐹0.05, por tanto, en el nivel 𝛼 = 0.05, rechazamos 𝐻0 : 𝜎12 = 𝜎22 a favor de 𝐻𝑎 : 𝜎12 > 𝜎22 y concluimos que la compañía competidora produce piezas con menor variación en sus diámetros. Ejercicios unidad 6 1. Una muestra aleatoria de 100 muertos registrado en México el año pasado muestra una vida promedio de 71.8 años. Suponga una desviación estándar poblacional de 8.9 años, ¿esto parece indicar que la vida media hoy en día es mayor de 70 años? Use α=0.05 µ=71.8 S=8.9 n=100 x =70 2. Buscando conocer los efectos entre hombres y mujeres de una gran compañía publicitaria contra el uso del tabaco, se ha observado a 90 hombres y 90 mujeres fumadores elegidos al azar para ver si hay diferencia en la disminución de cigarros consumidos diariamente; los resultados son: los hombres x1 5.6 cigarros menos y una desviación estándar S1 3.5 , y las mujeres x2 7.2 cigarros menos con S 2 2.9 ¿Qué nos permite inferir estos resultados? Use α=0.05 3. En el pasado, 15% de la propaganda por correo para donativos dio como resultado contribuciones. Se mando una nueva carta a una muestra de 200 personas y 45 enviaron un donativo. Para α=0.05 ¿Se puede concluir que la nueva carta fue más efectiva? p 0.45 n 200 H 0 : p 0.45 4. Un periodista publicó una nota en la que sostiene que 35 de cada 100 taxistas en la ciudad son personas que por lo menos han empezado una carrera profesional ¿Se confirma este porcentaje si en una muestra aleatoria de 90 taxistas, 38 de ellos expresaron haber iniciado al menos una carrera profesional? Use α=0.05 p1 0.35 n1 100 p2 0.42 n2 90 5. El proceso de bruñido se usa para esmerilar ciertos discos de silicio al grueso apropiado es aceptable sólo si σ ≤ 0.5 mm. Emplear el nivel de H : 0.5 H : 0 a significancia de α=0.05 para probar la > 0.5 si el grosor de 15 cubitos cortados de tales discos tienen una desviación estándar de 0.64 mm. S 0.64 n 15 6. Al analizar el mercado de comportamiento interno de un país, los responsables de la economía nacional han formulado la siguiente hipótesis de trabajo: “El índice de variación de los precios de los alimentos básicos en las zonas de alto nivel de vida es el mismo que el de las zonas de bajo nivel de vida”. Para contrastarla, se hizo un estudio en un sector, muy representativo, del respectivo nivel de vida de cada zona; o sea que se extrajeron al azar dos muestras de tamaño n1 n2 60 . Con cada muestra se obtuvieron los precios de uno de los principales alimentos básicos; registrándose las desviaciones estándar muéstrales S1 1.75 Pruebe la hipótesis con un 98% de confianza. S 2 2.07 .