Download Pruebas de hipótesis
Document related concepts
no text concepts found
Transcript
1 UNIDAD 5 PRUEBAS DE HIPÓTESIS Una hipótesis se define como una teoría tentativa o suposición adoptada provisionalmente para explicar ciertos hechos y guiar la investigación de otros. Una hipótesis estadística es un enunciado respecto a un parámetro de una o más poblaciones (, , p). Con frecuencia es deseable probar la validez de tales hipótesis. A fin de lograrlo se lleva a cabo un experimento y la hipótesis es rechazada si los valores obtenidos para el equivalente muestral del parámetro son tan grandes o tan pequeños que la probabilidad de que ocurran si la hipótesis es cierta es bastante remota; si los datos son muy probables, la hipótesis es “no rechazada”. Generalmente, se habla de "no rechazar" una hipótesis en lugar de "aceptar", ya que lo único que puede concluirse es que no hay suficiente evidencia estadística para rechazarla. Por ejemplo, se lanza la hipótesis de que la probabilidad de obtener un 1 al lanzar un dado es 1/6. Para probar dicha hipótesis se arroja un dado 600 veces; por intuición, es evidente que si se obtienen 600 unos, la hipótesis debe ser rechazada; al contrario, si se obtienen 100 unos, la hipótesis debe ser indudablemente “no rechazada”. Cuando se obtienen resultados tan claros, la intuición es suficiente para decidir cuando rechazar la hipótesis, pero generalmente los experimentos no conducen a conclusiones tan obvias; de ahí la necesidad de las pruebas de hipótesis. Implica, en cualquier investigación, la existencia de dos teorías o hipótesis implícitas, que se denominan hipótesis nula (Ho) e hipótesis alternativa (H1) y que de alguna manera reflejarán esa idea a priori que tenemos y que pretendemos contrastar con la “realidad”'; normalmente H1 es la negación de H0. Una hipótesis nula siempre debe establecerse de forma que especifique un valor exacto del parámetro (o con ≥ o ≤ si la prueba es unilateral), mientras que la hipótesis alternativa permite la posibilidad de varios valores. Por ejemplo, si Ho es p = 0.1, podría ser p 0.1, p > 0.1 o p < 0.1. La única manera de asegurar la veracidad o falsedad de una hipótesis estadística con certeza absoluta consiste en evaluar toda la población. Como lo que se hace generalmente es tomar una muestra, sólo puede hablarse de sospechas y, por ende, siempre existe la posibilidad de una conclusión errónea. El rechazo de Ho significa simplemente que hay una pequeña probabilidad de obtener la información muestral observada cuando, de hecho, la hipótesis es verdadera y no necesariamente que dicho planteamiento sea falso. Como la decisión de rechazar o no la hipótesis nula está basada en la elección de una muestra tomada al azar y por tanto es posible tomar decisiones erróneas. Los errores que se pueden cometer se clasifican como sigue: 2 a) Si se rechaza la hipótesis nula cuando realmente es verdadera. Esto se conoce como error tipo I; la probabilidad de cometerlo se denota con y se conoce como nivel de significancia. La probabilidad de cometer un error de este tipo es el mismo nivel de significancia. b) Si se acepta la hipótesis nula cuando realmente es falsa. Esto se conoce como error tipo II y la probabilidad de cometerlo se denota con . En lenguaje estadístico: = P(error tipo I) = P(rechazar Ho\ Ho es V) = P(error tipo II) = P(aceptar Ho\ Ho es falsa) Los errores tipo I y II están relacionados: Una disminución en la probabilidad de cometer uno de ellos siempre da como resultado un aumento en la probabilidad del otro, siempre que el tamaño muestral sea constante. En general, si el tamaño de muestra se aumenta, se reducen tanto como . EJEMPLO 5.1. Para ilustrar cómo se puede rechazar una hipótesis verdadera, suponga que una firma que fabrica computadores personales utiliza una gran cantidad de tarjetas de circuitos impresos. Los proveedores concursan para abastecer las tarjetas y, a quien presenta la cotización más baja, se le otorga un contrato considerable. El contrato especifica que el departamento de control de calidad del fabricante de los computadores hará un muestreo de todos los embarques de tarjetas que reciba; si más del 6% de las tarjetas de la muestra están por debajo de la norma, el embarque será rechazado. La hipótesis nula es que los embarques de tarjetas que se reciben contienen máximo 6% de tarjetas por debajo de la norma. La hipótesis alternativa es que está defectuoso más del 6% de las tarjetas. Una muestra de 50 tarjetas del lote que se recibió hoy reveló que 4 de ellas (8%) estaban por debajo de la norma. Si las tarjetas del embarque estaban en realidad por debajo de la norma, entonces la decisión de devolver las tarjetas al proveedor es correcta, pero supongamos que el embarque contenía 4000 tarjetas y que esas 4 eran las únicas defectuosas en todo el lote (sólo 0.1%); en ese caso, menos del 6% de todo el embarque estaba por debajo de la norma y el rechazo del embarque sería un error. Es decir, se rechazó la hipótesis nula cuando debió haberse aceptado; se cometió, entonces, un error tipo I. Supongamos ahora que dos de las cincuenta tarjetas de la muestra que se probó (4%) estuvieran por debajo de la norma, cuando el embarque tiene realmente 10% de tarjetas defectuosas. Según el procedimiento establecido, el embarque debe ser aceptado y, por tanto, se estaría cometiendo un error tipo II. 3 Desarrollamos en esta unidad los contrastes de hipótesis para los parámetros más usuales que venimos estudiando en los capítulos anteriores: medias y proporciones de una población. Los contrastes desarrollados en esta unidad se apoyan en que los datos poblacionales siguen una distribución normal. El procedimiento general consiste en definir un estadístico relacionado con la hipótesis que deseamos contrastar; a éste lo denominamos estadístico del contraste (Texp). A continuación suponiendo que H0 es verdadera se calcula un intervalo denominado región de aceptación de la hipótesis nula (Ti, Ts) (basados en un nivel de significancia, que indica el porcentaje de medias muestrales que está fuera la región de aceptación) y se compara con el estadístico de contraste, así: EJEMPLO 5.2. Un fabricante está interesado en el voltaje de salida de una fuente de alimentación utilizada en un computador. Se supone que el voltaje de salida tiene una distribución normal, con = 0.25 V; el fabricante desea probar Ho: = 5V contra H1: 5V y utiliza para ello 8 unidades. Si la media muestral cae entre 4.85 y 5.15V, el fabricante acepta la hipótesis; de lo contrario, la rechaza. Calcular la probabilidad de cometer un error tipo I y la probabilidad de cometer un error tipo II si es realmente 5.2V. Solución: La probabilidad de cometer un error tipo I puede calcularse como: P( X 4.85 / 5) P( X 5.15 / 5) P( Z 4.85 5 )*2 0.25 / 8 = P(Z < -1.70) * 2 = 2 * 0.0446 = 0.0892 Esto implica que el 8.92% de todas las muestras aleatorias conducirían al rechazo de Ho ( = 5V) cuando el voltaje de salida es realmente 5V. Es posible reducir aumentando el tamaño de la región de aceptación (si se puede) o incrementando el tamaño de la muestra. 4 Para calcular debe tenerse una H1 específica (en este caso, un valor particular de ): Según lo dado, podría calcularse como: P(4.85 X 5.15) / 5.2) P( 4.85 5.2 5.15 5.2 Z ) 0.25 / 8 0.25 / 8 P(3.96 Z 0.57) 0.2843 Un concepto muy importante que se relaciona con las posibilidades de error es la noción de potencia de una prueba, que es la probabilidad de rechazar de manera correcta una Ho que es falsa. Por lo tanto, el valor de la potencia es 1 – β. La potencia es una medida muy descriptiva y concisa de la sensibilidad de una prueba estadística (su capacidad para detectar diferencias). Por ejemplo, en el caso anterior β es 0.2843; por consiguiente, la potencia de la prueba es 0.7157 cuando µ = 5.2V. Esto es, la sensibilidad de la prueba para detectar la diferencia entre un voltaje de salida de 5V y otro de 5.2V es 0.7157, es decir, si el valor verdadero de µ es 5.2V, la prueba detectará esa diferencia (y rechazará Ho) el 71.57% de las veces. Si este valor se considera bajo, debe aumentarse α o el tamaño de la muestra. HIPÓTESIS UNILATERALES Y BILATERALES Una prueba de hipótesis se hace bilateral si es importante detectar diferencias a partir del valor hipotético del parámetro que se encuentren a su derecha o a su izquierda; en este caso la hipótesis alternativa se plantea con ≠, por ejemplo, µ ≠ µo. En una prueba de este tipo, la región crítica se separa en dos partes, generalmente con la misma probabilidad en cada cola. Si la afirmación implica alguna dirección, es decir, si lo que se quiere demostrar es que el parámetro es mayor o menor que un determinado valor, lo apropiado es hacer una prueba unilateral. Si la hipótesis alternativa es µ > µo, la región de rechazo debe encontrarse en la cola superior y, si es µ < µo, la región crítica se encontrará en la cola inferior. USO DE VALORES P EN LA PRUEBA DE HIPÓTESIS El nivel de significancia α puede predeterminarse antes de realizar el experimento, pero el rechazo de la hipótesis no muestra de una manera cuantitativa qué tan cerca o qué tan lejos está el valor con respecto a la región de aceptación (caso equivalente si se acepta). 5 Para evitar esta dificultad, existe el enfoque de valor P, que es el nivel de significancia más pequeño que conduce al rechazo de la hipótesis nula; el valor P es la probabilidad de que el estadístico de prueba tome un valor que sea al menos tan extremo como el valor observado del estadístico de prueba cuando la hipótesis nula es verdadera. Por lo tanto, un valor muy pequeño de P (por ejemplo, menor a 0.03) rechaza claramente Ho, ya que existiría una probabilidad mínima de que esa hipótesis fuera verdad. En caso de que haya predeterminado α, si el valor P es menor que él, se rechaza H o. En caso contrario no se rechaza. La tabla siguiente proporciona una interpretación razonable de los valores p: Valor P Interpretación Fuerte evidencia contra H0 P 0,01 0,01 P 0,05 Moderada evidencia contra H0 0,05 P 0,10 Evidencia sugestiva contra H0 Poca o no evidencias reales contra H0 0,10 P El resultado de determinar el valor P no sólo es una decisión respecto de Ho, sino que da una perspectiva adicional a la fortaleza de la decisión. Para ilustrar la situación, revisemos el siguiente ejemplo: EJEMPLO 5.3. Cierto experimento describe los resultados de pruebas de resistencia de 15 especímenes de cierta aleación que se utiliza en un proceso determinado. La carga para la que cada especimen falla es –en MPa-: 11.2 10.8 12.5 9.3 11.2 10.3 11.2 13.5 9.3 10.7 11.5 12.3 12.9 10.7 12 Si se asume distribución normal, ¿sugieren los datos que la carga promedio de falla es mayor que 10 MPa? Para responder la pregunta, tomar como base el respectivo valor P. Solución: X 11.293 MPa S 1.206 MPa H 0 : 10 MPa H 1 : 10 MPa Estadístico de prueba: t 11.293 10 1.206 / 15 4.15 6 Valor P es aproximadamente 0. Por lo tanto, se rechaza Ho y se concluye que la carga de falla promedio es mayor de 10 MPa. Tomando como base las distribuciones de muestreo ampliamente revisadas en la primera unidad, pueden realizarse pruebas de hipótesis para: Media, con varianza conocida o desconocida. Igualdad de dos medias, con varianza conocida o desconocida. Una o dos proporciones. Una o dos varianzas. Muestras pareadas. Además, desarrollar una prueba de hipótesis a un nivel de significancia α es equivalente a calcular un intervalo de confianza de 100(1-α)% sobre el mismo parámetro y rechazar Ho si el estadístico muestral no está dentro del intervalo de confianza. Por esas razones, no se amplía demasiado el tema. SUGERENCIAS: Conviene plantear la hipótesis nula siempre por la igualdad. Adapte la contrahipótesis de acuerdo con el objetivo del problema. Formule la hipótesis en base a los objetivos del estudio, pero siempre antes de extraer la muestra y calcular el estimador puntual del parámetro desconocido, para no verse influenciado por este resultado. Tenga en cuenta que si bien la hipótesis nula es la que se pone bajo prueba, eso no significa que deba ser siempre la suposición que el experimentador desea que se compruebe. Como en todo proceso de inferencia, existe algún grado de subjetividad en la realización de una prueba, particularmente en la elección del nivel de significancia y del tamaño de la muestra. Trate de que la elección de estos valores responda a un análisis cuidadoso del problema en cuestión. Una vez fijadas las condiciones de la prueba, el resultado de la misma es totalmente objetivo. Para fijar el nivel de significancia de la prueba, hay que tener en cuenta que cuando la probabilidad del error tipo I aumenta, la del error tipo II disminuye. La forma de minimizar el error tipo II independientemente del nivel de significancia es aumentando el tamaño de la muestra. Como las probabilidades de los errores tipo I y II están relacionadas entre si, pero el experimentador puede fijar la primera, antes de elegir el nivel de significancia hay que ver cuál de los dos tipos de errores resulta más crítico. OTRAS PRUEBAS DE HIPÓTESIS (contrastes basados en χ2) Existen multitud de situaciones en el que las variables de interés no pueden cuantificarse entre las que el investigador esté interesado en determinar posibles 7 relaciones. En este caso tendríamos, a lo sumo, las observaciones agrupadas en forma de frecuencia, por los que los métodos estudiados anteriormente no serían aplicables. Estos son los contrastes asociados con el estadístico. En general este tipo de pruebas consisten en tomar una muestra y observar si hay diferencia significativa entre las frecuencias observadas y las especificadas por la ley teórica del modelo que se contrasta, también denominadas ``frecuencias esperadas". Sin embargo, aunque éste sea el aspecto más conocido, el uso del test χ2 no se limita al estudio de variables cualitativas. Podríamos decir que existen tres aplicaciones básicas en el uso de esta prueba: Test de ajuste de distribuciones: Es un contraste de significación para saber si los datos de una muestra son conformes a una ley de distribución teórica que sospechamos que es la correcta. Test de homogeneidad de varias muestras cualitativas: Sirve para contrastar la igualdad de procedencia de un conjunto de muestras de tipo cualitativo. Test de independencia: Es un contraste para determinar la dependencia o independencia de caracteres cualitativos. 1. Prueba de bondad de ajuste: Esta prueba es útil para determinar si una población tiene una distribución teórica específica, con base en la distancia entre las frecuencias de ocurrencia de las observaciones en la muestra y las frecuencias esperadas obtenidas a partir de la distribución hipotética. El procedimiento de prueba requiere una muestra de tamaño n proveniente de la población cuya distribución se quiere verificar. Una prueba de bondad de ajuste entre las frecuencias observadas y esperadas se basa en la cantidad k (o e ) 2 2 i i ei i 1 donde k es el número de valores o intervalos, oi son las frecuencias observadas y ei son las frecuencias esperadas. El valor χ2 tiene una distribución chi cuadrada con (k – p – 1) grados de libertad, donde p representa el número de parámetros de la distribución propuesta estimados por los estadísticos muestrales. (uniforme: 0, Poisson: 1, normal: 2). Si las frecuencias observadas están cerca de las esperadas, el valor χ2 será pequeño, lo que refleja un buen ajuste. Un buen ajuste conduce a la aceptación de Ho, mientras que un mal ajuste conduce a su rechazo; por lo tanto, la región crítica (o de rechazo) caerá en la cola derecha de la distribución. 8 En general, este criterio de decisión no debe usarse si las frecuencias esperadas son pequeñas (<5) porque se infla mucho χ2, aunque las frecuencias no estén muy distantes; esto exige la combinación de celdas adyacentes, pero se debe tener en cuenta que se reduce el número de grados de libertad. EJEMPLO 5.4. Se supone que el número de defectos en las tarjetas de circuito impreso sigue una distribución de Poisson. Se reúne una muestra aleatoria de 60 tarjetas y se observa el número de defectos. Los resultados obtenidos son los siguientes: Número de defectos 0 1 2 3 Frecuencia 32 15 9 4 ¿Parece correcto utilizar una distribución Poisson? Solución: La media de la distribución propuesta es desconocida y debe estimarse a partir de los datos obtenidos en la muestra, por medio de ponderación. Por calculadora, esa media es 0.75 defectos. Ho: El número de defectos tiene distribución Poisson. H1: El número de defectos no tiene distribución Poisson. Aplicando distribución Poisson, las frecuencias esperadas son: e 0.75 (0.75) 0 e( X 0) 60 * 28.32 0! e( X 1) 60 * e 0.75 (0.75)1 21.24 1! e( X 2) 60 * e 0.75 (0.75) 2 7.98 2! e(X ≥ 3) = 2.46 Como la frecuencia en la última celda es tan pequeña, se combina con la anterior y queda: # defectos Frec. observ. Frec. esperada 0 32 28.32 1 15 21.24 2 o más 13 10.44 9 V=k–p–1=3–1–1=1 k 2 i 1 (oi ei ) 2 2 = 2.94 ei Valor P = 0.09, lo que implica que con un nivel de significancia menor no se debe rechazar la hipótesis. Sólo se rechazaría si es igual a 0.1 o más, lo cual constituiría una prueba muy exigente. 2. Pruebas con tablas de contingencia (cruzadas): a) Prueba de independencia: El procedimiento anterior se puede utilizar para probar la hipótesis de independencia entre dos variables. Supongamos que se tiene una tabla de contingencia con f filas y c columnas: C1 Filas C2 Columnas ... ... Ck F1 F2 … Fk Debe recordarse que los totales en filas y columnas se denominan frecuencias marginales. También es conveniente recordar que si dos variables son independientes, P( A B) P( A) * P( B) Por lo tanto, mirando la tabla: P(F1C1) = P(F1) * P(C1) P(F2C1) = P(F2) * P(C1) . . . P(FkCk) = P(Fk) * P(Ck) Si las anteriores probabilidades se multiplican por el número total de observaciones, se obtienen las frecuencias esperadas que se han de comparar con las observadas. El número de grados de libertad asociado con la prueba que se usa es igual al número de celdas que se podrían llenar libremente cuando se conocen los totales marginales y el gran total. Por tanto, viene dado por (f – 1)*(c - 1). 10 EJEMPLO 5.5. Una compañía opera cuatro máquinas tres turnos al día. De los registros de producción se obtienen los siguientes datos sobre el número de fallas: MÁQUINA A 41 31 15 Turno 1 Turno 2 Turno 3 B 20 11 17 C 12 9 16 D 16 14 10 ¿Es independiente el número de fallas del turno y la máquina que se use? Solución: Ho: El número de fallas es independiente del turno y de la máquina usada. H1: No es independiente. e( A 1) 87 * 89 * 212 36.5 212 * 212 e( B 1) 48 * 89 * 212 20.2 212 * 212 …….. Continuando de esta manera, la tabla de frecuencias esperadas es: MÁQUINA TURNO 1 2 3 A 36.5 26.7 23.8 B 20.2 14.7 13.1 C 15.5 11.3 10.1 D 16.8 12.3 10.9 V = 2*3 χ2 = 11.648 Valor P ≈ 0.07, por lo tanto no se rechazaría la hipótesis de independencia si el nivel de significancia es menor de 0.07; de todas maneras, no es una prueba contundente. b) Prueba de homogeneidad: Otra situación común se presenta cuando se muestrean c poblaciones y cada una de ellas está dividida en f categorías. En esta situación se desea investigar si las 11 proporciones son o no las mismas en todas; la Ho asegura que las poblaciones son homogéneas respecto a esas categorías. El cálculo de las frecuencias esperadas, la determinación de grados de libertad y el cálculo de χ2 es exactamente igual a la prueba de independencia. EJEMPLO 5.6. A continuación se detallan los resultados obtenidos en una encuesta que buscaba describir el estado de los equipos de cómputo para el trabajo de los estudiantes en tres diferentes universidades. Los datos son: ESTADO A 80 57 13 Bueno Regular Malo UNIVERSIDAD B 35 46 19 C 20 25 55 Pruebe la hipótesis de que el estado de los computadores es el mismo en las 3 universidades. Solución: Ho: Las poblaciones son homogéneas. H1: Las poblaciones no son homogéneas. Una tabla de valores esperados sería: Bueno Regular Malo A 57.9 54.9 37.3 Por lo tanto, χ2 = 78.3 Con 4 grados de libertad, el valor P es casi 0. Conclusión: Las poblaciones no son homogéneas. B 38.6 36.6 24.9 C 38.6 36.6 24.9 12 EJERCICIOS PROPUESTOS 1. Seleccione una o dos respuestas, según lo que se acomode a la situación: a) Si se duplica el tamaño de la muestra, la posibilidad de aceptar una Ho que es falsa Aumenta al doble Aumenta, pero no exactamente al doble Disminuye a la mitad Disminuye, pero no exactamente a la mitad b) Una hipótesis estadística es una proposición sobre: Un parámetro poblacional Un estadístico muestral X , pˆ o n 1 µ, p o σ c) Si α se reduce para un determinado tamaño de muestra, ¿qué le ocurre a β? Aumenta Disminuye No varía Algunas veces varía d) Se ejecuta una prueba de hipótesis para observaciones pareadas. Si t o = 6.05, cuando la muestra estaba conformada por 20 unidades El valor P es casi uno El valor P es casi cero Las poblaciones de las cuales se seleccionaron las muestras tienen una diferencia estadísticamente significativa en cuanto a la media Se podría considerar que dichas poblaciones tienen medias estadísticamente iguales. e) Al aumentar el nivel de confianza, el tamaño requerido de la muestra para estimar µ _____________ para una longitud de intervalo deseada y una σ determinada Aumenta Se mantiene igual Disminuye Sólo algunas veces varía 2. Se ha desarrollado un algoritmo para generar enteros seudoaleatorios sobre el intervalo 0 a 9; codifica el algoritmo y genera 1000 dígitos seudoaleatorios. La siguiente tabla contiene la frecuencia observada para cada entero: Oi Ei 0 94 1 93 2 112 3 101 4 104 5 95 6 100 7 99 8 108 9 94 ¿Existe evidencia de que el generador de números aleatorios funciona correctamente? (tienen una distribución discreta uniforme). Utilice = 0.05 3. Los siguientes datos muestran el número de defectos en 100000 líneas de código en un tipo particular de programa de software hecho en Estados Unidos y otro similar hecho en Japón. Para ello tomaron 12 muestras de 100000 líneas de cada país: Estados Unidos 39 42 52 40 52 52 54 52 55 43 46 52 Japón 50 48 42 40 43 38 36 40 45 38 30 41 ¿Hay suficiente evidencia para afirmar que existe diferencia significativa entre los programas de los dos países? Base su respuesta en el valor p. n 1000 1000 13 4. Un distribuidor de software para sistemas operativos de computadores personales está planeando la oferta inicial de sus existencias al público, a fin de reunir suficiente capital de trabajo y financiar el desarrollo de un sistema integrado de la séptima generación, radicalmente nuevo. Con las actuales ganancias de 1610 pesos por acción, el distribuidor estaba considerando un precio de oferta de 21000 pesos, o sea 13 veces las ganancias. A fin de verificar si el precio es adecuado, escogió en forma aleatoria 7 firmas de software cotizadas en la bolsa de valores y descubrió que su razón promedio de precio/ganancias era de 11.6, con una desviación estándar de la muestra de 1.3. Cuando = 0.2. ¿Puede el distribuidor afirmar que las acciones de las empresas cotizadas en la bolsa de valores tienen una razón promedio de precio/ganancias que es significativamente diferente del precio que él desea implantar? 5. El presidente de una empresa telefónica está molesto con el número de teléfonos producidos por la empresa que tienen defectos. En promedio 120 teléfonos son devueltos diariamente a causa de ese problema, con una desviación estándar de 81. El presidente ha decidido que, al menos que logre una seguridad promedio de 85% de que al día no serán devueltos más de 135 teléfonos en los próximos 40 días, ordenará revisar el producto. ¿Tomará esta medida? 7. 6. En la fabricación de semiconductores, a menudo se utiliza una sustancia química para quitar el silicio de la parte trasera de las obleas antes de la metalización. En este proceso es muy importante la rapidez con la que actúa la sustancia. Se han comparado dos soluciones químicas, utilizando para ello dos muestras aleatorias de 10 obleas para cada solución. La rapidez de acción observada es la siguiente (en mils/min): solución 1 9.9 10.6 9.4 9.3 9.6 10.2 10.3 10.0 10.3 10.1 solución 2 10.2 10.6 10.7 10.4 10.5 10.0 10.2 10.7 10.4 10.3 a) Los datos apoyan la afirmación de que la rapidez promedio de acción es la misma para ambas soluciones? Para obtener sus conclusiones, utilice = 0.05 y suponga que las varianzas de ambas poblaciones son iguales. b) Calcule el valor P para la prueba del inciso a) c) ¿Es descabellado suponer que las varianzas poblacionales son iguales? 7. Los siguientes datos representan el tiempo de armado para 20 unidades seleccionadas aleatoriamente: 9.8, 10.4, 10.6, 9.6, 9.7, 9.9, 10.9, 11.1, 9.6, 10.2, 10.3, 9.6, 9.9, 11.2, 10.6, 9.8, 10.5, 10.1, 10.5, 9.7. Supóngase que el tiempo necesario para armar una unidad es una variable aleatoria normal con = 0.6 minutos. Con base en esta muestra, ¿existe alguna razón para creer, a un nivel de 0.05, que el tiempo de armado promedio es mayor de 10 minutos? 8. Un fabricante desea comparar el proceso de armado para uno de sus productos con un método propuesto que supuestamente reduce el tiempo de armado. Se seleccionaron 8 trabajadores de la planta de armado y se les pidió que armaran las 14 unidades con ambos procesos. Los siguientes son los tiempos observados, en minutos: Proceso actual 1 2 3 4 5 6 7 8 38 32 41 35 42 32 45 37 Proceso propuesto 30 32 34 37 35 26 38 32 a) Con =0.05 ¿existe alguna razón para creer que el tiempo de armado para el proceso actual es mayor que el del método propuesto por más de 2 minutos? b) ¿Cuál es el valor de p? 9. En marzo, 325 estudiantes de la IUE navegaron en internet dentro de sus instalaciones; 136 eran estudiantes de Sistemas, 142 de Electrónica, 35 de Derecho y el resto, de Contaduría. En meses anteriores se ha observado que la proporción ha sido 10:10:2:1, respectivamente. a) ¿Hay alguna razón para pensar que dicha proporción cambio en el último mes? Use = 0.1 b) Halle un valor P para la prueba. Comente. 10. Se efectúa un estudio sobre las fallas de un componente electrónico. Existen cuatro tipos de fallas posibles y dos posiciones de montaje para el dispositivo. Se toman los datos siguientes: Tipo de falla Posición de montaje A B C D 1 22 46 18 9 2 4 17 6 12 ¿Puede concluirse que el tipo de falla es independiente de montaje? la posición de 11. Se estudia la fracción de circuitos integrados defectuosos producidos en cierto proceso. Para ello se somete a prueba una muestra de 300 circuitos, en la que 13 son defectuosos. Utilice los datos para probar si la proporción es 0.05 o si es diferente a eso. 12. Un fabricante de semiconductores produce controladores que se emplean en aplicaciones de motores automovilísticos. El cliente requiere que la fracción de controladores defectuosos en uno de los pasos de manufactura críticos no sea mayor que 0.03 y que el fabricante demuestre esta característica del proceso de fabricación con este nivel de calidad, utilizando = 0.05. El fabricante toma una muestra aleatoria de 120 dispositivos y encuentra que tres de ellos son defectuosos. 15 a) El fabricante puede demostrar al cliente la calidad del proceso? b) Calcule un valor P para el estadístico de prueba y concluya. 13. Se analizan dos catalizadores para determinar la forma en que afectan el rendimiento promedio de un proceso químico. El catalizador 1 es el que se está empleando en este momento; debido a que el catalizador 2 es más económico, éste puede adoptarse siempre y cuando no cambie el rendimiento del proceso. Se hace una prueba en una planta piloto; los resultados obtenidos aparecen en la tabla siguiente: Observ. Catal. 1 Catal. 2 1 91.5 86.5 2 94.2 90.5 3 92.2 88.2 4 95.4 90.0 5 91.8 91.5 6 89.1 85.8 7 94.7 88.6 8 89.2 ¿Podrá utilizarse el nuevo catalizador? 14. En la industria de los chips para computador recientemente se ha instituido un programa de seguridad industrial. La pérdida promedio semanal en horas/hombre a causa de accidentes en 10 fábricas similares, tanto antes como después del programa es: Fábrica Antes Después 1 30.5 23 2 18.5 21 3 24.5 22 4 32 28.5 5 16 14.5 6 15 15.5 7 23.5 24.5 8 25.5 21 9 28 23.5 10 18 16.5 a) Determine, mediante el cálculo del valor P, si el programa de seguridad ha resultado efectivo. b) Encuentre un intervalo de confianza del 90% para µ1 - µ 2. Suponga que la distribución de las diferencias es aproximadamente normal. 15. En la fábrica 1 del punto anterior, el número de accidentes semanales durante un período de 30 semanas fue: # accidentes Frec. observ 0 12 1 5 2 8 3 3 4 1 5 1 Pruebe la hipótesis de que el número de accidentes semanales tiene una distribución Poisson.