Download Pruebas de hipótesis

Document related concepts
no text concepts found
Transcript
1
UNIDAD 5
PRUEBAS DE HIPÓTESIS
Una hipótesis se define como una teoría tentativa o suposición adoptada
provisionalmente para explicar ciertos hechos y guiar la investigación de otros.
Una hipótesis estadística es un enunciado respecto a un parámetro de una o más
poblaciones (, , p).
Con frecuencia es deseable probar la validez de tales hipótesis. A fin de lograrlo se lleva
a cabo un experimento y la hipótesis es rechazada si los valores obtenidos para el
equivalente muestral del parámetro son tan grandes o tan pequeños que la probabilidad
de que ocurran si la hipótesis es cierta es bastante remota; si los datos son muy
probables, la hipótesis es “no rechazada”. Generalmente, se habla de "no rechazar" una
hipótesis en lugar de "aceptar", ya que lo único que puede concluirse es que no hay
suficiente evidencia estadística para rechazarla.
Por ejemplo, se lanza la hipótesis de que la probabilidad de obtener un 1 al lanzar un
dado es 1/6. Para probar dicha hipótesis se arroja un dado 600 veces; por intuición, es
evidente que si se obtienen 600 unos, la hipótesis debe ser rechazada; al contrario, si se
obtienen 100 unos, la hipótesis debe ser indudablemente “no rechazada”. Cuando se
obtienen resultados tan claros, la intuición es suficiente para decidir cuando rechazar la
hipótesis, pero generalmente los experimentos no conducen a conclusiones tan obvias;
de ahí la necesidad de las pruebas de hipótesis.
Implica, en cualquier investigación, la existencia de dos teorías o hipótesis implícitas,
que se denominan hipótesis nula (Ho) e hipótesis alternativa (H1) y que de alguna
manera reflejarán esa idea a priori que tenemos y que pretendemos contrastar con la
“realidad”'; normalmente H1 es la negación de H0.
Una hipótesis nula siempre debe establecerse de forma que especifique un valor exacto
del parámetro (o con ≥ o ≤ si la prueba es unilateral), mientras que la hipótesis
alternativa permite la posibilidad de varios valores. Por ejemplo, si Ho es p = 0.1, podría
ser p  0.1, p > 0.1 o p < 0.1.
La única manera de asegurar la veracidad o falsedad de una hipótesis estadística con
certeza absoluta consiste en evaluar toda la población. Como lo que se hace
generalmente es tomar una muestra, sólo puede hablarse de sospechas y, por ende,
siempre existe la posibilidad de una conclusión errónea. El rechazo de Ho significa
simplemente que hay una pequeña probabilidad de obtener la información muestral
observada cuando, de hecho, la hipótesis es verdadera y no necesariamente que dicho
planteamiento sea falso.
Como la decisión de rechazar o no la hipótesis nula está basada en la elección de una
muestra tomada al azar y por tanto es posible tomar decisiones erróneas. Los errores que
se pueden cometer se clasifican como sigue:
2
a) Si se rechaza la hipótesis nula cuando realmente es verdadera. Esto se conoce como
error tipo I; la probabilidad de cometerlo se denota con  y se conoce como nivel de
significancia.
La probabilidad de cometer un error de este tipo es el mismo nivel de significancia.
b) Si se acepta la hipótesis nula cuando realmente es falsa. Esto se conoce como error
tipo II y la probabilidad de cometerlo se denota con .
En lenguaje estadístico:
 = P(error tipo I) = P(rechazar Ho\ Ho es V)
 = P(error tipo II) = P(aceptar Ho\ Ho es falsa)
Los errores tipo I y II están relacionados: Una disminución en la probabilidad de
cometer uno de ellos siempre da como resultado un aumento en la probabilidad del otro,
siempre que el tamaño muestral sea constante. En general, si el tamaño de muestra se
aumenta, se reducen tanto  como .
EJEMPLO 5.1.
Para ilustrar cómo se puede rechazar una hipótesis verdadera, suponga que una firma
que fabrica computadores personales utiliza una gran cantidad de tarjetas de circuitos
impresos. Los proveedores concursan para abastecer las tarjetas y, a quien presenta la
cotización más baja, se le otorga un contrato considerable. El contrato especifica que el
departamento de control de calidad del fabricante de los computadores hará un muestreo
de todos los embarques de tarjetas que reciba; si más del 6% de las tarjetas de la
muestra están por debajo de la norma, el embarque será rechazado.
La hipótesis nula es que los embarques de tarjetas que se reciben contienen máximo 6%
de tarjetas por debajo de la norma. La hipótesis alternativa es que está defectuoso más
del 6% de las tarjetas.
Una muestra de 50 tarjetas del lote que se recibió hoy reveló que 4 de ellas (8%) estaban
por debajo de la norma. Si las tarjetas del embarque estaban en realidad por debajo de la
norma, entonces la decisión de devolver las tarjetas al proveedor es correcta, pero
supongamos que el embarque contenía 4000 tarjetas y que esas 4 eran las únicas
defectuosas en todo el lote (sólo 0.1%); en ese caso, menos del 6% de todo el embarque
estaba por debajo de la norma y el rechazo del embarque sería un error. Es decir, se
rechazó la hipótesis nula cuando debió haberse aceptado; se cometió, entonces, un error
tipo I.
Supongamos ahora que dos de las cincuenta tarjetas de la muestra que se probó (4%)
estuvieran por debajo de la norma, cuando el embarque tiene realmente 10% de tarjetas
defectuosas. Según el procedimiento establecido, el embarque debe ser aceptado y, por
tanto, se estaría cometiendo un error tipo II.
3
Desarrollamos en esta unidad los contrastes de hipótesis para los parámetros más
usuales que venimos estudiando en los capítulos anteriores: medias y proporciones de
una población. Los contrastes desarrollados en esta unidad se apoyan en que los datos
poblacionales siguen una distribución normal.
El procedimiento general consiste en definir un estadístico relacionado con la hipótesis
que deseamos contrastar; a éste lo denominamos estadístico del contraste (Texp). A
continuación suponiendo que H0 es verdadera se calcula un intervalo denominado
región de aceptación de la hipótesis nula (Ti, Ts) (basados en un nivel de significancia,
que indica el porcentaje de medias muestrales que está fuera la región de aceptación) y
se compara con el estadístico de contraste, así:
EJEMPLO 5.2.
Un fabricante está interesado en el voltaje de salida de una fuente de alimentación
utilizada en un computador. Se supone que el voltaje de salida tiene una distribución
normal, con  = 0.25 V; el fabricante desea probar Ho:  = 5V contra H1:   5V y
utiliza para ello 8 unidades. Si la media muestral cae entre 4.85 y 5.15V, el fabricante
acepta la hipótesis; de lo contrario, la rechaza.
Calcular la probabilidad de cometer un error tipo I y la probabilidad de cometer un error
tipo II si  es realmente 5.2V.
Solución:
La probabilidad de cometer un error tipo I puede calcularse como:
  P( X  4.85 /   5)  P( X  5.15 /   5)
  P( Z 
4.85  5
)*2
0.25 / 8
 = P(Z < -1.70) * 2
 = 2 * 0.0446 = 0.0892
Esto implica que el 8.92% de todas las muestras aleatorias conducirían al rechazo de Ho
( = 5V) cuando el voltaje de salida es realmente 5V.
Es posible reducir  aumentando el tamaño de la región de aceptación (si se puede) o
incrementando el tamaño de la muestra.
4
Para calcular  debe tenerse una H1 específica (en este caso, un valor particular de ):
Según lo dado,  podría calcularse como:
  P(4.85  X  5.15) /   5.2)
  P(
4.85  5.2
5.15  5.2
Z
)
0.25 / 8
0.25 / 8
  P(3.96  Z  0.57)
  0.2843
Un concepto muy importante que se relaciona con las posibilidades de error es la noción
de potencia de una prueba, que es la probabilidad de rechazar de manera correcta una
Ho que es falsa. Por lo tanto, el valor de la potencia es 1 – β. La potencia es una medida
muy descriptiva y concisa de la sensibilidad de una prueba estadística (su capacidad
para detectar diferencias).
Por ejemplo, en el caso anterior β es 0.2843; por consiguiente, la potencia de la prueba
es 0.7157 cuando µ = 5.2V. Esto es, la sensibilidad de la prueba para detectar la
diferencia entre un voltaje de salida de 5V y otro de 5.2V es 0.7157, es decir, si el valor
verdadero de µ es 5.2V, la prueba detectará esa diferencia (y rechazará Ho) el 71.57%
de las veces. Si este valor se considera bajo, debe aumentarse α o el tamaño de la
muestra.
HIPÓTESIS UNILATERALES Y BILATERALES
Una prueba de hipótesis se hace bilateral si es importante detectar diferencias a partir
del valor hipotético del parámetro que se encuentren a su derecha o a su izquierda; en
este caso la hipótesis alternativa se plantea con ≠, por ejemplo, µ ≠ µo. En una prueba de
este tipo, la región crítica se separa en dos partes, generalmente con la misma
probabilidad en cada cola.
Si la afirmación implica alguna dirección, es decir, si lo que se quiere demostrar es que
el parámetro es mayor o menor que un determinado valor, lo apropiado es hacer una
prueba unilateral. Si la hipótesis alternativa es µ > µo, la región de rechazo debe
encontrarse en la cola superior y, si es µ < µo, la región crítica se encontrará en la cola
inferior.
USO DE VALORES P EN LA PRUEBA DE HIPÓTESIS
El nivel de significancia α puede predeterminarse antes de realizar el experimento, pero
el rechazo de la hipótesis no muestra de una manera cuantitativa qué tan cerca o qué tan
lejos está el valor con respecto a la región de aceptación (caso equivalente si se acepta).
5
Para evitar esta dificultad, existe el enfoque de valor P, que es el nivel de significancia
más pequeño que conduce al rechazo de la hipótesis nula; el valor P es la probabilidad
de que el estadístico de prueba tome un valor que sea al menos tan extremo como el
valor observado del estadístico de prueba cuando la hipótesis nula es verdadera.
Por lo tanto, un valor muy pequeño de P (por ejemplo, menor a 0.03) rechaza
claramente Ho, ya que existiría una probabilidad mínima de que esa hipótesis fuera
verdad.
En caso de que haya predeterminado α, si el valor P es menor que él, se rechaza H o. En
caso contrario no se rechaza.
La tabla siguiente proporciona una interpretación razonable de los valores p:
Valor P
Interpretación
Fuerte evidencia contra H0
P  0,01
0,01 P  0,05 Moderada evidencia contra H0
0,05  P  0,10 Evidencia sugestiva contra H0
Poca o no evidencias reales contra H0
0,10  P
El resultado de determinar el valor P no sólo es una decisión respecto de Ho, sino que da
una perspectiva adicional a la fortaleza de la decisión. Para ilustrar la situación,
revisemos el siguiente ejemplo:
EJEMPLO 5.3.
Cierto experimento describe los resultados de pruebas de resistencia de 15 especímenes
de cierta aleación que se utiliza en un proceso determinado. La carga para la que cada
especimen falla es –en MPa-:
11.2 10.8 12.5 9.3 11.2 10.3 11.2 13.5 9.3 10.7 11.5 12.3 12.9 10.7 12
Si se asume distribución normal, ¿sugieren los datos que la carga promedio de falla es
mayor que 10 MPa? Para responder la pregunta, tomar como base el respectivo valor P.
Solución:
X  11.293 MPa
S  1.206 MPa
H 0 :   10 MPa
H 1 :   10 MPa
Estadístico de prueba: t 
11.293  10
1.206 / 15
 4.15
6
 Valor P es aproximadamente 0. Por lo tanto, se rechaza Ho y se concluye que la
carga de falla promedio es mayor de 10 MPa.
Tomando como base las distribuciones de muestreo ampliamente revisadas en la
primera unidad, pueden realizarse pruebas de hipótesis para:





Media, con varianza conocida o desconocida.
Igualdad de dos medias, con varianza conocida o desconocida.
Una o dos proporciones.
Una o dos varianzas.
Muestras pareadas.
Además, desarrollar una prueba de hipótesis a un nivel de significancia α es equivalente
a calcular un intervalo de confianza de 100(1-α)% sobre el mismo parámetro y rechazar
Ho si el estadístico muestral no está dentro del intervalo de confianza. Por esas razones,
no se amplía demasiado el tema.
SUGERENCIAS:







Conviene plantear la hipótesis nula siempre por la igualdad. Adapte la
contrahipótesis de acuerdo con el objetivo del problema.
Formule la hipótesis en base a los objetivos del estudio, pero siempre antes de
extraer la muestra y calcular el estimador puntual del parámetro desconocido,
para no verse influenciado por este resultado.
Tenga en cuenta que si bien la hipótesis nula es la que se pone bajo prueba, eso
no significa que deba ser siempre la suposición que el experimentador desea que
se compruebe.
Como en todo proceso de inferencia, existe algún grado de subjetividad en la
realización de una prueba, particularmente en la elección del nivel de
significancia y del tamaño de la muestra. Trate de que la elección de estos
valores responda a un análisis cuidadoso del problema en cuestión.
Una vez fijadas las condiciones de la prueba, el resultado de la misma es
totalmente objetivo.
Para fijar el nivel de significancia de la prueba, hay que tener en cuenta que
cuando la probabilidad del error tipo I aumenta, la del error tipo II disminuye. La
forma de minimizar el error tipo II independientemente del nivel de significancia
es aumentando el tamaño de la muestra.
Como las probabilidades de los errores tipo I y II están relacionadas entre si,
pero el experimentador puede fijar la primera, antes de elegir el nivel de
significancia hay que ver cuál de los dos tipos de errores resulta más crítico.
OTRAS PRUEBAS DE HIPÓTESIS (contrastes basados en χ2)
Existen multitud de situaciones en el que las variables de interés no pueden
cuantificarse entre las que el investigador esté interesado en determinar posibles
7
relaciones. En este caso tendríamos, a lo sumo, las observaciones agrupadas en forma de
frecuencia, por los que los métodos estudiados anteriormente no serían aplicables.
Estos son los contrastes asociados con el estadístico. En general este tipo de pruebas
consisten en tomar una muestra y observar si hay diferencia significativa entre las
frecuencias observadas y las especificadas por la ley teórica del modelo que se
contrasta, también denominadas ``frecuencias esperadas".
Sin embargo, aunque éste sea el aspecto más conocido, el uso del test χ2 no se limita al
estudio de variables cualitativas. Podríamos decir que existen tres aplicaciones básicas
en el uso de esta prueba:
Test de ajuste de distribuciones:
Es un contraste de significación para saber si los datos de una muestra son conformes
a una ley de distribución teórica que sospechamos que es la correcta.
Test de homogeneidad de varias muestras cualitativas:
Sirve para contrastar la igualdad de procedencia de un conjunto de muestras de tipo
cualitativo.
Test de independencia:
Es un contraste para determinar la dependencia o independencia de caracteres
cualitativos.
1. Prueba de bondad de ajuste:
Esta prueba es útil para determinar si una población tiene una distribución teórica
específica, con base en la distancia entre las frecuencias de ocurrencia de las
observaciones en la muestra y las frecuencias esperadas obtenidas a partir de la
distribución hipotética.
El procedimiento de prueba requiere una muestra de tamaño n proveniente de la
población cuya distribución se quiere verificar.
Una prueba de bondad de ajuste entre las frecuencias observadas y esperadas se basa en
la cantidad
k
(o  e ) 2
2   i i
ei
i 1
donde k es el número de valores o intervalos, oi son las frecuencias observadas y ei son
las frecuencias esperadas. El valor χ2 tiene una distribución chi cuadrada con (k – p – 1)
grados de libertad, donde p representa el número de parámetros de la distribución
propuesta estimados por los estadísticos muestrales. (uniforme: 0, Poisson: 1, normal:
2).
Si las frecuencias observadas están cerca de las esperadas, el valor χ2 será pequeño, lo
que refleja un buen ajuste. Un buen ajuste conduce a la aceptación de Ho, mientras que
un mal ajuste conduce a su rechazo; por lo tanto, la región crítica (o de rechazo) caerá
en la cola derecha de la distribución.
8
En general, este criterio de decisión no debe usarse si las frecuencias esperadas son
pequeñas (<5) porque se infla mucho χ2, aunque las frecuencias no estén muy distantes;
esto exige la combinación de celdas adyacentes, pero se debe tener en cuenta que se
reduce el número de grados de libertad.
EJEMPLO 5.4.
Se supone que el número de defectos en las tarjetas de circuito impreso sigue una
distribución de Poisson. Se reúne una muestra aleatoria de 60 tarjetas y se observa el
número de defectos. Los resultados obtenidos son los siguientes:
Número de defectos
0
1
2
3
Frecuencia
32
15
9
4
¿Parece correcto utilizar una distribución Poisson?
Solución:
La media de la distribución propuesta es desconocida y debe estimarse a partir de los
datos obtenidos en la muestra, por medio de ponderación. Por calculadora, esa media es
0.75 defectos.
Ho: El número de defectos tiene distribución Poisson.
H1: El número de defectos no tiene distribución Poisson.
Aplicando distribución Poisson, las frecuencias esperadas son:
e 0.75 (0.75) 0
e( X  0)  60 *
 28.32
0!
e( X  1)  60 *
e 0.75 (0.75)1
 21.24
1!
e( X  2)  60 *
e 0.75 (0.75) 2
 7.98
2!
e(X ≥ 3) = 2.46
Como la frecuencia en la última celda es tan pequeña, se combina con la anterior y
queda:
# defectos
Frec. observ. Frec. esperada
0
32
28.32
1
15
21.24
2 o más
13
10.44
9
V=k–p–1=3–1–1=1
k
2  
i 1
(oi  ei ) 2
 2 = 2.94
ei
Valor P = 0.09, lo que implica que con un nivel de significancia menor no se debe
rechazar la hipótesis. Sólo se rechazaría si  es igual a 0.1 o más, lo cual constituiría
una prueba muy exigente.
2. Pruebas con tablas de contingencia (cruzadas):
a) Prueba de independencia:
El procedimiento anterior se puede utilizar para probar la hipótesis de independencia
entre dos variables.
Supongamos que se tiene una tabla de contingencia con f filas y c columnas:
C1
Filas
C2
Columnas
...
...
Ck
F1
F2
…
Fk
Debe recordarse que los totales en filas y columnas se denominan frecuencias
marginales. También es conveniente recordar que si dos variables son independientes,
P( A  B)  P( A) * P( B)
Por lo tanto, mirando la tabla:
P(F1C1) = P(F1) * P(C1)
P(F2C1) = P(F2) * P(C1)
.
.
.
P(FkCk) = P(Fk) * P(Ck)
Si las anteriores probabilidades se multiplican por el número total de observaciones, se
obtienen las frecuencias esperadas que se han de comparar con las observadas.
El número de grados de libertad asociado con la prueba que se usa es igual al número de
celdas que se podrían llenar libremente cuando se conocen los totales marginales y el
gran total. Por tanto, viene dado por (f – 1)*(c - 1).
10
EJEMPLO 5.5.
Una compañía opera cuatro máquinas tres turnos al día. De los registros de producción
se obtienen los siguientes datos sobre el número de fallas:
MÁQUINA
A
41
31
15
Turno 1
Turno 2
Turno 3
B
20
11
17
C
12
9
16
D
16
14
10
¿Es independiente el número de fallas del turno y la máquina que se use?
Solución:
Ho: El número de fallas es independiente del turno y de la máquina usada.
H1: No es independiente.
e( A  1) 
87 * 89 * 212
 36.5
212 * 212
e( B  1) 
48 * 89 * 212
 20.2
212 * 212
……..
Continuando de esta manera, la tabla de frecuencias esperadas es:
MÁQUINA
TURNO
1
2
3
A
36.5
26.7
23.8
B
20.2
14.7
13.1
C
15.5
11.3
10.1
D
16.8
12.3
10.9
V = 2*3
χ2 = 11.648
 Valor P ≈ 0.07, por lo tanto no se rechazaría la hipótesis de independencia si el nivel
de significancia es menor de 0.07; de todas maneras, no es una prueba contundente.
b) Prueba de homogeneidad:
Otra situación común se presenta cuando se muestrean c poblaciones y cada una de
ellas está dividida en f categorías. En esta situación se desea investigar si las
11
proporciones son o no las mismas en todas; la Ho asegura que las poblaciones son
homogéneas respecto a esas categorías.
El cálculo de las frecuencias esperadas, la determinación de grados de libertad y el
cálculo de χ2 es exactamente igual a la prueba de independencia.
EJEMPLO 5.6.
A continuación se detallan los resultados obtenidos en una encuesta que buscaba
describir el estado de los equipos de cómputo para el trabajo de los estudiantes en tres
diferentes universidades. Los datos son:
ESTADO
A
80
57
13
Bueno
Regular
Malo
UNIVERSIDAD
B
35
46
19
C
20
25
55
Pruebe la hipótesis de que el estado de los computadores es el mismo en las 3
universidades.
Solución:
Ho: Las poblaciones son homogéneas.
H1: Las poblaciones no son homogéneas.
Una tabla de valores esperados sería:
Bueno
Regular
Malo
A
57.9
54.9
37.3
Por lo tanto, χ2 = 78.3
Con 4 grados de libertad, el valor P es casi 0.
Conclusión: Las poblaciones no son homogéneas.
B
38.6
36.6
24.9
C
38.6
36.6
24.9
12
EJERCICIOS PROPUESTOS
1. Seleccione una o dos respuestas, según lo que se acomode a la situación:
a) Si se duplica el tamaño de la muestra, la posibilidad de aceptar una Ho que es falsa
Aumenta al doble
Aumenta, pero no exactamente al doble
Disminuye a la mitad
Disminuye, pero no exactamente a la mitad
b) Una hipótesis estadística es una proposición sobre:
Un parámetro poblacional
Un estadístico muestral
X , pˆ o  n 1
µ, p o σ
c) Si α se reduce para un determinado tamaño de muestra, ¿qué le ocurre a β?
Aumenta
Disminuye
No varía
Algunas veces varía
d) Se ejecuta una prueba de hipótesis para observaciones pareadas. Si t o = 6.05, cuando la
muestra estaba conformada por 20 unidades
 El valor P es casi uno
 El valor P es casi cero
 Las poblaciones de las cuales se seleccionaron las muestras tienen una diferencia
estadísticamente significativa en cuanto a la media
 Se podría considerar que dichas poblaciones tienen medias estadísticamente iguales.
e) Al aumentar el nivel de confianza, el tamaño requerido de la muestra para estimar µ
_____________ para una longitud de intervalo deseada y una σ determinada
Aumenta
Se mantiene igual
Disminuye
Sólo algunas veces varía
2. Se ha desarrollado un algoritmo para generar enteros seudoaleatorios sobre el
intervalo 0 a 9; codifica el algoritmo y genera 1000 dígitos seudoaleatorios. La
siguiente tabla contiene la frecuencia observada para cada entero:
Oi
Ei
0
94
1
93
2
112
3
101
4
104
5
95
6
100
7
99
8
108
9
94
¿Existe evidencia de que el generador de números aleatorios funciona
correctamente? (tienen una distribución discreta uniforme). Utilice  = 0.05
3. Los siguientes datos muestran el número de defectos en 100000 líneas de código en
un tipo particular de programa de software hecho en Estados Unidos y otro similar
hecho en Japón. Para ello tomaron 12 muestras de 100000 líneas de cada país:
Estados Unidos 39 42 52 40 52 52 54 52 55 43 46 52
Japón
50 48 42 40 43 38 36 40 45 38 30 41
¿Hay suficiente evidencia para afirmar que existe diferencia significativa entre los
programas de los dos países? Base su respuesta en el valor p.
n
1000
1000
13
4. Un distribuidor de software para sistemas operativos de computadores personales
está planeando la oferta inicial de sus existencias al público, a fin de reunir
suficiente capital de trabajo y financiar el desarrollo de un sistema integrado de la
séptima generación, radicalmente nuevo. Con las actuales ganancias de 1610 pesos
por acción, el distribuidor estaba considerando un precio de oferta de 21000 pesos,
o sea 13 veces las ganancias. A fin de verificar si el precio es adecuado, escogió en
forma aleatoria 7 firmas de software cotizadas en la bolsa de valores y descubrió que
su razón promedio de precio/ganancias era de 11.6, con una desviación estándar de
la muestra de 1.3. Cuando  = 0.2. ¿Puede el distribuidor afirmar que las acciones
de las empresas cotizadas en la bolsa de valores tienen una razón promedio de
precio/ganancias que es significativamente diferente del precio que él desea
implantar?
5. El presidente de una empresa telefónica está molesto con el número de teléfonos
producidos por la empresa que tienen defectos. En promedio 120 teléfonos son
devueltos diariamente a causa de ese problema, con una desviación estándar de 81.
El presidente ha decidido que, al menos que logre una seguridad promedio de 85%
de que al día no serán devueltos más de 135 teléfonos en los próximos 40 días,
ordenará revisar el producto. ¿Tomará esta medida?
7.
6. En la fabricación de semiconductores, a menudo se utiliza una sustancia química
para quitar el silicio de la parte trasera de las obleas antes de la metalización. En este
proceso es muy importante la rapidez con la que actúa la sustancia. Se han
comparado dos soluciones químicas, utilizando para ello dos muestras aleatorias de
10 obleas para cada solución. La rapidez de acción observada es la siguiente (en
mils/min):
solución 1
9.9
10.6
9.4
9.3
9.6
10.2
10.3
10.0
10.3
10.1
solución 2
10.2
10.6
10.7
10.4
10.5
10.0
10.2
10.7
10.4
10.3
a) Los datos apoyan la afirmación de que la rapidez promedio de acción es la
misma para ambas soluciones? Para obtener sus conclusiones, utilice  = 0.05 y
suponga que las varianzas de ambas poblaciones son iguales.
b) Calcule el valor P para la prueba del inciso a)
c) ¿Es descabellado suponer que las varianzas poblacionales son iguales?
7. Los siguientes datos representan el tiempo de armado para 20 unidades seleccionadas
aleatoriamente: 9.8, 10.4, 10.6, 9.6, 9.7, 9.9, 10.9, 11.1, 9.6, 10.2, 10.3, 9.6, 9.9,
11.2, 10.6, 9.8, 10.5, 10.1, 10.5, 9.7. Supóngase que el tiempo necesario para armar
una unidad es una variable aleatoria normal con  = 0.6 minutos. Con base en esta
muestra, ¿existe alguna razón para creer, a un nivel de 0.05, que el tiempo de
armado promedio es mayor de 10 minutos?
8. Un fabricante desea comparar el proceso de armado para uno de sus productos con
un método propuesto que supuestamente reduce el tiempo de armado. Se
seleccionaron 8 trabajadores de la planta de armado y se les pidió que armaran las
14
unidades con ambos procesos. Los siguientes son los tiempos observados, en
minutos:
Proceso actual
1
2
3
4
5
6
7
8
38
32
41
35
42
32
45
37
Proceso
propuesto
30
32
34
37
35
26
38
32
a) Con =0.05 ¿existe alguna razón para creer que el tiempo de armado para el
proceso actual es mayor que el del
método propuesto por más de 2 minutos?
b) ¿Cuál es el valor de p?
9.
En marzo, 325 estudiantes de la IUE navegaron en internet dentro de sus
instalaciones; 136 eran estudiantes de Sistemas, 142 de Electrónica, 35 de
Derecho y el resto, de Contaduría. En meses anteriores se ha observado que la
proporción ha sido 10:10:2:1, respectivamente.
a) ¿Hay alguna razón para pensar que dicha proporción cambio en el último mes?
Use  = 0.1
b) Halle un valor P para la prueba. Comente.
10. Se efectúa un estudio sobre las fallas de un componente electrónico. Existen cuatro
tipos de fallas posibles y dos posiciones de montaje para el dispositivo. Se toman
los datos siguientes:
Tipo de falla
Posición de montaje A B C D
1
22 46 18
9
2
4 17 6 12
¿Puede concluirse que el tipo de falla es independiente de
montaje?
la posición de
11. Se estudia la fracción de circuitos integrados defectuosos producidos en cierto
proceso. Para ello se somete a prueba una muestra de 300 circuitos, en la que 13
son defectuosos. Utilice los datos para probar si la proporción es 0.05 o si es
diferente a eso.
12. Un fabricante de semiconductores produce controladores que se emplean en
aplicaciones de motores automovilísticos. El cliente requiere que la fracción de
controladores defectuosos en uno de los pasos de manufactura críticos no sea mayor
que 0.03 y que el fabricante demuestre esta característica del proceso de fabricación
con este nivel de calidad, utilizando  = 0.05. El fabricante toma una muestra
aleatoria de 120 dispositivos y encuentra que tres de ellos son defectuosos.
15
a) El fabricante puede demostrar al cliente la calidad del proceso?
b) Calcule un valor P para el estadístico de prueba y concluya.
13. Se analizan dos catalizadores para determinar la forma en que afectan el rendimiento
promedio de un proceso químico. El catalizador 1 es el que se está empleando en
este momento; debido a que el catalizador 2 es más económico, éste puede adoptarse
siempre y cuando no cambie el rendimiento del proceso. Se hace una prueba en una
planta piloto; los resultados obtenidos aparecen en la tabla siguiente:
Observ.
Catal. 1
Catal. 2
1
91.5
86.5
2
94.2
90.5
3
92.2
88.2
4
95.4
90.0
5
91.8
91.5
6
89.1
85.8
7
94.7
88.6
8
89.2
¿Podrá utilizarse el nuevo catalizador?
14. En la industria de los chips para computador recientemente se ha instituido un
programa de seguridad industrial. La pérdida promedio semanal en horas/hombre a
causa de accidentes en 10 fábricas similares, tanto antes como después del programa
es:
Fábrica
Antes
Después
1
30.5
23
2
18.5
21
3
24.5
22
4
32
28.5
5
16
14.5
6
15
15.5
7
23.5
24.5
8
25.5
21
9
28
23.5
10
18
16.5
a) Determine, mediante el cálculo del valor P, si el programa de seguridad ha
resultado efectivo.
b) Encuentre un intervalo de confianza del 90% para µ1 - µ 2. Suponga que la
distribución de las diferencias es aproximadamente normal.
15. En la fábrica 1 del punto anterior, el número de accidentes semanales durante un
período de 30 semanas fue:
# accidentes
Frec. observ
0
12
1
5
2
8
3
3
4
1
5
1
Pruebe la hipótesis de que el número de accidentes semanales tiene una distribución
Poisson.