Download inferencia estadistica

Document related concepts

Prueba t de Student wikipedia , lookup

Estadístico muestral wikipedia , lookup

Distribución t de Student wikipedia , lookup

Estimador wikipedia , lookup

Muestra estadística wikipedia , lookup

Transcript
6. Estimación,
DISTRIBUCIONES MUESTREO, Y PRUEBA DE
HIPÓTESIS.
6.1 INFERENCIA ESTADISTICA
La estadística está dividida en descriptiva e inferencial donde La
estadística Descriptiva se relaciona principalmente con la recopilación,
presentación y descripción de datos. Y la estadística Inferencial esta formada
por un conjunto de métodos o técnicas utilizadas para la toma de decisiones o
establecer conclusiones de una población. Para que la estadística inferencial sea
efectiva sobre las conclusiones de una población, se requiere que las muestras
seleccionadas de dicha población, sean muestras aleatorias. Los métodos
estadísticos hacen uso de la información contenida en la muestra aleatoria y con
base a esa información, se interpreta, se infiere y se toman las decisiones de la
población.
La
inferencia
estadística
puede
dividirse
en
dos
grandes
áreas:
estimación de parámetros y prueba de hipótesis.
6.2 POBLACION, MUESTRA Y MUESTREO
En este capítulo se hará un recordatorio de la definición de lo que es
muestra, población y muestreo como se vio en el capítulo 2.
Una población es el conjunto de todos los elementos a los que se
somete a un estudio estadístico; es decir, está formada por la totalidad
de las observaciones en las cuales se tiene cierto interés.
Una muestra es
un
conjunto
representativo
de
la
población
de
referencia, el número de individuos de una muestra es menor que el
de la población. O también es un subconjunto, extraído de la población
(mediante técnicas de muestreo), cuyo estudio sirve para inferir características
de toda la población, (Ver fig. 6.1).
Figura. 6.1. Población y Espacio muestral
El muestreo es la técnica o método con que se extraen los elementos
de la población a estudiar.
Existen dos tipos de muestreo Probabilístico y no probabilístico.
En este último (no probabilístico) puede haber clara influencia de la persona
o personas que seleccionan la muestra o simplemente se realiza atendiendo a
razones de comodidad. Salvo en situaciones muy concretas, en la que los errores
cometidos no son grandes, debido a la homogeneidad de la población, en general
no es un tipo de muestreo riguroso y científico, dado que no todos los elementos
de la población pueden formar parte de la muestra. Por ejemplo, si hacemos una
encuesta telefónica por la mañana, las personas que no tienen teléfono o que
están trabajando, no podrán formar parte de la muestra.
Muestreo probabilístico: En este tipo de muestreo es en el que todos los
individuos de la población, tienen la misma probabilidad de ser parte de la
muestra.
6.3 ESTADISTICOS Y DISTRIBUCIONES DE MUESTREO
Las inferencias estadísticas se hacen mediante los estadísticos. Los
estadísticos son funciones derivadas de las observaciones contenidas en una
muestra aleatoria. Una distribución de muestreo es una distribución de
probabilidad de un estadístico, por ejemplo la distribución de probabilidad de
𝑋̅, se le conoce como distribución de muestreo de la media. La distribución de
muestreo de un estadístico depende de la distribución de la población, del
tamaño de la muestra y del método de muestreo seleccionado.
6.4 DISTRIBUCION DE MUESTREO DE MEDIAS
Sea 𝑥1 , 𝑥2 , 𝑥3 , ⋯ , 𝑥𝑛 un conjunto de observaciones de una muestra aleatoria
de tamaño 𝑛 tomada de una población (finita o infinita) normal con media 𝜇 y
varianza 𝜎 2 . Cada observación en esta muestra es una
variable aleatoria
distribuida normal e independiente, con media 𝜇 y varianza 𝜎 2 . Entonces 𝑥̅ =
𝑥1 +𝑥2 +𝑥3 +⋯+𝑥𝑛
,
𝑛
tiene una distribución normal con media 𝜇𝑥̅ = 𝜇, y varianza 𝜎𝑥̅2 =
𝜎2
.
𝑛
Esta afirmación se puede verificar con el siguiente teorema.
Teorema del Límite Central: Si 𝑥1 , 𝑥2 , 𝑥3 , ⋯ , 𝑥𝑛 es una muestra aleatoria
de tamaño 𝑛 tomada de una población (finita o infinita) con media 𝜇 y varianza
𝜎 2 , y si 𝑥̅ es la media muestral, entonces la forma límite de la distribución de
𝑍=
𝑥̅ − 𝜇
𝜎
√𝑛
Cuando 𝑛 → ∞, es la distribución normal estándar.
Aun cuando la distribución de la población no es normal, el Teorema del
Límite Central permite afirmar que “prácticamente” 𝑥̅ es normal para muestras
grandes tomadas de cualquier población.
6.5 ESTIMADORES Y SU PROPIEDADES
Un estimador es una regla, a menudo expresada como una fórmula, que
indica cómo calcular el valor de una estimación con base en las mediciones
contenidas en una muestra. Existen dos tipos de estimaciones concernientes a
una población: la estimación por intervalo y la estimación puntual.
Una estimación puntual, es un solo valor o número que se utiliza para
estimar un parámetro de población desconocido. A menudo una estimación
puntual
es insuficiente debido a que
ya en resultado, solo se tienen dos
opciones: el valor de estimador es correcta o no. Por ejemplo, mediante una
estimación puntual se afirmara que para el año 2030, la proporción de enfermos
de sida a nivel mundial será 0.70, pudiera ser cierta o no.
Un estimador puntual es una variable aleatoria con una distribución de
muestreo que depende de la población y de su parámetro. Un buen estimador
debe de contener dos propiedades muy importantes, para evaluar la bondad del
estimador, que son que el estimador sea insesgado respecto al parámetro a
1
estimar y que tenga varianza mínima. Por ejemplo la media muestral 𝑥̅ = 𝑛 ∑𝑛𝑖=1 𝑥𝑖
es un estimador puntual de la media de la población 𝜇.
Los estimadores puntuales más usuales son los de la distribución binomial
(𝑝), de la distribución de Poisson del parámetro 𝜆 y la distribución normal (𝜇, 𝜎).
Antes de utilizar un estadístico muestral como estimador puntual, se
verifica si el estimador puntual tiene ciertas propiedades que corresponden a un
buen estimador puntual. Como hay distintos estadísticos muéstrales que se usan
como
estimadores
puntual
es
de
sus
correspondientes
parámetros
poblacionales, se usará la notación general siguiente:
𝜃: es el parámetro poblacional de interés.
𝜃̂: es el estadístico muestral o estimador puntual de 𝜃.
En general 𝜃 representa cualquier parámetro poblacional como, por
ejemplo, la media poblacional, la desviación estándar poblacional, etc.; y 𝜃̂
representa el correspondiente estadístico muestral, por ejemplo la media
muestral, la desviación estándar muestral y la proporción muestral.
Las propiedades de un buen estimador son:
 Insesgadez: Si el valor del estadístico muestral es igual al parámetro
poblacional que se estudia, se dice que el estudio muestral es un estimador
insesgado del parámetro poblacional.
El estadístico muestral 𝜃̂ es un estimador insesgado del parámetro
poblacional 𝜃 si 𝐸(𝜃̂) = 𝜃, donde 𝐸(𝜃̂) valor esperado del estadístico muestral.
Por lo tanto, el valor esperado, o media, de todos los posibles valores de
un estadístico muestral insesgado es igual al parámetro poblacional de
interés.
 Eficiencia: Se dice que el estimador puntual con menor error estándar tiene
mayor eficiencia relativa que los otros.
Cuando se muestrean poblaciones normales, el error estándar de la media
muestral es menor que el error estándar de la mediana muestral. Por tanto,
la media muestral es más eficiente que la mediana muestral.
 Consistencia: Un estimador puntual es consistente si el valor del estimador
puntual tiende a estar más cerca del parámetro poblacional a medida que el
tamaño de la muestra aumenta. En otras palabras, una muestra grande
tiende a proporcionar mejor estimación puntual que una pequeña.
Los estimadores 𝑥̅ , 𝑠 y 𝑝̂ son estimadores insesgado de
𝜇, 𝜎 y 𝑝,
respectivamente (Walpole, Ronald E., 2007).
6.6 ERROR ESTÁNDAR DE UN ESTADISTICO
Debido a que un estadístico es una variable aleatoria derivada de las
observaciones de un muestreo aleatorio, el valor del estadístico puede variar de
una muestra a otra muestra aleatoria, dependiendo de la variación
población de interés.
de la
De esta forma El error estándar de un estadístico
depende de la desviación estándar de su distribución de muestreo. Por ejemplo,
si la media muestral 𝑋̅ se utiliza como estimados puntual de la media poblacional
𝜇, el error estándar de 𝑋̅ mide que también 𝑋̅ estima a 𝜇.
Si 𝑥1 , 𝑥2 , 𝑥3 , ⋯ , 𝑥𝑛 es una muestra aleatoria de tamaño 𝑛 tomada de una
población normal con media 𝜇 y varianza
𝜎2
,
√𝑛
de modo que el error estándar de
𝑥̅ es
𝜎𝑥̅ =
𝜎
√𝑛
(6.1)
Si se desconoce el valor de 𝜎, éste se puede sustituir por la deviación estándar
muestral de 𝑥̅ en la expresión 6.1, por consiguiente el error estándar estimado
de 𝑥̅ es
𝜎𝑥̅ =
𝑆
√𝑛
(6.2)
6.7 ESTIMACION POR INTERVALOS
Tomando en cuenta que la mayoría de las veces el parámetro poblacional es
desconocido, conveniente obtener límites entre los cuales se encuentre el dicho
parámetro con un cierto nivel de confianza estadística, en este caso se trata de
la estimación por intervalos.
Es decir, la estimación por intervalos da por consecuencia un intervalo de
confianza en el que se espera que se encuentre el parámetro poblacional con
una alta probabilidad de certeza. Por ejemplo, el intervalo de confianza para la
media poblacional es el intervalo de valores que tiene una alta probabilidad de
contener a la media de la población
como se ilustra en la figura 6.2. En la
estimación por intervalos de un parámetro población, resulta adecuado hablar
en términos de probabilidad
de que el estimador cubra el verdadero valor del
parámetro, como se muestra en la figura 6.2. Por lo tanto, si se seleccionan 100
muestras de una población y se calcula cada media de las muestras, de las
cuales se les estima sus correspondiente intervalos de confianza del 95%, se
tendría que aproximadamente 95 de los 100 intervalos de confianza contienen
la media poblacional.
Figura 6.2 Distribución de muestreo para estimador por intervalos.
El nivel de confianza 𝛼 (alfa) es el valor de la probabilidad de que el parámetro
poblacional se encuentre dentro del intervalo; los niveles de confianza más
ampliamente usados son: 𝛼 = 0.10, 𝛼 = 0.05 𝑦 𝛼 = 0.01 correspondientes al 90%,
95% y 99% de confianza estadística, respectivamente.
6.8 ESTIMACION POR INTERVALO DE UNA MEDIA CON n > 30
Sea 𝑥1 , 𝑥2 , 𝑥3 , ⋯ , 𝑥𝑛 es una muestra aleatoria de tamaño 𝑛 > 30 tomada de
una población normal con media 𝜇 y varianza 𝜎 2 conocida. Entonces un intervalo
de confianza del 100%(1- 𝛼) para 𝜇 esta dada por
𝑥̅ − 𝑍∝⁄2
𝜎
√𝑛
≤ 𝜇 ≤ 𝑥̅ + 𝑍∝⁄2
𝜎
(6.3)
√𝑛
Donde 𝑍∝⁄2 es el punto de la distribución normal estándar, que corresponde al
nivel de confianza dado 𝛼. En la tabla 6.1, se pueden ver algunos valores de
𝑍𝛼⁄2 para diferentes valores de 𝛼.
𝛼
𝑍𝛼⁄2
0.10
𝑍0.05 = 1.645
0.05
𝑍0.025 = 1.96
0.01
𝑦 𝑍0.005 = 2.575
Tabla 6.1 Valores de 𝑍𝛼⁄2 para distintos valores 𝛼 (alfa)
Ejemplo 6.1. Los datos de la tabla 6.2 se encuentran una muestra
aleatoria de las estaturas en centímetros de 45 estudiantes de la licenciatura
de ingeniería de alguna universidad. Se sabe
que la
muestra aleatoria de
tamaño 𝑛 = 45 proviene de una población normal con la varianza poblacional
𝜎 2 = 9 . Construya un intervalo de confianza del 95% para la estatura media
poblacional 𝜇.
164
168
163
166
160
165
162
165
158
165
162
165
164
164
163
167
166
161
165
169
165
165
160
169
160
162
165
170
160
165
163
169
167
163
168
164
166
164
167
162
165
167
160
171
167
Tabla 6.2 Estaturas de 45 estudiantes
La media de la muestra de los 45 estudiantes es
𝑥̅ = 164.578
De la tabla I del apéndice y para un 𝛼 = 0.05 se tiene que
𝑍0,025 = 1.96. La
obtención del intervalo de confianza al 95% de las estaturas de los estudiantes
es la siguiente
164.578 − 1.96
3
≤ 𝜇 ≤ 164.578 + 1.96
3
√45
√45
3
3
164.578 − 1.96
≤ 𝜇 ≤ 164.578 + 1.96
6.708
6.708
164.578 − 1.96(0.447) ≤ 𝜇 ≤ 164.578 + 1.96(0.447)
164.578 − 0.876 ≤ 𝜇 ≤ 164.578 + 0.876
𝟏𝟔𝟑. 𝟕𝟎𝟐 ≤ 𝝁 ≤ 𝟏𝟔𝟓. 𝟒𝟓𝟒
Por lo tanto la estatura media poblacional de los estudiantes esta entre 163.702
y 165.454.
Ahora consideremos lo siguiente, dado que se seleccionó una confianza
estadística del 95%. ¿Qué hubiera pasado si se hubiera escogido una confianza
estadística mayor, por ejemplo 99%? ¿Cómo será el intervalo de confianza para
la estatura media poblacional de los estudiantes?
Para un 𝛼 = 0.01, y de la tabla I del apéndice se tiene que 𝑍𝛼⁄2 = 𝑍0.01⁄2 =
𝑍0.005 = 2.58, entonces el intervalo de confianza al 99% es
164.578 − 2.58
3
≤ 𝜇 ≤ 164.578 + 2.58
3
√45
√45
3
3
164.578 − 2.58
≤ 𝜇 ≤ 164.578 + 2.58
6.708
6.708
164.578 − 2.58(0.447) ≤ 𝜇 ≤ 164.578 + 2.58(0.447)
164.578 − 1.153 ≤ 𝜇 ≤ 164.578 + 1.153
𝟏𝟔𝟑. 𝟒𝟐𝟓 ≤ 𝝁 ≤ 𝟏𝟔𝟓. 𝟕𝟑𝟏
Por lo tanto, para una confianza estadística del 99%,
la estatura media
poblacional de los estudiantes esta entre 163.425 y 165.731.
Nótese que la longitud el intervalo de confianza al 99% es mayor que la longitud
del intervalo de confianza al 95%. En general, para un tamaño de muestra fijo
y una desviación estándar 𝜎 , entre mas grande sea la confianza estadística,
mas grande será el intervalo de confianza resultante.
6.9 ESTIMACION POR INTERVALO DE UNA PROPORCION
Si 𝑥 es una variable aleatoria binomial con los parámetros 𝑛 y 𝑝, y 𝑛 es grande
𝑥
y 𝑝̂ = 𝑛, entonces la expresión 6.4 es un intervalo de confianza aproximadamente
del (1 − 𝛼)100% para 𝑝,
𝑝̂ (1 − 𝑝̂ )
𝑝̂ (1 − 𝑝̂ )
𝑝̂ − 𝑍𝛼⁄2 ∙ √
< 𝑝 < 𝑝̂ + 𝑍𝛼⁄2 ∙ √
𝑛
𝑛
(6.4)
Ejemplo 6.2. En una muestra aleatoria, 145 personas de 450, a quienes
se aplicó una vacuna contra la influenza, experimentaron cierto síntoma de
incomodidad. Construir un intervalo de confianza del 95% para la proporción
poblacional de personas que experimentaron algún síntoma de incomodidad
por la vacuna.
145
Sustituyendo 𝑛 = 450, 𝑝̂ = 450 = 0.32
apéndice se tiene que
y para 𝛼 = 0.05 y de la tabla I del
𝑍0.025 = 1.96, en la expresión 6.4 del intervalo de
confianza, se obtiene que
0.32 − 1.96 ∙ √
0.32(1 − 0.32)
0.32(1 − 0.32)
< 𝑝 < 0.32 + 1.96 ∙ √
450
450
0.32 − (1.96)(0.02199) < 𝑝 < 0.32 + (1.96)(0.02199)
𝟎. 𝟐𝟕𝟔𝟗 < 𝑝 < 0.3631
Por lo tanto, la proporción poblacional de personas que experimentaron
algún síntoma de incomodidad por la vacuna está entre 0.2769 y 0.3631.
6.10 DISTRIBUCION t (t- Student)
Sea Z una variable aleatoria con distribución normal con 𝜇 = 0 y varianza 𝜎 2 = 1
y sea V una variable aleatoria ji-cuadrada con k grados de libertad. Si Z y V
son independientes, entonces la variable aleatoria
𝑇=
𝑍
√
𝑉
𝑘
tiene una función de densidad de probabilidad
𝑓(𝑥) =
Γ[(𝑘 + 1)/2]
√𝜋𝑘Γ(𝑘/2)[(𝑥 2 /𝑘) + 1](𝑘+1)/2
−∞<𝑥 <∞
y se dice que sigue una distribución t con k grados de libertad. Su media y
varianza de la distribución t son 𝜇 = 0 y 𝜎 = 𝑘/(𝑘 − 2) para 𝑘 > 2, respectivamente.
En la figura 6.3 se presenta la grafica de varias distribuciones t.
t de Student
0.4
G. L.
2
3
10
densidad
0.3
0.2
0.1
0
-9
-6
-3
0
x
3
6
9
Figura 6.3 Grafica de varias distribuciones t
6.11 DISTRIBUCION MUESTRAL t (t- Student)
Por lo general en muchas ocasiones no se conoce la desviación estándar
de la población,
estándar
sino que se cuenta con solo la estimación de la desviación
obtenida de una muestra aleatoria de dicha población, por
consiguiente no es posible obtener el valor de Z de una distribución normal
estándar. En este caso, se obtiene el estadístico t (t-Student), definido como la
expresión 6.5.
𝑡=
𝑥̅ − 𝜇
𝑆
(6.5)
Donde t sigue una distribución t (t-Student) con n-1 grados de libertad y
∑(𝑥−𝑥𝑖 )2
√
𝑛−1
𝑆=
es la desviación estándar muestral.
La distribución 𝑡 tiene una curva más ancha que la distribución normal
estandarizada cuando el número de grados de libertad es pequeño. Cuando los
grados de libertad tienden a infinito, la distribución t tiende a una distribución
normal estándar. Es significa que a medida que se incrementa el tamaño de la
muestra, la desviación estándar muestral se aproxima a la desviación estándar
poblacional y en consecuencia la distribución de t se a próxima a la distribución
normal estándar (ver figura 6.4)
Figura 6.4 Distribución t de Student y normal.
6.12 ESTIMACION POR INTERVALO DE UNA MEDIA CON 𝒏 ≤ 𝟑𝟎
Sea 𝑥̅
y S la media y desviación estándar, respectivamente, de una
muestra aleatoria tomada de una población normal con media 𝜇 y varianza 𝜎 2
desconocida. Entonces un intervalo de confianza del 100%(1- 𝛼) para 𝜇 esta
dos por
𝑥̅ − 𝑡∝⁄2,𝑛−1
𝑠
√𝑛
≤ 𝜇 ≤ 𝑥̅ + 𝑡∝⁄2,𝑛−1
𝑠
(6.6)
√𝑛
Donde 𝑡∝⁄2,𝑛−1 es un punto critico superior de la t-Student con n-1 grados de
libertad, correspondiente al nivel de confianza 𝛼.
Ejemplo 6.3. Los siguientes datos de la tabla 6.3 corresponden a la estatura en
centímetros
de una muestra aleatoria de 10 estudiantes
del grupo A de la
licenciatura de ingeniería. Encontrar un intervalo de confianza del 95% para la
estatura media.
168
165
168
157
164
165
Tabla 6.3 Estaturas en centímetros de 10 estudiantes
160
164
171
165
Supongas que la estatura de los estudiantes sigue una distribución normal. La
media y desviación estándar de la muestra son
𝑥̅ = 164.7
S=4.00139
De la tabla II del apéndice y para un 𝛼 = 0.05 y para n-1=10-1=9 grados de
libertad se tiene que
𝑡0,025,9 = 2.262. El intervalo de confianza al 95% de las
estaturas de los estudiantes es
164.7 − 2.262
4.00139
√9
≤ 𝜇 ≤ 164.7 + 2.262
4.00139
√9
164.7 − 2.262(1.333) ≤ 𝜇 ≤ 164.7 + 2.262(1.333)
𝟏𝟔𝟏. 𝟏𝟓 ≤ 𝝁 ≤ 𝟏𝟔𝟕. 𝟕𝟏
Por lo tanto, se tiene una confianza estadística del 95% de que el promedio de
estatura de los estudiantes se encuentra entre 161.15 y 167.71.
6.13 DISTRIBUCION JI-CUADRADA
Sean 𝑍1 , 𝑍2 , 𝑍3 , ⋯ , 𝑍𝑣 variables aleatorias con distribución normal e
independiente, con media 𝜇 = 0 y varianza 𝜎 2 = 1, entonces, la variable
aleatoria definida como
(6.7)
𝜒 = 𝑍12 + 𝑍22 + ⋯ + 𝑍𝑣2
Tiene la función de densidad de probabilidad
𝑓(𝑥) =
𝑥 (𝑣⁄2)−1 𝑒 −𝑥⁄2
2𝑣⁄2 Γ(𝑣 ⁄2)
𝑝𝑎𝑟𝑎 𝑥 > 0
y por consiguiente 𝜒 sigue una distribución ji-cuadrada con v grados de libertad,
y se simboliza con 𝜒𝑣2 . La media y la varianza de la distribución 𝜒𝑣2 son
𝜇=𝑣
𝜎 2 = 2𝑣
En la figura 6.5 se pueden ver la distribución 𝜒𝑣2 con v=1, v=5, v=10, grados de
libertad. La distribución de ji-cuadrada es una de las distribuciones de muestreo
con mayor utilidad.
Chi-Cuadrada
0.6
G. L.
2
5
10
densidad
0.5
0.4
v=2
0.3
0.2
v=5
v=10
0.1
0
0
10
20
x
30
40
Figura 6.5 Gráficas de la distribución 𝜒 2 con distintos grados de libertad
Supóngase que 𝑋1 , 𝑋2 , 𝑋3 , ⋯ , 𝑋𝑛 es una muestra aleatoria de tamaño,
tomada de una población normal, con media 𝜇 y 𝜎 2 , entonces el estadístico jicuadrada dado por
𝜒2 =
(𝑛 − 1)𝑆 2
𝜎2
(6.8)
Tiene una distribuida como 𝜒 2 con n-1 grados de libertad y se le conoce como
la distribución de muestreo ji-cuadrada, donde 𝑛 es el tamaño de la muestra
aleatoria, 𝑠 2 la varianza muestral. Con la distribución de muestreo ji-cuadrada
se puede construir estimaciones de intervalo de confianza y hacer pruebas de
hipótesis estadísticas sobre la varianza de una población normal. El estadístico
ji-cuadrada también se puede dar con la siguiente expresión
∑𝑛𝑖=1(𝑋𝑖 − 𝑋̅)2
𝜒 =
𝜎2
2
(6.9)
Propiedades de las distribuciones ji-cuadrada
1. Los valores de 𝜒 2 son mayores o iguales que 0.
2. La forma de una distribución 𝜒 2 depende de 𝑛 − 1 𝑔𝑟𝑎𝑑𝑜𝑠 𝑑𝑒 𝑙𝑖𝑏𝑒𝑟𝑡𝑎𝑑. En
consecuencia, hay un número infinito de distribuciones 𝜒 2 .
3. El área bajo una curva ji-cuadrada y sobre el eje horizontal es 1.
4. Las distribuciones 𝜒 2 no son simétricas. Tienen colas estrechas que se
extienden a la derecha; esto es, están sesgadas a la derecha.
5. Cuando 𝑛 > 2, la media de una distribución 𝜒 2 es 𝑛 − 1 y la varianza es
2(𝑛 − 1).
6. El valor modal de una distribución 𝜒 2 se da en el valor (𝑛 − 3).
6.14 INTERVALO DE CONFIANZA DE LA VARIANZA
Sea 𝑋1 , 𝑋2 , 𝑋3 , ⋯ , 𝑋𝑛 una muestra aleatoria de tamaño n
población normal, sea 𝑆 2 la varianza muestral
tomada de una
y por consiguiente sea 𝑆 2 el
estimador puntual de 𝜎 2 . En la sección 6.13 se mostró que la expresión
𝜒2 =
(𝑛 − 1)𝑆 2
𝜎2
es una ji- cuadrada con n-1 grados de libertad. Esta distribución se muestra en
la figura 6.6. Para el desarrollo del intervalo de confianza de 𝜎 2 , de la figura 6.4
se tiene la siguiente expresión (6.10)
2
𝑝 (𝜒1−(𝛼
⁄2) ≤
(𝑛 − 1)𝑆 2
2
≤ 𝜒(𝛼
⁄2) ) = 1 − 𝛼
𝜎2
(6.10)
y haciendo un reordenamiento la expresión 6.10 puede escribirse como
𝑃(
(𝑛 − 1)𝑆 2
2
𝜒(𝛼
⁄2, 𝑛−1)
≤ 𝜎2 ≤
(𝑛 − 1)𝑆 2
)
2
𝜒(1−𝛼
⁄2, 𝑛−1)
=1−𝛼
(6.11)
Figura 6.6 Derivación de un intervalo de confianza para 𝜎 2 en una distribución normal
y por lo tanto, de la expresión 6.11, concluimos que el intervalo de confianza
del 100(1 − 𝛼)% para 𝜎 2 esta dado por
(
(𝑛 − 1)𝑆 2
,
2
𝜒(𝛼
⁄2, 𝑛−1)
(6.12)
(𝑛 − 1)𝑆 2
)
2
𝜒(1−𝛼
⁄2, 𝑛−1)
Ejemplo 6.4. Considerando los datos del ejemplo 6.3, de las estaturas de los
estudiantes, encontrar
un intervalo de confianza bilateral al 95% para la
varianza poblacional 𝜎 2 de las estaturas de los estudiantes.
Supongas que la estatura de los estudiantes sigue una distribución normal. La
desviación estándar y la varianza de la muestra son
S=4.00139
S2=16.011
De la tabla III del apéndice y para un 𝛼 = 0.05 y para n-1=10-1=9 grados de
2
libertad se tiene que 𝜒(𝛼
⁄2,
𝑛−1)
2
= 𝜒(0.025,
9)
2
= 19.02 y 𝜒(1−𝛼
⁄2,
𝑛−1)
2
= 𝜒(0.975,
9)
=
2.70, sustituyendo estos valores en la expresión 6.9, se tiene que el intervalo
de confianza para 𝜎 2
al 95% de las estaturas de los estudiantes es
(9)(16.011) (9)(16.011)
(
,
)
19.02
2.70
(
144.099 144.099
,
)
19.02
2.70
(7.57, 53.37)
Por lo tanto, se estima que la varianza poblacional 𝜎 2 de las estaturas de los
estudiantes esta entre 7.57 y 53.37.
6.15 PRUEBA DE HIPOTESIS
En muchos problemas de la ciencia, de la ingeniería y de la administración, se
requiere que se toma una decisión entre aceptar y rechazar una proposición
sobre algún parámetro. Esta proposición recibe el nombre de hipótesis. Y el
procedimiento sobre la toma de decisión sobre la hipótesis, se le conoce como
prueba de hipótesis.
Una hipótesis estadística es una proposición o supuesto sobre los
parámetros de una o más poblaciones.
Ejemplo 6.5. Considerando los datos del ejemplo 6.1, de las estaturas
en centímetros de los estudiantes de alguna universidad. El interés se centra
sobre la estatura promedio de los estudiantes, de manera específica, el interés
recae en decir si la estatura promedio es o no de 165 centímetros, esto lo
podemos expresar simbólicamente como
𝐻0 : 𝜇 = 165 centímetros
(𝐻0 : 𝐿𝑎 𝑒𝑠𝑡𝑎𝑡𝑢𝑟𝑎 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 𝑑𝑒 𝑙𝑜𝑠 𝑒𝑠𝑡𝑢𝑑𝑖𝑎𝑛𝑡𝑒𝑠 𝑒𝑠 𝑑𝑒 165 𝑐𝑒𝑛𝑡𝑖𝑚𝑒𝑛𝑡𝑟𝑜𝑠)
𝐻𝑎 : 𝜇 ≠ 165 centímetros
(𝐻𝑎 : 𝐿𝑎 𝑒𝑠𝑡𝑎𝑡𝑢𝑟𝑎 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 𝑑𝑒 𝑙𝑜𝑠 𝑒𝑠𝑡𝑢𝑑𝑖𝑎𝑛𝑡𝑒𝑠 𝑒𝑠 𝑑𝑖𝑓𝑒𝑟𝑒𝑛𝑡𝑒 𝑑𝑒 165 𝑐𝑒𝑛𝑡𝑖𝑚𝑒𝑛𝑡𝑟𝑜𝑠)
La proposición𝐻0 : 𝜇 = 165 centímetros, se conoce como Hipótesis nula,
mientras que la proposición 𝐻𝑎 : 𝜇 ≠ 165 centímetros, recibe el nombre de
Hipótesis alternativa. En la hipótesis alternativa se especifican los valores de
𝜇 que pueden ser mayores o menores que 165 centímetros, también se conoce
como Hipótesis alternativa bilateral. En algunas situaciones, lo que se desea
es formular una Hipótesis alternativa unilateral, como pudieran ser,
𝐻0 : 𝜇 = 165 𝑐𝑒𝑛𝑡𝑖𝑚𝑒𝑡𝑟𝑜𝑠;
𝐻𝑎 : 𝜇 < 165 𝑐𝑒𝑛𝑡𝑖𝑚𝑒𝑡𝑟𝑜𝑠.
ó
𝐻0 : 𝜇 = 165 𝑐𝑒𝑛𝑡𝑖𝑚𝑒𝑡𝑟𝑜𝑠;
𝐻𝑎 : 𝜇 > 165 𝑐𝑒𝑛𝑡𝑖𝑚𝑒𝑡𝑟𝑜𝑠.
De este modo, en forma general podemos decir que la
Hipótesis nula,
representada por 𝐻0 , es la afirmación sobre una o más características de
poblaciones que al inicio se supone cierta (es decir, una "creencia a priori"). La
Hipótesis alternativa, representada por 𝐻𝑎 , es la afirmación contradictoria a
𝐻0 , y ésta es la hipótesis del investigador.
Es importante señalar que las hipótesis siempre son proposiciones sobre la
población o distribución bajo estudio, no proposiciones sobre la muestra. Por lo
general, el valor del parámetro de la población especificado en la hipótesis nula
se determina en una de tres maneras diferentes:
1. Puede ser resultado de la experiencia pasada o del conocimiento del
proceso, entonces el objetivo de la prueba de hipótesis usualmente es
determinar si ha cambiado el valor del parámetro.
2. Puede obtenerse a partir de alguna teoría, modelo o diseño experimental,
que se relaciona con el proceso bajo estudio. En este caso, el objetivo de
la prueba de hipótesis es verificar la teoría o modelo.
3. Cuando el valor del parámetro proviene de consideraciones externas,
tales como las especificaciones de diseño o ingeniería, o de obligaciones
contractuales. En esta situación, el objetivo usual de la prueba de
hipótesis es probar el cumplimiento de las especificaciones.
Los procedimientos de prueba de hipótesis dependen del empleo de la
información contenida en la muestra aleatoria de la población de interés. Si esta
información es consistente con la hipótesis, se concluye que ésta es verdadera;
sin embargo si esta información es inconsistente con la hipótesis, se concluye
que esta es falsa. Debe hacerse hincapié en que la verdad o falsedad de una
hipótesis en particular nunca puede conocerse con certidumbre, a menos que
pueda examinarse a toda la población. Usualmente esto es imposible en muchas
situaciones prácticas. Por tanto, es necesario desarrollar un procedimiento de
prueba de hipótesis teniendo en cuenta la probabilidad de llegar a una conclusión
equivocada.
La hipótesis nula se rechaza en favor de la hipótesis alternativa, sólo si la
evidencia muestral sugiere que 𝐻0 es falsa. Si la muestra no contradice
decididamente a 𝐻0 , se continúa creyendo en la validez de la hipótesis nula.
Entonces, las dos conclusiones posibles de un análisis por prueba de hipótesis
son rechazar 𝑯𝟎 o no rechazar 𝑯𝟎 .
6.16 ERRORES DEL TIPO I Y TIPO II.
El procedimiento de contrastar la
alternativa con base de
hipótesis nula contra la hipótesis
la información obtenida en una muestra aleatoria,
puede llevar a cometer dos posibles errores, debido a fluctuaciones o variaciones
del azar en el muestreo. Si la hipótesis nula es en realidad verdadera, pero los
datos de la muestra aleatoria la contradicen entonces la hipótesis nula es
rechazada y entonces se estará cometiendo el Error Tipo I. Por otro lado, si la
hipótesis nula es falsa y los datos de la muestra conllevan a no rechazarla, se
estará cometiendo el Error Tipo II. En otras palabras, El Error tipo I se define
como el rechazo de la hipótesis nula H0 cuando esta es verdadera y el Error tipo
II se define como la aceptación de la hipótesis nula H0 cuando esta es falsa. Por
lo tanto, al probar cualquier hipótesis estadística, existen cuatro situaciones
diferentes que determinan
si la decisión final es correcta o errónea. Estas
situaciones aparecen en la tabla 6.4
Decisión
Eventos
No se rechaza 𝐻0
Rechazar 𝐻0
𝐻0 es Verdadera
No hay error con
Error Tipo I
probabilidad
𝐻0 es Falsa
1−𝛼
con probabilidad 𝛼
Error Tipo II
No hay error
con probabilidad 𝛽
(potencia)
Con probabilidad
1−
𝛽
Tabla 6.4 Situaciones que determinan si la decisión final fue correcta o errónea.
Algunas veces, la probabilidad del error tipo I recibe el nombre de nivel de
significancia de la prueba y se denota con 𝛼 y La probabilidad de cometer un
error Tipo II se denota por  . La probabilidad de no rechazar una hipótesis nula
verdadera es la confianza 1 − 𝛼, con la cual se trabajó para hacer estimaciones
por intervalo. Cuando se rechaza una hipótesis nula falsa se ha tomado una
decisión correcta y la probabilidad de hacerlo se denomina potencia o poder de
la prueba y es denotada por 1  . En símbolos esto se expresa de la siguiente
manera:
P(Error tipo I) = P(Rechazar H0H0 es verdadera) = 
P(No rechazar H0H0 es verdadera) = 1 
P(Error Tipo II)=P(No rechazar H0H0 es falsa) = 
P(Rechazar H0H0 es falsa) = Potencia = 1 
El nivel de significancia  lo fija el investigador, y en la práctica se suelen
usar valores de 0.01, 0.05 o el 0.1
En la figura 6.7 se ilustra las reglas de decisión y los tipos de error:
Figura 6.7 Reglas de decisión.
6.17 PROCEDIMIENTO GENERAL PARA LA PRUEBA DE HIPOTESIS
Una vez que se han formulado las hipótesis nula, 𝐻0 y la hipótesis
alternativa, 𝐻𝑎 , se debe realizar un procedimiento de comparación‚ por medio
del cual se toma una decisión basada en la muestra aleatoria seleccionada de la
población en estudio. Para llevar a cabo este procedimiento es necesario
seleccionar el estadístico de prueba adecuado, calcularlo con base en la muestra
y luego tomar la decisión de rechazar o no 𝐻0 con respecto a un nivel de
significancia 𝛼. Se recomienda utilizar los siguientes pasos al aplicar la
metodología de prueba de hipótesis
Los pasos a seguir en una prueba de hipótesis son:
1. Identificar el parámetro de interés, el cual se deriva del problema.
2. Formular las hipótesis nula H0 y la hipótesis alternativa Ha.
3. Escoger un nivel de significancia .
4. Seleccionar el estadístico de prueba adecuado a la distribución
muestral.
5. Determinar la región crítica o de rechazo para el estadístico de
prueba.
6. Calcular el estadístico de prueba.
7. Tomar una decisión de rechazar H0 o no rechazarla.
8. Dar una conclusión al problema.
6.18 PRUEBA DE HIPOTESIS SOBRE LA MEDIA DE UNA
DISTRIBUCION NORMAL Y VARIANZA CONOCIDA
CASO I
Supongas que se desea probar la hipótesis
𝐻0 : 𝜇 = 𝜇0
𝐻𝑎 : 𝜇 ≠ 𝜇0
Donde 𝜇0 es un valor especifico.
Sea 𝑥1 , 𝑥2 , 𝑥3 , ⋯ , 𝑥𝑛 una muestra aleatoria de tamaño 𝑛, y sea 𝑋̅ la media
muestral con distribución normal con media 𝜇 y varianza 𝜎 2
entonces el
estadístico de prueba para la media esta en la expresión 6.13,
𝑍0 =
𝑥̅ − 𝜇0
(6.13)
𝜎
√𝑛
Donde 𝜇0 es el valor que supuesto en la hipótesis nula (𝐻0 ).
REGLA DE DECISION
Si se ha planteado la hipótesis alternativa como, 𝐻𝑎 : 𝜇 ≠ 𝜇0 , donde 𝜇0 es un valor
especifico, se tiene una prueba de hipótesis bilateral, es decir a dos colas, por
lo tanto, el nivel de significancia 𝛼 se divide en dos partes iguales, quedando
estos valores en los extremos de la distribución como se aprecia en la figura 6.8.
En consecuencia, si 𝐻0 : 𝜇 = 𝜇0 es cierta, la probabilidad de que el estadístico de
prueba 𝑍0
este entre −𝑍𝛼⁄2 y 𝑍𝛼⁄2 es 1 − 𝛼. Los valores de −𝑍𝛼⁄2 y 𝑍𝛼⁄2
pertenecen a una distribución Normal estándar. Nótese en la figura 6.8 que la
probabilidad del estadístico de prueba este en la región 𝑍0 > 𝑍𝛼⁄2 o 𝑍0 < −𝑍𝛼⁄2
cuando 𝐻0 : 𝜇 = 𝜇0 es verdadera, es 𝛼. En consecuencia, la hipótesis 𝐻0 debe
rechazarse si se cumple que
𝑍0 > 𝑍𝛼⁄2 o 𝑍0 < −𝑍𝛼⁄2
De otra forma si el valor del estadístico de prueba 𝑍0 está entre −𝑍𝛼⁄2 y 𝑍𝛼⁄2 no
se rechaza la hipótesis H0.
Figura 6.8 Distribución de Z0 cuando 𝐻0 : 𝜇 = 𝜇0 es verdadera, con región critica para 𝐻𝑎 : 𝜇 ≠ 𝜇0 .
Ejemplo 6.6. Se esta estudiando el rendimiento de un proceso químico.
De la experiencia, se sabe que la desviación estándar del rendimiento es de 3.2.
En la tabla 6.5 están los resultados del rendimiento obtenidas los últimos 40 días
en la planta de operación ¿Existe evidencia de que el rendimiento no es del 90%?
Utilizar 𝛼 = 0.05.
86.74
81.58
87.68
84.84
91.88
87.38
87.32
81.72
89.66
82.66
83.81
88.30
85.00
80.67
81.84
92.51
88.22
76.78
86.18
79.35
85.33
89.65
81.76
90.84
83.75
87.04
89.33
82.97
88.31
85.22
86.33
86.04
86.86
83.26
82.97
86.74
90.39
92.32
88.45
88.11
Tabla 6.5 Rendimiento de un proceso químico
Siguiendo los pasos de la prueba de hipótesis tenemos
1. El parámetro de interés es 𝜇, el promedio del rendimiento de un proceso.
2. La hipótesis nula es
𝐻0 : 𝜇 = 90
La hipótesis alternativa es
𝐻𝑎 : 𝜇 ≠ 90
3. El nivel de significancia es
𝛼 = 0.05
4. El estadístico de prueba es
𝑍0 =
𝑥̅ −𝜇0
𝜎
√𝑛
5. Rechazar H0 si se cumple que 𝑍0 > 𝑍𝛼⁄2 o 𝑍0 < −𝑍𝛼⁄2 , de la tabla I del
apéndice se tiene que 𝑍0.025 = 1.96 y −𝑍0.025 = −1.96 .
6. Considerando que el promedio muestral 𝑥̅ = 85.99, n=40, 𝜎 = 3.2 y 𝜇0 = 90
el valor del estadístico de prueba es
𝑍0 =
85.99 − 90
3.2
√40
𝑍0 = −7.99
7. Dado que 𝑍0 < −𝑍0.025 , como se ilustra en la figura 6.9, se rechazar la
hipótesis H0.
8. Por lo tanto se concluye, con una confianza estadística del 95%, de que
el promedio del rendimiento de un proceso químico no es de 90%.
Figura 6.9 Regla de decisión para una prueba de hipótesis a dos colas
CASO II
Si se ha planteado la hipótesis alternativa como: 𝐻𝑎 : 𝜇 > 𝜇0 , se tiene una prueba
de hipótesis a una cola superior, quedando el nivel de significancia 𝛼 en la parte
superior de la distribución, como se aprecia en la figura 6.10, donde 𝑍𝛼 pertenece
a una distribución Normal estándar
Figura 6.10 Regla de decisión para una prueba de hipótesis a una cola superior
Si el valor del estadístico de prueba 𝑍0 es mayor que 𝑍𝛼 se rechaza la
hipótesis nula, en caso contrario no se rechaza 𝐻0 .
Ejemplo 6.7. Un proceso manufacturero usado por una fábrica durante
los últimos años da una producción media de 100 unidades por hora con una
desviación estándar de 8 unidades. Se acaba de introducir en el mercado una
nueva máquina para realizar ese tipo de producto. Aunque es muy cara
comparada con la que está ahora en uso, si la media de producción de la nueva
máquina es de más de 150 unidades por hora, su adopción daría bastantes
beneficios.
Para decidir si se debiera comprar la nueva máquina, a la gerencia de la
fábrica se le permite hacer un ensayo durante 35 horas, hallándose un promedio
de 160 unidades por hora. Con ésta información qué decisión se debe tomar si
se asume un nivel de confianza del 𝛼 = 0.01.
Siguiendo los pasos de la prueba de hipótesis tenemos
1.
El parámetro de interés es 𝜇, el promedio de producción de unidades.
2.
La hipótesis nula es
𝐻0 : 𝜇 = 150
La hipótesis alternativa es
𝐻𝑎 : 𝜇 > 150
3.
El nivel de significancia es 𝛼 = 0.01
4.
El estadístico de prueba es 𝑍0 =
𝑥̅ −𝜇0
𝜎
√𝑛
5.
Rechazar H0 si se cumple que 𝑍0 > 𝑍𝛼 de la tabla I del apéndice se
tiene que 𝑍0.01 = 2.33
6.
Considerando que el promedio muestral 𝑥̅ = 160, n=35, 𝜎 = 8 y 𝜇0 =
150 el valor del estadístico de prueba es
𝑍0 =
160 − 150
8
√35
𝑍0 = 7.395
7.
Dado que 𝑍0 > 𝑍0.01 se rechazar la hipótesis H0.
8.
En consecuencia, como puede observarse en la figura 6.11, el valor del
estadístico de prueba está en la zona de rechazo de la hipótesis nula,
por lo tanto, se acepta que la producción promedio por hora es superior
a las 150 unidades y asumiendo un riesgo del 1%, se puede comprar
la nueva máquina.
Figura 6.11 Regla de decisión para una prueba de hipótesis a una cola inferior
CASO III
Si se ha planteado la hipótesis alternativa como, 𝐻𝑎 : 𝜇 < 𝑘, se tiene una prueba
de hipótesis a una cola inferior, quedando el nivel de significancia 𝛼 en la parte
inferior de la distribución, como se aprecia en la figura 6.12, 𝑍∝ pertenece a una
distribución Normal estándar.
Figura 6.12 Regla de decisión para una prueba de hipótesis a una cola inferior
Si el valor del estadístico de prueba 𝑍0 es menor que 𝑍𝛼 se rechaza la
hipótesis nula, en caso contrario no se rechaza 𝐻0 .
Ejemplo 6.8. Considerando los datos del ejemplo 6.6 con respecto al
rendimiento de un proceso químico, plantearemos la hipótesis alternativa de que
el rendimiento del proceso químico es menor que el 90%, es decir 𝐻𝑎 : 𝜇 < 90,
utilizar 𝛼 = 0.05.
Siguiendo los pasos de la prueba de hipótesis tenemos
1.
El parámetro de interés es 𝜇, el promedio del rendimiento de un
proceso químico.
2.
La hipótesis nula es
𝐻0 : 𝜇 = 90
La hipótesis alternativa es
𝐻𝑎 : 𝜇 < 90
3.
El nivel de significancia es
𝛼 = 0.05
4.
El estadístico de prueba es 𝑍0 =
5.
Rechazar H0 si se cumple que
𝑥̅ −𝜇0
𝜎
√𝑛
𝑍0 < 𝑍𝛼 , de la tabla I del apéndice se
tiene que 𝑍0.05 = 1.96.
6.
Considerando que el promedio muestral 𝑥̅ = 85.99, n=40, 𝜎 = 3.2 y 𝜇0 =
90 el valor del estadístico de prueba es
−7.99
𝑍0 =
85.99−90
3.2
√40
𝑍0 =
7.
Dado que 𝑍0 < 𝑍0.05 se rechazar la hipótesis H0.
8.
Por lo tanto se concluye, con una confianza estadística del 95%, de
que el promedio del rendimiento de un proceso químico no es de 90%,
dado el resultado de la prueba se puede afirmar que el promedio del
rendimiento es menor a 90%.
6.19 PRUEBA DE HIPÓTESIS
SOBRE IGUALDAD DE DOS MEDIAS,
VARIANZAS CONOCIDAS
En algunos problemas de investigación, se tiene el interés en comparar
las medias de dos poblaciones distintas con muestras aleatorias independientes
de tamaños 𝑛1 y
𝑛2 . Por ejemplo, comparar el rendimiento de dos maquinas
de ensamble, comparar una encuesta de opinión sobre que opinan lo hombres
con respecto a que opinan las mujeres, la calidad de un producto de un
proveedor con respecto a otro proveedor, etc.
Supóngase que se tienen dos poblaciones de interés, donde la primera tiene una
media poblacional desconocida 𝜇1 y varianza conocida 𝜎12 y la segunda tiene
una media poblacional desconocida 𝜇2 y varianza conocida 𝜎22 . Supóngase que
las dos poblaciones son normales, y sino se aplican las condiciones del teorema
del
limite central. Un
planteamiento de las hipótesis para la diferencia de
medias en dos poblaciones se puede ver en la tabla 6.6.
- Prueba de hipótesis a
- Prueba de hipótesis a
- Prueba de hipótesis a
dos colas
una cola superior
una cola inferior
𝐻0 : 𝜇1 = 𝜇2 ó 𝐻0 : 𝜇1 − 𝜇2 = 𝑘
𝐻0 : 𝜇1 = 𝜇2 ó 𝐻0 : 𝜇1 − 𝜇2 = 𝑘
𝐻0 : 𝜇1 = 𝜇2 ó 𝐻0 : 𝜇1 − 𝜇2 = 𝑘
𝐻𝑎 : 𝜇1 ≠ 𝜇2 ó 𝐻𝑎 : 𝜇1 − 𝜇2 ≠ 𝑘
𝐻𝑎 : 𝜇1 > 𝜇2 ó 𝐻𝑎 : 𝜇1 − 𝜇2 > 𝑘
𝐻𝑎 : 𝜇1 < 𝜇2 ó 𝐻𝑎 : 𝜇1 − 𝜇2 < 𝑘
Tabla 6.6 Diversas formas de plantear las hipótesis, donde k es un valor específico.
El procedimiento de prueba se basa en la distribución de la diferencia de
las medias muestrales 𝑋̅1 − 𝑋̅2 . En general, si la hipótesis nula 𝐻0 : 𝜇1 = 𝜇2 es
verdadera, la distribución de 𝑋̅1 − 𝑋̅2 es una distribución normal con media 𝜇1 − 𝜇2 y
varianza
𝜎12
𝑛1
+
𝜎22
,
𝑛2
por lo tanto el estadístico de prueba,
se puede ver en la
expresión 6.14
𝑍0 =
(6.14)
(𝑥̅1 − 𝑥̅2 ) − (𝜇1 − 𝜇2 )
𝜎12
√
𝑛1
𝜎22
+𝑛
2
El estadístico 𝑍0 tiene una distribución normal estándar. Por consiguiente si la
hipótesis alternativa es definida como 𝐻𝑎 : 𝜇1 ≠ 𝜇2 , entonces es una
prueba de
hipótesis es bilateral, por consiguiente la hipótesis nula 𝐻0 se rechaza si
𝑍0 > 𝑍𝛼⁄2 o 𝑍0 < −𝑍𝛼⁄2
Si la hipótesis alternativa es definida como 𝐻𝑎 : 𝜇1 > 𝜇2 , corresponde a una prueba
de hipótesis unilateral a una cola superior, en consecuencia la hipótesis nula 𝐻0
se rechaza si
𝑍0 > 𝑍𝛼
Si la hipótesis alternativa es definida como 𝐻𝑎 : 𝜇1 < 𝜇2 , corresponde a una
prueba de hipótesis unilateral a una cola inferior, en consecuencia la hipótesis
nula 𝐻0 se rechaza si
𝑍0 < 𝑍𝛼 .
Ejemplo 6.9 Un constructor está considerando dos lugares alternativos
para construir un centro comercial. Como los ingresos de los hogares de la
comunidad son una consideración importante en ésta selección, desea probar
que el ingreso promedio de la primera comunidad excede al promedio de la
segunda comunidad en cuando menos $1,500 diarios. Con la información de un
censo realizado el año anterior se sabe que la desviación estándar del ingreso
diario de la primera comunidad es de $1,800 y la desviación estándar de la
segunda es de $2,400. Se toma una muestra aleatoria de 30 hogares de la
primera comunidad, encuentra que el ingreso promedio es de $35,500 y con una
muestra de 40 hogares de la segunda comunidad el ingreso promedio es de
$34,600. Pruebe la hipótesis con un nivel de significancia 𝛼 = 0.05.
Solución: Se desea probar si la diferencia entre los ingresos de la comunidad 1
y la 2 es de $1,500 o más, por lo tanto:
𝐻0 : 𝜇1 − 𝜇2 = 1,500
𝑯𝒂 : 𝝁𝟏 − 𝝁𝟐 > 𝟏, 𝟓𝟎𝟎
El tamaño de las muestras es grande y las varianzas poblacionales son
conocidas, por consiguiente la estadística de trabajo a utilizar es la expresión
6.14
𝑛1 = 30 𝑥̅1 = 35,500 𝜎1 = 1,800 𝑛2 = 40 𝑥̅2 = 34,600 𝜎2 = 2,400 𝛼 = 0.05
𝑍0 =
(𝑥̅1 − 𝑥̅2 ) − (𝜇1 − 𝜇2 )
𝜎2
√ 1
𝑛1
+
𝜎22
𝑛2
=
(35,500 − 34,600) − (1,500)
1,8002
√
30
+
2,4002
40
= −1.195
Para un nivel de significancia 𝛼 = 0.05, en la tabla I de la distribución normal del
apéndice se tiene un valor de 𝑍0.05 es 1.96. Por consiguiente 𝑍0 < 𝑍0.05 , lo que
significa que no es posible rechazar la hipótesis nula, con lo que podemos por lo
tanto, con una confiabilidad del 95%, la diferencia entre el ingreso promedio por
hogar en las dos comunidades no es mayor a $1,500.
6.20 PRUEBA DE HIPÓTESIS SOBRE IGUALDAD DE DOS MEDIAS,
VARIANZAS DESCONOCIDAS CON (𝒏𝟏 ≥ 𝟑𝟎 𝐲 𝒏𝟐 ≥ 𝟑𝟎)
Para la diferencia de dos medias si las muestras se obtienen de poblaciones
con distribuciones normales, pero 𝑛1 ≥ 30 y 𝑛2 ≥ 30 y varianzas poblacionales
desconocidas, el estadístico de prueba de la expresión 6.14 es modificado al
sustituir las varianzas muestrales 𝑠12 y 𝑠22 por sus respectivas varianzas
poblacionales 𝜎12 y 𝜎22 , como se ilustra en la expresión 6.15
𝑍0 =
(6.15)
(𝑥̅1 − 𝑥̅2 ) − (𝜇1 − 𝜇2 )
√
𝑆12
𝑛1
𝑆22
+𝑛
2
Las reglas de rechazo para la hipótesis nula, son las mismas que se describen
en la sección 6.19.
Ejemplo 6.10 Una muestra de 80 alambres de acero producidos por la fábrica
A presenta una resistencia promedio a la ruptura de 1,230 lbs. Con una
desviación estándar de 120 lbs. Una muestra de 100 alambres de acero
producidos por la fábrica B presenta una resistencia promedio a la ruptura de
1,110 lbs. Con una desviación estándar de 90 lbs. Con base en ésta
información pruebe si la resistencia promedio a la rotura de los alambres de
acero de la marca A es significativamente mayor que la de los alambres de
acero de la marca B. Utilizar un nivel de significancia de 𝛼 = 0.01.
Solución Las hipótesis a probar son
𝐻0 : 𝜇𝐴 = 𝜇𝐵
𝐻𝑎 : 𝜇𝐴 > 𝜇𝐵
El tamaño de las muestras es grande, las varianzas poblacionales son
desconocidas,
y asumiendo que las medias poblacionales son iguales y
sustituyendo 𝑥̅𝐴 = 1,230, 𝑠𝐴 = 120, 𝑥̅𝐵 = 1,190, 𝑠𝐵 = 90, 𝑛𝐵 = 100 y 𝑛𝐴 = 80 en el
estadístico de prueba de la expresión 6.15, se tiene
𝑍0 =
̅2 ) − (𝜇1 − 𝜇2 )
(̅
𝑥1 − 𝑥
𝑠2
√ 1
𝑛1
𝑠2
+ 𝑛2
2
=
(1,230 − 1,190) − (0)
2
√120
80
902
+ 100
= 2.476
Para un nivel de significancia 𝛼 = 0.01, en la tabla de la distribución normal el
valor de 𝑍0.05 es 2.33. Se tiene que 𝑍0 > 𝑍0.05, como se aprecia en la figura
6.13, El estadístico de prueba 𝑍0 está en la zona de rechazo de la hipótesis
nula, por consiguiente, con una confiabilidad del 99% se acepta que la
resistencia promedio de los alambres de la marca A es significativamente
mayor que la resistencia promedio de los alambres de la marca B.
Figura 6.13 Regla de decisión para una prueba de hipótesis a una cola superior
6.21 PRUEBAS DE HIPÓTESIS SOBRE LA MEDIA DE UNA
DISTRIBUCION NORMAL, VARIANZA DESCONOCIDA (𝒏 ≤ 𝟑𝟎).
Cuando se prueban hipótesis sobre la media 𝜇 de una población normal cuando
𝜎 2 es desconocida, es posible aplicar los procedimientos de la sección 6.18, al
sustituir
la desviación estándar muestral S por la desviación estándar
poblacional 𝜎, siempre y cuando el tamaño de muestra sea grande, es decir 𝑛 ≥
30. Sin embargo, cuando la muestra es pequeña, digamos 𝑛 ≤ 30, y 𝜎 2 es
desconocida se requiere de otra distribución de muestreo.
Sea 𝑥1 , 𝑥2 , 𝑥3 , ⋯ , 𝑥𝑛 una muestra aleatoria de tamaño 𝑛, y sea 𝑋̅ y S la
media y desviación estándar muestral, respectivamente, se desea probar la
hipótesis alternativa bilateral
𝐻0 : 𝜇 = 𝜇0
𝐻𝑎 : 𝜇 ≠ 𝜇0
Donde 𝜇0 es un valor especifico.
El estadístico de prueba es
𝑡0 =
𝑥̅ − 𝜇0
(6.16)
𝑆
√𝑛
El estadístico 𝑡0 tiene una distribución t con n-1 grados de libertad, si la hipótesis
nula 𝐻0 : 𝜇 = 𝜇0 , es verdadera, para una hipótesis alternativa bilateral 𝐻𝑎 : 𝜇 ≠ 𝜇0 ,
la hipótesis nula 𝐻0 se rechaza si
𝑡0 > 𝑡𝛼⁄2,𝑛−1 o 𝑡0 < −𝑡𝛼⁄2,𝑛−1
donde 𝑡𝛼⁄
2,𝑛−1
y −𝑡𝛼⁄
2,𝑛−1
son los puntos superior e inferior, respectivamente, de
la distribución t con n-1 grados de libertad.
Si la hipótesis alternativa unilateral superior 𝐻𝑎 : 𝜇 > 𝜇0 , se calcula el estadístico
de prueba 𝑡0 de la expresión 6.16, la hipótesis nula 𝐻0 , se rechaza si
𝑡0 > 𝑡𝛼,𝑛−1
y por lo contrario no se rechaza 𝐻0 .
Para una hipótesis alternativa unilateral inferior 𝐻𝑎 : 𝜇 < 𝜇0 , se calcula el
estadístico de prueba 𝑡0 de la expresión 6.16, la hipótesis nula 𝐻0 , se rechaza si
𝑡0 < −𝑡𝛼,𝑛−1
y por lo contrario no se rechaza 𝐻0 .
Ejemplo 6.11 En su calidad de comprador comercial para un supermercado, se
toma una muestra aleatoria de 12 sobres de café de una empacadora. Se
encuentra que el peso promedio muestral del contenido de café de cada sobre
es 15.97 grs. con una desviación estándar de 0.15. La compañía empacadora
afirma que el peso promedio mínimo del café es de 16 grs. por sobre. ¿Puede
aceptarse ésta afirmación si se asume un nivel de confianza del 90%?
Solución. Se desea probar si el peso mínimo es de 16 grs., es decir mayor o
igual a 16 grs., así que las hipótesis adecuadas son:
𝐻0 : 𝜇 = 16
𝐻𝑎 : 𝜇 > 16
Teniendo en cuenta que el tamaño de la muestra es pequeño 𝑛 = 12, la
media muestra es 𝑥̅ = 15.97 y su desviación estándar muestral es S=0.15, el
calculo del estadístico de prueba
𝑡0 =
𝑥̅ − 𝜇0
𝑆
√𝑛
=
15.97 − 16
0.15
√12
= −0.697
Como lo indica la hipótesis alternativa, se trabaja a una cola superior y
para 𝛼 = 0.10 en la tabla II, de la distribución 𝑡 del apéndice, con 11 grados de
libertad el valor de 𝑡0.10,11 es 1.363. Por consiguiente 𝑡0 < 𝑡0.10,11 , y en
consecuencia no se puede rechazar la hipótesis nula y se puede concluir que la
compañía de café tiene la razón de que el peso promedio mínimo de los sobres
de café es de 16 grs.
6.22 PRUEBAS DE HIPÓTESIS SOBRE LAS MEDIAS DE DOS
DISTRIBUCIONES NORMALES, VARIANZAS DESCONOCIDAS
Supóngase que se tienen dos poblaciones de interés, donde la primera
tiene una media poblacional desconocida 𝜇1
y varianza desconocida 𝜎12
y la
segunda tiene una media poblacional desconocida 𝜇2 y varianza desconocida 𝜎22 .
Supóngase que las dos poblaciones son normales. Un
planteamiento de las
hipótesis para la diferencia de medias en dos poblaciones se puede ver en la
tabla 6.6. Para probar las hipótesis que se plantean en la tabla 6.6 se usara el
estadístico de prueba t. Pero para esto, es necesario considerar dos situaciones
diferentes. En el primer caso, se supondrá que las varianzas de las dos
distribuciones normales son desconocidas pero iguales, esto es 𝜎12 = 𝜎22 = 𝜎 2 y en
un segundo caso, se supondrá que 𝜎12 ≠ 𝜎22 y desconocidas.
Caso I 𝝈𝟐𝟏 = 𝝈𝟐𝟐
Sea 𝑥11 , 𝑥12 , 𝑥13 , ⋯ , 𝑥1𝑛1 una muestra aleatoria de 𝑛1 observaciones tomadas de la
primera población y sea 𝑥21 , 𝑥22 , 𝑥23 , ⋯ , 𝑥2𝑛2 una muestra aleatoria
observaciones de la segunda población. Sean 𝑋̅1 , 𝑋̅2 , 𝑆12 , 𝑆22
de 𝑛2
las medias
muestrales y varianzas muestrales, respectivamente. Supongamos que 𝑆12 𝑦 𝑆22
son estimaciones de la varianza común 𝜎 2 , en consecuencia ambas varianzas
muestrales pueden combinarse para formar un solo estimador, como se ilustra
en la expresión
𝑆𝑝2 =
(6.17)
(𝑛1 − 1)𝑆12 + (𝑛2 − 1)𝑆22
𝑛1 + 𝑛2 − 2
Por lo tanto el estadístico de prueba para la comparación de dos medias es
𝑡0 =
𝑥̅1 − 𝑥̅2
1
𝑆𝑝 √𝑛
1
+
(6.18)
1
𝑛2
Donde 𝑆𝑝 es,
(6.19)
(𝑛1 − 1)𝑆12 + (𝑛2 − 1)𝑆22
𝑆𝑝 = √
𝑛1 + 𝑛2 − 2
Si 𝐻0 : 𝜇1 = 𝜇2 es verdadera 𝑡0 tiene una distribución 𝑡𝑛1 +𝑛2 −2.
Si la hipótesis alternativa es bilateral 𝐻𝑎 : 𝜇1 ≠ 𝜇2 , entonces si
𝑡0 > 𝑡𝛼⁄
2,𝑛1 +𝑛2 −2
o 𝑡0 < −𝑡𝛼⁄
se debe rechazar la hipótesis nula 𝐻0 : 𝜇1 = 𝜇2 .
2,𝑛1+𝑛2 −2
Si la hipótesis alternativa es unilateral superior 𝐻𝑎 : 𝜇1 > 𝜇2 , entonces si
𝑡0 > 𝑡𝛼⁄
2,𝑛1 +𝑛2 −2
se debe rechazar la hipótesis nula 𝐻0 : 𝜇1 = 𝜇2 .
Si la hipótesis alternativa es unilateral inferior 𝐻𝑎 : 𝜇1 < 𝜇2 , entonces si
𝑡0 < −𝑡𝛼⁄2,𝑛1 +𝑛2 −2
se debe rechazar la hipótesis nula 𝐻0 : 𝜇1 = 𝜇2 .
Ejemplo 6.12
Caso II 𝝈𝟐𝟏 ≠ 𝝈𝟐𝟐
En algunos casos no es recomendable suponer que la varianzas desconocidas
𝜎12 𝑦 𝜎22 sean iguales. En tal situación, no existe un estadístico t exacto para
probar la hipótesis nula 𝐻0 : 𝜇1 = 𝜇2 . Pero el estadístico
𝑥̅1 − 𝑥̅2
𝑡0∗ =
𝑆2
√1
𝑛1
+
(6.20)
𝑆22
𝑛2
tiene una distribución que es aproximadamente una distribución t con v grados
libertad, donde 𝑣 esta dado por
𝑆2
𝑣=
1
2
2
2
𝑆2
𝑆2
( 1⁄𝑛1 )
( 2⁄𝑛2 )
𝑛1 +1
(6.21)
2
𝑆2
(𝑛1 +𝑛2 )
+
- 2
𝑛2 +1
El procedimiento de prueba de hipótesis es el mismo, que en caso I, solo que
ahora los grados de libertad están determinados por la expresión 6.21.
Ejemplo 6.13
6.23 PRUEBA DE HIPÓTESIS PARA PARA UNA PROPORCION
En muchos problemas que surgen en la práctica tienen una variable
aleatoria que sigue una distribución binomial, por ejemplo, la proporción de
productos defectuosos, la proporción de personas que están de acuerdo con una
nueva política en la empresa, la proporción de personas que presentan cierto
síntoma de enfermedad, etc. En este caso el parámetro de interés es p, por
consiguiente las hipótesis para considerar en la prueba están en la tabla 6.7
- Prueba de hipótesis a
- Prueba de hipótesis a
- Prueba de hipótesis a
dos colas
una cola superior
una cola inferior
𝐻0 : 𝑝 = 𝑝0
𝐻0 : 𝑝 = 𝑝0
𝐻0 : 𝑝 = 𝑝0
𝐻𝑎 : 𝑝 ≠ 𝑝0
𝐻𝑎 : 𝑝 > 𝑝0
𝐻𝑎 : 𝑝 < 𝑝0
Tabla 6.7 Hipótesis a considera en la prueba, donde 𝑝0 es un valor especifico
Si la hipótesis nula 𝐻0 : 𝑝 = 𝑝0 es verdadera, el estadístico de prueba es
𝑍0 =
𝑝 − 𝑝0
(6.22)
𝑝(1−𝑝)
√
𝑛
Para una hipótesis alternativa bilateral 𝐻𝑎 : 𝑝 ≠ 𝑝0 , la hipótesis nula 𝐻0 : 𝑝 = 𝑝0 se
rechazará si
𝑍0 > 𝑍𝛼⁄2 o 𝑍0 < −𝑍𝛼⁄2
Para una hipótesis alternativa unilateral superior 𝐻𝑎 : 𝑝 > 𝑝0 , la hipótesis nula
𝐻0 : 𝑝 = 𝑝0 se rechazará si
𝑍0 > 𝑍𝛼
Para una hipótesis alternativa unilateral inferior 𝐻𝑎 : 𝑝 < 𝑝0 , la hipótesis nula
𝐻0 : 𝑝 = 𝑝0 se rechazará si
𝑍0 < −𝑍𝛼
Es importante señalar que el estadístico de prueba es valido siempre y cuando
no sea muy próximo a 1 o a cero, y si el tamaño de muestra es relativamente
grande, digamos 𝑛 ≥ 30.
Ejemplo 6.14 Un fabricante afirma que por lo menos el 90% de las piezas de
una
maquinaria
que
se
fabrican
en
una
empresa
cumplen
con
las
especificaciones del producto. Una inspección de 200 de esas piezas reveló que
160 de ellas cumplían con las especificaciones. Pruebe si lo que afirma el
fabricante es cierto. Utilizar 𝛼 = 0.05.
Solución:
𝐻0 : 𝑝 = 0.9
𝐻𝑎 : 𝑃 < 0.9
Para realizar una prueba de hipótesis para la proporción se utiliza la
expresión 6.22
𝑛 = 200
𝑝=
𝑍0 =
160
= 0.8
200
𝑝 − 𝑝0
𝑝(1−𝑝)
√
𝑛
=
1 − 𝑝 = 0.2
0.8 − 0.9
𝛼 = 0.05
= −3.536
(0.8)(0.2)
√
200
Para 𝛼 = 0.05 y de la tabla I de la distribución normal estándar del apéndice el
valor de −𝑍𝛼 = −1.64, de este modo 𝑍0 < −𝑍𝛼 , por consecuencia El valor del
estadístico de prueba se encuentra en la zona de rechazo, como se puede
observar en la figura 6.14, por consiguiente, con una confiabilidad del 95% se
concluye que la afirmación del fabricante no es cierta.
Figura 6.14 Regla de decisión para una prueba de hipótesis a una cola inferior
6.24 PRUEBA DE HIPÓTESIS PARA UNA VARIANZA
Supóngase que se quiere probar la hipótesis de que la varianza de una población
normal 𝜎 2 es igual un valor específico, digamos, 𝜎02 . Para probar
𝐻0 : 𝜎 2 = 𝜎02
𝐻𝑎 : 𝜎 2 ≠ 𝜎02
Se utiliza el estadístico de prueba
𝜒02 =
(𝑛 − 1)𝑠 2
(6.23)
𝜎02
donde 𝑠 2 es la varianza muestral.
Si la hipótesis nula 𝐻0 : 𝜎 2 = 𝜎02 es verdadera, entonces el estadístico 𝜒02 se
distribuye ji-cuadrada con n-1 grados de libertad.
Si se plantea como hipótesis alternativa 𝐻𝑎 : 𝜎 2 ≠ 𝜎02 , entonces se trata una
prueba de hipótesis bilateral. Por consiguiente, la hipótesis nula 𝐻0 : 𝜎 2 = 𝜎02 , será
rechazada si se cumple que
𝜒02 > 𝜒𝛼2,𝑛−1 o
2
2
𝜒02 < 𝜒1−
𝛼
,𝑛−1
2
2
donde 𝜒𝛼2,𝑛−1 y 𝜒1−
son los puntos que corresponden a los porcentajes 100𝛼/2
𝛼
,𝑛−1
2
2
inferior y superior, respectivamente, de la distribución ji-cuadrada con n-1
grados de libertad.
Si se plantea como hipótesis alternativa 𝐻𝑎 : 𝜎 2 > 𝜎02 , entonces se trata una
prueba de hipótesis unilateral superior. Por consiguiente, la hipótesis nula
𝐻0 : 𝜎 2 = 𝜎02 , será rechazada si se cumple que
2
𝜒02 > 𝜒𝛼,𝑛−1
Si se plantea como hipótesis alternativa 𝐻𝑎 : 𝜎 2 < 𝜎02 , entonces se trata una
prueba de hipótesis unilateral inferior. Por consiguiente, la hipótesis nula 𝐻0 : 𝜎 2 =
𝜎02 , será rechazada si se cumple que
2
𝜒02 < 𝜒1−𝛼,𝑛−1
Ejemplo 6.15 Se afirma que un pieza para un semiconductor es producido por
una compañía, tiene una varianza del diámetro no mayor que 0.0002 pulgadas.
Una muestra aleatoria de 10 piezas arrojó una varianza muestral de 0.0003,
pruébese que la varianza del diámetro de la pieza es mayor que 0.0002, utilícese
𝛼 = 0.05.
Solución. Las hipótesis a probar son
𝐻0 : 𝜎 2 = 0.0002
𝐻𝑎 : 𝜎 2 > 0.0002
Es una prueba de hipótesis unilateral superior. Supongamos que las mediciones
de los diámetros tienen una distribución normal, por consiguiente el valor del
estadístico de prueba es
𝜒02 =
(𝑛 − 1)𝑠 2
𝜎02
=
(9)(0.0003)
= 13.5
0.0002
Para un 𝛼 = 0.05 y de la tabla III de los valores de la distribución ji-cuadrada, se
2
2
tiene que 𝜒0.05,9
= 16.919. Por consiguiente se tiene que 𝜒02 < 𝜒𝛼,𝑛−1
, por lo tanto
no es posible rechazar 𝐻0 : 𝜎 2 = 0.0002 , lo que significa que no hay suficiente
evidencia para afirmar que 𝜎 2 sea mayor que 0.0002.
6.25 DISTRIBUCION MUESTRAL F DE SNEDECOR
Si 𝑆12 𝑦 𝑆22 son las varianzas de muestras aleatorias independientes de
tamaño 𝑛1 𝑦 𝑛2, respectivamente, tomadas de dos poblaciones normales que
tienen la misma varianza, entonces
𝐹0 =
𝑆12
𝑆22
(6.24)
Es un valor de una variable aleatoria que tiene distribución 𝐹 con
parámetros 𝑣1 = 𝑛1 − 1 𝑦
𝑣2 = 𝑛2 − 1.
En la figura 6.15 se puede ver la grafica de esta distribución. La
distribución 𝐹 se usa en situaciones de dos muestras para realizar inferencias
sobre la población. Sin embargo, la distribución 𝐹 se aplica a muchos otros tipos
de problemas en los cuales están relacionadas las varianzas muestrales. De
hecho la distribución 𝐹 se llama distribución de razón de varianzas.
Fig. 6.15. Distribución 𝐹.
6.26 COMPARACION DE DOS VARIANZAS POBLACIONALES
Las características son:




Continua, es decir valores infinitos.
Positivamente sesgada (derecha).
Asintótica (aumenta 𝑥 pero no toca el eje)
Existe una familia de distribuciones 𝐹 (grados de libertad)
Pasos para comparar dos varianzas poblacionales
1. Hipótesis nula vs hipótesis alternativa:
𝐻0 : 𝜎12 = 𝜎22
𝐻𝑎 : 𝜎12 ≠ 𝜎22
𝐻0 : 𝜎12 = 𝜎22
𝐻𝑎 : 𝜎12 > 𝜎22
𝐻0 : 𝜎12 = 𝜎22
𝐻𝑎 : 𝜎12 < 𝜎22
2. Nivel de confianza 𝛼:
Probabilidad de rechazar la hipótesis nula.
usualmente 0.05 y 0.01
3. Grados de Libertad y Valor Crítico (𝑛 − 1).
Según los grados de libertad se ubica el valor crítico en la tabla 𝐹.
4. Se extrae el valor de prueba: 𝐹 =
𝑆12
𝑆22
el valor resultante se compara con
el valor crítico (𝐹), si es mayor se rechaza la hipótesis nula.
Ejemplo 6.16 Una compañía produce piezas maquinadas para motor que se
supone tienen una varianza en diámetro no mayor que 0.0002 pulgadas. Una
muestra aleatoria de 𝑛 = 10 piezas dio 𝑠12 = 0.0003 pulgadas. Suponga que
deseamos comparar la variación en los diámetros de las piezas producidas por
la empresa, con la variación en los diámetros de las piezas producidas por un
competidor
donde para 𝑛 = 20 piezas la 𝑠22 = 0.0001 ¿los datos proporcionan
suficiente información para indicar una variación mas pequeña en diámetros
para el competidor? Prueba usando 𝛼 = 0.05.
Solución: Estamos probando
𝐻0 : 𝜎12 = 𝜎22
𝑣𝑠
𝐻𝑎 : 𝜎12 > 𝜎22
𝑆2
El estadístico de prueba, 𝐹 = 𝑆12 esta basado en 𝑣1 = 9 𝑔𝑙 en el numerador
2
y 𝑣2 = 19 𝑔𝑙 en el denominador y 𝐹0.05 = 2.42 (véase la tabla IV del apéndice)
como el valor observado del estadístico de prueba es
𝑆12 0.0003
𝐹= 2=
=3
𝑆2 0.0001
Vemos que 𝐹 > 𝐹0.05, por tanto, en el nivel 𝛼 = 0.05, rechazamos 𝐻0 : 𝜎12 =
𝜎22 a favor de 𝐻𝑎 : 𝜎12 > 𝜎22 y concluimos que la compañía competidora produce
piezas con menor variación en sus diámetros.
Ejercicios unidad 6
1. Una muestra aleatoria de 100 muertos registrado en México el año pasado
muestra una vida promedio de 71.8 años. Suponga una desviación
estándar poblacional de 8.9 años, ¿esto parece indicar que la vida media
hoy en día es mayor de 70 años? Use α=0.05
µ=71.8 S=8.9 n=100 x =70
2. Buscando conocer los efectos entre hombres y mujeres de una gran
compañía publicitaria contra el uso del tabaco, se ha observado a 90
hombres y 90 mujeres fumadores elegidos al azar para ver si hay
diferencia en la disminución de cigarros consumidos diariamente; los
resultados son: los hombres x1  5.6 cigarros menos y una desviación
estándar S1  3.5 , y las mujeres x2  7.2 cigarros menos con S 2  2.9 ¿Qué
nos permite inferir estos resultados? Use α=0.05
3. En el pasado, 15% de la propaganda por correo para donativos dio como
resultado contribuciones. Se mando una nueva carta a una muestra de
200 personas y 45 enviaron un donativo. Para α=0.05 ¿Se puede concluir
que la nueva carta fue más efectiva? p  0.45
n  200
H 0 : p  0.45
4. Un periodista publicó una nota en la que sostiene que 35 de cada 100
taxistas en la ciudad son personas que por lo menos han empezado una
carrera profesional ¿Se confirma este porcentaje si en una muestra
aleatoria de 90 taxistas, 38 de ellos expresaron haber iniciado al menos
una carrera profesional? Use α=0.05
p1  0.35 n1  100
p2  0.42
n2  90
5. El proceso de bruñido se usa para esmerilar ciertos discos de silicio al
grueso apropiado es aceptable sólo si σ ≤ 0.5 mm. Emplear el nivel de
H :   0.5
H :
0
a
significancia de α=0.05 para probar la
> 0.5 si el
grosor de 15 cubitos cortados de tales discos tienen una desviación
estándar de 0.64 mm.
S  0.64 n  15
6. Al analizar el mercado de comportamiento interno de un país, los
responsables de la economía nacional han formulado la siguiente hipótesis
de trabajo: “El índice de variación de los precios de los alimentos básicos
en las zonas de alto nivel de vida es el mismo que el de las zonas de bajo
nivel de vida”. Para contrastarla, se hizo un estudio en un sector, muy
representativo, del respectivo nivel de vida de cada zona; o sea que se
extrajeron al azar dos muestras de tamaño n1  n2  60 . Con cada muestra
se obtuvieron los precios de uno de los principales alimentos básicos;
registrándose las desviaciones estándar muéstrales S1  1.75
Pruebe la hipótesis con un 98% de confianza.
S 2  2.07 .