Download 6. Estimación, DISTRIBUCIONES MUESTREO, Y

Document related concepts

Prueba t de Student wikipedia , lookup

Estadístico muestral wikipedia , lookup

Distribución t de Student wikipedia , lookup

Prueba de Bartlett wikipedia , lookup

Contraste de hipótesis wikipedia , lookup

Transcript
6. Estimación,
DISTRIBUCIONES MUESTREO, Y PRUEBA DE
HIPÓTESIS.
6.1 INFERENCIA ESTADISTICA
La estadística está dividida en descriptiva e inferencial donde La
estadística Descriptiva se relaciona principalmente con la recopilación,
presentación y descripción de datos. Y la estadística Inferencial esta formada
por un conjunto de métodos o técnicas utilizadas para la toma de decisiones o
establecer conclusiones de una población. Para que la estadística inferencial
sea efectiva sobre las conclusiones de una población, se requiere que las
muestras seleccionadas de dicha población, sean muestras aleatorias. Los
métodos estadísticos hacen uso de la información contenida en la muestra
aleatoria y con base a esa información, se interpreta, se infiere y se toman las
decisiones de la población.
La
inferencia
estadística
puede
dividirse
en
dos
grandes
áreas:
estimación de parámetros y prueba de hipótesis.
6.2 POBLACION, MUESTRA Y MUESTREO
En este capítulo se hará un recordatorio de la definición de lo que es
muestra, población y muestreo como se vio en el capítulo 2.
Una población es el conjunto de todos los elementos a los que se
somete a un estudio estadístico; es decir, está formada por la
totalidad de las observaciones en las cuales se tiene cierto interés.
Una muestra es
un
conjunto
representativo
de
la
población
de
referencia, el número de individuos de una muestra es menor que el
de la población. O también es un subconjunto, extraído de la población
(mediante técnicas de muestreo), cuyo estudio sirve para inferir características
de toda la población, (Ver fig. 6.1).
Figura. 6.1. Población y Espacio muestral
El muestreo es la técnica o método con que se extraen los elementos
de la población a estudiar.
Existen dos tipos de muestreo Probabilístico y no probabilístico.
En este último (no probabilístico) puede haber clara influencia de la
persona o personas que seleccionan la muestra o simplemente se realiza
atendiendo a razones de comodidad. Salvo en situaciones muy concretas, en la
que los errores cometidos no son grandes, debido a la homogeneidad de la
población, en general no es un tipo de muestreo riguroso y científico, dado que
no todos los elementos de la población pueden formar parte de la muestra. Por
ejemplo, si hacemos una encuesta telefónica por la mañana, las personas que
no tienen teléfono o que están trabajando, no podrán formar parte de la
muestra.
Muestreo probabilístico: En este tipo de muestreo es en el que todos
los individuos de la población, tienen la misma probabilidad de ser parte de la
muestra.
6.3 ESTADISTICOS Y DISTRIBUCIONES DE MUESTREO
Las inferencias estadísticas se hacen mediante los estadísticos. Los
estadísticos son funciones derivadas de las observaciones contenidas en una
muestra aleatoria. Una distribución de muestreo es una distribución de
probabilidad de un estadístico, por ejemplo la distribución de probabilidad de
̅ , se le conoce como distribución de muestreo de la media. La distribución de
muestreo de un estadístico depende de la distribución de la población, del
tamaño de la muestra y del método de muestreo seleccionado.
6.4 DISTRIBUCION DE MUESTREO DE MEDIAS
Sea
un conjunto de observaciones de una
muestra
aleatoria de tamaño
tomada de una población (finita o infinita) normal con
media
. Cada observación en esta muestra es una
y varianza
aleatoria distribuida normal e independiente, con media
Entonces ̅
varianza
̅
.
, y
. Esta afirmación se puede verificar con el siguiente teorema.
Teorema del Límite Central: Si
de tamaño
y varianza
, tiene una distribución normal con media
̅
variable
es una muestra aleatoria
tomada de una población (finita o infinita) con media
y varianza
, y si ̅ es la media muestral, entonces la forma límite de la distribución de
̅
√
Cuando
, es la distribución normal estándar.
Aun cuando la distribución de la población no es normal, el Teorema del
Límite Central permite afirmar que “prácticamente” ̅ es normal para muestras
grandes tomadas de cualquier población.
6.5 ESTIMADORES Y SU PROPIEDADES
Un estimador es una regla, a menudo expresada como una fórmula, que
indica cómo calcular el valor de una estimación con base en las mediciones
contenidas en una muestra. Existen dos tipos de estimaciones concernientes a
una población: la estimación por intervalo y la estimación puntual.
Una estimación puntual, es un solo valor o número que se utiliza para
estimar un parámetro de población desconocido. A menudo una estimación
puntual
es insuficiente debido a que
ya en resultado, solo se tienen dos
opciones: el valor de estimador es correcta o no. Por ejemplo, mediante una
estimación puntual se afirmara que para el año 2030, la proporción de
enfermos de sida a nivel mundial será 0.70, pudiera ser cierta o no.
Un estimador puntual es una variable aleatoria con una distribución de
muestreo
que depende
de
la población y de su parámetro.
Un buen
estimador debe de contener dos propiedades muy importantes, para evaluar
la bondad del estimador, que son que el estimador sea insesgado respecto al
parámetro a estimar y que tenga varianza mínima. Por ejemplo la media
muestral ̅
∑
es un estimador puntual de la media de la población .
Los estimadores puntuales más usuales son los de la distribución
binomial
, de la distribución de Poisson del parámetro
normal
.
y la distribución
Antes de utilizar un estadístico muestral como estimador puntual, se
verifica si el estimador puntual tiene ciertas propiedades que corresponden a
un buen estimador puntual. Como hay distintos estadísticos muéstrales que se
usan como estimadores puntual es de sus correspondientes parámetros
poblacionales, se usará la notación general siguiente:
: es el parámetro poblacional de interés.
̂: es el estadístico muestral o estimador puntual de .
En general
representa cualquier parámetro poblacional como, por
ejemplo, la media poblacional, la desviación estándar poblacional, etc.; y ̂
representa el correspondiente estadístico muestral, por ejemplo la media
muestral, la desviación estándar muestral y la proporción muestral.
Las propiedades de un buen estimador son:
 Insesgadez: Si el valor del estadístico muestral es igual al parámetro
poblacional que se estudia, se dice que el estudio muestral es un estimador
insesgado del parámetro poblacional.
El estadístico muestral ̂ es un estimador insesgado del parámetro
poblacional
si
( ̂)
, donde
( ̂) valor esperado del estadístico
muestral.
Por lo tanto, el valor esperado, o media, de todos los posibles valores de
un estadístico muestral insesgado es igual al parámetro poblacional de
interés.
 Eficiencia: Se dice que el estimador puntual con menor error estándar
tiene mayor eficiencia relativa que los otros.
Cuando se muestrean poblaciones normales, el error estándar de la
media muestral es menor que el error estándar de la mediana muestral. Por
tanto, la media muestral es más eficiente que la mediana muestral.
 Consistencia: Un estimador puntual es consistente si el valor del
estimador puntual tiende a estar más cerca del parámetro poblacional a
medida que el tamaño de la muestra aumenta. En otras palabras, una
muestra grande tiende a proporcionar mejor estimación puntual que una
pequeña.
Los estimadores
̅
̂ son estimadores insesgado de
,
respectivamente (Walpole, Ronald E., 2007).
6.6 ERROR ESTÁNDAR DE UN ESTADISTICO
Debido a que un estadístico es una variable aleatoria derivada de las
observaciones de un muestreo aleatorio, el valor del estadístico puede variar
de una muestra a otra muestra aleatoria, dependiendo de la variación de la
población de interés.
De esta forma El error estándar de un estadístico
depende de la desviación estándar de su distribución de muestreo. Por
ejemplo, si la media muestral ̅ se utiliza como estimados puntual de la media
poblacional , el error estándar de ̅ mide que también ̅ estima a .
Si
es una muestra aleatoria de tamaño
población normal con media
de
y varianza
√
tomada de una
, de modo que el error estándar
̅ es
̅
√
(6.1)
Si se desconoce el valor de , éste se puede sustituir por la deviación estándar
muestral de ̅ en la expresión 6.1, por consiguiente el error estándar estimado
de ̅ es
̅
√
(6.2)
6.7 ESTIMACION POR INTERVALOS
Tomando en cuenta que la mayoría de las veces el parámetro poblacional es
desconocido,
conveniente obtener
límites entre los cuales se encuentre el
dicho parámetro con un cierto nivel de confianza estadística, en este caso se
trata de la estimación por intervalos.
Es decir, la estimación por intervalos da por consecuencia un intervalo
de confianza en el que se espera que se encuentre el parámetro poblacional
con una alta probabilidad de certeza. Por ejemplo, el intervalo de confianza
para la media poblacional es el intervalo de valores que tiene una alta
probabilidad de contener a la media de la población
como se ilustra en la
figura 6.2. En la estimación por intervalos de un parámetro población, resulta
adecuado hablar en términos de probabilidad
de que el estimador cubra el
verdadero valor del parámetro, como se muestra en la figura 6.2. Por lo tanto,
si se seleccionan 100 muestras de una población y se calcula cada media de
las muestras, de las cuales se les estima sus correspondiente intervalos de
confianza del 95%, se tendría que aproximadamente 95 de los 100 intervalos
de confianza contienen la media poblacional.
Figura 6.2 Distribución de muestreo para estimador por intervalos.
El nivel de confianza
(alfa) es el valor de la probabilidad de que el
parámetro poblacional se encuentre dentro del intervalo; los niveles de
confianza
más
correspondientes
ampliamente
al
90%,
usados
95%
y
son:
99%
de
confianza
estadística,
respectivamente.
6.8 ESTIMACION POR INTERVALO DE UNA MEDIA CON n > 30
Sea
es una muestra aleatoria de tamaño
una población normal
con media
y varianza
intervalo de confianza del 100%(1- ) para
̅
Donde
⁄
√
̅
conocida. Entonces un
esta dos por
⁄
(6.3)
√
es el punto de la distribución normal estándar, que corresponde
al nivel de confianza dado
⁄
⁄
tomada de
. En la tabla 6.1, se pueden ver algunos valores de
para diferentes valores de .
⁄
0.05
0.01
Tabla 6.1 Valores de
⁄
para distintos valores
(alfa)
Ejemplo 6.1. Los datos de la tabla 6.2 se encuentran una muestra
aleatoria de las estaturas en centímetros de 45 estudiantes de la licenciatura
de ingeniería de alguna universidad. Se sabe
tamaño
que la
muestra aleatoria de
proviene de una población normal con la varianza poblacional
. Construya un intervalo de confianza del 95% para la estatura media
poblacional .
164
168
163
166
160
165
162
165
158
165
162
165
164
164
163
167
166
161
165
169
165
165
160
169
160
162
165
170
160
165
163
169
167
163
168
164
166
164
167
162
165
167
160
171
167
Tabla 6.2 Estaturas de 45 estudiantes
La media de la muestra de los 45 estudiantes es
̅
De la tabla I del apéndice y para un
se tiene que
obtención del intervalo de confianza al 95%
estudiantes es la siguiente
. La
de las estaturas de los
√
√
Por lo tanto la estatura media poblacional de los estudiantes esta entre
163.702 y 165.454.
Ahora consideremos lo siguiente, dado que se seleccionó una confianza
estadística del 95%. ¿Qué hubiera pasado si se hubiera escogido una confianza
estadística mayor, por ejemplo 99%?
¿Cómo será el intervalo de confianza
para la estatura media poblacional de los estudiantes?
Para un
, y de la tabla I del apéndice se tiene que
⁄
⁄
, entonces el intervalo de confianza al 99% es
√
√
Por lo tanto, para una confianza estadística del 99%,
la estatura media
poblacional de los estudiantes esta entre 163.425 y 165.731.
Nótese que la longitud el intervalo de confianza al 99% es mayor que la
longitud del intervalo de confianza al 95%. En general, para un tamaño de
muestra fijo y una desviación estándar
, entre mas grande sea la confianza
estadística, mas grande será el intervalo de confianza resultante.
6.9 ESTIMACION POR INTERVALO DE UNA PROPORCION
Si
es una variable aleatoria binomial con los parámetros
y
̂
,
entonces
la
expresión
aproximadamente del
̂
⁄
6.4
es
un
,y
intervalo
de
es grande
confianza
para ,
√
̂
̂
̂
⁄
√
̂
̂
(6.4)
Ejemplo 6.2. En una muestra aleatoria, 145 personas de 450, a quienes
se aplicó una vacuna contra la influenza, experimentaron cierto síntoma de
incomodidad. Construir un intervalo de confianza del 95% para la proporción
poblacional de personas que experimentaron algún síntoma de incomodidad
por la vacuna.
Sustituyendo
apéndice se tiene que
confianza, se obtiene que
̂
y para
y de la tabla I del
, en la expresión 6.4 del intervalo de
√
√
Por lo tanto, la proporción poblacional de personas que experimentaron
algún síntoma de incomodidad por la vacuna está entre 0.2769 y 0.3631.
6.10 DISTRIBUCION t (t- Student)
Sea Z una variable aleatoria con distribución normal con
y varianza
y sea V una variable aleatoria ji-cuadrada con k grados de libertad. Si Z y V
son independientes, entonces la variable aleatoria
√
tiene una función de densidad de probabilidad
[
]
[
√
]
y se dice que sigue una distribución t con k grados de libertad. Su media y
varianza
de
la
respectivamente.
distribuciones t.
distribución
En
la
t
figura
son
6.3
y
se
presenta
la
grafica
para
,
de
varias
t de Student
0.4
G. L.
2
3
10
densidad
0.3
0.2
0.1
0
-9
-6
-3
0
x
3
6
9
Figura 6.3 Grafica de varias distribuciones t
6.11 DISTRIBUCION MUESTRAL t (t- Student)
Por lo general en muchas ocasiones no se conoce la desviación estándar
de la población,
estándar
sino que se cuenta con solo la estimación de la desviación
obtenida de una muestra aleatoria de dicha población, por
consiguiente no es posible obtener el valor de Z de una distribución normal
estándar. En este caso, se obtiene el estadístico t (t-Student), definido como
la expresión 6.5.
̅
(6.5)
Donde t sigue una distribución t (t-Student) con n-1 grados de libertad y
∑
√
es la desviación estándar muestral.
La distribución
tiene una curva más ancha que la distribución normal
estandarizada cuando el número de grados de libertad es pequeño. Cuando
los grados de libertad tienden a infinito, la distribución
tiende a una
distribución normal estándar. Es significa que a medida que se incrementa el
tamaño de la muestra, la desviación estándar muestral se aproxima a la
desviación estándar poblacional y en consecuencia la distribución de t se a
próxima a la distribución normal estándar (ver figura 6.4)
Figura 6.4 Distribución t de Student y normal.
6.12 ESTIMACION POR INTERVALO DE UNA MEDIA CON
Sea
̅
y S la media y desviación estándar, respectivamente, de una
muestra aleatoria tomada de una población normal con media
y varianza
desconocida. Entonces un intervalo de confianza del 100%(1- ) para
esta
dos por
̅
Donde
⁄
⁄
̅
√
(6.6)
⁄
√
es un punto critico superior de la t-Student con n-1 grados de
libertad, correspondiente al nivel de confianza .
Ejemplo 6.3. Los siguientes datos de la tabla 6.3 corresponden a la estatura
en centímetros de una muestra aleatoria de 10 estudiantes del grupo A de la
licenciatura de ingeniería. Encontrar un intervalo de confianza del 95% para la
estatura media.
168
165
168
157
164
165
Tabla 6.3 Estaturas en centímetros de 10 estudiantes
160
164
171
165
Supongas que la estatura de los estudiantes sigue una distribución normal. La
media y desviación estándar de la muestra son
̅
S=4.00139
De la tabla II del apéndice y para un
libertad se tiene que
y para n-1=10-1=9 grados de
. El intervalo de confianza al 95% de las
estaturas de los estudiantes es
√
√
Por lo tanto, se tiene una confianza estadística del 95% de que el promedio de
estatura de los estudiantes se encuentra entre 161.15 y 167.71.
6.13 DISTRIBUCION JI-CUADRADA
Sean
variables aleatorias con distribución normal e
independiente, con media
y varianza
, entonces, la variable
aleatoria definida como
(6.7)
Tiene la función de densidad de probabilidad
⁄
⁄
y por consiguiente
⁄
⁄
sigue una distribución ji-cuadrada con v grados de
libertad, y se simboliza con
. La media y la varianza de la distribución
son
En la figura 6.5 se pueden ver la distribución
de libertad. La distribución de
con v=1, v=5, v=10, grados
ji-cuadrada es una de las distribuciones de
muestreo con mayor utilidad.
Chi-Cuadrada
0.6
G. L.
2
5
10
densidad
0.5
0.4
v=2
0.3
0.2
v=5
v=10
0.1
0
0
10
Figura 6.5 Gráficas de la distribución
20
x
30
40
con distintos grados de libertad
Supóngase que
es una muestra aleatoria de tamaño,
tomada de una población normal, con media
y
, entonces el estadístico ji-
cuadrada dado por
(6.8)
Tiene una distribuida como
con n-1 grados de libertad y se le conoce como
la distribución de muestreo ji-cuadrada, donde
aleatoria,
es el tamaño de la muestra
la varianza muestral. Con la distribución de muestreo ji-cuadrada
se puede construir estimaciones de intervalo de confianza y hacer pruebas de
hipótesis estadísticas sobre la varianza de una población normal. El estadístico
ji-cuadrada también se puede dar con la siguiente expresión
∑
̅
(6.9)
Propiedades de las distribuciones ji-cuadrada
1. Los valores de
son mayores o iguales que 0.
2. La forma de una distribución
depende de
. En
consecuencia, hay un número infinito de distribuciones
.
3. El área bajo una curva ji-cuadrada y sobre el eje horizontal es 1.
4. Las distribuciones
no son simétricas. Tienen colas estrechas que se
extienden a la derecha; esto es, están sesgadas a la derecha.
5. Cuando
, la media de una distribución
es
y la varianza es
.
6. El valor modal de una distribución
se da en el valor
.
6.14 INTERVALO DE CONFIANZA DE LA VARIANZA
Sea
una muestra aleatoria de tamaño n
población normal, sea
estimador puntual de
la varianza muestral
tomada de una
y por consiguiente sea
el
. En la sección 6.13 se mostró que la expresión
es una ji- cuadrada con n-1 grados de libertad. Esta distribución se muestra en
la figura 6.6. Para el desarrollo del intervalo de confianza de
, de la figura
6.4 se tiene la siguiente expresión (6.10)
(
⁄
⁄
)
(6.10)
y haciendo un reordenamiento la expresión 6.10 puede escribirse como
(
)
⁄
⁄
(6.11)
Figura 6.6 Derivación de un intervalo de confianza para
en una distribución normal
y por lo tanto, de la expresión 6.11, concluimos que in intervalo de confianza
del
para
esta dado por
(
(6.12)
)
⁄
⁄
Ejemplo 6.4. Considerando los datos del ejemplo 6.3, de las estaturas de los
estudiantes, encontrar
varianza poblacional
un intervalo de confianza bilateral al 95% para la
de las estaturas de los estudiantes.
Supongas que la estatura de los estudiantes sigue una distribución normal. La
desviación estándar y la varianza de la muestra son
S=4.00139
S2=16.011
De la tabla III del apéndice y para un
libertad se tiene que
⁄
y para n-1=10-1=9 grados de
y
⁄
, sustituyendo estos valores en la expresión 6.9, se tiene que el intervalo
de confianza para
al 95% de las estaturas de los estudiantes es
(
)
(
)
Por lo tanto, se estima que la varianza poblacional
de las estaturas de los
estudiantes esta entre 7.57 y 53.37.
6.15 PRUEBA DE HIPOTESIS
En muchos problemas de la ciencia, de la ingeniería y de la administración, se
requiere que se toma una decisión entre aceptar y rechazar una proposición
sobre algún parámetro. Esta proposición recibe el nombre de hipótesis. Y el
procedimiento sobre la toma de decisión sobre la hipótesis, se le conoce como
prueba de hipótesis.
Una hipótesis estadística es una proposición o supuesto sobre los
parámetros de una o más poblaciones.
Ejemplo 6.5. Considerando los datos del ejemplo 6.1, de las estaturas
en centímetros de los estudiantes de alguna universidad. El interés se centra
sobre la estatura promedio de los estudiantes, de manera específica, el interés
recae en decir si la estatura promedio es o no de 165 centímetros, esto lo
podemos expresar simbólicamente como
centímetros
centímetros
La proposición
centímetros, se conoce como Hipótesis nula,
mientras que la proposición
centímetros, recibe el nombre de
Hipótesis alternativa. En la hipótesis alternativa se especifican los valores de
que pueden ser mayores o menores que 165 centímetros, también se conoce
como Hipótesis alternativa bilateral. En algunas situaciones, lo que se
desea es formular una Hipótesis alternativa unilateral, como pudieran ser,
.
ó
.
De este modo, en forma general podemos decir que la
representada por
Hipótesis nula,
, es la afirmación sobre una o más características de
poblaciones que al inicio se supone cierta (es decir, una "creencia a priori").
La Hipótesis alternativa, representada por
a
, es la afirmación contradictoria
, y ésta es la hipótesis del investigador.
Es importante señalar que las hipótesis siempre son proposiciones sobre la
población o distribución bajo estudio, no proposiciones sobre la muestra. Por lo
general, el valor del parámetro de la población especificado en la hipótesis nula
se determina en una de tres maneras diferentes:
1. Puede ser resultado de la experiencia pasada o del conocimiento del
proceso, entonces el objetivo de la prueba de hipótesis usualmente es
determinar si ha cambiado el valor del parámetro.
2. Puede
obtenerse
experimental,
a
partir
de
alguna
teoría,
modelo
o
diseño
que se relaciona con el proceso bajo estudio. En este
caso, el objetivo de la prueba de hipótesis es verificar la teoría o
modelo.
3. Cuando el valor del parámetro proviene de consideraciones externas,
tales como las especificaciones de diseño o ingeniería, o de obligaciones
contractuales. En esta situación, el objetivo usual de la prueba de
hipótesis es probar el cumplimiento de las especificaciones.
Los procedimientos de prueba de hipótesis dependen del empleo de la
información contenida en la muestra aleatoria de la población de interés. Si
esta información es consistente con la hipótesis, se concluye que ésta es
verdadera; sin embargo si esta información es inconsistente con la hipótesis,
se concluye que esta es falsa. Debe hacerse hincapié en que la verdad o
falsedad
de
una
hipótesis
en
particular
nunca
puede
conocerse
con
certidumbre, a menos que pueda examinarse a toda la población. Usualmente
esto es imposible en muchas situaciones prácticas. Por tanto, es necesario
desarrollar un procedimiento de prueba de hipótesis teniendo en cuenta la
probabilidad de llegar a una conclusión equivocada.
La hipótesis nula se rechaza en favor de la hipótesis alternativa, sólo si la
evidencia muestral sugiere que
decididamente a
es falsa. Si la muestra no contradice
, se continúa creyendo en la validez de la hipótesis nula.
Entonces, las dos conclusiones posibles de un análisis por prueba de hipótesis
son rechazar
o no rechazar
.
6.16 ERRORES DEL TIPO I Y TIPO II.
El procedimiento de contrastar la
alternativa con base de
hipótesis nula contra la hipótesis
la información obtenida en una muestra aleatoria,
puede llevar a cometer dos posibles errores, debido a fluctuaciones o
variaciones del azar en el muestreo. Si la hipótesis nula es en realidad
verdadera, pero los datos de la muestra aleatoria la contradicen entonces la
hipótesis nula es rechazada y entonces se estará cometiendo el Error Tipo I.
Por otro lado, si la hipótesis nula es falsa y los datos de la muestra conllevan a
no rechazarla, se estará cometiendo el Error Tipo II.
En otras palabras, El
Error tipo I se define como el rechazo de la hipótesis nula H0 cuando esta es
verdadera y el Error tipo II se define como la aceptación de la hipótesis nula H0
cuando esta es falsa. Por lo tanto, al probar cualquier hipótesis estadística,
existen cuatro situaciones diferentes que determinan
si la decisión final es
correcta o errónea. Estas situaciones aparecen en la tabla 6.4
Decisión
Eventos
es Verdadera
No se rechaza
Rechazar
No hay error con
Error Tipo I
probabilidad
con probabilidad
Error Tipo II
es Falsa
con probabilidad
No hay error
(potencia)
Con probabilidad
Tabla 6.4 Situaciones que determinan si la decisión final fue correcta o errónea.
Algunas veces, la probabilidad del error tipo I recibe el nombre de nivel de
significancia de la prueba y se denota con
error Tipo II se denota por
y La probabilidad de cometer un
. La probabilidad de no rechazar una hipótesis
nula verdadera es la confianza
, con la cual se trabajó para hacer
estimaciones por intervalo. Cuando se rechaza una hipótesis nula falsa se ha
tomado una decisión correcta y la probabilidad de hacerlo se denomina
potencia o poder de la prueba y es denotada por 1 . En símbolos esto se
expresa de la siguiente manera:
P(Error tipo I) = P(Rechazar H0H0 es verdadera) = 
P(No rechazar H0H0 es verdadera) = 1 
P(Error Tipo II)=P(No rechazar H0H0 es falsa) = 
P(Rechazar H0H0 es falsa) = Potencia = 1 
El nivel de significancia  lo fija el investigador, y en la práctica se
suelen usar valores de 0.01, 0.05 o el 0.1
En la figura 6.7 se ilustra las reglas de decisión y los tipos de error:
Figura 6.7 Reglas de decisión.
6.17 PROCEDIMIENTO GENERAL PARA LA PRUEBA DE HIPOTESIS
Una vez que se han formulado las hipótesis nula,
alternativa,
y la hipótesis
, se debe realizar un procedimiento de comparación‚ por medio
del cual se toma una decisión basada en la muestra aleatoria seleccionada de
la población en estudio. Para llevar a cabo este procedimiento es necesario
seleccionar el estadístico de prueba adecuado, calcularlo con base en la
muestra y luego tomar la decisión de rechazar o no
de significancia
con respecto a un nivel
. Se recomienda utilizar los siguientes pasos al aplicar la
metodología de prueba de hipótesis
Los pasos a seguir en una prueba de hipótesis son:
1. Identificar el parámetro de interés, el cual se deriva del problema.
2. Formular las hipótesis nula H0 y la hipótesis alternativa Ha.
3. Escoger un nivel de significancia .
4. Seleccionar el estadístico de prueba adecuado a la distribución
muestral.
5. Determinar la región crítica o de rechazo para el estadístico de
prueba.
6. Calcular el estadístico de prueba.
7. Tomar una decisión de rechazar H0 o no rechazarla.
8. Dar una conclusión al problema.
6.18 PRUEBA DE HIPOTESIS SOBRE LA MEDIA DE UNA
DISTRIBUCION NORMAL Y VARIANZA CONOCIDA
CASO I
Supongas que se desea probar la hipótesis
Donde
es un valor especifico.
Sea
una muestra aleatoria de tamaño
muestral con distribución normal con media
, y sea ̅ la media
y varianza
entonces el
estadístico de prueba para la media esta en la expresión 6.13,
̅
(6.13)
√
Donde
es el valor que supuesto en la hipótesis nula
.
REGLA DE DECISION
Si se ha planteado la hipótesis alternativa como,
, donde
valor especifico, se tiene una prueba de hipótesis bilateral, es decir
colas, por lo tanto, el nivel de significancia
es un
a dos
se divide en dos partes iguales,
quedando estos valores en los extremos de la distribución como se aprecia en
la figura 6.8. En consecuencia, si
estadístico de prueba
⁄
es cierta, la probabilidad de que el
este entre
⁄
y
⁄
es
. Los valores de
⁄
y
pertenecen a una distribución Normal estándar. Nótese en la figura 6.8
que la probabilidad del estadístico de prueba este en la región
⁄
cuando
es verdadera, es
o
o
. En consecuencia, la hipótesis
debe rechazarse si se cumple que
⁄
⁄
⁄
De otra forma si el valor del estadístico de prueba
está entre
⁄
y
⁄
no se rechaza la hipótesis H0.
Figura 6.8 Distribución de Z0 cuando
es verdadera, con región critica para
.
Ejemplo 6.6. Se esta estudiando el rendimiento de un proceso químico.
De la experiencia, se sabe que la desviación estándar del rendimiento es de
3.2. En la tabla 6.5 están los resultados del rendimiento obtenidas los últimos
40 días en la planta de operación ¿Existe evidencia de que el rendimiento no
es del 90%? Utilizar
.
86.74
81.58
87.68
84.84
91.88
87.38
87.32
81.72
89.66
82.66
83.81
88.30
85.00
80.67
81.84
92.51
88.22
76.78
86.18
79.35
85.33
89.65
81.76
90.84
83.75
87.04
89.33
82.97
88.31
85.22
86.33
86.04
86.86
83.26
82.97
86.74
90.39
92.32
88.45
88.11
Tabla 6.5 Rendimiento de un proceso químico
Siguiendo los pasos de la prueba de hipótesis tenemos
1. El parámetro de interés es
proceso.
2. La hipótesis nula es
, el promedio del rendimiento de un
La hipótesis alternativa es
3. El nivel de significancia es
̅
4. El estadístico de prueba es
√
5. Rechazar H0 si se cumple que
⁄
apéndice se tiene que
6. Considerando
o
y
que el promedio muestral
, de la tabla I del
⁄
.
̅
, n=40,
y
el valor del estadístico de prueba es
√
7. Dado que
, como se ilustra en la figura 6.9, se rechazar la
hipótesis H0.
8. Por lo tanto se concluye, con una confianza estadística del 95%, de que
el promedio del rendimiento de un proceso químico no es de 90%.
Figura 6.9 Regla de decisión para una prueba de hipótesis a dos colas
CASO II
Si se ha planteado la hipótesis alternativa como:
, se tiene una
prueba de hipótesis a una cola superior, quedando el nivel de significancia
en
la parte superior de la distribución, como se aprecia en la figura 6.10, donde
pertenece a una distribución Normal estándar
Figura 6.10 Regla de decisión para una prueba de hipótesis a una cola superior
Si el valor del estadístico de prueba
es mayor que
hipótesis nula, en caso contrario no se rechaza
se rechaza la
.
Ejemplo 6.7. Un proceso manufacturero usado por una fábrica durante
los últimos años da una producción media de 100 unidades por hora con una
desviación estándar de 8 unidades. Se acaba de introducir en el mercado una
nueva máquina para realizar ese tipo de producto. Aunque es muy cara
comparada con la que está ahora en uso, si la media de producción de la
nueva máquina es de más de 150 unidades por hora, su adopción daría
bastantes beneficios.
Para decidir si se debiera comprar la nueva máquina, a la gerencia de la
fábrica se le permite hacer un ensayo durante 35 horas, hallándose un
promedio de 160 unidades por hora. Con ésta información qué decisión se
debe tomar si se asume un nivel de confianza del
Siguiendo los pasos de la prueba de hipótesis tenemos
1.
El parámetro de interés es , el promedio de producción de unidades.
2.
La hipótesis nula es
La hipótesis alternativa es
3.
El nivel de significancia es
4.
El estadístico de prueba es
̅
√
5.
Rechazar H0 si se cumple que
de la tabla I del apéndice se
tiene que
6.
Considerando
que el promedio muestral
̅
, n=35,
y
el valor del estadístico de prueba es
√
7.
Dado que
se rechazar la hipótesis H0.
8.
En consecuencia, como puede observarse en la figura 6.11, el valor
del estadístico de prueba está en la zona de rechazo de la hipótesis
nula, por lo tanto, se acepta que la producción promedio por hora es
superior a las 150 unidades y asumiendo un riesgo del 1%, se puede
comprar la nueva máquina.
Figura 6.11 Regla de decisión para una prueba de hipótesis a una cola inferior
CASO III
Si se ha planteado la hipótesis alternativa como,
, se tiene una prueba
de hipótesis a una cola inferior, quedando el nivel de significancia
inferior de la distribución, como se aprecia en la figura 6.12,
una distribución Normal estándar.
en la parte
pertenece a
Figura 6.12 Regla de decisión para una prueba de hipótesis a una cola inferior
Si el valor del estadístico de prueba
es menor que
hipótesis nula, en caso contrario no se rechaza
se rechaza la
.
Ejemplo 6.8. Considerando los datos del ejemplo 6.6 con respecto al
rendimiento de un proceso químico, plantearemos la hipótesis alternativa de
que el rendimiento del proceso químico es menor que el 90%, es decir
, utilizar
.
Siguiendo los pasos de la prueba de hipótesis tenemos
1.
El parámetro de interés es
, el promedio del rendimiento de un
proceso químico.
2.
La hipótesis nula es
La hipótesis alternativa es
3.
El nivel de significancia es
4.
El estadístico de prueba es
̅
√
5.
Rechazar H0 si se cumple que
tiene que
6.
Considerando
, de la tabla I del apéndice se
.
que el promedio muestral
̅
, n=40,
el valor del estadístico de prueba es
√
y
7.
Dado que
se rechazar la hipótesis H0.
8.
Por lo tanto se concluye, con una confianza estadística del 95%, de
que el promedio del rendimiento de un proceso químico
no es de
90%, dado el resultado de la prueba se puede afirmar que el
promedio del rendimiento es menor a 90%.
6.19 PRUEBA DE HIPÓTESIS
SOBRE IGUALDAD DE DOS MEDIAS,
VARIANZAS CONOCIDAS
En algunos problemas de investigación, se tiene el interés en comparar
las medias de dos poblaciones distintas con muestras aleatorias independientes
de tamaños
. Por ejemplo, comparar el rendimiento de dos maquinas
de ensamble, comparar una encuesta de opinión sobre que opinan lo hombres
con respecto a que opinan las mujeres, la calidad de un producto de un
proveedor con respecto a otro proveedor, etc.
Supóngase que se tienen dos poblaciones de interés, donde la primera tiene
una media poblacional desconocida
y varianza conocida
tiene una media poblacional desconocida
y varianza conocida
y la segunda
. Supóngase
que las dos poblaciones son normales, y sino se aplican las condiciones del
teorema del
limite central. Un
planteamiento de las hipótesis para la
diferencia de medias en dos poblaciones se puede ver en la tabla 6.6.
- Prueba de hipótesis a
- Prueba de hipótesis a
- Prueba de hipótesis a
dos colas
una cola superior
una cola inferior
Tabla 6.6 Diversas formas de plantear las hipótesis, donde k es un valor específico.
El procedimiento de prueba se basa en la distribución de la diferencia de
las medias muestrales ̅
verdadera, la distribución de ̅
̅ . En general, si la hipótesis nula
̅ es una distribución normal con media
es
y
varianza
, por lo tanto el estadístico de prueba,
se puede ver en la
expresión 6.14
̅
̅
(6.14)
√
El estadístico
tiene una distribución normal estándar. Por consiguiente si la
hipótesis alternativa es definida como
, entonces es una
hipótesis es bilateral, por consiguiente la hipótesis nula
⁄
o
prueba de
se rechaza si
⁄
Si la hipótesis alternativa es definida como
, corresponde a una prueba
de hipótesis unilateral a una cola superior, en consecuencia la hipótesis nula
se rechaza si
Si la hipótesis alternativa es definida como
, corresponde a una
prueba de hipótesis unilateral a una cola inferior, en consecuencia la hipótesis
nula
se rechaza si
.
Ejemplo 6.9 Un constructor está considerando dos lugares alternativos
para construir un centro comercial. Como los ingresos de los hogares de la
comunidad son una consideración importante en ésta selección, desea probar
que el ingreso promedio de la primera comunidad excede al promedio de la
segunda comunidad en cuando menos $1,500 diarios. Con la información de
un censo realizado el año anterior se sabe que la desviación estándar del
ingreso diario de la primera comunidad es de $1,800 y la desviación estándar
de la segunda es de $2,400. Se toma una muestra aleatoria de 30 hogares de
la primera comunidad, encuentra que el ingreso promedio es de $35,500 y con
una muestra de 40 hogares de la segunda comunidad el ingreso promedio es
de $34,600. Pruebe la hipótesis con un nivel de significancia
.
Solución: Se desea probar si la diferencia entre los ingresos de la comunidad 1
y la 2 es de $1,500 o más, por lo tanto:
El tamaño de las muestras es grande y las varianzas poblacionales son
conocidas, por consiguiente la estadística de trabajo a utilizar es la expresión
6.14
̅
̅
̅
̅
√
Para un nivel de significancia
del apéndice se tiene un valor de
√
, en la tabla I de la distribución normal
es 1.96. Por consiguiente
, lo
que significa que no es posible rechazar la hipótesis nula, con lo que podemos
por lo tanto, con una confiabilidad del 95%, la diferencia entre el ingreso
promedio por hogar en las dos comunidades no es mayor a $1,500.
6.20 PRUEBA DE HIPÓTESIS
SOBRE IGUALDAD DE DOS
MEDIAS, VARIANZAS DESCONOCIDAS CON
Para la diferencia de dos medias si las muestras se obtienen de poblaciones
con distribuciones normales, pero
y varianzas poblacionales
desconocidas, el estadístico de prueba de la expresión 6.14 es modificado al
sustituir las varianzas muestrales
y
por sus respectivas varianzas
poblacionales
y
, como se ilustra en la expresión 6.15
̅
̅
(6.15)
√
Las reglas de rechazo para la hipótesis nula, son las mismas que se describen
en la sección 6.19.
Ejemplo 6.10 Una muestra de 80 alambres de acero producidos por la
fábrica A presenta una resistencia promedio a la ruptura de 1,230 lbs. Con
una desviación estándar de 120 lbs. Una muestra de 100 alambres de acero
producidos por la fábrica B presenta una resistencia promedio a la ruptura de
1,110 lbs. Con una desviación estándar de 90 lbs. Con base en ésta
información pruebe si la resistencia promedio a la rotura de los alambres de
acero de la marca A es significativamente mayor que la de los alambres de
acero de la marca B. Utilizar un nivel de significancia de
.
Solución Las hipótesis a probar son
El tamaño de las muestras es grande, las varianzas poblacionales son
desconocidas,
sustituyendo
y asumiendo que las medias poblacionales son iguales y
,
̅
, ̅
,
,
y
en el
estadístico de prueba de la expresión 6.15, se tiene
̅
̅
(
)
√
Para un nivel de significancia
valor de
es 2.33. Se tiene que
√
, en la tabla de la distribución normal el
, como se aprecia en la figura
6.13, El estadístico de prueba
está en la zona de rechazo de la hipótesis
nula, por consiguiente, con una confiabilidad del 99% se acepta que la
resistencia promedio de los alambres de la marca A es significativamente
mayor que la resistencia promedio de los alambres de la marca B.
Figura 6.13 Regla de decisión para una prueba de hipótesis a una cola superior
6.21 PRUEBAS DE HIPÓTESIS SOBRE LA MEDIA DE UNA
DISTRIBUCION NORMAL, VARIANZA DESCONOCIDA
Cuando se prueban hipótesis sobre la media
.
de una población normal cuando
es desconocida, es posible aplicar los procedimientos de la sección 6.18, al
sustituir
la desviación estándar muestral S por la desviación estándar
poblacional
, siempre y cuando el tamaño de muestra sea grande, es decir
. Sin embargo, cuando la muestra es pequeña, digamos
, y
es desconocida se requiere de otra distribución de muestreo.
Sea
una muestra aleatoria de tamaño
, y sea ̅ y S la
media y desviación estándar muestral, respectivamente, se desea probar la
hipótesis alternativa bilateral
Donde
es un valor especifico.
El estadístico de prueba es
̅
(6.16)
√
El estadístico
tiene una distribución t con n-1 grados de libertad, si la
hipótesis nula
, es verdadera, para una hipótesis alternativa bilateral
, la hipótesis nula
se rechaza si
o
⁄
donde
⁄
y
⁄
⁄
son los puntos superior e inferior, respectivamente, de
la distribución t con n-1 grados de libertad.
Si la hipótesis alternativa unilateral superior
de prueba
de la expresión 6.16, la hipótesis nula
y por lo contrario no se rechaza
, se rechaza si
.
Para una hipótesis alternativa unilateral inferior
estadístico de prueba
, se calcula el estadístico
, se calcula el
de la expresión 6.16, la hipótesis nula
, se rechaza
si
y por lo contrario no se rechaza
.
Ejemplo 6.11 En su calidad de comprador comercial para un supermercado,
se toma una muestra aleatoria de 12 sobres de café de una empacadora. Se
encuentra que el peso promedio muestral del contenido de café de cada sobre
es 15.97 grs. con una desviación estándar de 0.15. La compañía empacadora
afirma que el peso promedio mínimo del café es de 16 grs. por sobre. ¿Puede
aceptarse ésta afirmación si se asume un nivel de confianza del 90%?
Solución. Se desea probar si el peso mínimo es de 16 grs., es decir mayor o
igual a 16 grs., así que las hipótesis adecuadas son:
Teniendo en cuenta que el tamaño de la muestra es pequeño
media muestra es
, la
y su desviación estándar muestral es S=0.15, el
̅
calculo del estadístico de prueba
̅
√
√
Como lo indica la hipótesis alternativa, se trabaja a una cola superior y
para
en la tabla II, de la distribución
libertad el valor de
del apéndice, con 11 grados de
es 1.363. Por consiguiente
, y en
consecuencia no se puede rechazar la hipótesis nula y se puede concluir que la
compañía de café tiene la razón de que el peso promedio
mínimo de los
sobres de café es de 16 grs.
6.22 PRUEBAS DE HIPÓTESIS SOBRE LAS MEDIAS DE DOS
DISTRIBUCIONES NORMALES, VARIANZAS DESCONOCIDAS
Supóngase que se tienen dos poblaciones de interés, donde la primera
tiene una media poblacional desconocida
y varianza desconocida
segunda tiene una media poblacional desconocida
y la
y varianza desconocida
. Supóngase que las dos poblaciones son normales. Un planteamiento de las
hipótesis para la diferencia de medias en dos poblaciones se puede ver en la
tabla 6.6. Para probar las hipótesis que se plantean en la tabla 6.6 se usara el
estadístico de prueba t. Pero para esto, es necesario considerar dos situaciones
diferentes. En el primer caso, se supondrá que las varianzas de las dos
distribuciones normales son desconocidas pero iguales, esto es
en un segundo caso, se supondrá que
y desconocidas.
y
Caso I
Sea
una muestra aleatoria de
la primera población y sea
observaciones tomadas de
una muestra aleatoria
observaciones de la segunda población. Sean
̅
̅
de
las medias
muestrales y varianzas muestrales, respectivamente. Supongamos que
son estimaciones de la varianza común
, en consecuencia ambas varianzas
muestrales pueden combinarse para formar un solo estimador, como se ilustra
en la expresión
(6.17)
Por lo tanto el estadístico de prueba para la comparación de dos medias es
̅
̅
(6.18)
√
Donde
es,
(6.19)
√
Si
es verdadera
tiene una distribución
Si la hipótesis alternativa es bilateral
⁄
.
, entonces si
o
se debe rechazar la hipótesis nula
⁄
.
Si la hipótesis alternativa es unilateral superior
⁄
, entonces si
se debe rechazar la hipótesis nula
.
Si la hipótesis alternativa es unilateral inferior
, entonces si
⁄
se debe rechazar la hipótesis nula
.
Ejemplo 6.12
Caso II
En algunos casos no es recomendable suponer que la varianzas desconocidas
sean iguales. En tal situación, no existe un estadístico t exacto para
probar la hipótesis nula
. Pero el estadístico
̅
̅
(6.20)
√
tiene una distribución que es aproximadamente una distribución t con v grados
libertad, donde
esta dado por
(
(
⁄
(6.21)
)
)
(
⁄
- 2
)
El procedimiento de prueba de hipótesis es el mismo, que en caso I, solo que
ahora los grados de libertad están determinados por la expresión 6.21.
Ejemplo 6.13
6.23 PRUEBA DE HIPÓTESIS PARA PARA UNA PROPORCION
En muchos problemas que surgen en la práctica tienen una variable
aleatoria que sigue una distribución binomial, por ejemplo, la proporción de
productos defectuosos, la proporción de personas que están de acuerdo con
una nueva política en la empresa, la proporción de personas que presentan
cierto síntoma de enfermedad, etc. En este caso el parámetro de interés es p,
por consiguiente las hipótesis para considerar en la prueba están en la tabla
6.7
- Prueba de hipótesis a
- Prueba de hipótesis a
- Prueba de hipótesis a
dos colas
una cola superior
una cola inferior
Tabla 6.7 Hipótesis a considera en la prueba, donde
Si la hipótesis nula
es un valor especifico
es verdadera, el estadístico de prueba es
(6.22)
√
Para una hipótesis alternativa bilateral
, la hipótesis nula
se
rechazará si
⁄
o
⁄
Para una hipótesis alternativa unilateral superior
, la hipótesis nula
se rechazará si
Para una hipótesis alternativa unilateral inferior
se rechazará si
, la hipótesis nula
Es importante señalar que el estadístico de prueba es valido siempre y cuando
no sea muy próximo a 1 o a cero, y si el tamaño de muestra es relativamente
grande, digamos
.
Ejemplo 6.14 Un fabricante afirma que por lo menos el 90% de las piezas de
una
maquinaria
que
se
fabrican
en
una
especificaciones del producto. Una inspección
empresa
cumplen
con
las
de 200 de esas piezas reveló
que 160 de ellas cumplían con las especificaciones. Pruebe si lo que afirma el
fabricante es cierto. Utilizar
.
Solución:
Para realizar una prueba de hipótesis para la proporción se utiliza la
expresión 6.22
√
Para
el valor de
√
y de la tabla I de la distribución normal estándar del apéndice
, de este modo
, por consecuencia El valor del
estadístico de prueba se encuentra en la zona de rechazo, como se puede
observar en la figura 6.14, por consiguiente, con una confiabilidad del 95% se
concluye que la afirmación del fabricante no es cierta.
Figura 6.14 Regla de decisión para una prueba de hipótesis a una cola inferior
6.24 PRUEBA DE HIPÓTESIS PARA UNA VARIANZA
Supóngase que se quiere probar la hipótesis de que la varianza de una
población normal
es igual un valor específico, digamos,
. Para probar
Se utiliza el estadístico de prueba
(6.23)
donde
es la varianza muestral.
Si la hipótesis nula
es verdadera, entonces el estadístico
se
distribuye ji-cuadrada con n-1 grados de libertad.
Si se plantea como hipótesis alternativa
, entonces se trata una
prueba de hipótesis bilateral. Por consiguiente, la hipótesis nula
será rechazada si se cumple que
,
o
donde
y
son los puntos que corresponden a los porcentajes
inferior y superior, respectivamente, de la distribución ji-cuadrada con
n-1 grados de libertad.
Si se plantea como hipótesis alternativa
, entonces se trata una
prueba de hipótesis unilateral superior. Por consiguiente, la hipótesis nula
, será rechazada si se cumple que
Si se plantea como hipótesis alternativa
, entonces se trata una
prueba de hipótesis unilateral inferior. Por consiguiente, la hipótesis nula
, será rechazada si se cumple que
Ejemplo 6.15 Se afirma que un pieza para un semiconductor es producido
por una compañía, tiene una varianza del diámetro no mayor que 0.0002
pulgadas. Una muestra aleatoria de 10 piezas arrojó una varianza muestral de
0.0003, pruébese
0.0002, utilícese
que la varianza del diámetro de la pieza es mayor que
.
Solución. Las hipótesis a probar son
Es una prueba de
hipótesis unilateral superior. Supongamos
que las
mediciones de los diámetros tienen una distribución normal, por consiguiente
el valor del estadístico de prueba es
Para un
y de la tabla III de los valores de la distribución ji-cuadrada,
se tiene que
. Por consiguiente se tiene que
tanto no es posible rechazar
, por lo
, lo que significa que no hay
suficiente evidencia para afirmar que
sea mayor que 0.0002.
6.25 DISTRIBUCION MUESTRAL F DE SNEDECOR
Si
tamaño
son las varianzas de muestras aleatorias independientes de
, respectivamente, tomadas de dos poblaciones normales que
tienen la misma varianza, entonces
(6.24)
Es un valor de una variable aleatoria que tiene distribución
parámetros
con
.
En la figura 6.15 se puede ver la grafica de esta distribución. La
distribución
se usa en situaciones de dos muestras para realizar inferencias
sobre la población. Sin embargo, la distribución
se aplica a muchos otros
tipos de problemas en los cuales están relacionadas las varianzas muestrales.
De hecho la distribución
se llama distribución de razón de varianzas.
Fig. 6.15. Distribución .
6.26 COMPARACION DE DOS VARIANZAS POBLACIONALES
Las características son:




Continua, es decir valores infinitos.
Positivamente sesgada (derecha).
Asintótica (aumenta pero no toca el eje)
Existe una familia de distribuciones (grados de libertad)
Pasos para comparar dos varianzas poblacionales
1. Hipótesis nula vs hipótesis alternativa:
2. Nivel de confianza :
Probabilidad de rechazar la hipótesis nula.
usualmente 0.05 y 0.01
3. Grados de Libertad y Valor Crítico
.
Según los grados de libertad se ubica el valor crítico en la tabla
.
4. Se extrae el valor de prueba:
el valor crítico
el valor resultante se compara con
, si es mayor se rechaza la hipótesis nula.
Ejemplo 6.16 Una compañía produce piezas maquinadas para motor que se
supone tienen una varianza en diámetro no mayor que 0.0002 pulgadas. Una
muestra aleatoria de
piezas dio
pulgadas. Suponga que
deseamos comparar la variación en los diámetros de las piezas producidas por
la empresa, con la variación en los diámetros de las piezas producidas por un
competidor
donde para
piezas la
¿los datos proporcionan
suficiente información para indicar una variación mas pequeña en diámetros
para el competidor? Prueba usando
.
Solución: Estamos probando
El estadístico de prueba,
esta basado en
en el
numerador y
en el denominador y
(véase la tabla IV del
apéndice) como el valor observado del estadístico de prueba es
Vemos que
, por tanto, en el nivel
, rechazamos
a favor de
y concluimos que la compañía competidora
produce piezas con menor variación en sus diámetros.
Ejercicios unidad 6
1. Una muestra aleatoria de 100 muertos registrado en México el año
pasado muestra una vida promedio de 71.8 años. Suponga una
desviación estándar poblacional de 8.9 años, ¿esto parece indicar que la
vida media hoy en día es mayor de 70 años? Use α=0.05
µ=71.8 S=8.9 n=100 x =70
2. Buscando conocer los efectos entre hombres y mujeres de una gran
compañía publicitaria contra el uso del tabaco, se ha observado a 90
hombres y 90 mujeres fumadores elegidos al azar para ver si hay
diferencia en la disminución de cigarros consumidos diariamente; los
resultados son: los hombres x1  5.6 cigarros menos y una desviación
estándar S1  3.5 , y las mujeres x2  7.2 cigarros menos con S 2  2.9
¿Qué nos permite inferir estos resultados? Use α=0.05
3. En el pasado, 15% de la propaganda por correo para donativos dio como
resultado contribuciones. Se mando una nueva carta a una muestra de
200 personas y 45 enviaron un donativo. Para α=0.05 ¿Se puede
concluir que la nueva carta fue más efectiva? p  0.45
n  200
H 0 : p  0.45
4. Un periodista publicó una nota en la que sostiene que 35 de cada 100
taxistas en la ciudad son personas que por lo menos han empezado una
carrera profesional ¿Se confirma este porcentaje si en una muestra
aleatoria de 90 taxistas, 38 de ellos expresaron haber iniciado al menos
una carrera profesional? Use α=0.05
p1  0.35 n1  100
p2  0.42
n2  90
5. El proceso de bruñido se usa para esmerilar ciertos discos de silicio al
grueso apropiado es aceptable sólo si σ ≤ 0.5 mm. Emplear el nivel de
H :   0.5
H :
0
a
significancia de α=0.05 para probar la
> 0.5 si el
grosor de 15 cubitos cortados de tales discos tienen una desviación
estándar de 0.64 mm.
S  0.64 n  15
6. Al analizar el mercado de comportamiento interno de un país, los
responsables de la economía nacional han formulado la siguiente
hipótesis de trabajo: “El índice de variación de los precios de los
alimentos básicos en las zonas de alto nivel de vida es el mismo que el
de las zonas de bajo nivel de vida”. Para contrastarla, se hizo un estudio
en un sector, muy representativo, del respectivo nivel de vida de cada
zona; o sea que se extrajeron al azar dos muestras de tamaño
n1  n2  60 . Con cada muestra se obtuvieron los precios de uno de los
principales alimentos básicos; registrándose las desviaciones estándar
muéstrales
confianza.
S1  1.75
S 2  2.07 . Pruebe la hipótesis con un 98% de