Download Material "pdf"

Document related concepts

Error estándar wikipedia , lookup

Intervalo de confianza wikipedia , lookup

Estimación estadística wikipedia , lookup

Distribución t de Student wikipedia , lookup

Tamaño de la muestra wikipedia , lookup

Transcript
 FUOC • XP00/79003/00238
81
12. Inferencia estadística: parte 1
Intervalo de confianza para la media aritmética
Ya hemos explicado algunos ejemplos de lo que denominamos inferencia en
estadística. En el capítulo 10 considerábamos varias situaciones en el control
de calidad, y destacábamos un procedimiento que se podía usar para identificar cuándo algo va mal en el proceso de producción. Decíamos que un proceso
está fuera de control cuando la media de una variable específica se ha vuelto
demasiado baja (o demasiado alta) y cuando esta desviación es superior a lo
que podríamos esperar a partir de una variación aleatoria. El proceso de usar
la estadística para llegar a una conclusión sobre algún aspecto de la población
se denomina inferencia estadística. En este capítulo presentaremos un tipo de
deducción muy útil que implica calcular el grado de precisión de nuestras estimaciones de las medias poblacionales, denominado intervalo de confianza.
En este capítulo sobre los intervalos de confianza aprenderéis:
•
Qué es un margen de error.
•
Qué es un intervalo de confianza y cómo se interpreta uno.
•
Qué es un nivel de confianza.
•
Cómo se calcula un intervalo de confianza para la media aritmética
de una distribución normal con varianza conocida.
Instrucción
Mirad el vídeo de la unidad 20.
Resumen del vídeo
El vídeo comienza con un ejemplo de la estimación de la duración de unas pilas para fundamentar las afirmaciones publicitarias de que unas pilas determinadas duran más. Esta estimación se basa en la comprobación de una muestra
de pilas, y ya presenta un tipo de inferencia estadística.
Se muestra un ejemplo más simple, en el que se toman mediciones de la presión sanguínea cada día durante una semana y se calcula la media, que resulta
ser 130. Si pensamos en todas las mediciones que habríamos podido tomar en
este periodo, o sea, la población de las mediciones, entonces su media es un
valor desconocido µ. ¿Qué grado de precisión presenta nuestra estimación? Si
Inferencia estadística: parte 1
 FUOC • XP00/79003/00238
82
hubiéramos tomado otras siete mediciones, ¿hasta qué punto los resultados
serían diferentes?
Para contestar a estas preguntas supongamos que la distribución subyacente
de nuestras mediciones es normal y que éstas son suficientemente distantes en
el tiempo como para no influirse unas a otras. Queremos estimar el parámetro
µ de esta distribución. Supongamos también que conocemos la desviación estándar σ de esta distribución desde el comienzo.
Ya hemos estudiado cómo se distribuye la media de una muestra de tamaño n
extraída de una distribución normal: también presenta una distribución normal, con la misma media µ, pero con una desviación estándar menor que
σ x = σ ⁄ ( n ) . También sabemos que cerca del 95% de todas las medias de
muestras de tamaño n caerán entre dos desviaciones estándar 2σ x de nuestras
medias observadas. Podemos utilizar este resultado para definir un intervalo
en el que suponemos que debe caer la verdadera (pero desconocida) media poblacional µ.
El intervalo x + 2σ x es un intervalo de confianza para µ. El centro del intervalo es nuestra estimación original, la media muestral. A esta media le sumamos y le restamos el margen de error σ x para indicar el grado de precisión de
nuestra estimación. Existe un nivel de confianza asociado a este intervalo; en
este caso, en el que usamos dos desviaciones estándar, este nivel es del 95%.
El vídeo ilustra en este sentido que confiamos o esperamos en un 95% que el
intervalo de confianza contenga la media poblacional µ. Si repetimos la estimación del intervalo muchas veces, en el 95% de las repeticiones el intervalo
de confianza incluirá la verdadera media, y en un 5% de las ocasiones, no lo
hará. Por tanto, la probabilidad de que el método funcione es de 0,95.
Aplicando este método a la muestra de siete lecturas de la presión sanguínea a
partir de una distribución normal con una media desconocida pero con una
desviación estándar conocida de 20, calculamos una media de 130 y un margen de error de 2 × 20 ⁄ 7 = 15,2 . Esto da como resultado un intervalo de
confianza de 130 ± 15,2; es decir, concluimos que la verdadera media cae entre
114,8 y 145,2. Dado que nuestro método incluye la verdadera media en el 95%
de las ocasiones que lo usamos, confiamos en que en este caso concreto ha
funcionado.
La precisión de la estimación
Hemos visto ejemplos de la estimación de la media desconocida µ de una población. Por ejemplo, en el control de calidad estimábamos la media de una
variable específica que realizaba el seguimiento de la calidad de un producto
en un proceso de fabricación. También hablábamos de estimar la proporción
Inferencia estadística: parte 1
 FUOC • XP00/79003/00238
83
de personas que votarán a un partido específico en unas elecciones, en que la
verdadera proporción π también es una media poblacional. En cada caso suponemos que la media poblacional es un valor fijo que sólo podríamos medir
con exactitud si conociéramos a toda la población. Por tanto, tomamos una
muestra aleatoria de observaciones y utilizamos la media de la muestra para
estimar el valor poblacional.
También hemos comprobado que la media muestral resulta en sí misma una
variable aleatoria que presenta su propia distribución muestral. Por lo tanto,
si tomamos otra muestra, obtenemos una estimación diferente de la media poblacional µ. Sin embargo, en la práctica sólo disponemos de una única muestra y una única estimación de la media. Sabemos que, si nuestra muestra fuese
más amplia, entonces su variabilidad sería menor, lo que sugiere claramente
que una muestra así sería una estimación más precisa de µ. Pero ¿cómo podemos medir la precisión de nuestras estimaciones?
Los intervalos de confianza
Pensemos ahora en dos diarios diferentes que realizan predicciones sobre
cuál será el porcentaje de la población que participará en unas elecciones.
Uno predice que el porcentaje será del 71%, mientras que la predicción del
otro es del 76%. Después de las elecciones, el verdadero porcentaje se determina exactamente en el 75% –parece, pues, que la segunda empresa había
conseguido una predicción más exacta–. Sólo lo podemos comprobar si sabemos el verdadero porcentaje, y en la práctica resulta muy raro que nos encontremos con una situación en la que el verdadero valor de un parámetro
poblacional sea conocido. En casi todas las situaciones, estimamos unos valores poblacionales que no podremos confirmar nunca.
Por tanto, ¿cómo podemos cuantificar la precisión de nuestras estimaciones
cuando sólo tenemos una única muestra de datos y ninguna manera de confirmar el resultado? La manera de hacerlo es no dar una única estimación del
valor poblacional, sino todo un abanico de valores, y después reforzarlo por
medio de una declaración de vuestro grado de confianza de que el verdadero
valor se incluye dentro de este abanico. Esto se denomina intervalo de confianza.
El intervalo de confianza para la media de una distribución
normal
Consideraremos un caso simple para comenzar, cuando la población es normal y conocemos la desviación estándar σ de esta distribución (resulta muy
poco frecuente que conozcamos la desviación estándar de la población, nor-
Inferencia estadística: parte 1
 FUOC • XP00/79003/00238
84
Inferencia estadística: parte 1
malmente la estimamos también a partir de la muestra –trataremos este caso
en el próximo capítulo).
El vídeo ilustra cómo se calcula un intervalo de confianza para la media µ basado en una muestra de tamaño n. El procedimiento es el siguiente:
1) Calculad la media x de la muestra.
2) Calculad el error estándar de la media: σ x = σ ⁄ ( n ) .
3) Calculad el margen de error como z∗ para el error estándar: z∗ σ x .
4) El intervalo de confianza es la media más o menos el margen de error: x ± z ∗ σ x .
El ejemplo del vídeo muestra un intervalo de confianza del 95% para µ, utili-
El margen de error...
... de un intervalo de confianza
es el radio del intervalo en torno a la media ...= ± z∗ σ x .
zando un valor de z∗ = 2. Esta operación se basa en la regla 68-95-99,7, que hemos visto anteriormente. Hablando con propiedad, el valor para z∗, que
incluye exactamente el 95% de la distribución normal, es 1,96; pero en la práctica a menudo se usa el 2. Podemos calcular un intervalo de confianza para
cualquier nivel de confianza que escojamos. Por ejemplo, para un nivel de
confianza del 90% necesitamos encontrar el valor z∗, de manera que el 90%
del área bajo la curva normal se incluya entre −z∗ y +z∗. Éste es el valor z∗ = 1,645.
Para ser más precisos, omitiremos la notación ∗ usada en el vídeo, y en su lugar
usaremos la notación z.05 = 1,645 para indicar el valor de normal estándar que
corta el 5% en la cola superior (y así como el 5% en la cola inferior). Por tanto,
también z .025 = 1,96 es el valor z que usaríamos para un intervalo de confianza
del 95% y z .005 = 2,576 para un intervalo de confianza del 99% (consultad la
tabla A del apéndice). En general, podemos indicar el valor z como z α ⁄ 2 , donde ± zα ⁄ 2 incluye un área de (1 – α ) bajo la curva normal (figura 12.1).
Figura 12.1.
El intercambio entre la precisión y el nivel de confianza
Si rebajamos el nivel de confianza al 90%, el margen de error sería menor (ya
que el valor z sería también menor: de 1,645 en contraposición a 1,96) y el
intervalo de confianza sería más breve. Éste parece un resultado más preciso,
pero el nivel de confianza naturalmente es más bajo: ahora la posibilidad (1
entre 10) de que el intervalo no incluya la verdadera µ es mayor. Por tanto,
Nivel de confianza
(1 – α ) representa la probabilidad de que el parámetro estimado se incluya en el intervalo
de confianza (es decir, el área
de la curva normal incluida entre –z∗ y z∗).
 FUOC • XP00/79003/00238
85
Inferencia estadística: parte 1
podemos afirmar que nada es gratuito. Se da un intercambio entre la precisión que se puede expresar en un intervalo de confianza y el nivel de confianza. Para una muestra en particular, cuanto más corto y preciso sea el
intervalo de confianza, más bajo será el nivel de confianza.
El efecto del tamaño de la muestra
La única manera de mejorar tanto vuestra precisión como vuestro nivel de confianza es reducir el error estándar. Si la desviación estándar poblacional σ es fija,
entonces sólo podemos reducir el error estándar mediante el incremento de las
dimensiones muestrales. Esta acción reduce el margen de error, de manera que
recorta el intervalo de confianza para un nivel de confianza en particular. Alternativamente, si se mantiene el margen de error en un nivel fijo, incrementar las
dimensiones muestrales conducen al incremento del valor z∗ y, por consiguiente, también del nivel de confianza. Fijaos en que, ya que el error estándar se obtiene dividiendo la desviación estándar por la raíz cuadrada de n, se necesita una
muestra cuatro veces mayor para reducir la anchura del intervalo de confianza
a la mitad.
Instrucción
Revisad el vídeo, unidad 20. Observad la manera como se calcula el margen de
error y la razón por la que el intervalo de confianza es la media muestral más
o menos el margen de error.
Actividades
12.1. Se toma una muestra aleatoria de tamaño 50 de una distribución normal. La desviación estándar de esta distribución es 0,34. La media aritmética de la muestra es 1,89. Calculad: (a) un intervalo de confianza del 95% para la media µ de la distribución; (b) un
intervalo de confianza del 99%.
12.2. A partir de unos datos previos sabemos que el nivel de polución del aire urbano, medido con un índice de polución de 0 a 100, está normalmente distribuido, con una desviación estándar de 13 unidades. En un día bueno, la polución en la zona es de 25-30
unidades, mientras que en un día malo llega hasta 70. Supongamos que tomamos 4 mediciones a lo largo de un día y obtenemos una media de polución de índice 46. ¿Cuál es
el intervalo de confianza del 95% para el verdadero nivel de polución este día?
12.3. En conexión con la pregunta 13.3, supongamos que queremos estimar un intervalo
de confianza del 95% para un nivel de polución tal que el margen de error sea como
máximo de 5 unidades. ¿Cuántas mediciones independientes necesitamos tomar?
12.4. Un banco comprueba el tiempo de respuesta de su red nacional de cajeros automáticos. Gracias a estudios anteriores se sabe que el tiempo de respuesta se halla en torno a
10 segundos, con una desviación estándar de 2. Les preocupa que el tiempo aumente, y
quieren establecer el tiempo de la media actual de respuesta con una precisión de 0,5 segundos. ¿Qué dimensiones deberá presentar la muestra para obtener esta precisión? Supongamos que toman una muestra aleatoria de 10 tiempos de respuesta y encuentran
que el tiempo de media es de 12,4 segundos. ¿Evidencia este resultado que el tiempo de
respuesta de la red ha aumentado?
Recordad
El error estándar es
σ x = σ ⁄ ( n)
 FUOC • XP00/79003/00238
86
Glosario
intervalo de confianza
Estimación de un parámetro poblacional en forma de intervalo en el que confiamos que cae
el parámetro.
margen de error
Precisión del intervalo de confianza; el intervalo de confianza viene dado en la forma de una
estimación más o menos el margen de error.
Para un intervalo de confianza sobre la media µ de una distribución normal con una derivación estándar conocida σ , se calcula la media aritmética x de la muestra aleatoria de tamaño
n y entonces el intervalo es x ± z α ⁄ 2 σ ⁄ ( n) ; zα ⁄ 2 es el punto apropiado sobre la curva normal de manera que un área de 1 – α se incluye bajo la curva entre ± zα / 2 .
nivel de confianza
La probabilidad 1 – α de que nuestro intervalo de confianza incluya el verdadero parámetro
poblacional, expresado como porcentaje, es 100(1 – α)%.
Inferencia estadística: parte 1
 FUOC • XP00/79003/00238
87
Inferencia estadística: parte 2
13. Inferencia estadística: parte 2
El intervalo de confianza para una proporción
En el capítulo 11 vemos que una proporción, o porcentaje, se puede calcular
como media aritmética de un conjunto de datos binarios codificados como
cero o uno. También deducimos la desviación estándar de una proporción, o
su error estándar. No podemos suponer que los datos binarios son normales,
pero sabemos que, por lo que respecta a muestras grandes, la distribución de
la media muestral es aproximadamente normal. De manera que podemos usar
todos los resultados obtenidos hasta ahora para conseguir los intervalos de
confianza para una proporción.
En este capítulo sobre intervalos de confianza aprenderéis:
•
Cómo se calcula un margen de error y un intervalo de confianza
para un porcentaje.
•
Cómo se calcula el tamaño muestral que da un margen específico de
error en la estimación de un porcentaje.
Los porcentajes presentados en los medios de comunicación
Nosotros oímos varias estimaciones porcentuales casi cada día: el índice de desempleo, el porcentaje de personas que votarán a un partido político determinado, el porcentaje de consumidores que escogen tal jabón o tal diario, el
porcentaje de malos conductores y conductoras en nuestras carreteras, y así sucesivamente. Todas estas estimaciones se basan en una muestra a partir de una
población, pero casi nunca se nos da la precisión de la estimación. En algunos
casos es posible que veamos una pequeña nota a pie de página informando de
algún margen de error o –como en estas raras excepciones extraídas del New
York Times– la explicación siguiente en lo concerniente al método usado para
llevar a cabo un sondeo de opinión:
“En teoría, se puede decir que en 95 casos de cada 100, los resultados basados
en la totalidad de la muestra no difieren en más de tres puntos porcentuales
en una y otra dirección de lo que se habría obtenido si se hubiese entrevistado
a toda la población adulta norteamericana.”
La distribución del porcentaje, o proporción
En el capítulo 11 vemos que se puede considerar una proporción como la media de un conjunto de mediciones cero o uno (notad que si empre utilizamos
Recordad
Si x es una variable binaria,
la media es una proporción π
y la desviación estándar es
σ =
π( 1 – π )
88
 FUOC • XP00/79003/00238
Inferencia estadística: parte 2
proporciones a la hora de hablar de cuestiones teóricas, pero en la práctica normalmente damos los resultados sobre una escala porcentual). Por tanto, para
muestras grandes, hemos visto que una proporción calculada tiene una distribución normal aproximada, con una media igual a la proporción poblacional
µ y una desviación estándar (es decir, el error estándar) igual a
π (1 – π ) ⁄ n .
Pero ¿qué significa grande para nosotros? La distribución binaria puede resultar muy asimétrica cuando la proporción de la población no se halla cerca del
0,5 (observad, por ejemplo, la figura 11.1). Hay que disponer de un tamaño
muestral de al menos 100 unidades para que el teorema central del límite sea
aplicable, y en cualquier caso necesitaremos al menos 100 para estimar el porcentaje correcto para un punto porcentual. Por tanto, sólo estudiaremos proporciones calculadas sobre muestras de 100 o más unidades.
Sólo se nos plantea un problema que tenemos que resolver antes de aplicar la
teoría que hemos desarrollado. El error estándar depende del verdadero valor
que tratamos de estimar; por tanto, ¿cómo calculamos el margen de error? La
solución es sustituir el valor de la proporción muestral p, que es nuestra estimación de π , en la fórmula para el error estándar. Por ejemplo, si tenemos una
estimación para π de p = 0,37, basada en un tamaño muestral de 100, calculamos el error estándar como
p ( 1 – p) ⁄ n =
0,37 × 0,63 ⁄ 100 = 0,0483 .
Por tanto, un intervalo de confianza del 95% para la proporción poblacional
π sería 0,37 ± 1,96 × 0,0483 = 0,37 ± 0,095, un intervalo de 0,275 a 0,465.
Intervalo de confianza para una proporción
Los pasos para calcular un intervalo de confianza para una proporción son los
siguientes:
1) Calcular la proporción p de “éxitos” a partir de la muestra de tamaño n.
2) Calcular el error estándar de la proporción: σ p =
p ( 1 – p) ⁄ n ,
3) Calcular el margen de error como zα ⁄ 2 por el error estándar: zα ⁄ 2 σ p , donde
z α ⁄ 2 es el valor apropiado de la variable normal estándar para el nivel de confianza 100(1 – α)%.
4) El intervalo de confianza es la proporción observada p más o menos el margen de error: p ± z α ⁄ 2 σ p .
Actividades
13.1. En una muestra aleatoria de neumáticos producidos por una gran empresa europea,
el 10% no satisfacieron los nuevos estándares propuestos de resistencia a los reventones.
Construid un intervalo de confianza del 95% para la proporción de neumáticos que no
satisfacen los estándares, si el tamaño muestral es:
a) n = 125
b) n = 500
Recordad
El intervalo de confianza es:
µ ± z α ⁄ 2 σx
89
 FUOC • XP00/79003/00238
13.2. Se llevó a cabo un sondeo de opinión en el Estado español, y una de las preguntas
realizadas a una muestra aleatoria de 1.500 personas era: “¿Os parece que la economía
mejorará en 1996 o no?”. 473 (31,5%) de las personas encuestadas dijeron que sí, 967
(64,5%) dijeron que no y 60 (4,0%) dijeron que no lo sabían. Construid los intervalos de
confianza del 95% para cada uno de los porcentajes de las respuestas “sí” y “no”.
13.3. Durante unas elecciones municipales en las que dos partidos, CiU y PSOE, participaban, se llevó a cabo un sondeo de opinión en el que se preguntaba a 1.000 votantes
seleccionados al azar a qué partido votarían. Un total de 615 indicaron su preferencia por
CiU. Construid un intervalo de confianza del 95% para la proporción de votos que se
emitirán a favor de CiU. ¿CiU puede pensar que tiene la victoria asegurada?
Los tamaños muestrales para un margen de error previamente
establecido
En general, el margen de error para estimar una media con un nivel de confianza 100(1 – α )% a partir de una muestra de tamaño n es:
margen de error = zα ⁄ 2 σ ⁄ n
donde σ es la desviación estándar de la distribución poblacional. Para un determinado tamaño de la muestra n, podemos calcular el margen de error. Por
otro lado, si previamente establecemos el margen de error que requerimos
para nuestra estimación, podremos calcular el tamaño muestral. La actividad
12.3 del capítulo anterior era un ejemplo de esta idea.
Expresamos ahora el tamaño muestral n a partir de la fórmula de más arriba
en términos de los otros factores:
22
σ

tamaño muestral =  zα ⁄ 2 --------------------------------------------
m arg en de error 
Esto muestra claramente que para reducir el margen de error a la mitad, por
ejemplo, hay que incrementar el tamaño muestral cuatro veces.
Si aplicamos esta fórmula a nuestra situación actual de estimación de proporciones, donde σ =
π ( 1 – π ) , obtenemos:
2
π (1 – π )
tamaño muestral = ( zα ⁄ 2 ) ------------------------------------------------( margen de error )2
Esta fórmula resulta útil como anticipación a una encuesta por sondeo para
determinar el tamaño muestral requerido para estimar una proporción con
una precisión determinada. Pero, para aplicar esta fórmula necesitamos conocer π , la proporción que tratamos de estimar. Si en realidad π = 0,25, entonces
π (1 – π ) = 0,1875; mientras que, si π = 0,10, π (1 – π ) = 0,09, lo que es la
mitad del valor e implicaría que se requiere la mitad del tamaño muestral.
¿Qué valor de π tenemos que usar? Esto depende de si tenemos alguna idea
aproximada de la proporción poblacional o no. Por ejemplo, podemos estar
Inferencia estadística: parte 2
90
 FUOC • XP00/79003/00238
bastante seguros de que la popularidad de un partido político se encuentra en
torno al 30% de la población, pero queremos llevar a cabo una encuesta para
determinar este porcentaje con mayor precisión, digamos con un margen de
error de dos puntos porcentuales. Podríamos usar el valor 0,30 para determinar el tamaño muestral requerido:
2
× 0,70 = 2,017
tamaño muestral = 1,96 0,30
-----------------------------0,02 2
Por otro lado, si no tenemos ninguna idea inicial de la proporción poblacional, o si llevamos a cabo una encuesta para estimar diferentes proporciones,
algunas de las cuales pueden ser altas y otras bajas (por ejemplo, la población
de diferentes partidos políticos), entonces deberíamos usar el valor 0,5 para π .
La proporción 0,5 da el valor más alto de π (1 – π ) = 0,5 × 0,5 = 0,25, de manera que nos proporciona el tamaño muestral máximo necesario para obtener
el margen de error para cualquier proporción. Por tanto, para obtener un margen de error de 2 puntos porcentuales para estimar cualquier proporción, el
tamaño muestral debería ser:
2 0,5 × 0,5
tamaño muestral = 1,96 ----------------------= 2,401
2
0,02
Usando esta fórmula podemos obtener los tamaños muestrales máximos necesarios para cualquier margen de error, por ejemplo, desde el 5% hasta el 1%:
Margen de error
Tamaño muestral
5%
384
4%
600
3%
1067
2%
2401
1%
9604
Actividades
13.4. En una gran empresa agrícola separan las manzanas de alta calidad de las de baja
calidad. En años pasados, los porcentajes de manzanas de calidad alta y baja han sido
aproximadamente de 50:50. Después de una temporada de muy poca lluvia, el director
de la explotación quiere comprobar el porcentaje de manzanas de calidad baja, por lo que
desearía tener una estimación del verdadero porcentaje con una precisión de 5 puntos
porcentuales. ¿Cuántas manzanas deberían inspeccionar al azar para obtener una estimación con un nivel de confianza del 90%?
13.5. Se ha introducido un nuevo formulario de las rentas, por lo que el gobierno desea
estimar el porcentaje de formularios rellenados incorrectamente. ¿Cuántos formularios
deberían comprobar al azar antes de llegar a una estimación con una precisión de 1 punto porcentual? (Si no se especifica un nivel de confianza, usad el nivel del 95%.)
13.6. Una empresa de servicios estadísticos lleva a cabo encuestas mensuales para estimar
una amplia variedad de opiniones sobre cuestiones sociales. Para asegurar una precisión
general de 2,5 puntos porcentuales o más en sus estimaciones, ¿qué tamaño muestral debería usar esta empresa?
Inferencia estadística: parte 2
91
 FUOC • XP00/79003/00238
Glosario
tamaño muestral
Tamaño de la muestra requerido para estimar una proporción con un margen de error determinado, que viene dada por el tamaño:
2
π (1 – π )
( z α/2 ) -----------------------------------------------------2
( m arg en d e e r r o r)
donde π es la verdadera proporción poblacional. En la práctica, usamos un valor aproximado
para π , basado en la experiencia, o el valor π = 0,5, que nos dará el tamaño muestral máximo
requerido.
margen de error para una proporción estimada
Margen que se obtiene: zα ⁄ 2 = p ( 1 – p ) ⁄ n , donde z α ⁄ 2 es el valor normal estándar apropiado que corta una probabilidad α ⁄ 2 en la cola; esto corresponde a un intervalo de confianza
100(1 – α )%, y se debería usar sólo para muestras de, al menos, 100 unidades.
Inferencia estadística: parte 2
92
 FUOC • XP00/79003/00238
Inferencia estadística: parte 3
14. Inferencia estadística: parte 3
El desconocimiento de la varianza y la distribución t-Student
Hasta ahora hemos supuesto que conocemos la desviación estándar σ en la
población y, por tanto, el error estándar de cualquier muestra extraída a partir
de la población. Esta suposición no es real en la práctica, y sólo la hemos usado
para facilitar las cosas. Casi nunca tenemos un conocimiento exacto de la desviación estándar, y también tenemos que usar la muestra para estimarla. Este
hecho afecta a la manera de calcular los intervalos de confianza; éste es el tema
de este capítulo.
En este capítulo sobre inferencia estadística aprenderéis:
•
Qué es una distribución t.
•
Cómo se calcula un intervalo de confianza para la media aritmética
cuando la desviación estándar es desconocida.
Cuando la desviación estándar poblacional es desconocida
En el capítulo 12 calculábamos los márgenes de error y, desde aquí, intervalos
de confianza para la media aritmética usando la fórmula siguiente para obtener el error estándar de la media: σ x = σ ⁄ n donde σ es la desviación estándar de la variable X en la población, y n es el tamaño muestral. Sin embargo,
en la práctica no conocemos σ , por lo que la tenemos que estimar a partir de
la muestra. En el capítulo 12 vemos cómo se podía estimar σ por medio de la
2
desviación estándar muestral s, que es la raíz cuadrada de la varianza s :
1
s 2 = -----------n–1
n
∑ ( x i – x)
2
i=1
Resulta curioso por qué dividimos por (n – 1) y no por n. Una manera de explicarlo es advirtiendo que la fórmula anterior nos da una estimación no sesgada de σ 2 . Esto significa que, si tomamos muestras aleatorias de tamaño 10,
por ejemplo, muchas veces y de una manera repetida a partir de una distribución normal que presenta la varianza σ 2 , y si observamos la media de todas
las estimaciones s 2 de la varianza, nos acercaremos mucho a σ 2 . Si dividimos
por n en lugar de hacerlo por (n – 1), nuestras estimaciones aparecen sesgadas
y tienden a resultar un poco más bajas de lo que deben ser (10% más bajas, en
este caso, en que n = 10). No demostramos este efecto aquí, pero se puede demostrar fácilmente observando la distribución muestral de la varianza, de la
93
 FUOC • XP00/79003/00238
Inferencia estadística: parte 3
misma manera que investigamos la distribución muestral de la media aritmética en el capítulo 10. También, para tamaños muestrales mayores, nuestras estimaciones s
2
2
a partir de repetidas muestras se acercan cada vez más a σ ,
igual que la media s 2 se acercaba cada vez más a la verdadera media µ cuando
el tamaño muestral aumentaba. Esta propiedad se denomina consistencia ,
que, obviamente, es una propiedad deseable en un estimador.
Por lo tanto, s
2
2
es una buena estimación de la varianza poblacional σ , y pa-
rece razonable que reemplacemos σ por s en la fórmula para el error estándar.
Ahora bien, lo que no resulta razonable es continuar como antes utilizando el
valor exacto de σ .
De hecho, que hayamos estimado σ por s ha introducido una nueva incertidumbre en nuestro estudio de la media, y esto se debería tener en cuenta.
Todo lo que sabemos es que cuando el tamaño muestral es grande, la estimación s se acerca a σ y únicamente entonces podemos seguir como antes.
La conexión entre la distribución t y la cerveza Guiness
W.S. Gossett (1876-1937), el autor de la distribución t, trabajó como cervecero jefe en la
cervecería Guiness de Londres. Su tarea implicaba comparar diferentes métodos de elaboración, y para él era importante cuantificar la variabilidad de la media con tamaños
muestrales pequeños. Gosset publicó estudios científicos con el seudónimo “Student”,
por lo que la variable t a menudo recibe el nombre de “ t de Student”.
Gosset observó que, incluso cuando la distribución esperada era normal, la distribución
de la media tenía una varianza mayor de la esperada si la media hubiese sido normalmente distribuida. Esto llevó al descubrimiento de la distribución t, de manera que se puede
decir que la cerveza fue cómplice de una incalculable contribución a la estadística.
La distribución t
Hasta ahora, hemos trabajado implícitamente con versiones estandarizadas de
la media: ( x – µ ) ⁄ σ x . Si la distribución de la que se extrae la muestra es normal, entonces la media estandarizada es normal estándar. Ésta es otra manera
de derivar el intervalo de confianza: si el 95% de la curva normal estándar cae
entre ± 1,96, entonces podemos expresarlo de la siguiente manera:
P ( – 1,96 ≤ ( x – µ ) ⁄ σ x ≤ 1,96) = 0,95
donde P(...) significa la probabilidad (el área bajo la curva normal) correspondiente al intervalo entre paréntesis. Se puede arreglar de nuevo esta expresión
de la manera siguiente:
P ( x – 1,96σ x ≤ µ ≤ x + 1,96 σ x ) = 0,95
lo que es una manera alternativa de expresar el intervalo de confianza del 95%.
 FUOC • XP00/79003/00238
94
Cuando reemplazamos σ x = σ ⁄ n por la estimación muestral s x = s ⁄ n , la
versión estandarizada de la media, ( x – µ)/ s x , no está normalmente distribuida. Presenta la distribución t. No probaremos este hecho en este curso, lo que
haremos es señalar la pequeña modificación que debemos realizar siempre
que calculemos el intervalo de confianza. En todas partes donde utilizábamos
un valor z anteriormente, ahora usamos un valor t que deriva a partir de la distribución t, no de la distribución normal. Así, el valor 1,96, por ejemplo, no es
el valor que utilizaremos en la práctica, excepto que, naturalmente, la muestra
sea grande y se estime σ de una manera exacta.
Actividad
14.1. Cuando reemplazamos σ por s y calculamos el intervalo de confianza del 95%
como en ( ∗) de más arriba, ¿os parece que el valor que usamos para reemplazar 1,96 será
mayor o menor que 1,96?
La distribución t, como la distribución normal, también resulta simétrica en
torno al valor 0, pero es más dispersa que la distribución normal estándar. Por
este motivo, la respuesta del ejercicio 14.1 es que el valor será mayor, porque
necesitamos ampliarlo más para incluir el 95% del área. El perfil de la distribución depende del tamaño muestral, y es más dispersa en el caso de muestras
menores. Más específicamente, la distribución t se define en términos de n – 1,
el tamaño muestral menos 1. Este número se denomina grados de libertad de
la distribución, y a menudo se abrevia como “df” (degrees of freedom). La figura
14.1 muestra la distribución normal estándar, así como algunos ejemplos de
la distribución t para df = 1, 2 y 4. A medida que los grados de libertad aumentan, la distribución t va tomando más el aspecto de distribución normal: podéis pensar en la normal como la distribución t cuando el tamaño muestral se
vuelve infinito.
Figura 14.1.
El intervalo de confianza para la media aritmética
Los pasos para hallar el intervalo de confianza para la media cuando la desviación estándar es desconocida son, por tanto, los siguientes, sólo ligeramente
diferentes de los anteriores:
Inferencia estadística: parte 3
95
 FUOC • XP00/79003/00238
Inferencia estadística: parte 3
1) Calcular la media x de la muestra.
2) Calcular la desviación estándar s de la muestra.
3) Calcular el error estándar de la media: sx = s ⁄ n .
4) Calcular el margen de error como t α ⁄ 2 ,
donde tα ⁄ 2 ,
n– 1
n–1
para el error estándar: t α ⁄ 2 , n – 1 s x ,
es el valor de la distribución t (con n – 1 grados de libertad), de
manera que el 100(1 – α )% del área se incluye entre ± t α ⁄ 2 ,
n–1
.
5) El intervalo de confianza es la media más o menos el margen de error:
x ± t α ⁄ 2,
n – 1.
El método anteriormente expuesto se mantiene para muestras de cualquier tamaño, mientras se trate de muestras aleatorias a partir de una distribución
normal.
96
 FUOC • XP00/79003/00238
Glosario
cálculo de márgenes de error para la estimación de la media
Para calcular márgenes de error para la estimación de la media y, así, los intervalos de confianza, usamos la distribución t en lugar de la distribución normal; el intervalo de confianza
para la media poblacional µ es x ± tα ⁄ 2 , n – 1 s x , donde t α ⁄ 2 , n – 1 es el punto apropiado en la distribución t que deja un área de α ⁄ 2 en cada cola.
estimación de la desviación estándar poblacional
Cuando la desviación estándar poblacional α es desconocida, debemos estimarla a partir de
la muestra de observaciones, x 1, x 2, ..., x n, por medio de la fórmula habitual:
s =
1 n ( x – x)2
-----------n – 1i = 1 i
∑
Entonces calculamos los errores estándar de la manera habitual, sustituyendo s por σ :
sx = s ⁄
n.
Las suposiciones con las que podemos calcular los intervalos de confianza mediante este método son que la muestra se escoge de forma aleatoria e independiente de una población normal.
grados de libertad de la distribución t
La distribución t depende del tamaño muestral, en especial de n – 1, que se denominan los
grados de libertad.
Inferencia estadística: parte 3