Download Biostatistics course. Part 8. Inferences of a mean in Spanish

Document related concepts

Poder estadístico wikipedia , lookup

Contraste de hipótesis wikipedia , lookup

Prueba t de Student wikipedia , lookup

Valor p wikipedia , lookup

Distribución t de Student wikipedia , lookup

Transcript
Curso de Bioestadística
Parte 8
Inferencias acerca de una
media
Dr. en C. Nicolás Padilla Raygoza
Departamento de Enfermería y Obstetricia
División Ciencias de la Salud e Ingenierías
Campus Celaya Salvatierra
Universidad de Guanajuato México
Presentación
 Médico Cirujano por la Universidad Autónoma de Guadalajara.
 Pediatra por el Consejo Mexicano de Certificación en Pediatría.
 Diplomado en Epidemiología, Escuela de Higiene y Medicina





Tropical de Londres, Universidad de Londres.
Master en Ciencias con enfoque en Epidemiología, Atlantic
International University.
Doctorado en Ciencias con enfoque en Epidemiología, Atlantic
International University.
Profesor Titular A, Tiempo Completo, Universidad de
Guanajuato.
Nivel 1 del Sistema Nacional de Investigadores.
[email protected]
Competencias
 Aplicará prueba de Z para obtener
inferencias de una media.
 Obtendrá intervalo de confianza para una
media.
 Aplicará prueba de t para una media en una
muestra pequeña.
 Obtendrá el intervalo de confianza para una
media en una muestra pequeña.
Introducción
 Si medimos la estatura de estudiantes de la
FEOC, podemos obtener su media y
desviación estándar:





Número de estudiantes: 269
Media de estatura: 161.6 cm
Desviación estándar: 6.3 cm
Mediana: 159 cm
Rango: 149 a 185 cm.
Notación
 Para parámetros de la población usamos
letras griegas, para parámetros de la
muestra, usamos letras latinas.
Parámetro
Población
Muestra
Media
μ
_
X
Desviación
estándar
σ
s
Distribución de muestreo
 Si tomamos muchas muestras del mismo tamaño de
la misma población, cada muestra puede tener
media y desviación estándar diferentes.
 Si graficamos esas medias de las muestras podemos
obtener una distribución de muestreo.
 Sabiendo que el tamaño de muestra es grande, la
distribución de las medias de las muestras es
aproximadamente Normal, aunque la distribución de
los datos en la población no sea Normal.
Distribución de muestreo
n
%
% acumulado
149
2
0.7
0.7
150
3
1.1
1.8
152
6
2.2
4.0
154
12
4.5
8.5
155
27
10.0
18.5
157
29
10.8
29.3
158
26
9.7
39.0
159
33
12.3
51.3
163
37
13.8
65.1
164
16
5.9
71.0
165
24
8.9
79.9
168
18
6.7
86.6
169
14
5.2
91.8
171
6
2.2
94.0
174
7
2.6
96.6
175
1
0.4
97.0
177
4
1.5
98.5
179
2
0.7
99.2
184
1
0.4
99.6
185
1
0.4
100.0
Total
269
100.0
Datos de estudiantes de la
FEOC. Si tomamos otras
999 muestras de
estudiantes podemos
graficar la distribución de
sus medias.
Distribución de muestreo 1000
muestras; n=269
300
250
200
150
100
50
0
Frecencia
Estatura en cm.
158
157 158
159 160 161
Medias de estatura en cm
162
Intervalos de confianza al 95%
 Usa la teoría de la probabilidad para extraer
conclusiones acerca de una población, a
partir de los datos obtenidos en una muestra.
 Es muy difícil estudiar a toda la población,
por lo que estudiamos muestras.
 Métodos para hacer estimaciones y probar
hipótesis son fundamentales para obtener
inferencias.
Intervalos de confianza al 95%
(cont…)
 Entonces los intervalos de confianza para una media
se calculan así:
_
X ± 1.96 (ES)
_
X es el estimado obtenido de la muestra
1.96 es el múltiplo de errores estándar para 95%
ES es el error estándar
 Deberíamos esperar que el intervalo de confianza al
95% alrededor de la media de la muestra incluya la
media de la población en el 95% de las veces, si
tomamos miles de muestras.
Intervalos de confianza al 95%
(cont…)
 Calculemos el intervalo de confianza al 95%
para la primera muestra de 269 estudiantes
de la FEOC:
_
X = 161.6
ES= 6.3/√269= 0.38
IC95%= 161.6 ± 1.96 (0.38) = 161.6 ± 0.74 =
160.86 a 162.34
Intervalos de confianza al 95%
(cont…)
 Podemos usar intervalos de confianza a otro
porcentaje de confianza, sólo debemos
cambiar el múltiplo del error estándar:



Por ejemplo, al 90% cambia a 1.69.
Para el 95.4% cambia a 2.
Para el 99% cambia a 3.
Prueba de hipótesis para una media
 La prueba de hipótesis es comprobar si nuestra estimación
concuerda con una valor específico.
 Nuestra muestra de 269 estudiantes fue de 161.6 con
desviación estándar de 6.3 y error estándar de 0.38.
 En un estudio similar en los estudiantes de la Facultad de
Contabilidad y Administración, obtuvieron una media de
estatura de 167 cm.
 ¿Cómo podemos demostrar si la estatura de los estudiantes de
la FEOC es igual o diferente de los estudiantes de la FCA?
 Media de FEOC 161.6
 Media de FCA 167
 Podemos ver, obviamente que no son iguales.
 Pero no sabemos si la diferencia observada es real o es debido
a error de muestreo, ya que 161.6 es una estimación de
muchas que pudimos haber obtenido.
Prueba de hipótesis para una media
 Para evaluar si la diferencia observada es real, se
hace lo siguiente:






Hipótesis nula señala que las medias de ambas
poblaciones es la misma (la primera población es la
población de estudiantes de la FEOC y la población de
referencia es la de estudiantes de Contabilidad).
La hipótesis nula se escribe Ho.
Si la media de la hipótesis es μo y la media en estudio
es μ, entonces la hipótesis nula se escribe como HO :
μ = μo
Hipótesis alternativa
La hipótesis alternativa es que las medias de las dos
poblaciones no son iguales.
Usualmente se escribe como H1: μ≠μ0
Prueba de hipótesis para una media
 Ya que se ha señalado la hipótesis nula,
calculamos la probabilidad de obtener los
datos observados si la hipótesis nula es
verdad.
 Para obtener esta probabilidad, calculamos
una prueba estadística y la comparamos a la
distribución implicada por la hipótesis nula.
 En muchos casos será la distribución
Normal.
Prueba de hipótesis para una media
 La forma general de la prueba estadística compara los valores
observados estimados de la muestra y el valor esperado si la
hipótesis nula fuera verdad.
 También toma en cuenta la variabilidad en la población usando
el error estándar.
 Esta prueba estadística se llama Z y es igual a:
_
X – μo
Z= -----------ES
_
Entonces, la prueba es una diferencia estandarizada entre X y μo.
Ejemplo
 La muestra de estudiantes de la FEOC
Media = 161.6
S = 6.3
IC 95% = 160.6 a 162.60
 La hipótesis nula es que no hay diferencia entre las medias de
estatura de estudiantes de la FEOC y FCA
Ho: μ = 167cm
Necesitamos usar la prueba de z:
_
X – μo
161.6 -167
z = ----------- = ---------------- = - 14.21
ES(X)
0.38
Muestras pequeñas
 Si el tamaño de muestra es pequeño,
usamos la distribución t.
 Su forma depende de los grados de libertad,
que es una medida de qué tan pequeña es el
tamaño de muestra.
 Los grados de libertad de una distribución t
es igual al tamaño de muestra menos 1.
Muestras pequeñas
 Entre menos grados de libertad, menos probabilidad de estar
alrededor de la muestra y altas probabilidad de estar en las
colas.
 Las distribuciones t con los más pequeños grados de libertad
tienen las más pequeñas probabilidades a los lados de la media
y mayores probabilidades en las colas.
 Sin embargo, entre mayor el tamaño de muestra y por lo tanto,
mayor grados de libertad, más parecida es la distribución t a la
distribución Normal.
 Hay tablas publicadas de valores seleccionados del área bajo la
distribución t que usaremos cuando calculemos intervalos de
confianza y pruebas de hipótesis.
Muestras pequeñas
 Así, cuando el tamaño de muestra es pequeño, menos de 100,
las fórmulas para el intervalo de confianza y la prueba de
hipótesis, son:
95%IC
Estimación ± multiplicador (error estándar)
Estimación es la media estimada
Multiplicador es el valor de t que
corresponde a p=0.05 con grados de
libertad igual al tamaño de muestra
menos 1
Prueba de hipótesis
Para probar Ho: μ=μo
Para probar H1: μ≠μo
_
X – μ0
t = --------ES
Valores de p
 ¿Una o dos colas?
 Ahora sabemos que el valor de p es la probabilidad de
haber obtenido un resultado al menos tan extremo
como el encontrado con nuestra muestra si la hipótesis
nula fuera verdad.
 Pero, ¿qué significa extremo?
 Cuando la hipótesis alternativa es
H1: µ ≠ µo
 Luego resultados extremos pueden ocurrir por azar a
cada lado de la media de la hipótesis, µo.
 Debido a esto usamos las tablas para dos colas de las
distribuciones Normal y t.
Valores de p
 Hay situaciones menos comunes donde la hipótesis alternativa




es H1: µ < µo o
H1: µ > µo
Entonces, valores extremos podrían ocurrir sólo a la izquierda o
sólo a la derecha, de la media de la hipótesis.
¿Cuán pequeño es pequeño para el valor de p?
Muchas personas usan el valor de p de 0.05 como punto de
corte. Es un valor arbitrario, pero muy sensible. Significa que
estamos preparados para rechazar la hipótesis nula al menos
una vez de 20 cuando es verdad.
Note que cuando el valor de una prueba tiene un valor de p
menor a 0.05, el intervalo de confianza no incluye el valor de la
hipótesis.
Valores de p
 ¿Si tenemos un valor de p de 0.048 podemos
rechazar la hipótesis nula?
 ¿Si tenemos un valor de p de 0.052 no
rechazamos la hipótesis nula?
 Cuando los valores de p estén entre 0.07 y
0.03 deberán ir acompañados del valor real
de p, ya que están en los bordes de ser
significativos.
Presentación de resultados
 Presente sus resultados acompañados de los
intervalos de confianza
 Clarifique cuál es sus hipótesis nula y alternativa
 De el valor de p de cada prueba, pero es suficiente
con decir p< 0.001 cuando sea el caso.
 No malinterprete los valores de p


Un valor pequeño de p da lugar a rechazar la hipótesis
nula
Un valor de p grande da lugar sólo a no rechazar la
hipótesis nula
Bibliografía
 1.- Last JM. A dictionary of epidemiology.
New York, 4ª ed. Oxford University Press,
2001:173.
 2.- Kirkwood BR. Essentials of medical
statistics. Oxford, Blackwell Science, 1988: 14.
 3.- Altman DG. Practical statistics for medical
research. Boca Ratón, Chapman & Hall/
CRC; 1991: 1-9.