Download Producción científica de UPC en SCOPUS, 2007-2011

Document related concepts
no text concepts found
Transcript
Percy Mayta Tristán MD, MPH (c), MHEd (c)
Profesor, Escuela de Medicina, Universidad Peruana de Ciencias Aplicadas
Profesor, Escuela de Posgrado, Universidad Peruana Cayetano Heredia
Comité Editor, Revista Peruana de Medicina Experimental y Salud Publica
Comité de Ética, Instituto Nacional de Salud
[email protected]




Recordar algunos conceptos básicos de
estadística para poder comprender el uso de
pruebas de hipótesis.
Conocer los pasos para elegir una prueba
estadística.
Conocer las principales pruebas estadísticas y
los escenarios en los que se pueden usar.
Conocer la forma de redactar un plan de
análisis de datos en un protocolo de
investigación.


Día a día, cada decisión que tomamos tiene
un margen de error (las cirugías tienen un
margen de error, los vuelos aéreos tienen un
margen de error, etc.)
Conocer cual es la magnitud del error es la
tarea del investigador. Por eso se debe
plantear en cada caso, el error que estamos
dispuestos a aceptar.

Desde el punto de vista matemático siempre
se tiene dos hipótesis:
 Hipótesis nula (H0) o hipótesis de trabajo
 Hipótesis alternativa (H1) o hipótesis preliminar
del investigador

Ejemplos:
 H0: la variable edad tiene distribución normal
 H1: la variable edad no tiene distribución normal
 H0: µ(edad mujeres) = µ(edad varones)
 H1: µ(edad mujeres) ≠ µ(edad varones)

Nivel de significancia: es la máxima cantidad
de error que estamos dispuestos aceptar para
dar como válida la hipótesis del investigador
 En líneas generales siempre se establece en 5% o
menos (0.05 ó menor)

Error tipo I:
 Conocido como alfa (α)
 Ocurre cuando rechazamos la hipótesis nula
cuando esta es verdadera
 La meta es mantener este error lo más pequeño
posible

Error tipo II:
 Conocido como beta (β)
 Ocurre cuando no rechazamos la hipótesis nula
cuando está es falsa
 La meta es mantener este error lo más pequeño
posible (aceptado: 0.20)

Poder (potencia):
 El poder de un estudio viene dado por (1 – β)
 Es la probabilidad de rechazar la hipótesis nula
cuando es falsa
 La meta es mantener el poder de un estudio lo
más grande posible

Si especificamos que α = 0,05, veremos una
región de rechazo:

El p-valor: es la probabilidad de equivocarse al
aceptar la hipótesis del investigador como
verdadera; es decir, la probabilidad de cometer
error tipo I.

Interpretación del p-valor:
 Si el valor de p es menor que el error tipo I (α),
entonces es posible rechazar la hipótesis nula
 Si el valor de p es igual o mayor que el error tipo I
(α), entonces no es posible rechazar la hipótesis
nula.

A tomar en cuenta:
 El error tipo I (α) es 0,05 en la mayoría de casos
 El error tipo II (β) es en la mayoría de casos 0,20,
de esta manera el poder de un estudio es de 0,80
(80%)
 Por convención se juzga como “estadísticamente
significativo si el valor de p < 0.05

Hace referencia a la concentración de los
valores estimados en torno al valor que se
trata de estimar, de tal manera que la
distancia entre el valor a estimar y el valor
estimado sea pequeña


Es un concepto unido al tamaño de muestra
Por ejemplo: si deseo calcular el tamaño de
muestra para un estudio que quiere
determinar la prevalencia de caries en
escolares de Lima, se requiere saber la
prevalencia esperada y la precisión de este
estimado.

Es lo cerca que el resultado de una medición
está del verdadero valor.

La precisión y la exactitud son conceptos
ligados pero no significan lo mismo.


Se entiende por un par de números entre los
cuales se estima que estará cierto valor
desconocido
con
una
determinada
probabilidad de acierto.
Se trata de que los resultados de una muestra
permitan inferir el estimado de la población.


La probabilidad de que el verdadero valor se
encuentre en el intervalo que hemos
construido se denomina nivel de confianza y
se denota como (1 - α)
Generalmente se construye intervalos de
confianza de 95% (otros menos frecuentes
son de 90% y de 99%)


Se puede construir un intervalo de confianza
al 95% (IC95%) para una media, una
proporción, una prevalencia, una diferencia,
entre otros.
A mayor tamaño de muestra, mayor
precisión y se tendrá un intervalo de
confianza más pequeño.




Cuando se comete un error de tipo I
Cuando se comete un error de tipo II
Qué es el valor de p
Cuando se hace más pequeño un intervalo de
confianza.



Cuáles son los objetivos de mi estudio.
Qué hipótesis he planteado.
Cuál es la naturaleza de mi variable
dependiente e independiente.

Estos elementos deben ser previstos desde el
protocolo para calcular el tamaño muestral
mínimo requerido para demostrar nuestra
hipótesis.
SI
Test de McNemar
¿Grupos relacionados?
NO
OJO :) Cuando menos, un valor esperado
es menor de 2 o cuando menos el 20% de
los valores esperados es menor a 5
NO
Chi Cuadrado
SI
Test Exacto de
Fisher


Se desea evaluar si existe asociación entre el género
y el uso de piercings en una población de estudiantes
de Medicina de la Universidad Z.
Se desarrolla un estudio con 39 alumnos de los
cuales 8 tienen piercing.
Ho: No existe asociación entre el género y el usar piercing
NO
¿Hay valores esperado menor de 2 o
cuando menos el 20% son menores a 5?
Test Exacto de Fisher
¿Qué concluiría?
Ho: No existe asociación entre el género y el usar piercing


Se desarrolla un estudio de casos y controles, considerando
como caso a las personas con la enfermedad gavinica (EG)
y como variable de exposición consumo de Redbull.
De las 400 personas con EG, 100 se expusieron al Redbull;
de los 1200 controles, 200 estuvieron expuestas al Redbull.
Ho: No existe asociación entre la enfermedad gavinica y el consumo de Redbull
NO
¿Hay valores esperado menor de 2 o
cuando menos el 20% son menores a 5?
Chi Cuadrado
¿Qué concluiría?
Ho: No existe asociación entre la enfermedad gavinica y el consumo de Redbull
OR
¿Qué concluiría?
Ho: No existe asociación entre la enfermedad gavinica y el consumo de Redbull

Debemos tener claro algunos pasos cuando
elegimos una prueba:
 Cuáles son mis objetivos de estudio.
 Cuál es mi variable dependiente (outcome) e
independiente (exposición), y de que tipo son.
 Cuál es mi hipótesis (traducir en términos
estadísticos).
 Qué supuestos requiero evaluar para saber que
prueba elegir.
OJO, este proceso lo debemos hacer desde el
protocolo y es la base para estimar el tamaño de
muestra.


No continuaremos
revisando los
supuestos de cada
prueba estadística
(es todo un curso).
Veremos tips
básicos a tener en
cuenta para cada
tipo de prueba (las
más comunes).
En otras palabras, evaluar si hay asociación entre dos
variables, donde una de ellas es categórica dicotómica
Variables numéricas con Variables numéricas sin
distribución normal
distribución normal tipo
Rangos (Orden) o Scores
(Puntajes)
Prueba t de Student (para Prueba de Mann-Whitney.
datos no pareados).
(suma de rangos de
Diferencia de medias
Wilcoxon).
Diferencia de medianas
Variable categóricas
(Dicotómicas y
Politómicas)
Prueba de Chi cuadrado o
Test Exacto de Fisher
según caso. Para evaluar
asociación entre dos
variables categóricas.
Diferencia de proporciones
Asociación entre la edad y Asociación entre la
Asociación entre el nivel
la intención de emigrar en satisfacción del usuario y la socioeconómico y la
estudiantes de medicina.
intención de regreso al
presencia de anemia
servicio.
En otras palabras, evaluar si hay asociación entre dos variables:
Por ejemplo pre-post o dos formas de medir lo mismo en una
misma unidad., donde una de ellas es categórica dicotómica
Variables numéricas con Variables numéricas sin
distribución normal
distribución normal tipo
Rangos (Orden) o Scores
(Puntajes)
Prueba t de Student (para Prueba de Mann-Whitney.
datos no pareados).
(suma de rangos de
Diferencia de medias
Wilcoxon).
Diferencia de medianas
Variable categóricas
(Dicotómicas y
Politómicas)
Prueba de Chi cuadrado o
Test Exacto de Fisher
según caso. Para evaluar
asociación entre dos
variables categóricas.
Diferencia de proporciones
Cambios en el nivel de
Cambios en el nivel de
Cambios en la prevalencia
colesterol en personas en dolor articular luego de un de burnout luego de un
tratamiento con sacha inchi programa de taichi (antes - programa de yoga (antes y
(antes - después)
después)
después)
En otras palabras, evaluar si hay asociación entre dos
variables, donde una de ellas es categórica politómica
Variables numéricas con Variables numéricas sin
distribución normal
distribución normal tipo
Rangos (Orden) o Scores
(Puntajes)
ANOVA
Kruskall Wallis
Diferencia de medianas
Diferencia de medias
Variable categóricas
(Dicotómicas y
Politómicas)
Prueba de Chi cuadrado o
Test Exacto de Fisher
según caso.
Diferencia de proporciones
Asociación entre los niveles Asociación entre el puntaje Asociación entre la
de glucosa y dosis de
de dolor y las dosis de uña intensidad del higado graso
jarabe de yacón en ratas. de gato en ratas
según dosis de boldo en
ratas.
En otras palabras, evaluar la magnitud y direccionalidad
de la asociación entre dos variables
Variables numéricas con Variables numéricas sin
distribución normal
distribución normal tipo
Rangos (Orden) o Scores
(Puntajes)
Correlación de Spearman
Correlación de Pearson
Variable categóricas
(Dicotómicas y
Politómicas)
Prueba de Chi cuadrado o
Test Exacto de Fisher
según caso.
Asociación entre el peso de Asociación entre el puntaje Asociación entre la
la madre y el peso del niño de calidad del sueño y el
intensidad del higado graso
al nacer
rendimiento académico
según dosis de boldo en
ratas.
En otras palabras, evaluar la magnitud y direccionalidad
de la asociación entre dos variables
Variables respuesta es
numérica con
distribución normal
Regresión lineal (simple,
múltiple)
Variable respuesta es
ordinal o politómica
Variable respuesta es
categórica dicotómica
Regresión logística ordinal Regresión logística (simple
o multinomial
o múltiple).
Prevalencia >20% buscar
otras opciones (GLM,
poisson)
Asociación entre el peso al Asociación entre el peso
Asociación entre la
nacer y el peso de la
(normal, sobrepeso, obeso) intención de emigrar y el
madre, ajustado por
y el nivel socioeconómico, nivel educativo de los
diabetes gestacional, edad, ajustado por edad, sexo,
padres, ajustado por edad,
paridad, nivel
ejercicio, educación,
sexo, tipo de universidad,
socioeconómico.
ruralidad.
nivel socioeconómico.




La investigación se hace en redes y en equipo.
El investigador no debe saber a la perfección
todos los aspectos relacionados con los
procesos del trabajo, pero si entender por
qué se hicieron.
Alguien del equipo debe hacerse responsable
de la parte del análisis de datos.
Deficiencias en el análisis de datos es uno de
los principales motivos de rechazo de
artículos.



Se definirá el paquete estadístico a usar
(STATA, SPSS, R, SAS, Epi-Info, etc.)
Se debe exponer las técnicas lógicas y básicas
para análisis (estadísticas descriptivas) que
serán empleadas para descifrar lo que revelan
los datos que se han recogidos
Se expresa también análisis y modelos más
avanzados de ser necesario
Randomized control trial to evaluate the effect of a novel-based
intervention to increase HIV testing in MSM in Lima, Peru
Hepatitis B infection and its association with consistent condom use: A
population-based survey in Peru
USO DE TECNOLOGÍAS DE INFORMACIÓN Y COMUNICACIÓN EN
MÉDICOS RECIÉN EGRESADOS DE LIMA, 2011
25
Artículos publicados
20
15
Estudiantes
Medicina
10
No medicina
5
0
2007
2008
2009
2010
2011
¿Cuál era el tema de esta
clase?



Revise sus objetivos y enuncie sus hipótesis.
Revise las características de las variables
implicadas.
Plantee cual sería la prueba estadística a
elegir.