Download Producción científica de UPC en SCOPUS, 2007-2011
Document related concepts
no text concepts found
Transcript
Percy Mayta Tristán MD, MPH (c), MHEd (c) Profesor, Escuela de Medicina, Universidad Peruana de Ciencias Aplicadas Profesor, Escuela de Posgrado, Universidad Peruana Cayetano Heredia Comité Editor, Revista Peruana de Medicina Experimental y Salud Publica Comité de Ética, Instituto Nacional de Salud [email protected] Recordar algunos conceptos básicos de estadística para poder comprender el uso de pruebas de hipótesis. Conocer los pasos para elegir una prueba estadística. Conocer las principales pruebas estadísticas y los escenarios en los que se pueden usar. Conocer la forma de redactar un plan de análisis de datos en un protocolo de investigación. Día a día, cada decisión que tomamos tiene un margen de error (las cirugías tienen un margen de error, los vuelos aéreos tienen un margen de error, etc.) Conocer cual es la magnitud del error es la tarea del investigador. Por eso se debe plantear en cada caso, el error que estamos dispuestos a aceptar. Desde el punto de vista matemático siempre se tiene dos hipótesis: Hipótesis nula (H0) o hipótesis de trabajo Hipótesis alternativa (H1) o hipótesis preliminar del investigador Ejemplos: H0: la variable edad tiene distribución normal H1: la variable edad no tiene distribución normal H0: µ(edad mujeres) = µ(edad varones) H1: µ(edad mujeres) ≠ µ(edad varones) Nivel de significancia: es la máxima cantidad de error que estamos dispuestos aceptar para dar como válida la hipótesis del investigador En líneas generales siempre se establece en 5% o menos (0.05 ó menor) Error tipo I: Conocido como alfa (α) Ocurre cuando rechazamos la hipótesis nula cuando esta es verdadera La meta es mantener este error lo más pequeño posible Error tipo II: Conocido como beta (β) Ocurre cuando no rechazamos la hipótesis nula cuando está es falsa La meta es mantener este error lo más pequeño posible (aceptado: 0.20) Poder (potencia): El poder de un estudio viene dado por (1 – β) Es la probabilidad de rechazar la hipótesis nula cuando es falsa La meta es mantener el poder de un estudio lo más grande posible Si especificamos que α = 0,05, veremos una región de rechazo: El p-valor: es la probabilidad de equivocarse al aceptar la hipótesis del investigador como verdadera; es decir, la probabilidad de cometer error tipo I. Interpretación del p-valor: Si el valor de p es menor que el error tipo I (α), entonces es posible rechazar la hipótesis nula Si el valor de p es igual o mayor que el error tipo I (α), entonces no es posible rechazar la hipótesis nula. A tomar en cuenta: El error tipo I (α) es 0,05 en la mayoría de casos El error tipo II (β) es en la mayoría de casos 0,20, de esta manera el poder de un estudio es de 0,80 (80%) Por convención se juzga como “estadísticamente significativo si el valor de p < 0.05 Hace referencia a la concentración de los valores estimados en torno al valor que se trata de estimar, de tal manera que la distancia entre el valor a estimar y el valor estimado sea pequeña Es un concepto unido al tamaño de muestra Por ejemplo: si deseo calcular el tamaño de muestra para un estudio que quiere determinar la prevalencia de caries en escolares de Lima, se requiere saber la prevalencia esperada y la precisión de este estimado. Es lo cerca que el resultado de una medición está del verdadero valor. La precisión y la exactitud son conceptos ligados pero no significan lo mismo. Se entiende por un par de números entre los cuales se estima que estará cierto valor desconocido con una determinada probabilidad de acierto. Se trata de que los resultados de una muestra permitan inferir el estimado de la población. La probabilidad de que el verdadero valor se encuentre en el intervalo que hemos construido se denomina nivel de confianza y se denota como (1 - α) Generalmente se construye intervalos de confianza de 95% (otros menos frecuentes son de 90% y de 99%) Se puede construir un intervalo de confianza al 95% (IC95%) para una media, una proporción, una prevalencia, una diferencia, entre otros. A mayor tamaño de muestra, mayor precisión y se tendrá un intervalo de confianza más pequeño. Cuando se comete un error de tipo I Cuando se comete un error de tipo II Qué es el valor de p Cuando se hace más pequeño un intervalo de confianza. Cuáles son los objetivos de mi estudio. Qué hipótesis he planteado. Cuál es la naturaleza de mi variable dependiente e independiente. Estos elementos deben ser previstos desde el protocolo para calcular el tamaño muestral mínimo requerido para demostrar nuestra hipótesis. SI Test de McNemar ¿Grupos relacionados? NO OJO :) Cuando menos, un valor esperado es menor de 2 o cuando menos el 20% de los valores esperados es menor a 5 NO Chi Cuadrado SI Test Exacto de Fisher Se desea evaluar si existe asociación entre el género y el uso de piercings en una población de estudiantes de Medicina de la Universidad Z. Se desarrolla un estudio con 39 alumnos de los cuales 8 tienen piercing. Ho: No existe asociación entre el género y el usar piercing NO ¿Hay valores esperado menor de 2 o cuando menos el 20% son menores a 5? Test Exacto de Fisher ¿Qué concluiría? Ho: No existe asociación entre el género y el usar piercing Se desarrolla un estudio de casos y controles, considerando como caso a las personas con la enfermedad gavinica (EG) y como variable de exposición consumo de Redbull. De las 400 personas con EG, 100 se expusieron al Redbull; de los 1200 controles, 200 estuvieron expuestas al Redbull. Ho: No existe asociación entre la enfermedad gavinica y el consumo de Redbull NO ¿Hay valores esperado menor de 2 o cuando menos el 20% son menores a 5? Chi Cuadrado ¿Qué concluiría? Ho: No existe asociación entre la enfermedad gavinica y el consumo de Redbull OR ¿Qué concluiría? Ho: No existe asociación entre la enfermedad gavinica y el consumo de Redbull Debemos tener claro algunos pasos cuando elegimos una prueba: Cuáles son mis objetivos de estudio. Cuál es mi variable dependiente (outcome) e independiente (exposición), y de que tipo son. Cuál es mi hipótesis (traducir en términos estadísticos). Qué supuestos requiero evaluar para saber que prueba elegir. OJO, este proceso lo debemos hacer desde el protocolo y es la base para estimar el tamaño de muestra. No continuaremos revisando los supuestos de cada prueba estadística (es todo un curso). Veremos tips básicos a tener en cuenta para cada tipo de prueba (las más comunes). En otras palabras, evaluar si hay asociación entre dos variables, donde una de ellas es categórica dicotómica Variables numéricas con Variables numéricas sin distribución normal distribución normal tipo Rangos (Orden) o Scores (Puntajes) Prueba t de Student (para Prueba de Mann-Whitney. datos no pareados). (suma de rangos de Diferencia de medias Wilcoxon). Diferencia de medianas Variable categóricas (Dicotómicas y Politómicas) Prueba de Chi cuadrado o Test Exacto de Fisher según caso. Para evaluar asociación entre dos variables categóricas. Diferencia de proporciones Asociación entre la edad y Asociación entre la Asociación entre el nivel la intención de emigrar en satisfacción del usuario y la socioeconómico y la estudiantes de medicina. intención de regreso al presencia de anemia servicio. En otras palabras, evaluar si hay asociación entre dos variables: Por ejemplo pre-post o dos formas de medir lo mismo en una misma unidad., donde una de ellas es categórica dicotómica Variables numéricas con Variables numéricas sin distribución normal distribución normal tipo Rangos (Orden) o Scores (Puntajes) Prueba t de Student (para Prueba de Mann-Whitney. datos no pareados). (suma de rangos de Diferencia de medias Wilcoxon). Diferencia de medianas Variable categóricas (Dicotómicas y Politómicas) Prueba de Chi cuadrado o Test Exacto de Fisher según caso. Para evaluar asociación entre dos variables categóricas. Diferencia de proporciones Cambios en el nivel de Cambios en el nivel de Cambios en la prevalencia colesterol en personas en dolor articular luego de un de burnout luego de un tratamiento con sacha inchi programa de taichi (antes - programa de yoga (antes y (antes - después) después) después) En otras palabras, evaluar si hay asociación entre dos variables, donde una de ellas es categórica politómica Variables numéricas con Variables numéricas sin distribución normal distribución normal tipo Rangos (Orden) o Scores (Puntajes) ANOVA Kruskall Wallis Diferencia de medianas Diferencia de medias Variable categóricas (Dicotómicas y Politómicas) Prueba de Chi cuadrado o Test Exacto de Fisher según caso. Diferencia de proporciones Asociación entre los niveles Asociación entre el puntaje Asociación entre la de glucosa y dosis de de dolor y las dosis de uña intensidad del higado graso jarabe de yacón en ratas. de gato en ratas según dosis de boldo en ratas. En otras palabras, evaluar la magnitud y direccionalidad de la asociación entre dos variables Variables numéricas con Variables numéricas sin distribución normal distribución normal tipo Rangos (Orden) o Scores (Puntajes) Correlación de Spearman Correlación de Pearson Variable categóricas (Dicotómicas y Politómicas) Prueba de Chi cuadrado o Test Exacto de Fisher según caso. Asociación entre el peso de Asociación entre el puntaje Asociación entre la la madre y el peso del niño de calidad del sueño y el intensidad del higado graso al nacer rendimiento académico según dosis de boldo en ratas. En otras palabras, evaluar la magnitud y direccionalidad de la asociación entre dos variables Variables respuesta es numérica con distribución normal Regresión lineal (simple, múltiple) Variable respuesta es ordinal o politómica Variable respuesta es categórica dicotómica Regresión logística ordinal Regresión logística (simple o multinomial o múltiple). Prevalencia >20% buscar otras opciones (GLM, poisson) Asociación entre el peso al Asociación entre el peso Asociación entre la nacer y el peso de la (normal, sobrepeso, obeso) intención de emigrar y el madre, ajustado por y el nivel socioeconómico, nivel educativo de los diabetes gestacional, edad, ajustado por edad, sexo, padres, ajustado por edad, paridad, nivel ejercicio, educación, sexo, tipo de universidad, socioeconómico. ruralidad. nivel socioeconómico. La investigación se hace en redes y en equipo. El investigador no debe saber a la perfección todos los aspectos relacionados con los procesos del trabajo, pero si entender por qué se hicieron. Alguien del equipo debe hacerse responsable de la parte del análisis de datos. Deficiencias en el análisis de datos es uno de los principales motivos de rechazo de artículos. Se definirá el paquete estadístico a usar (STATA, SPSS, R, SAS, Epi-Info, etc.) Se debe exponer las técnicas lógicas y básicas para análisis (estadísticas descriptivas) que serán empleadas para descifrar lo que revelan los datos que se han recogidos Se expresa también análisis y modelos más avanzados de ser necesario Randomized control trial to evaluate the effect of a novel-based intervention to increase HIV testing in MSM in Lima, Peru Hepatitis B infection and its association with consistent condom use: A population-based survey in Peru USO DE TECNOLOGÍAS DE INFORMACIÓN Y COMUNICACIÓN EN MÉDICOS RECIÉN EGRESADOS DE LIMA, 2011 25 Artículos publicados 20 15 Estudiantes Medicina 10 No medicina 5 0 2007 2008 2009 2010 2011 ¿Cuál era el tema de esta clase? Revise sus objetivos y enuncie sus hipótesis. Revise las características de las variables implicadas. Plantee cual sería la prueba estadística a elegir.