Download De la evidencia a la recomendación. GRADE

Document related concepts
no text concepts found
Transcript
C A P Í T U L O
11
De la evidencia
a la recomendación. GRADE
Juan Bautista Cabello López y Jaime Latour Pérez
OBJETIVOS DEL CAPÍTULO
• Reflexionar sobre la metodología GRADE y su contexto de uso: desarrollo
e interpretación de las revisiones sistemáticas y de las guías de práctica
clínica.
• Describir la escala GRADE con su doble dimensión: su parte valorativa
relacionada con la calidad de la evidencia y su parte la aplicativa relacionada
con la fuerza de la recomendación.
• Evaluar la «calidad» de la evidencia.
• Ajustar la dirección y fuerza de la recomendación.
INTRODUCCIÓN
En capítulos precedentes hemos abordado la lectura crítica de los estudios
o piezas elementales de evidencia (estudios de tratamiento o prevención,
diagnóstico, pronóstico, etc.), y hemos identificado los elementos para rea­
lizar un juicio de valor sobre su validez, sobre la importancia y precisión
del efecto, así como unas reflexiones sobre su aplicabilidad.
Asimismo, hemos hecho lectura crítica de las síntesis, que responden
a una pregunta clínica estructurada PICO y que incluyen un grupo de
estudios que han sido seleccionados, evaluados y sintetizados de modo
explícito y sistemático. También en capítulos previos hemos introducido
los diferentes tipos de documentos de evidencia y, entre ellos, las GPC y
otros sumarios de evidencias.
© 2015. Elsevier España, S.L.U. Reservados todos los derechos
Descargado de ClinicalKey.es desde Universidad Nacional Autonoma de Mexico junio 16, 2016. Para uso personal exclusivamente. No
se permiten otros usos sin autorización. Copyright ©2016. Elsevier Inc. Todos los derechos reservados.
182
LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA
Tanto las RS como las guías de práctica y otros sumarios comparten el
hecho de que las piezas de evidencia que las constituyen (los estudios) no
son directamente accesibles al lector y, por tanto, no es posible una lectura
crítica «directa» del modo en que hemos practicado. Sin embargo, necesi­
tamos un modo de saber si podemos confiar en la calidad de la evidencia
contenida en esos documentos y, en el caso de las guías, si podemos confiar
en las recomendaciones.
¿QUÉ ES GRADE?
GRADE es el acrónimo de Grading of Recommendations, Assessment,
Development, and Evaluations, que es un método para valorar la calidad
de la evidencia y para señalar la dirección y fuerza de las recomendacio­
nes de uso en las GPC.
El interés por la jerarquización de la evidencia se inicia en Canadá en
1979 (1). Desde entonces se han usado múltiples instrumentos para este
propósito, generando con ello una cierta confusión. Una RS de 2002 (2),
ampliada en 2008 (3), identificó hasta 50 instrumentos usados para este fin,
que, puntuados por los expertos metodólogos, produjeron una destacada
ventaja en las puntuaciones de los de GRADE y SIGN (Scottish Interco­
llegiate Guidelines Network). Finamente, el panel propuso usar el primero,
y estimular su desarrollo y difusión, tarea que actualmente continúa el
grupo de trabajo GRADE (www.gradeworkinggroup.org).
El método ha sido adoptado por múltiples organizaciones produc­
toras de evidencia y/o de guías de práctica, de modo que su uso se ha
extendido con extraordinaria rapidez (4). Actualmente, GRADE es un
instrumento esencial para quienes realizan RS, e imprescindible para
las personas involucradas en la formulación de recomendaciones en el
contexto de GPC.
Por extensión, su conocimiento es clave para los clínicos y profesionales
de la salud, que como usuarios de evidencia preevaluada han de com­
prender las revisiones y los sumarios de evidencia, y como decisores clínicos
han de interpretar las guías de práctica e integrar sus recomendaciones con
los valores y preferencias de los pacientes.
DESCRIPCIÓN DE LA ESCALA GRADE
La escala separa explícitamente la calidad de la evidencia (5) del grado
de recomendación (6) (cuadro 11-1), y lo hace así porque asume que los
procesos son diferentes y los criterios que se usan en cada una de las es­
calas son esencialmente distintos. No obstante, plantea una relación de
dependencia de ambos procesos, y así la calidad de la evidencia resul­
tante es usada como un elemento determinante en la formulación de las
recomendaciones.
Descargado de ClinicalKey.es desde Universidad Nacional Autonoma de Mexico junio 16, 2016. Para uso personal exclusivamente. No
se permiten otros usos sin autorización. Copyright ©2016. Elsevier Inc. Todos los derechos reservados.
11. De la evidencia a la recomendación. GRADE
183
CUADRO 11-1
E S C A L A G R A D E PA R A L A C A L I D A D
DE LA EVIDENCIA Y EL GRADO
DE RECOMENDACIÓN
Calidad de la evidencia
• Alta calidad (⊕⊕⊕⊕ o A): estamos seguros de que el efecto mostrado
en los estudios refleja el efecto real existente
• Moderada calidad (⊕⊕⊕⊝ o B): estamos bastante seguros de que el
efecto mostrado en los estudios está cerca del auténtico efecto real
• Baja calidad (⊕⊕⊝⊝ o C): creemos que el auténtico efecto puede
diferir significativamente del estimado en estos estudios
• Muy baja calidad (⊕⊝⊝⊝ o D): es casi seguro que el auténtico
efecto difiere del que ofrecen estos estudios
Grado de recomendación
•
•
•
•
Fuerte a favor (↑↑ o 1)
Débil a favor (↑? o 2)
Débil en contra (↓? o 2)
Fuerte en contra (↓↓ o 1)
© Elsevier. Fotocopiar sin autorización es un delito.
Para expresar la calidad de la evidencia GRADE, usa una escala con
cuatro categorías decrecientes, que se representa con los símbolos o letras
que se muestran en el cuadro 11-1, y cuyo significado describimos:
• Alta calidad: significa que es poco probable que nuevos estudios
cambien el efecto estimado, es decir, confiamos bastante en esta
estimación del efecto, es evidencia prácticamente cerrada.
• Moderada calidad: aunque confiamos que nuestra estimación está
cerca del auténtico efecto, es posible que nuevos estudios puedan
cambiar de modo sustancial la estimación del efecto, es decir, aunque
estamos relativamente seguros, aún es evidencia abierta.
• Baja calidad: creemos que el auténtico efecto puede ser muy distinto
del que hemos observado o, en términos de futuro, es probable que
nueva investigación tenga gran impacto y cambie nuestra estimación
de la evidencia.
• Muy baja calidad: estamos realmente inseguros sobre estos resultados
o, de otro modo, es casi seguro que nueva investigación cambie por
completo los resultados de la estimación. Dicho en términos prácticos,
carecemos de evidencia.
Descargado de ClinicalKey.es desde Universidad Nacional Autonoma de Mexico junio 16, 2016. Para uso personal exclusivamente. No
se permiten otros usos sin autorización. Copyright ©2016. Elsevier Inc. Todos los derechos reservados.
184
LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA
En relación con la recomendación, la escala tiene dos componentes: uno
es la dirección, que podrá ser a favor o en contra de la alternativa estudiada;
y el otro es la fuerza de la recomendación, que tiene, a su vez, dos categorías,
fuerte o débil (llamada también discrecional o condicional). Combinando
fortaleza y dirección, se obtiene una escala ordinal, como se muestra en la
figura 11-2 (v. más adelante) y en el cuadro 11-1.
CARACTERÍSTICAS ESENCIALES DE ESTA METODOLOGÍA
• El método se ha desarrollado, fundamentalmente, para comparaciones
entre alternativas terapéuticas o preventivas, y a ello nos
circunscribiremos en este capítulo. Hay desarrollos GRADE para
estudios de diagnóstico, salud pública o sistemas de salud que tienen
sus especificidades y retos particulares, y que no abordaremos aquí.
No existe, sin embargo, desarrollo adecuado para el pronóstico
(aunque el pronóstico tenga clara relación con la elección de opciones).
• El proceso tiene dos partes diferenciadas para cumplimentar las
escalas mencionadas: una relacionada con la evaluación de la calidad
de la evidencia relativa a una determinada pregunta PICO; y una
segunda que es una recomendación de uso, que se realiza sopesando
los efectos positivos y negativos de la intervención comparada,
considerando la calidad de la evidencia, e incorporando valores del
paciente y de la colectividad (fig. 11-1).
• Sin duda, la característica más destacable de GRADE es que el
proceso se centra en los desenlaces y, a diferencia de otras jerarquías
de evidencia, GRADE no se limita a valorar un solo desenlace, sino
que considera todos los desenlaces relevantes, tanto los beneficiosos
como los indeseados. Ya señalamos en capítulos previos la existencia
de tres tipos de desenlaces clínicos (críticos para la decisión,
importantes, pero no críticos, y no importantes); pues bien, GRADE
incorpora los desenlaces críticos e importantes no críticos, y no toma
en consideración los no importantes. Asimismo, comentamos
previamente que la arquitectura de estudio (definida por los detalles
del diseño y conducción) permite probar simultáneamente el efecto de
la intervención sobre varios desenlaces. Sin embargo, la influencia
de esos detalles del diseño y conducción sobre la validez del estudio
es diferente para cada desenlace (p. ej., la ausencia de cegamiento
puede ser esencial si consideramos un desenlace subjetivo como
los síntomas, pero será menos relevante si analizamos un desenlace
como mortalidad o infarto de miocardio). Por tanto, la calidad de la
evidencia no puede predicarse de un diseño en general, sino que debe
valorarse para cada desenlace específico.
• GRADE no se aplica habitualmente a estudios individuales (no es
un modo de leer críticamente un artículo), sino que valora el cuerpo
de evidencia sobre una cuestión PICO para sus diversos desenlaces
Descargado de ClinicalKey.es desde Universidad Nacional Autonoma de Mexico junio 16, 2016. Para uso personal exclusivamente. No
se permiten otros usos sin autorización. Copyright ©2016. Elsevier Inc. Todos los derechos reservados.
© Elsevier. Fotocopiar sin autorización es un delito.
11. De la evidencia a la recomendación. GRADE
185
FIGURA 11-1 Proceso de evaluación de la evidencia y realización de recomendaciones.
ECA, ensayo clínico aleatorio.
posibles, y ello tiene dos consecuencias distintas, según el contexto.
En cada caso será preciso determinar cuál es la evidencia incorporable
para cada conjunto «PICO-desenlace», y cabe esperar que las RS del
futuro aborden todos los desenlaces importantes y críticos. Dichas
consecuencias son las siguientes:
• Si se trata de RS, es posible que algunos estudios incluidos no
hayan estudiado desenlaces críticos o importantes no críticos y, por
tanto, esos estudios no contribuirán a la estimación combinada de
ese particular desenlace.
Descargado de ClinicalKey.es desde Universidad Nacional Autonoma de Mexico junio 16, 2016. Para uso personal exclusivamente. No
se permiten otros usos sin autorización. Copyright ©2016. Elsevier Inc. Todos los derechos reservados.
186
LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA
• Si se trata de GPC (que contendrán múltiples preguntas PICO, cada
una de las cuales con diversos desenlaces, cuya importancia clínica
es pactada al comienzo del proceso), es posible que algunos de los
desenlaces críticos o importantes no críticos no hayan sido objeto
de estudio en la RS seleccionada. En tal caso, puede ser necesario
usar otra revisión, realizar su propia RS ad hoc o usar estudios
observacionales (esto puede ocurrir para desenlaces como efectos
adversos, especialmente si son raros o tardíos).
• El método tras analizar cada uno de los desenlaces separadamente
condensa el proceso en el llamado perfil de evidencia, que ofrece para
cada desenlace una información explícita de la calidad de la evidencia
y de los resultados de los estudios agregados, llamado este último
resumen de datos. Ese perfil es útil para hacer una valoración global
del conjunto de la evidencia sobre esa pregunta PICO considerando
todos los desenlaces. Por tanto, es una herramienta de interés para
clínicos lectores de revisiones y panelistas o usuarios de GPC.
• Una característica final es que el método ofrece un marco flexible y
explícito para la incorporación de los valores y preferencias de los
pacientes en las recomendaciones y en el uso de ellas.
Veamos, pues, cómo se evalúa la calidad de la evidencia y cómo se
formulan las recomendaciones.
¿CÓMO EVALUAR LA CALIDAD DE LA EVIDENCIA?
El método propone realizar un juicio o calificación inicial y un ajuste pos­
terior En cada caso será preciso determinar cuál es la evidencia incorporable
para cada conjunto «PICO-desenlace», y cabe esperar que las RS del futuro
aborden todos los desenlaces importantes y críticos, teniendo en cuenta
características metodológicas y otras reflexiones de contexto.
Dado que nos referimos a comparaciones terapéuticas o preventivas, el
diseño adecuado será el ECA y, en nuestro caso, la RS de ensayos aleatorios.
Sin embargo, no siempre dispondremos de la revisión y, en algunas circuns­
tancias, será necesario incluir estudios observacionales.
Como la unidad de valoración es el desenlace, para cada desenlace
enjuiciaremos su calidad, considerando las características de los estudios
de la revisión:
• Juicio inicial: basándonos en la asunción descrita y si se trata de ECA,
calificaremos la evidencia de alta calidad y, si procede de estudios
observacionales, la calificaremos de baja calidad.
• Ajuste posterior: aunque en general esa calidad inicial responde a
la superioridad conocida de los ECA sobre los observacionales, hay
detalles particulares del diseño o reflexiones de contexto que en el
caso de los ECA harán bajar la calificación en la escala 4 (una o dos
Descargado de ClinicalKey.es desde Universidad Nacional Autonoma de Mexico junio 16, 2016. Para uso personal exclusivamente. No
se permiten otros usos sin autorización. Copyright ©2016. Elsevier Inc. Todos los derechos reservados.
11. De la evidencia a la recomendación. GRADE
187
categorías por cada defecto), o en el caso de los observacionales
subir (una o dos categorías) la puntuación. Este es un punto
distintivo esencial con respecto a otros sistemas de jerarquización
de la evidencia que equiparan de forma automática tipo de diseño y
grado de evidencia. GRADE reconoce la importancia del diseño del
estudio para establecer el grado de evidencia, pero también que un
ensayo de baja calidad proporcione evidencia baja, o que un estudio
observacional proporcione evidencia moderada.
Veamos, pues, cuáles son esos ajustes.
AJUSTES A LA BAJA A PARTIR DE ENSAYOS CLÍNICOS ALEATORIOS
(ALTA CALIDAD INICIAL)
Son cinco los factores que pueden restar puntuación de calidad a la es­
timación del efecto para ese desenlace.
RIESGO DE SESGO
O la existencia de defectos en el diseño o conducción de los estudios que
compromete su validez (la clásicamente llamada validez interna). Tales
problemas, comentados en los capítulos 4 y 5, son:
•
•
•
•
•
•
No ocultación de la secuencia de aleatorización.
Ausencia de cegamiento.
Pérdidas excesivas en el seguimiento.
Ausencia de análisis por intención de tratar.
Detención precoz por supuesto beneficio.
Comunicación selectiva de desenlaces, particularmente los que no
muestran efecto.
© Elsevier. Fotocopiar sin autorización es un delito.
EVIDENCIA INDIRECTA
Puede adoptar, típicamente, dos formas.
En unos casos, la evidencia proviene de una comparación indirecta,
es decir, A es mejor que B, y B mejor que C, luego A es mejor que C,
o alternativamente A y B comparadas con placebo, pero no entre sí.
En otros casos se trata de ligeros cambios en el PICO: las poblaciones son
muy diferentes (diferente gravedad de la enfermedad o distintos tratamien­
tos asociados), o las intervenciones o comparaciones son algo diferentes
(diferente dosis de una u otra droga) y, en ocasiones, son diferentes modos de
medir el desenlace, o se miden algunos a través de una variable subrogada.
En esos casos se generan dudas respecto de la calidad de la evidencia y
por ello se baja una o dos categorías la puntuación.
IMPRECISIÓN
Cuando los estudios incluyen relativamente pocos pacientes, y es­
pecialmente si ocurren pocos eventos los intervalos de confianza son muy
Descargado de ClinicalKey.es desde Universidad Nacional Autonoma de Mexico junio 16, 2016. Para uso personal exclusivamente. No
se permiten otros usos sin autorización. Copyright ©2016. Elsevier Inc. Todos los derechos reservados.
188
LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA
amplios, baja la puntuación, porque esa evidencia podría cambiar si nuevos
estudios con más efectivos tuvieran otros resultados. Por ello, un IC am­
plio, especialmente cuando incluye al umbral de decisión, disminuye su
credibilidad y sugiere reducir la calidad de la evidencia en al menos un
escalón. Adicionalmente, GRADE considera que puede haber imprecisión
con IC estrechos, cuando estos se basan en un número muy reducido de
eventos: en estos casos, el resultado es estadísticamente significativo a
expensas de un efecto implausible, exageradamente grande (efecto de es­
tudios pequeños) y debe ser contemplado con escepticismo.
INCONSISTENCIA
La existencia de diferentes estimados del efecto entre los distintos
estudios requiere estudiar la heterogeneidad, especialmente si el (los) es­
tudio(s) inconsistente(s) puede(n) cambiar la dirección del efecto. Cuando
no encontramos una explicación satisfactoria para ello, hay que poner en
duda la estimación y bajar uno o dos puntos la puntuación de calidad.
SESGO DE PUBLICACIÓN
Si existen dudas al respecto, la calidad de la evidencia se resiente; es
particularmente probable cuando hay pocos estudios y también en los es­
tudios financiados por la industria.
AJUSTES AL ALZA A PARTIR DE ESTUDIOS OBSERVACIONALES
(BAJA CALIDAD)
Aun cuando ya hemos comentado su interés para algunos desenlaces
concretos, los estudios observacionales son considerados de baja cali­
dad por su propensión a los sesgos (generalmente la sobreestimación del
efecto); sin embargo, en circunstancias excepcionales, y siempre que no
tengan defectos metodológicos, su evidencia puede calificarse de moderada
(y quizá de alta); tales circunstancias son:
• Cuando el efecto estimado es muy grande y es consistente entre
estudios, se puede aumentar a moderada o incluso a alta calidad la
evidencia. Por ejemplo, en una RS observacional (7) de la profilaxis
del tromboembolismo con anticoagulantes orales en pacientes con
sustitución valvular, la OR fue de 0,17 (IC 95%: 0,13-0,24), que es
tan intensa y plausible que debe considerarse evidencia de alta
calidad.
• Existencia de relación dosis-respuesta. Por ejemplo, el riesgo de
sangrado en pacientes con sobredosificación de anticoagulantes orales
procede de estudios observacionales, pero el hecho de que cuanto
mayor es la sobredosificación más riesgo de sangrado existe, aumenta
nuestra confianza en la evidencia sobre ese efecto adverso de la
anticoagulación.
Descargado de ClinicalKey.es desde Universidad Nacional Autonoma de Mexico junio 16, 2016. Para uso personal exclusivamente. No
se permiten otros usos sin autorización. Copyright ©2016. Elsevier Inc. Todos los derechos reservados.
11. De la evidencia a la recomendación. GRADE
189
• Plausibilidad de un factor de confusión. A veces, la existencia de
factores de confusión cuyo efecto va en contra del efecto detectado
hace más creíble el efecto detectado.
CONCEPTUALIZANDO LA CALIDAD DE LA EVIDENCIA
Durante todo el capítulo hemos tratado la calidad de la evidencia, y
conviene realizar alguna precisión sobre ese concepto. El concepto va más
allá de la tradicional validez (interna) de la epidemiologia clínica, y supone
más bien la confianza en la estimación basada en una red argumental que
incluye la validez interna, pero también otros argumentos vinculados a la
precisión, a la consistencia o al sesgo de publicación.
En nuestro capítulo hay un matiz adicional según contexto. Así, para el
caso de las RS, la calidad de la evidencia significa en qué medida confiamos
que un efecto estimado es correcto, y en el contexto de las guías, refleja en
qué medida un efecto estimado es adecuado para justificar una recomen­
dación determinada.
El concepto, además, debe diferenciarse de otros de áreas próximas y,
en particular, del de la calidad de una RS, y también del de la calidad de
una GPC, conceptos que incluyen diferentes componentes y para los que
disponemos de instrumentos específicos, como AMSTAR (8) y AGREE (9),
respectivamente.
© Elsevier. Fotocopiar sin autorización es un delito.
PRODUCTOS GRÁFICOS DE GRADE
Un objetivo de GRADE es ofrecer un sistema transparente y explícito
para la presentación de la calidad de la evidencia disponible que pueda ser
usado para su eventual aplicación clínica o para su uso por los panelistas
de las GPC. En la tabla 11-1 se muestra el denominado perfil de evidencia
para alguno de los ejemplos que introduciremos (anticoagulación frente a
antiagregación como prevención secundaria en pacientes con ictus no car­
dioembólico). En la tabla se puede apreciar la ordenación por desenlaces y
la separación entre la valoración de la calidad (columnas de la izquierda)
y los resultados resumidos (columnas de la derecha).
CÓMO SE REALIZA LA RECOMENDACIÓN
Como señalábamos, hay dos dimensiones en la recomendación que
analizaremos de modo separado.
DIRECCIÓN DE LA RECOMENDACIÓN
La formulación de una recomendación a favor o en contra de una inter­
vención depende del balance global entre los desenlaces beneficiosos y los
indeseados del tratamiento o intervención frente a una alternativa concreta.
Descargado de ClinicalKey.es desde Universidad Nacional Autonoma de Mexico junio 16, 2016. Para uso personal exclusivamente. No
se permiten otros usos sin autorización. Copyright ©2016. Elsevier Inc. Todos los derechos reservados.
Descargado de ClinicalKey.es desde Universidad Nacional Autonoma de Mexico junio 16, 2016. Para uso personal exclusivamente. No
se permiten otros usos sin autorización. Copyright ©2016. Elsevier Inc. Todos los derechos reservados.
TABLA 11-1 Perfil de evidencia para anticoagulación frente a antiagregación como prevención secundaria en pacientes con ictus no cardioembólico
Calidad estimada
Resumen de los resultados
N.° de participantes
(n estudios)
Riesgo
Evidencias
Sesgo de
Años de seguimiento de sesgo Inconsistencia indirectas Imprecisión publicación
Calidad
de la evidencia
en general
Índice de eventos
en el estudio (%)
Riesgo
relativo
(IC 95%)
Diferencia
del riesgo con
Riesgo con
anticoagulante
antiagregantes oral (IC 95%)
Con
Con
anticoagulante
antiagregantes oral
Mortalidad en general (desenlace importante)
Riesgo de Severa
5.400 (5 estudios)
0-5 años
sesgo
no
severo
No severo
Moderada
No
127 de 2.707
debido a la
encontrado
(4,7)
inconsistencia
172 de 2.693
(6,4)
1,36
(1,09-1,7)
No
Alta
encontrado
253 de 2.707
(9,3)
260 de 2.693
(9,7)
Moderado
1,03
(0,88-1,22) 106 apoplejías 3 apoplejías más
por cada
por cada 1.000
1.000
(de menos de
13 a 23 más)
Severa
Moderada
No
debido a la
encontrado
imprecisión
40 de 812 (4,9) 37 de 825 (4,5) 0,91
(0,59-1,4)
No severa
No
Alta
encontrado
23 de 1.604
(1,4)
No severa
Ictus recurrente no letal (isquémico o/y hemorrágico) (desenlace crítico)
5.400 (5 estudios)
Riesgo de No severa
No severo No severa
0-5 años
sesgo
no
severo
Infarto de miocardio no letal (desenlace importante)
1.637 (2 estudios)
Riesgo de No severa
No severo
3-5 años
sesgo
no
severo
Hemorragia extracraneal mayor, no letal (desenlace crítico)
3.194 (4 estudios)
Riesgo de No severa
No severo
0-5 años
sesgo
no
severo
Riesgo basal asumido
En negrita, calidad general de la evidencia estimada en función de las observaciones anteriores.
IC 95%, intervalo de confianza al 95%; IM, infarto de miocardio.
Modificada de (10).
82 de 1.590
(5,2)
Moderado
50 muertes por 18 muertes más
cada 1.000
por cada 1.000
(de 5 más a
35 más)
Moderado
13 IM por cada 1 IM menos por
1.000
cada 1.000
(de 5 menos a
5 más)
Moderado
RR 3,6
(2,29-5,66) 10 episodios
26 episodios más
de sangrado
de sangrado
por cada
por cada 1.000
1.000
(de 13 más a
47 más)
11. De la evidencia a la recomendación. GRADE
191
Si, considerados en su conjunto, los primeros superan a los segundos,
se debe establecer una recomendación a favor; en caso contrario, se es­
tablecerá una recomendación en contra de la intervención. Entre los efectos
deseados de la intervención podemos citar la reducción de la mortalidad, la
prevención de eventos morbosos, la mejoría de los síntomas, la mejoría de
la calidad de vida o la reducción del consumo de recursos. Por el contrario,
entre los efectos indeseados se encuentran la reducción de la longevidad,
la aparición de complicaciones graves o de efectos colaterales, la reducción
de la calidad de vida, las molestias asociadas a su uso o el aumento de los
costes.
Por ejemplo, en el caso de la anticoagulación oral frente a antiagregan­
tes en pacientes con antecedentes de ictus isquémico no cardioembólico,
se valoró su efecto sobre la mortalidad global, la aparición de un nuevo
ictus (isquémico o hemorrágico) no letal, el infarto de miocardio no letal
y las hemorragias extracraneales no letales (v. tabla 11-1). El metaanálisis
mostró que la warfarina apenas influyó en nuevos ictus cardioembólicos
(RR: 1,03; 0,86-1,22) o infartos de miocardio (RR: 0,91; 0,59-1,4) y, en cambio,
se encontró un exceso de muertes (RR: 1,35; 1,09-1,7) y de hemorragias
extracraneales (RR: 3,6; 2,29-5,66) en los pacientes tratados con anticoa­
gulantes, por lo que la dirección de la recomendación es en contra de la
anticoagulación oral en estos pacientes.
FUERZA DE LA RECOMENDACIÓN
© Elsevier. Fotocopiar sin autorización es un delito.
Aunque la relación riesgo-beneficio es un continuo, GRADE establece
cuatro categorías de recomendación: fuerte a favor, débil a favor, débil en
contra y fuerte en contra (fig. 11-2).
FIGURA 11-2 Categorías de recomendación.
Descargado de ClinicalKey.es desde Universidad Nacional Autonoma de Mexico junio 16, 2016. Para uso personal exclusivamente. No
se permiten otros usos sin autorización. Copyright ©2016. Elsevier Inc. Todos los derechos reservados.
192
LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA
La fuerza de la recomendación depende del grado de confianza que se
tiene en la relación entre las consecuencias deseables e indeseables de la
intervención. Si estamos muy convencidos de que los beneficios esperados
superan a los efectos adversos (o viceversa), deberemos establecer una
recomendación fuerte a favor (o, en su caso, en contra). Por el contrario, si
la confianza sobre la relación riesgo-beneficio es menor, se formulará una
recomendación débil.
En cualquier caso, el grado de recomendación debe ir acompañado
del grupo de comparación. Por ejemplo, en el caso del ictus isquémico no
cardioembólico, el enunciado de la recomendación debe especificar que
se refiere al uso de anticoagulantes orales en comparación con los antia­
gregantes.
DETERMINANTES DE LA FUERZA DE LA RECOMENDACIÓN
El grado de confianza en el balance entre riesgos y beneficios depende
de varios factores. Los más importantes son la magnitud estimada de los
efectos beneficiosos y los efectos adversos, el grado de evidencia sobre
los efectos importantes, las preferencias del paciente y los costes. En prin­
cipio, una diferencia importante entre los efectos beneficiosos y los efectos
adversos, y una alta calidad de evidencia apoyan el establecimiento de
una recomendación fuerte, especialmente si hay una escasa variabilidad
de las preferencias y un coste favorable. Por el contrario, un beneficio neto
de escasa magnitud o una calidad de evidencia baja favorecerían una reco­
mendación débil, más aún si hay variabilidad importante o incertidumbre
en las preferencias de los pacientes, o los costes asociados a la intervención
son elevados (tabla 11-2).
Sin embargo, no hay reglas fijas, y hay que integrar todos los factores.
Así, puede haber recomendaciones fuertes respaldadas por evidencias de
baja calidad. Ello ocurre, por ejemplo, cuando la evidencia de un efecto
adverso es muy baja en un tratamiento protector y cómodo frente a una
alternativa más segura, igualmente efectiva, pero más incómoda. Por ejem­
plo, en gestantes de entre 6-12 semanas con trombosis venosas profundas,
TABLA 11-2 Principios generales para las recomendaciones
Dominio
Recomendación según escenario
Equilibrio entre efectos deseables
y adversos
Calidad de la evidencia
Cuanto mayor equilibrio, menor fuerza de
recomendación
Cuanta menor confianza en la calidad de la
evidencia, menor fuerza de recomendación
Cuanta más variabilidad entre personas y cuanta
menor confianza en la estimación de los valores
y preferencias, menor fuerza de recomendación
Cuanto mayor coste, menor fuerza de recomendación
Valores y preferencias
Uso de recursos (costes)
Descargado de ClinicalKey.es desde Universidad Nacional Autonoma de Mexico junio 16, 2016. Para uso personal exclusivamente. No
se permiten otros usos sin autorización. Copyright ©2016. Elsevier Inc. Todos los derechos reservados.
11. De la evidencia a la recomendación. GRADE
193
los anticoagulantes orales frente a heparina tienen similar efectividad; esta
última es más costosa y más molesta y, aunque el riego de malformaciones
por los anticoagulantes es ciertamente pequeño, casi todas las mujeres
preferían la heparina.
Las GPC deben ser explícitas sobre la forma en que se cuantifican estas
dimensiones, y en especial las preferencias. Por ejemplo, las recomendacio­
nes respecto a un tratamiento antitrombótico pueden ser diferentes según el
peso que se le dé a los desenlaces favorables (infartos o ictus evitados) y a
los efectos adversos (hemorragias extracraneales). Así, en las guías de ictus
anteriormente citadas, se asume explícitamente que, como promedio, los
pacientes consideran un ictus (isquémico o hemorrágico) como tres veces
más desfavorable que una hemorragia mayor extracraneal.
De igual forma, es importante especificar la población a la que se aplica;
por ejemplo, la relación riesgo-beneficio puede ser favorable en pacientes
con alto riesgo, pero desfavorable en pacientes con bajo riesgo de eventos.
En el caso de la anticoagulación frente a la antiagregación a largo plazo
en pacientes con ictus no cardioembólico, los anticoagulantes añadieron
18 muertes (entre 5 y 35) y 26 hemorragias extracraneales (entre 13 y 47) por
cada 1.000 pacientes tratados, sin diferencias claras en la incidencia de un
nuevo ictus o de infarto de miocardio. Aunque la calidad de la evidencia
del aumento de las hemorragias fue alta, la calidad de la evidencia del
aumento de la mortalidad fue solo moderada, debido a inconsistencia (I2:
62%). En consecuencia, los panelistas propusieron una recomendación 1B
en contra de los anticoagulantes en estos pacientes.
© Elsevier. Fotocopiar sin autorización es un delito.
SIGNIFICADO DE LA FUERZA DE LA RECOMENDACIÓN
PARA PACIENTES Y CLÍNICOS
Desde el punto de vista del paciente, una recomendación fuerte es aque­
lla que adoptaría la práctica totalidad de los pacientes bien informados. Por
el contrario, si una parte sustancial de pacientes discrepara respecto a la
decisión que hay que elegir, entonces la recomendación sería débil.
Aunque comentar las decisiones con el paciente es siempre necesario,
en el caso de las recomendaciones débiles es especialmente importante que
el clínico le dedique un tiempo a la decisión compartida, para asegurarse
de que la decisión basada en la recomendación es coherente con las prefe­
rencias del paciente.
SIGNIFICADO DE LA FUERZA DE LA RECOMENDACIÓN
PARA LOS DECISORES POLÍTICOS
Desde el punto de vista de los decisores políticos, una recomendación
fuerte significa que puede ser adoptada en la mayoría de las situaciones,
y que una variación en la práctica clínica en este caso es inaceptable, por
lo que podría utilizarse como criterio de calidad. Por el contrario, las va­
riaciones poblacionales relacionadas con recomendaciones débiles pueden
Descargado de ClinicalKey.es desde Universidad Nacional Autonoma de Mexico junio 16, 2016. Para uso personal exclusivamente. No
se permiten otros usos sin autorización. Copyright ©2016. Elsevier Inc. Todos los derechos reservados.
194
LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA
ser apropiadas y, por tanto, su uso como criterio de calidad no estaría jus­
tificado.
El hecho de que una recomendación sea fuerte no significa que debe ser
implantada de forma prioritaria. Para los decisores políticos, la prioridad
de la implantación de una intervención debe tener en cuenta otros factores,
como la prevalencia de la enfermedad, la facilidad de implementación, los
costes sociales, el impacto potencial o la equidad.
El lector interesado en profundizar puede obtener más información en:
• Serie de artículos en BMJ (v. http://www.gradeworkinggroup.org/
publications/).
• Serie de Journal of Clinical Epidemiology (v. en http://www.jclinepi.
com/content/jce-GRADE-Series).
Bibliografía
1.The periodic health examination. Canadian Task Force on the Periodic Health Examination.
Can Med Assoc J. 1979;121:1193-1254.
2.West S, King V, Carey T, Lohr KN, McKoy N, Sutton SF, et al. Systems to Rate the Strength
of Scientific Evidence. Rockville: Agency for Healthcare Research and Quality (US); 2002
[20/07/2014]. Disponible en: http://www.ncbi.nlm.nih.gov/books/NBK11930/#A86871.
ref82.
3.Shukla V, Bai A, Milne S, Wells G. Systematic review of the evidence grading system for
grading level of evidence. German J Evidence and Quality in Health Care. 2008;102:43.
4.Guyatt GH, Oxman AD, Vist GE, Kunz R, Falck-Ytter Y, Alonso-Coello P, GRADE Working
Group. et al. GRADE: an emerging consensus on rating quality of evidence and strength
of recommendations. BMJ. 2008;336:24-26.
5.Guyatt GH, Oxman AD, Kunz R, Vist GE, Falck-Ytter Y, Schünemann HJ. GRADE Working
Group, GRADE: what is «quality of evidence» and why is it important to clinicians? BMJ.
2008;336:995-998.
6.Guyatt GH, Oxman AD, Kunz R, Falck-Ytter Y, Vist GE, Liberati A, et al.; GRADE Working
Group. GRADE: going from evidence to recommendations. BMJ. 2008;336:1049-1051.
7.Cannegieter SC, Rosendaal FR, Briet E. Thromboembolic and bleeding complications in
patients with mechanical heart valve prostheses. Circulation. 1994;89:635-641.
8.Shea BJ, Grimshaw JM, Wells GA. Development of AMSTAR: a measurement tool to assess
the methodological quality of systematic reviews. BMC Med Res Methodol. 2007;7:10.
9.Brouwers M, Kho ME, Browman GP, Cluzeau F, Feder G, Fervers B, et al.; AGREE Next
Steps Consortium. AGREE II: Advancing guideline development, reporting and evaluation
in healthcare. Can Med Assoc J. 2010;182:E839-E842.
10.Lansberg MG, O’Donnell MJ, Khatri P, Lang ES, Nguyen-Huynh MN, Schwartz NE, et al.;
American College of Chest Physicians. Antithrombotic and thrombolytic therapy for is­
chemic stroke: Antithrombotic Therapy and Prevention of Thrombosis, 9th ed: American
College of Chest Physicians Evidence-Based Clinical Practice Guidelines. Chest. 2012;141
(2 Suppl):e601S-e636S. Cómo citar este capítulo:
Cabello JB, Latour J. De la evidencia a la recomendación. GRADE. En: Cabello Juan B, editor.
Lectura crítica de la evidencia clínica. Barcelona: Elsevier; 2015. p. 181-194.
Descargado de ClinicalKey.es desde Universidad Nacional Autonoma de Mexico junio 16, 2016. Para uso personal exclusivamente. No
se permiten otros usos sin autorización. Copyright ©2016. Elsevier Inc. Todos los derechos reservados.