Download Medicina basada en evidencias

Document related concepts
no text concepts found
Transcript
Medicina basada en evidencias
Medicina basada en evidencias
Joseph Bernstein, MD, MS
Resumen
La medicina basada en evidencias (MBE) utiliza y valora la información para ayudar a tomar las decisiones más correctas. En contra de lo que se cree normalmente,
para utilizar la MBE hay que aceptar la existencia de incertidumbres en la toma de
las mencionadas decisiones; esto se debe a lo difícil que resulta lograr una información que sea a la vez veraz y completa. Tras aceptar la incertidumbre como algo inherente a la medicina, los defensores de la MBE aconsejan utilizar un proceso de
toma de decisiones que incluye cinco fases: formulación de preguntas que puedan
tener respuesta, reunión de evidencias, evaluación de las mismas, puesta en práctica (aplicación) de las evidencias válidas y valoración del proceso. La formulación de
preguntas con respuesta requiere de una clasificación de las características de los
casos para compararlas con las de evidencias obtenidas en estudios previos. La evaluación de las evidencias utiliza métodos epidemiológicos que estimen su validez y
aplicabilidad. La puesta en práctica hace referencia a un plan clínico basado en las
evidencias obtenidas, en la opinión del médico y en las preferencias del paciente.
Por último, la MBE requiere de una valoración y un perfeccionamiento continuos.
Los métodos de la MBE son muy importantes en la medicina contemporánea, puesto que los profesionales trabajan bajo intensas presiones, que les obligan a buscar
los mejores resultados posibles, y en un entorno de conocimientos médicos cada vez
más amplios.
J Am Acad Orthop Surg (Ed Esp) 2004;3:152-160
J Am Acad Orthop Surg 2004;12:80-88
La medicina basada en evidencias
(MBE) es un fenómeno cada vez más
frecuente (fig. 1); pero ¿qué es exactamente? Para evaluar el valor de la
MBE1 y estimar su impacto práctico, lo
primero que hay que hacer es definirla. Por lo tanto, mi primera intención
es comentar dicha definición y revisar
los métodos de valoración crítica epidemiológicos en los que se basa. Otro
asunto más sutil, pero tal vez más interesante, es saber por qué ha aumentado tanto recientemente el interés por
la MBE. Decir que la MBE es una nueva forma de práctica médica parece indicar que los métodos tradicionales no
se basaban en evidencias. No se trata
de una crítica directa; nadie ha comparado, por ejemplo, la medicina occidental con la necromancia o la astrología. Sin embargo, se mantiene la insinuación de que la práctica médica carece de base científica.
152
El argumento más fuerte que apoya la idea de que la medicina carece
de fundamento científico proviene
de estudios que publican variaciones
enormes con respecto a la prevalencia de una determinada enfermedad.
Por ejemplo, la tasa de lumbalgia
tratada quirúrgicamente en los pacientes de Medicare de Santa Bárbara
es 5 veces superior a la del Bronx.2
Teniendo en cuenta que es poco probable que en realidad la prevalencia
de la enfermedad difiera tanto, es probable que exista un tipo de pacientes
para el que los médicos de California,
basándose en opiniones científicas,
recomiendan la cirugía, mientras que
los médicos del Bronx, apoyados en
los mismos conocimientos científicos, no la aconsejan. Podría pensarse
que o tienen razón los médicos de
California o la tienen los médicos del
Bronx, pero no ambos a la vez.
Hay que dejar claro que una amplia variación no demuestra que la
medicina no sea científica. También,
que de que incluso la mejor evidencia sólo puede reducir, pero no eliminar totalmente, la incertidumbre y la
variación.
Definición de medicina
basada en evidencias
El término MBE hace referencia a
un proceso de utilización y valoración de la información que puede
ayudar a los médicos a tomar sus decisiones profesionales. La definición
que se menciona a continuación es la
de Sackett y cols.:3 «La MBE es la utilización meticulosa, explícita y sensata de las mejores evidencias existentes para ayudar a tomar decisiones referentes al tratamiento de los
pacientes. La práctica de la MBE implica integrar las experiencias clínicas individuales y las mejores evidencias derivadas de investigaciones sistemáticas.» Llama la atención
que en dicha definición no se mencionan los ensayos aleatorizados
controlados. Tampoco hace referencia a los estudios de coste-eficacia ni
a los algoritmos. Lo que sí menciona
de forma tácita es que el proceso de
El Dr. Bernstein es Attending Surgeon, Veterans
Hospital, Philadelphia, PA y Senior Fellow, Leonard Davis Institute of Health Economics, University of Pennsylvania School of Medicine, Philadelphia.
Ni el Dr. Bernstein ni su departamento asociado
han recibido ayudas ni poseen acciones en empresas u organismos relacionados directa o indirectamente con el tema de este artículo.
Copyright 2004 by the American Academy of
Orthopaedic Surgeons.
Journal of the American Academy of Orthopaedic Surgeons (Edición Española)
28
Joseph Bernstein, MD, MS
2.000
1.500
1.000
500
0
1994
1995
1996
1997
1998
1999
2000
Figura 1. Diagrama del número de citas
por año que se encontraron en MEDLINE
bajo el epígrafe de «medicina basada en evidencias» (1994-2000).
toma de decisiones médicas es difícil. ¿Por qué los médicos tienen que
realizar esfuerzos «explícitos y sensatos»?.
La toma de decisiones resulta difícil porque los médicos se enfrentan
al dilema de basarlas en informaciones imperfectas o inadecuadas. A
esto se le llama «el principio de incertidumbre en la toma de decisiones
clínicas»; según dicho principio, no
es posible tener una información que
sea al mismo tiempo verídica y completa. Para entender el fundamento
de este dilema, hay que comprender
cuál es la naturaleza del conocimiento médico.
chos comprobados no es una garantía de seguridad. Si descartamos
todo lo que no está comprobado,
podríamos rechazar muchas verdades no demostradas. Un diagrama
de Venn, que represente el universo
del conocimiento médico, es de
gran ayuda para ilustrar dicha cuestión (fig. 2). Una parte de dicho universo incluye afirmaciones que sin
duda son ciertas (círculo A). También existe un grupo de afirmaciones que han sido comprobadas (círculo B). La intersección de los círculos A y B (área C) representa las
afirmaciones que han sido comprobadas y que son ciertas, es decir la
información validada que todos los
médicos deseamos. Sin embargo, el
área C obviamente no contiene sólo
verdades; de hecho el área C es una
zona del área A. Precisamente aquí
está el dilema. Si nos limitamos sólo
a las afirmaciones del área C, dejaremos de tener acceso a las afirmaciones veraces que no han sido comprobadas (área D). Sin embargo, si
aceptamos lo no comprobado del
área D, también nos arriesgamos a
utilizar falsas afirmaciones que están fuera del área A. Debemos elegir entre utilizar sólo los datos validados, que pueden ser inadecua-
Conocimiento médico
El decano de la Facultad de Medicina de la Universidad de Cornell
dio una vez la bienvenida a una clase de nuevos alumnos con la siguiente frase: «La mitad de lo que
les vamos a enseñar es falso y la otra
mitad es verdadero. El problema es
que no sabemos qué mitad es verdadera y cuál es falsa». Aunque parece
una broma, en realidad la verdad
que aquí se encierra es muy seria. Si
nos guiamos por lo que ha ocurrido
en la historia, es previsible que mucho de lo que actualmente damos
por cierto cambie o se modifique en
el futuro.
Sabemos que al menos parte de
la información de la que disponemos es errónea. Ante esa circunstancia, ¿qué hay que hacer?. Desde
luego, limitar nuestra práctica a he-
29
dos, o aventurarnos más allá de lo
comprobado y emplear ideas posiblemente incorrectas.
La existencia de verdades no
comprobadas puede atribuirse a la
falta de recursos; es decir, no hay
tiempo ni dinero suficiente para
comprobar todo. El problema es que
incluso con recursos ilimitados todavía habrá algunas afirmaciones
ciertas cuya verdad no pueda establecerse. Esto precisamente fue demostrado en 1930 por Kurt Gödel en
su sorprendente teorema de la «incompletitud».4 Una traducción en
lenguaje común del teorema dice
que «no todas las afirmaciones verdaderas son probablemente verdaderas».
Por lo tanto nos quedan dos opciones poco atractivas: la imperfección por un lado y la inadecuación
por el otro. Sin embargo, todavía
hay que elegir. Recordemos la fábula del asno hambriento, que fue colocado exactamente equidistante a
dos montones de paja; al sentirse
atraído del mismo modo en ambas
direcciones acabó muriéndose de
hambre. En la práctica no podemos
confiar en encontrar para cada caso
la información perfecta. En realidad,
las decisiones hay que tomarlas con
U
A
Verdadero
Verdadero pero
no comprobado
D
B
Comprobado
C
E
Comprobado
y falso
F
Comprobado y
verdadero
Ni verdadero ni
comprobado
Figura 2. Diagrama de Venn que representa el universo (U) del conocimiento médico. El
área A indica todas las afirmaciones verdaderas mientras que el área B representa todas las
afirmaciones que han sido comprobadas. El área C indica todas las afirmaciones validadas
(comprobadas y verdaderas), pero no contiene todas las verdades. Éstas se han perdido en
el área D, que representa las verdades que no han sido comprobadas (verdaderas pero sin
comprobar). El área E indica el conocimiento invalidado, es decir, todas las afirmaciones
comprobadas pero falsas. El área F incluye aquellas afirmaciones que ni son verdaderas ni
han sido comprobadas. El médico que utiliza los conocimientos no comprobados espera que
estén en el área D, aunque de hecho pueden estar en el área F.
Vol 3, N.o 3, Mayo/Junio 2004
153
Medicina basada en evidencias
la información que tengamos a
mano, sabiendo que dicha información a veces es imprecisa. Los métodos de la MBE pueden ayudarnos a
tomar decisiones aun con esta incertidumbre.
Utilización de la medicina
basada en evidencias
Vamos a considerar el caso del
señor Pérez, un paciente con fractura abierta de tibia que fue tratado
con una férula en su hospital local, y
después fue enviado a un traumatólogo interesado en aplicar la MBE.
Dicho médico pensó que el paciente
necesitaba una operación. Sin embargo, no tenía claro si era mejor
realizar una osteosíntesis interna o
una fijación externa. Si nuestra idea
es utilizar un tratamiento sólo cuando se haya demostrado su eficacia
en estudios prospectivos aleatorizados a doble ciego controlados y de
gran escala, ninguna forma de tratamiento será la adecuada, puesto que
dichos estudios no suelen existir. Si
el médico continúa con la férula y
no elige ningún otro tratamiento, en
realidad estaría eligiendo una tercera opción: dejar al paciente con la férula inicial. Es decir, siempre hay
que tomar una decisión. Para realizar una elección con sabiduría y no
dejarla a la suerte, Sackett y Haynes5
aconsejan los cinco pasos fundamentales de la MBE: (1) formular
preguntas que puedan responderse
(2) reunir evidencias, (3) valorarlas,
(4) ponerlas en práctica y (5) evaluar
el proceso.
Primer paso: formular
preguntas que puedan
responderse
Uno no puede consultar la bibliografía y preguntar ¿qué haré con el
señor Pérez?. La pregunta debe
transformarse en otra que pueda responderse. Esto supone en realidad
hacer tres preguntas. ¿Quién es el señor Pérez? ¿Cuáles son las opciones?
¿Qué puede ocurrir si elijo una de las
opciones? Por tanto, formular preguntas que puedan responderse re-
154
quiere definir al paciente, los posibles tratamientos existentes y los mejores resultados.
Para definir al paciente, lo primero que hay que hacer es tener un
diagnóstico. Después se deben identificar las características del paciente
que parezcan relevantes para el tratamiento. Los factores que describen
a un paciente son su edad, sexo, historia clínica y, por ejemplo, la localización de la fractura, el grado de la
lesión y la posible existencia de enfermedades asociadas. Es decir, no
hay estudios que hablen exclusivamente del señor Pérez, sino de pacientes que comparten características
entre sí. Así pues, el médico debe decidir mediante su «experiencia clínica individual» qué características son
importantes. Por ejemplo, la mayoría
de los médicos estaría de acuerdo en
que un estudio de fracturas tibiales
en mujeres adultas sería relevante
para el caso del señor Pérez, mientras
que un estudio de fracturas tibiales
en muchachos pre-adolescentes no lo
sería. Puede parecer obvio que la
edad es más determinante que el
sexo, aunque dicha circunstancia en
realidad expresa una experiencia clínica individual. Es poco probable
que los autores de un estudio sobre
fracturas pediátricas incluyan un aviso explícito de no aplicar sus conclusiones a pacientes adultos.
El siguiente paso consiste en
identificar los posibles tratamientos.
Ésta también es una decisión personalizada, puesto que algunas de las
opciones referidas en la bibliografía
pueden no estar disponibles o no
ser prácticas. Existen circunstancias
que pueden limitar las posibles opciones, como son la escasez de medios, las limitaciones de las habilidades médicas o la presencia de otras
lesiones. El concepto de que «la bibliografía sugiere la técnica X pero
para mis recursos la técnica Y es
mejor» es válido. Desde luego, uno
debe considerar que si sus recursos
no pueden resolver un problema, lo
mejor sería enviar el paciente a otro
médico.
El paso final consiste en definir los
resultados de interés. No todos los
resultados que los investigadores publican son necesariamente aplicables
a la decisión de tratar al señor Pérez.
Un estudio sobre los resultados del
tratamiento de fracturas tibiales puede mencionar el período de consolidación, el de hospitalización, el porcentaje de pacientes que lograron la
consolidación, la incidencia de complicaciones y otros parámetros. La
decisión sobre qué aspectos son importantes y en qué medida, dependerá de cada paciente.
Segundo paso: reunión
de las evidencias
La recopilación de un gran número de artículos sobre una determinada materia es algo relativamente fácil. Sin embargo, reunir «las
mejores evidencias disponibles de
una investigación sistemática»3 puede resultar más difícil. Si se realiza
incorrectamente, una búsqueda bibliográfica puede saturarse de citas
irrelevantes. Esto debe hacernos recordar al lamento del anciano marinero de Coleridge cuando decía: «agua,
agua por todas partes, y ni una gota
para beber». Cuando uno se enfrenta
a un número inmenso de estudios, la
identificación del «mejor» puede ser
una tarea titánica.
Este artículo no pretende enseñar
cómo realizar una búsqueda bibliográfica correctamente; tal vez, ningún
artículo pueda hacerlo. En realidad,
uno adquiere la habilidad para ello
mediante la práctica. En cierta medida, aprender a efectuar búsquedas
bibliográficas se asemeja al aprendizaje de la artroscopia: uno empieza
haciendo un curso, pero después necesita mejorar constantemente.
Tercer paso: valoración
de las evidencias
Los defensores de la MBE dicen
que los médicos deben evaluar las
evidencias médicas del mismo modo
que los jueces los asuntos legales. Esto
nos hace recordar que la valoración de
evidencias médicas es una tarea realizada por seres humanos y sujeta por
tanto a errores (consultar Apéndice en
http://www5.aaos.org/jaaos/pdf/
v12n2a10.pdf). Dicha comparación
Journal of the American Academy of Orthopaedic Surgeons (Edición Española)
30
Joseph Bernstein, MD, MS
con los asuntos legales también pone
de relieve la incoherencia de la opinión de algunos críticos según los cuales la medicina no se basa en evidencias simplemente porque algunas afirmaciones médicas no han sido demostradas de forma perfecta. Después de
todo, la gente no dice que la mayoría
de los asesinos son sentenciados sin
evidencias sólo porque unos pocos hayan sido fotografiados en el momento
de cometer el crimen. Por el contrario,
se acepta que existen varios tipos de
evidencias legales, y que unos son mejores que otros. De hecho, incluso la
identificación mediante testigos y la
confesión son imperfectas. Además,
en la medicina como en el derecho, la
importancia de la materia que hay que
resolver mediante evidencias afecta
directamente al grado de certeza que
sea necesario.6 Por lo tanto, la pregunta no es: «¿Es perfecta la evidencia? La
pregunta debería ser: ¿Cuan buena es
la evidencia?».
En la investigación clínica no todas las fuentes de evidencias se crean
de la misma forma. Si consideramos
los estudios que publican resultados
terapéuticos, la mayoría de los epidemiólogos estarían de acuerdo con la
pirámide de evidencias que se menciona a continuación:
Ensayo controlado aleatorizado
Estudio prospectivo de cohorte
Estudio retrospectivo de cohorte
Estudio de casos-control
Serie de casos
Caso clínico
Opinión de experto
Observación personal
Las características de cada uno de
los tipos mencionados se resumen en
la tabla 1.
La citada pirámide tiene una jerarquía por la que cada apartado de la
lista representa un método supuestamente mejor que el que está por debajo de él. Por ejemplo, un estudio de
cohorte que demuestra X supera a
una serie de casos que demuestre lo
contrario. Sin embargo, también son
legítimas incluso las formas de evidencia de la parte baja de la lista. Por
lo tanto, cuando no existen evidencias, incluso un caso clínico puede
dar legitimidad a una determinada
decisión. Una evidencia débil no significa que haya falta de evidencias.
31
Tabla 1
Definición de los tipos de estudio utilizados en la investigación clínica
Tipo de estudio
Caso clínico
Serie de casos
Casos-control
Cohorte retrospectiva
Cohorte
prospectiva
Ensayo controlado
aleatorizado
Definición
Publicación de un sólo paciente
Publicación de muchos pacientes que han seguido el
mismo tratamiento, pero sin grupo control o grupo
para comparar
Estudio en el que los grupos de pacientes se separan
por la presencia o ausencia de enfermedad, y que
se estudian por la exposición previa a la enfermedad que se considere de interés
Estudio en el que los grupos de pacientes se separan
en razón de su exposición a la enfermedad o de su
tratamiento, pero en los que la exposición ocurre
antes de iniciar el estudio
Estudio en el que los grupos de pacientes se separan
en razón de su exposición a la enfermedad o de su
tratamiento, pero en los que la exposición ocurre
después de iniciar el estudio
Estudio en el que los pacientes se asignan al azar al
grupo de tratamiento o al grupo control, y son seguidos de forma prospectiva
Considerando la jerarquía de evidencias como una pirámide, puede
destacarse una cosa importante: las
mejores formas de evidencia suelen
ser las más raras. Por ejemplo, en una
revisión de una muestra bibliográfica
ortopédica de casi 500 artículos, 33
fueron ensayos controlados aleatorizados, aunque muchos de ellos mos-
traban métodos estadísticamente inadecuados7 (fig. 3).
El ensayo controlado aleatorizado
frente a la serie de casos
Los hallazgos de un ensayo controlado aleatorizado suponen la mejor
forma de evidencia médica. Para apreciar las ventajas de los ensayos contro-
Casos-control
2%
Serie de casos
64%
Cohorte
retrospectiva
8%
Cohorte
prospectiva
1%
Caso clínico
18%
Ensayo
controlado
aleatorizado 7%
Figura 3. Distribución de los diferentes tipos de estudio entre los artículos de un año del
Journal of Bone and Joint Surgery (americano y británico) y del Clinical Orthopaedics and Related
Research.7
Vol 3, N.o 3, Mayo/Junio 2004
155
Medicina basada en evidencias
lados aleatorizados hay que compararlos con métodos peores, como, por
ejemplo, las series de casos. Imaginemos una serie de casos de 50 pacientes
con artrosis de rodilla tratados mediante desbridamiento artroscópico
con resultado exitoso. ¿Demostraría
ésta serie la eficacia de dicha intervención? Tal vez no. Hay que tener en
cuenta que dicho estudio puede ser
erróneo por los siguientes sesgos:
Selección del paciente: Si sólo se
ofreció la intervención a aquellos pacientes de los que se esperaba que
respondieran bien, la eficacia publicada se ha sobrestimado.
Falta de contexto: Se dice que la operación ha sido un éxito, ¿pero comparada con qué? Para decir que un tratamiento es eficaz hace falta como mínimo compararlo con otro grupo tratado de otra forma. Incluso una mejoría
comprobada mediante parámetros
objetivos no es suficiente para indicar
que un tratamiento es realmente eficaz; tal vez la evolución natural de la
artrosis incluye períodos de mejorías
debidas al azar. Para confirmar el valor real del tratamiento debería añadirse un grupo que no haya recibido
tratamiento (ni siquiera un placebo).
Pérdida de datos: Un estudio retrospectivo puede no incluir todos los
pacientes tratados. Pueden perderse
historiales. Además, los pacientes interrogados sobre sus síntomas de
hace años pueden no recordarlos de
forma adecuada.
Exclusiones sutiles: Los estudios retrospectivos de una intervención no
suelen incluir datos de los pacientes
a los que se les aconsejó dicha intervención y que finalmente no aceptaron ser operados. Este hecho también
implica un sesgo. Los pacientes que
estaban demasiado enfermos para
ser operados, y que por tanto fueron
tratados de forma no quirúrgica, fueron excluidos del grupo quirúrgico.
Por tanto, dicha circunstancia también puede afectar a los resultados.
Disonancia cognitiva: Un paciente
que decide operarse y acepta todos
los riesgos de la cirugía puede autoconvencerse de que la operación mereció la pena, incluso sin ser verdad,
para de esa forma validar la decisión
que tomó. Por la misma razón, un cirujano que realiza una intervención
156
puede no ser imparcial a la hora de
valorar su propio trabajo.
La forma de contrarrestar los mencionados sesgos es la realización de un
estudio controlado aleatorizado prospectivo y a doble ciego. En este tipo de
ensayos, los pacientes que cumplen
determinados criterios de inclusión se
asignan a diferentes grupos de tratamiento. Esta distribución arbitraria
evita el sesgo de los resultados derivados de ofrecer el tratamiento sólo a
aquellos pacientes con más probabilidades de responder a él satisfactoriamente. Para que sirva de comparación, hay que crear un grupo de control. Además, la naturaleza prospectiva de los ensayos permite que los investigadores definan por adelantado
las variables de interés, para de esa
forma asegurar que se toman datos de
todos los pacientes. Los sesgos por exclusión pueden corregirse mediante
un «análisis con intención de tratar»,
en el que los pacientes se consideran
en razón del grupo al que fueron asignados y no por el tratamiento que recibieron. Además, el hecho de que el paciente y al investigador desconozcan
el tratamiento realizado (lo que se llama doble ciego) sirve para limitar el
sesgo de los efectos psicológicos.
El valor de los ensayos controlados
aleatorizados precisamente subyace en
su resistencia al sesgo, aunque desafortunadamente no son infalibles. En un
extremo están los ensayos controlados
aleatorizados que parecen demostrar
los beneficios de la homeopatía,8 que
para Park no sólo están en desacuerdo
con los principios de la medicina sino
también en conflicto con las leyes de
la biología, química y física. Es bastante más probable que dichos ensayos sean erróneos o que presenten lo
que se denomina ruido estadístico.
Que p = 0,005 sea el criterio de significación estadística implica que aceptamos a priori un 5% de probabilidades
de que un estudio pueda mostrar diferencias donde en realidad no las hay.
Los ensayos controlados y aleatorizados ofrecen buenas evidencias.
Sin embargo, no son perfectos. Si el
lector tiene dudas al respecto, considere esta anécdota narrada por Skrabanek y McCormick.10 Un paciente
fue incluido en un estudio controlado, aleatorizado, prospectivo y doble
ciego para investigar los efectos de
un determinado fármaco. Un día, de
repente, preguntó a su médico por
qué se le había cambiado la medicación. El médico, sin conocer a qué
grupo había sido asignado el paciente, le contestó que no sabía bien a qué
se refería. A pesar de todo, contestó
al paciente: «¿Qué le hace pensar que
se le ha cambiado su medicación?».
A lo que el enfermo respondió: «Hasta ahora, cuando tiraba las pastillas
por el retrete, se hundían; sin embargo, cuando las he tirado durante esta
semana, flotan».
Estudios de casos-control
Debido a sus limitaciones, los ensayos controlados y aleatorizados pueden no ser la mejor forma de evidencia. De hecho, algunas preguntas son
contestadas mejor por otros métodos.
Para valorar, por ejemplo, el riesgo de
una determinada lesión a largo plazo,
los estudios de casos-control pueden
ser los más adecuados. Si queremos
averiguar si la carrera de larga distancia produce artrosis de cadera, por
ejemplo, sería absurdo crear un ensayo aleatorizado de sujetos, hacerles
correr maratones y, a continuación,
varias décadas después, medir la tasa
de artrosis en ambos grupos. Una forma mejor de contestar a esa pregunta
sería realizar un estudio de casos-control; el investigador recogería los datos de los pacientes que sufren artrosis en el presente y que hacían carreras de larga distancia, y los compararía con los de un grupo de control de
sujetos sin artrosis.
El método de casos-control es sin
duda alguna imperfecto, puesto que
algunos sujetos pueden recordar mejor que otros las circunstancias previas a la presentación de los síntomas. Además, en los casos-control la
relación causa-efecto se sugiere, no
se comprueba. Sin embargo, cuando
entre la exposición a una determinada enfermedad y la presentación de
la misma haya transcurrido mucho
tiempo, o cuando la enfermedad estudiada sea rara, los estudios de casos-control suelen ser los mejores.
Opinión del experto
La opinión de un experto está cerca de la parte inferior de la pirámide
Journal of the American Academy of Orthopaedic Surgeons (Edición Española)
32
Joseph Bernstein, MD, MS
de evidencias, posición que sin duda
tiene un significado metafórico: la
enseñanza de los expertos es la base
sobre las que se apoya el conocimiento. Los buenos estudiantes preguntan a sus profesores y consultan los
libros de texto (no los artículos de las
revistas) cuando quieren comenzar a
estudiar una determinada área de conocimiento. Sin embargo, como forma de evidencia, la opinión de los
expertos está subordinada a la investigación sistemática. De hecho, la historia está repleta de ejemplos en los
que los expertos se equivocaron de
forma impresionante.11 Por ejemplo,
William Harvey fue ferozmente criticado por los «expertos» por su idea
radical de la circulación sanguínea.
Scott12 ha referido que en la cirugía
ortopédica también existen ejemplos
parecidos.
La mejor forma de respaldar algo
es apelar a la autoridad. Por ejemplo, no hace demasiado tiempo muchos argumentos de los psicoanalistas comenzaban así: «Como observó
Freud,…». La cirugía ortopédica se
sustenta en bases más objetivas que
el psicoanálisis, aunque comparte
con él un hecho: que el entrenamiento profesional se realiza en forma de
un aprendiz que trata de imitar a un
maestro. Teniendo en cuenta que solemos aceptar las enseñanzas de los
expertos en cuestiones básicas, puede resultarnos difícil rechazar sus razonamientos cuando especulen con
ellos. Sin embargo, debemos aceptarlos. Una vez más hay que recordar la jerarquía de las evidencias: la
opinión del experto es mejor que la
del que no lo es, pero peor que la derivada de una buena investigación
clínica.
Observación personal
La observación personal es la peor
forma de evidencia. Podemos engañarnos con nuestras propias observaciones, incluso aunque seamos conscientes de ello e intentemos compensarlo. Hay que recordar en primer lugar que las observaciones personales
se basan en pequeñas muestras. Imaginemos un investigador que estudia
la anticoagulación en prótesis totales
de rodilla. Si observa un grupo de 10
pacientes que no reciben medicación
33
y no sufren tromboembolismo, podría erróneamente concluir que los
anticoagulantes no son necesarios.
Sin embargo, si el riesgo de embolia
pulmonar sin profilaxis es por ejemplo del 3%, las probabilidades de que
el médico no vea una embolia en un
grupo de 10 pacientes sin tratamiento son aproximadamente de 3 a 1. Lógicamente, como dicha complicación
es rara, que los anticoagulantes son
necesarios sólo puede deducirse a
partir de grandes series.
Por otro lado, las observaciones
personales son estudios sin control.
Como señalan Redelmeier y Tversky,13
la gente quiere que el mundo tenga
sentido e inventa explicaciones para lo
que quiere ver, independientemente
de que dichas explicaciones sean ciertas. Si un paciente es tratado y queda
bien es humano que crea que se curó
gracias al tratamiento, simplemente
porque la curación siguió al tratamiento. Esto recuerda a la falacia post hoc
ergo propter, que confunde las asociaciones en el tiempo con las relaciones
causa-efecto. Si existiera un grupo de
control para comparar los resultados
sería menos probable cometer errores.
Por último, las observaciones personales están sometidas a sesgos de
recuerdo. Por ejemplo, si no hemos
sido capaces de detectar un sarcoma
sinovial del tibial posterior en un paciente que se torció el tobillo, podemos sobreestimar la posibilidad de
este poco común diagnóstico en los
pacientes que veamos más adelante
con torcedura de tobillo.
Cuarto paso: puesta en
práctica de las evidencias
La correcta realización de la pregunta clínica es importante para valorar las opciones terapéuticas de un
determinado paciente. Una adecuada consulta y valoración de las evidencias nos ayudará a conocer los
posibles resultados de dichas opciones. Para tomar una decisión, el médico simplemente debe elegir la mejor opción de una lista. A veces el
proceso es muy directo; otras puede
resultar más incierto. Las causas de
dicha incertidumbre son básicamente dos. La primera se refiere a las lla-
Vol 3, N.o 3, Mayo/Junio 2004
madas zonas de vacío en las evidencias, por las que el médico se ve obligado a interpolar. La segunda se
debe a que el valor asignado a alguno de los resultados puede ser variable. Es decir, incluso entendiendo
bien desde el punto de vista científico los posibles tratamientos, las incertidumbres y las variaciones suelen abundar.
Imaginemos el siguiente caso: un
atleta de 21 años, con dolor, inflamación y molestias en la interlínea articular 2 días después de torcerse la rodilla. Tras recoger la información y
revisar las evidencias de la historia
clínica, la exploración física, los estudios de imagen y la aspiración de líquido articular, el médico concluye
que el paciente tiene una rotura del
menisco interno en la zona de unión
menisco-sinovial (la denominada
zona roja), sin que haya ninguna otra
lesión.
En ese momento hay tres opciones
terapéuticas posibles: la reparación
meniscal, la meniscectomía y el tratamiento conservador. La forma lógica
de elegir la mejor de ellas es utilizar
un árbol de decisión14 (fig. 4). En dicho árbol, lógicamente, se incluyen
todas las opciones. Las ramas que salen de ellas conducen a unos nódulos
terminales que representan los posibles resultados de una determinada
opción. A cada rama se le asigna un
peso específico proporcional a la probabilidad de que se llegue a un determinado resultado, y a los nódulos
terminales se les asigna valores que
corresponden con los de cada resultado.
La utilidad esperada de una determinada opción terapéutica se puede
calcular computando la media del
peso de los resultados que hacen elegir dicha opción. La utilidad esperada es la suma de los valores de utilidad de cada nódulo terminal (estado
del resultado) multiplicado por la
probabilidad de que dicho resultado
tenga lugar. Por tanto, elegir la mejor
opción terapéutica significa elegir la
opción con un mayor valor esperado.
Para rellenar el árbol de decisión
del ejemplo que estamos analizando,
hay que utilizar la siguiente información hipotética referente a los resultados. Las roturas de la zona roja
157
Medicina basada en evidencias
Meniscectomía
Utilidad =
P1 · UO1
+
P2 · UO2
Rotura meniscal
en zona roja
Reparación
meniscal
Utilidad =
P3 · UO3
+
P4 · UO4
Tratamiento
conservador
Utilidad =
P5 · UO5
+
P6 · UO6
P1
P2
P3
P4
P5
P6
Resultados1
Resultados2
Resultados3
Resultados4
Resultados5
Resultados6
Figura 4. Árbol de decisión simple referente a las opciones y resultados de las roturas meniscales en zona roja. Los recuadros de la derecha representan los resultados del tratamiento. Las líneas que van hacia ellos se han sopesado según la probabilidad de que alcancen un
determinado resultado. P1 es la probabilidad de que se obtenga el resultado1. Para simplificar, sólo se muestran dos resultados por tratamiento, aunque en realidad podrían ser más.
El valor de un tratamiento es P1 · UO1, que es la suma de todos los resultados posibles de un
tratamiento. Px = probabilidad de lograr un resultado. UOx = utilidad del Resultadox.
<1 cm tienen una probabilidad de cicatrizar sin cirugía del 90%. En la población joven, la meniscectomía tiene
una probabilidad de aliviar los síntomas del 99% a las 6 semanas, aunque
también tiene un 40% de probabilidades de que aparezca artrosis a los
10 años. La reparación de una zona
meniscal roja tiene un 75% de probabilidades de éxito. Puede parecer que
con dichos datos podríamos hacer la
selección del mejor tratamiento; sin
embargo, realmente nos falta la información más importante. Es decir,
la valoración del paciente de los posibles resultados. De hecho, los valores que los pacientes relacionan con
los resultados suelen variar.
En el caso de la rotura meniscal en
zona roja, podría considerarse que la
reparación meniscal es la elección
más adecuada. Sin embargo, imaginemos la actitud de un estudiante de
un equipo de baloncesto de instituto
158
que quiere jugar el campeonato nacional dentro de 2 meses. Es probable
que la casi certeza de que a las 6 semanas de la meniscectomía podrá
volver a jugar puede inducirle a olvidar el riesgo de artrosis y a dar demasiada importancia a los beneficios
de la meniscectomía. Por el contrario,
un paciente cuyo padre haya muerto
durante una intervención quirúrgica
puede valorar en exceso el tratamiento conservador, incluso poniendo en
riesgo su propia rodilla.
Teniendo en cuenta que muchas
intervenciones de cirugía ortopédica
se hacen para aliviar los síntomas, el
factor más importante para recomendar una intervención suele ser la
utilidad que se asigna al posible resultado de un determinado tratamiento. A veces es difícil encontrar
dicha utilidad. Para ello hay que estar seguro de que todos los resultados se presentan sin sesgo y que los
valores de utilidad se recogen de
forma correcta. Hay que emplear
una escala en la que todas las posibilidades puedan estar expresadas.
Por ejemplo, «muerte perioperatoria» y «capacidad de caminar los 18
hoyos de un campo de golf» son algunos de los resultados que tienen
interés cuando se va a realizar una
prótesis total de cadera. Aunque parezca que dichos resultados no son
comparables, los pacientes arriesgarán la vida para poder jugar al golf.
El paciente también puede tener
aversión al riesgo y no tener en
cuenta la utilidad futura en su valor
neto actual. Así pues, el tratamiento
«apropiado» de una rotura meniscal
periférica dependerá de las preferencias del paciente, incluso aunque
existan evidencias de un buen resultado. Por eso, pueden realizarse más
intervenciones de columna lumbar
en Santa Bárbara que en el Bronx,
simplemente porque los ciudadanos
de cada barrio tienen diferentes valores de utilidades y diferentes preferencias personales. No hay que olvidar que también puede haber otras
explicaciones.
Por otro lado, la lista de las evidencias de los resultados de las roturas
meniscales tiene zonas vacías. No
existe información sobre el tamaño de
las roturas de los pacientes, ni sobre
la precisión de un cálculo aproximado basado en los estudios de imagen.
Se sabe cuál es la tasa de cicatrización de las roturas <1 cm, ¿pero es
dicha tasa 0 para las roturas más
grandes o depende del tamaño de la
rotura? ¿Qué pasa si el tejido no cicatriza?. Por último, ¿cuáles son las
complicaciones de la cirugía, y qué
probabilidades hay de que ocurran?
Para tomar una decisión acertada
en este caso hacen falta más datos,
de forma que el árbol de decisiones
resultará más complejo que el que
se muestra en la figura 4. Por ejemplo, hay que ampliar el resultado
para cuando fracase el tratamiento
conservador, puesto que la meniscectomía o la reparación meniscal
pueden intentarse si el tratamiento
conservador no funciona. También
hay que considerar la opción quirúrgica de la artroscopia diagnóstica, puesto que puede ocurrir que se
Journal of the American Academy of Orthopaedic Surgeons (Edición Española)
34
Joseph Bernstein, MD, MS
encuentre una pequeña rotura y se
opte por no realizar la reparación
meniscal, o que se encuentre una
rotura irreparable y se decida realizar finalmente una meniscectomía.
Por último, las variables dicotómicas, como los términos «cicatrizado» o «fallo de la reparación» son
en realidad grados de una misma línea continua.
El ejemplo mencionado demuestra que incluso un caso aparentemente sencillo y con muchos datos referentes a los resultados puede ser
complejo. En palabras de Eddy, se
podría decir que «excede en mucho a
la capacidad mental humana».15 Hasta que aparezcan métodos que permitan discernir el deseo de los pacientes y se inventen recomendaciones para aplicar sus preferencias, las
evidencias médicas recogidas no serán de gran utilidad.
Quinto paso: valoración
del proceso
La valoración del rendimiento es
esencial para la práctica de la MBE,
aunque puede tener sus problemas.
La mayor dificultad reside en que
tradicionalmente la valoración se ha
basado en observaciones personales,
y por tanto dicha evidencia está sujeta
a sesgo. Además, uno puede liarse
con la estadística cuando trabaja con
números pequeños. A causa de las
limitaciones de la observación personal, es mejor realizar la valoración
como parte de un esfuerzo conjunto.
Por ejemplo, la utilización de un registro de intervenciones de artroplastias articulares puede ser de
gran ayuda. Incluso la recogida de
datos de organizaciones médicas
pueden proporcionar una retroalimentación positiva útil. Imaginemos
un médico de atención primaria que
no manda ni un solo estudio de densitometría ósea al año. La revisión de
la utilización de datos de dicho médico podría sugerir que no está prestando suficiente atención a la prevención de la osteoporosis. Por eso,
en el proceso de valoración es importante estimular la cooperación
entre médicos, con el fin de alcanzar
el éxito.
35
Resistencia a la medicina
basada en evidencias
La resistencia a la práctica de la
MBE suele verse entre médicos que
conocen su teoría pero no la practican. Dichos médicos pueden estar
molestos por creer que la práctica de
la MBE exige un alto nivel de conocimientos matemáticos. Sin embargo,
en realidad, la MBE no precisa de un
especial manejo de los números. El
médico que practique la MBE no necesita ser estadístico; sólo debe saber
cómo utilizar lo que los estadísticos
producen. La analogía de Greenhalgh dice que no se pide a los médicos que fabriquen coches, sino sólo
que sepan conducirlos.16
Mayor resistencia pueden presentar los médicos que piensan que la
MBE es un pretexto que limita su autonomía profesional, es decir, los que
piensan que bajo las normas de la
MBE los médicos quedan reducidos
a ser meros autómatas. Imitando los
hechos de Nottinghamshire en el siglo XIX, en los que los Luditas rompieron los telares de algodón para
proteger sus empleos, tales médicos
pueden menoscabar la MBE aduciendo que detiene el progreso.
También es importante tener en
cuenta las resistencias de los médicos
bien intencionados que consideran
que la MBE no es práctica. Dichas resistencias son legítimas, puesto que
los médicos tienen cada vez menos
tiempo libre, por lo que la lectura y
valoración de la bibliografía les hace
consumir mucho tiempo. Por ejemplo, en el año 2000, MEDLINE citó
479 artículos sólo de la revista Spine.
La mirada superficial de dicha revista puede consumir más tiempo del
que disponen los médicos para la lectura. Los creadores de la MBE conocen tal dificultad y por ello animan a
grupos de médicos a realizar revisiones sistemáticas, de forma de que de
dichas revisiones se extraiga directrices prácticas. Una revisión sistemática no es aquélla en la un experto presenta su punto de vista y lo apoya en
la bibliografía. Por el contrario, se
trata de una recogida de bibliografía
según un esquema organizado para
después valorarla en comparación
con un determinado estándar. Es de-
Vol 3, N.o 3, Mayo/Junio 2004
cir, una revisión sistemática no necesariamente debe ser escrita por un
experto, y de hecho no debería ser
así.
De las revisiones sistemáticas lógicamente se extraen directrices. Una
directriz basada en una revisión sistemática satisface los tres primeros
pasos de la MBE: la formulación de
una pregunta que pueda responderse, la recogida de evidencias y su valoración. Ofrecen a los médicos una
revisión completa, sin obligarles a
consultar personalmente la bibliografía primaria. La clave es que la directriz debe ser suficientemente sólida como para tener en cuenta las variaciones de diferentes médicos y las
preferencias de los pacientes. Como
contrapartida, los médicos no podrán aplicar sus directrices de forma
rígida. Como mencionó en el siglo
XIV el cirujano francés Henri de Mondeville: «cualquiera que crea que la
misma cosa puede ser buena para
todo es un gran idiota, puesto que la
medicina no la practica la humanidad en general sino un médico en
particular».17
Resumen
La MBE puede simplemente parecer una frase nueva; sin embargo, se
sustenta en un viejo concepto: es un
asunto de resultados empíricos. La
idea la inició hace 100 años el cirujano ortopédico Codman, destacando
la medición de los resultados finales.
De hecho, los métodos de la MBE se
utilizaron ya en el siglo XIX en París,
cuando las sangrías fueron desacreditadas por Pierre Louis. Louis llevó
a cabo lo que el New York Times describió como uno de los primeros ensayos clínicos: «Trató a gente con
neumonía mediante sangría precoz y
agresiva o mediante medidas menos
agresivas; al final del experimento, el
Dr. Louis contó los cadáveres y encontró que había más en la fosa donde se enterró a los de las sangrías que
en la otra».18 Dicho resultado (y no
ninguna reserva teórica) fue lo que
hizo que se abandonaran las sangrías
de la práctica médica.
A pesar de su venerable árbol genealógico, la MBE está obligada a res-
159
Medicina basada en evidencias
ponder a las demandas contemporáneas. La proliferación de información,
en primer lugar por la expansión de
Internet,19 pero también por la expansión de las revistas tradicionales, hace
que el médico tenga que hilvanar la
recogida y valoración de la información. El problema no es la falta de datos sino su exceso. Necesitamos dar
sentido a un mar de información, y la
MBE tal vez pueda hacerlo.
Por último, hay que tener en cuenta los límites científicos. El dramaturgo Berthold Brecht (que casualmente
fue estudiante de medicina) escribió:
«El objetivo principal de la ciencia no
es abrir una puerta de infinito deseo;
es poner un límite a un error infinito» (La vida de Galileo). Así pues,
cuando decimos que la MBE se basa
en la ciencia lo que queremos decir
no es que la MBE sea una estrategia
para tener razón todo el tiempo (la
ciencia no puede darla), sino que es
una herramienta para disminuir las
probabilidades de equivocación. Probablemente el objetivo de reducir al
mínimo el error está a nuestro alcan-
Agradecimientos: A Kevin Freedman, MD, Kirsten Hickerson, MSN y
Kames Bernstein por sus comentarios.
Mis pensamientos con respecto a la
MBE estuvieron influidos directamente por cuatro libros10,15,16,20 e indirectamente, pero no menos, por el libro de
Douglas Hofstadter titulado Gödel Escher Bach.4 Agradezco a la OREF y a
Zimmer (Warsw, IN) su Premio para
el Desarrollo de Carrera Quirúrgica.
8. Linde K, Melchart D: Randomized controlled trials of individualized homeopathy: A state-of-the-art review. J Altern
Complement Med 1998;4:371-388.
9. Park RL: (ed): Voodoo Science: The Road
From Foolishness to Fraud. New York, NY:
Oxford University Press, 2000.
10. Skrabanek P, McCormick J: (eds): Follies
and Fallacies in Medicine. Buffalo, NY:
Prometheus Books, 1990.
11. Hellman H: (ed): Great Feuds in Medicine:
Ten of the Liveliest Disputes Ever. NewYork,
NY: John Wiley and Sons, 2001.
12. Scott WN: Preface, in Insall JN, Scott
WN(eds): Surgery of the Knee, ed 3. New
York, NY: Churchill Livingstone, 2001, p
xiii.
13. Redelmeier DA, Tversky A: On the belief that arthritis pain is related to the
weather. Proc Natl Acad Sci USA 1996;
93:2895-2896.
14. Bernstein J: Decision analysis. J Bone Joint
Surg Am 1997;79:1404-1414.
15. Eddy DM: (ed): Clinical Decision Mak-ing:
From Theory to Practice. Sudbury, MA:
Jones and Bartlett, 1996.
16. Greenhalgh T: (ed): How to Read a Paper:
The Basics of Evidence Based Med-icine,
ed 2. London, England: BMJ Books,
2001.
17. Skrabanek P: Fat heads. National Review
1995;47:43.
18. Patterson K: What Doctors Don’t Know
(Almost Everything). New York Times.
May 5, 2002:6,74.
19. Beredjiklian PK, Bozentka DJ, Steinberg
DR, Bernstein J: Evaluating the source and
content of orthopaedic information on the
Internet: The case of carpal tunnel syndrome. J Bone Joint Surg Am 2000;82:15401543.
20. Guyatt G, Rennie D: (eds): Users’ Guides
to the Medical Literature: A Manual for Evidence-Based Clinical Practice. Chicago, IL:
American Medical Association Press,
2002.
ce. En realidad, su búsqueda es responsabilidad nuestra.
Bibliografía
2. Lalwani SI, Olive DL: Problems withevidence-based medicine. J Am Assoc Gynecol Laparosc 1999;6:237-240.
2. Dartmouth Medical School: The Dartmouth Atlas of Musculoskeletal Health Care.
Chicago, IL: AHA Press, 2000.
3. Sackett DL, Rosenberg WM, Gray JA,
Haynes RB, Richardson WS: Editorial:
Evidence based medicine: What it is and
what it isn’t. BMJ 1996;312:71-72.
4. Hofstadter DR: (ed): Gödel, Escher, Bach:
An Eternal Golden Braid. New York, NY:
Basic Books, 1999.
5. Sackett DL, Haynes B: On the need for
evidence based medicine. Evidence-Based
Med 1995;1:4-5.
6. Pauker SG, Kassirer JP: The threshold
approach to clinical decision making. N
Engl J Med 1980;302:1109-1117.
7. Freedman KB, Back S, Bernstein J: Sample size and statistical power of randomised controlled trials in orthopaedics.
J Bone Joint Surg Br 2001;83:397-402.
160
Journal of the American Academy of Orthopaedic Surgeons (Edición Española)
36