Download Una Aplicación de la Regla de Bayes en Ciencias de la Salud

Document related concepts
no text concepts found
Transcript
XXVI Simposio Internacional de Estadística 2016
Sincelejo, Sucre, Colombia, 8 al 12 de Agosto de 2016
Una Aplicación de la Regla de Bayes en Ciencias de la Salud
An Application of Bayes' Rule in Health Sciences
1, a
Yeider Mercado Pérez
2, b
, Juana Robles Gonzalez
1 Departamento de Matemáticas y Estadística, Facultad de Ciencias Básicas, Universidad de Córdoba,
Montería, Colombia
Resumen
En este trabajo se estimara la sensibilidad, especicidad, valores predictivos, razón de verosimilitud
y con estos resultados encontraremos la curva de Roc (acrónimo de Reciever Operating Characteristic), la cual es una representación gráca de la sensibilidad frente a 1-especicidad, para un sistema
clasicador binario, para ello utilizamos los teoremas de Bayes, Probabilidad Total y Probabilidad
del suceso contrario en un suceso condicionado, así poder calcular las probabilidades positivas y negativas, y sus respectivos valores predictivos para cada prevalencia, con el n de detectar si a cierta
población a la que se le aplica un diagnostico posee o no la enfermedad y en que grado la tienen cada
uno de los individuos.
Palabras clave : Sensibilidad, Especicidad, Curva de Roc, Verosimilitud.
Abstract
In this paper, the sensitivity, specicity, predictive values, likelihood ratio and with these results
we nd the curve Roc (acronym for Reciever Operating Characteristic), which is a graphical representation of the sensitivity versus 1-specicity for a stimulated system binary classier, for we use
theorems Bayes Probability Total and Probability of the opposite event in a conditioned event, so we
can calculate the positive and negative probabilities, and their predictive values for each prevalence,
in order to detect whether a certain population to which is applied a diagnosis has the disease or not
and to what extent have each of the individuals.
Key words : Sensitivity, specicity, Roc curve, Verisimilitude.
a Estudiante Estadística. E-mail: [email protected]
b Profesor Titular. E-mail: [email protected]
1
2
Yeider Mercado Pérez & Juana Robles Gonzalez
1. Introducción
La Estadística es en la actualidad un elemento esencial de los conocimientos en todas las áreas del
saber. La medicina es una ciencia estadística, pues siempre se trabaja con la probabilidad de enfermar
y con la oportunidad incierta del diagnóstico y del tratamiento. Es natural y conveniente el uso de la
estadística en deniciones y discusiones en ciencias de la salud. En algunos casos, el uso de notación y
terminología estadística es inevitable. el Teorema de Bayes es una proposición, que expresa la probabilidad
condicional de un evento aleatorio A dado B en términos de la distribución de probabilidad condicional
del evento B dado A y la distribución de probabilidad marginal de sólo A. El Teorema de Bayes es de
considerable importancia en ciencias de la salud, es especialmente utilizado en el calculo de probabilidades
diagnósticas, en este caso para calcular la sensibilidad, especicidad y valores predictivos.
2. Metodología
Se hace una encuesta a una población la cual cuida a enfermos en sus casas, esto con el n de medir
el estrés que manejan estos cuidadores, ya obtenidos estas escalas procedemos a encontrar los valores
verdaderos positivos(Vp ), falsos positivos(Fp ), falsos negativos(Fn ), verdaderos negativos(Vn para formar
la tabla de contingencia o la matriz de confusión (2*2) y con esta matriz utilizamos los de Teoremas
de Bayes, de la probabilidad total y Probabilidad del suceso contrario en un suceso condicionado, esto
con el n de calcular las probabilidades positivas y negativas,y sus respectivos valores predictivos para
cada prevalencia, sensibilidad, especicidad y demás valores que son de nuestro interés, para así poder
llegar a nuestro resultado nal que es la curva de ROC, ya que esta curva nos muestra la efectividad del
diagnostico.
3. Marco Teórico
3.1. Error tipo I y Tipo II
Un modelo de clasicación (clasicador o Clasicadores(matemático) o Diagnóstico) es una función
que permite decidir cuáles de un conjunto de instancias están relacionadas o no pertenecen a un mismo
tipo o clase. Consideremos un problema de predicción de clases binario, en la que los resultados se
etiquetan positivos (p) o negativos (n). Hay cuatro posibles resultados a partir de un clasicador binario
como el propuesto. Si el resultado de una exploración es p y el valor dado es también p, entonces se
conoce como un Verdadero Positivo (Vp ); sin embargo si el valor real es n entonces se conoce como un
Falso Positivo (Fp ). De igual modo, tenemos un Verdadero Negativo (Vn ) cuando tanto la exploración
como el valor dado son n, y un Falso Negativo (Fn ) cuando el resultado de la predicción es n pero el valor
real es p.
De lo anterior se puede denir un experimento a partir de P instancias positivas y N negativas. Los cuatro
posibles resultados se pueden formular en una tabla de contingencia (o una matriz de confusión 2 ∗ 2):
verdaderos positivos(Vp )
falsos negativos(Fn )
falsos positivos(Fp )
verdaderos negativos(Vn )
3.2. Sensibilidad
La sensibilidad nos indica la capacidad de nuestro estimador para dar con casos positivos los casos realmente enfermos; proporción de enfermos correctamente identicados. Es decir, la sensibilidad caracteriza
la capacidad de la prueba para detectar la enfermedad, la sensibilidad se dene como:
Sensibilidad =
Vp
V p + Fn
XXVI Simposio de Estadística (2016)
Una Aplicación de la Regla de Bayes en Ciencias de la Salud
3
Donde Vp , es verdaderos positivos y Fn , falsos negativos.
3.3. Especicidad
La especicidad nos indica la capacidad de nuestro estimador para dar como casos negativos los casos
realmente sanos; proporción de sanos correctamente identicados. Es decir, la especicidad caracteriza la
capacidad de la prueba para detectar la ausencia de la enfermedad en sujetos sanos, La especicidad de
una prueba representa la probabilidad de que un sujeto sano tenga un resultado negativo en la prueba.
La especicidad se dene como:
Especif icidad =
Vn
V n + Fp
Donde Vn , serian los verdaderos negativos y Fp , los falsos positivos.
3.4. Valores Predictivos
Los valores predictivos miden la ecacia real de una prueba diagnostica. Son probabilidades del resultado, es decir, dan la probabilidad de padecer o no una enfermedad una vez conocido el resultado de
la prueba diagnostica. Se trata de valores post-test y dependen de la pre valencia de una enfermedad,
es decir, del porcentaje de una población que ésta afectada por esa determinada patología. Estos valores
predictivos son útiles, por que son indices que evalúan el comportamiento de la prueba diagnóstica en
una población con una determinada proporción de enfermos por lo que sirven para medir la relevancia
de la sensibilidad y especicidad en una determinada población.
3.4.1. Valor Predictivo Positivo
El valor predictivo positivo (VPP) de una prueba diagnóstica es la probabilidad que tiene una persona
con al prueba diagnóstica positiva de tener la enfermedad. Este indice se calcula de la siguiente manera:
V PP =
V erdaderos positivos (Vp )
V erdaderos positivos (Vp ) + F alsos positivos (Fp )
3.4.2. Valor Predictivo Negativo
El valor predictivo negativo (VPN) de una prueba diagnóstica es la probabilidad que tiene una persona
que ha resultado negativa en la prueba diagnóstica de no tener la enfermedad. Este indice se calcula de
la siguiente manera:
V PN =
V erdaderos negativos (Vn )
V erdaderos negativos (vn ) + F alsos negativos (Fn )
3.5. Razones de Verosimilitud
3.5.1. Razón de Verosimilitud Positiva
Esta relación indica a qué punto una persona tiene más posibilidades de ser positivo en la realidad
cuando la prueba es que está diciendo es positivo. Tenemos
RV + =
Sensibilidad
1 − especif icidad
XXVI Simposio de Estadística (2016)
4
Yeider Mercado Pérez & Juana Robles Gonzalez
3.5.2. Razón de Verosimilitud Negativa
Esta relación indica a qué punto una persona tiene más posibilidades de ser negativo, en realidad,
cuando la prueba es que está diciendo es positivo. Tenemos
RV − =
1 − sensibilidad
especif icidad
3.6. Curva ROC
En la teoría de detección de señales una curva ROC (acrónimo de Reciever Operating Characteristic,
o Característica Operativa del Receptor) es una representación gráca de la sensibilidad frente a (1especicidad) para un sistema clasicador binario según se varía el umbral de discriminación. ROC
también puede signicar Relative Operating Characteristic (Característica Operativa Relativa) porque
es una operación de dos características operativas (Vp y Fp ) donde Vp es(verdaderos positivos) y Fp es
(falsos positivos). El análisis de la curva de ROC, o simplemente análisis ROC, Proporciona herramientas
para seleccionar los modelos posibles óptimos y descartar modelos subóptimos independientemente de (y
antes de especicar) el coste de la distribución de las dos clases sobre las que se decide.
4. Resultados
De lo anterior y obteniendo los datos de la encuesta hecha previamente a las personas que cuidan a
enfermos se tiene la matriz (2*2)
Vp = 20
Fn = 5
Fp = 21
Vn = 24
De esta manera quedan representados los resultados obtenidos en la encuesta, con los cuales vamos a
calcular la Sensibilidad y Especicidad.
Sensibilidad =
Especif icidad =
Vp
20
= 0.8
=
V p + Fn
20 + 5
Vn
24
= 0.53
=
Vn + Fp
24 + 21
Luego ya obtenidos los datos calculamos los valores predictivos positivo y negativo para nuestra prueba
diagnóstica.
V PP =
20
20
=
= 0, 4878
20 + 21
41
V PN =
24
24
=
= 0, 8275
24 + 5
29
ya calculada la sensibilidad y especicidad, obtenemos las razones de verosimilitud tanto positiva como
negativa.
RV + =
0, 8
= 1, 70
1 − 0, 53
RV − =
1 − 0, 8
= 0, 377
0, 53
Con los resultados anteriores es de nuestro interés encontrar la curva ROC
XXVI Simposio de Estadística (2016)
Una Aplicación de la Regla de Bayes en Ciencias de la Salud
5
5. Conclusiones
La sensibilidad implica que el 80 % de nuestra población en estudio padecen la enfermedad del cuidador, es decir que esta población tiene estrés. la especicidad quiere decir que el 53 % de nuestra población
en estudio se encuentran sanos, no padecen de estrés. Los valores predictivos positivos y negativos, quiere
decir que una persona a la cual se la halla aplicado la prueba diagnóstica tiene el 48, 78 % de tener la
enfermedad del cuidador y que una persona a la cual le hallamos aplicado la prueba diagnóstica tiene
82.75 % de no tener la enfermedad del cuidador. Ahora para las razones de verosimilitud, tenemos que
como la razón positiva es mayor que 1 quiere decir que la probabilidad aumenta y para la razón negativa
es menor que 1 lo que quiere decir que dicha probabilidad disminuye, es decir que mientras una aumenta
la otra disminuye. Esta curva es regular, ya que se encuentra en un punto medio del plano, es decir que
proporciona un buen indice de la capacidad para la prueba diagnostica.
6. Referencias
• Vitaliano PP, Young HM, Russo J. Burden: a review of measures used among caregivers of indivi-
duals with dementia. Gerontologist. 1991;31:67-75.
• García-Calvente MM, Mateo-Rodríguez I, Maroto-Navarro G. El impacto de cuidar en la salud y
calidad de vida de las mujeres. Gac Sanit. 2004;18 Supl 2:83-92.
• Fajardo-Gutíerres Et. Al. Utilidad de las curvas de sensibilidad y especicidad conjunta en la
aplicación de una prueba diagnóstico. Salud Pública de México. 1994; 36: 311-317.
• Díaz , C., y de la Fuente, I. (En prensa). Assessing psychology students' diculties with conditional
probability and Bayesian reasoning, Trabajo aceptado para presentar en ICOTS-7. International
Conference on Teaching Statistics. Salvador (Bahia), Brasil, 2006
• Falk, R. (1989). Inference under uncertainty via conditional probability. En R. Morris (Ed.), Studies
in mathematics education, vol. 7, (pp. 175 ? 184), Paris: UNESCO.
• Díaz, C. y de La Fuente, I. (2006). Enseñanza del teorema de Bayes con apoyo tecnológico. En P.
Flores; J. Lupiáñez (Eds.), Investigación en el aula de matemáticas. Estadística y azar. Granada:
Sociedad de Educación Matemática Thales. CD ROM.
• Batanero, C. (2001). Didáctica de la estadística. Granada: Universidad de Granada.
XXVI Simposio de Estadística (2016)