Download Big Data Aportando valor a los datos de Aportando valor a

Document related concepts
no text concepts found
Transcript
Big Data
Aportando valor a los datos de
salud
3 de octubre de 2014
Pablo Serrano Balazote
Dirección General de Sistemas de Información
Consejería de Sanidad. Comunidad de Madrid
Agenda
 Big data en atención sanitaria
 Experiencias con grandes
d volúmenes
l
d
de d
datos y
analítica avanzada
Big Data
 Capacidad de procesar grandes volúmenes de datos
con el p
propósito
p
de generar
g
conocimiento de ellos
 La cantidad de datos aumenta de forma exponencial
desde múltiples fuentes:
 En sanidad la p
principal
p es la Historia Clínica Electrónica
(todos los sistemas de información sanitarios con identificación del
sujeto)
Reutilización ‒uso secundario
secundario- de la información registrada en la
atención sanitaria ‒uso primario-.
 Registro de Salud Personal del paciente
 Conexión d
de los
l objetos:
b
datos
d
d
de salud
l d y cuidados
d d ubicuos
b
 Redes sociales: comunicarse sobre bienestar, salud y atención
Situación actual y potencial
 desarrollado en muchos sectores de la ciencia y la
economía
 se ha empezado a aplicar en la atención sanitaria
 experiencias
p
con p
propósitos
p
de
 investigación
 comerciales
 ha generado expectativas
 transformación de la forma de adquirir conocimiento
 motor
t d
de la
l innovación
i
ió d
de la
l atención
t
ió sanitaria
it i
 es necesario que se
 identifiquen los usos apropiados
 demuestre el valor en casos concretos
Aplicaciones del Big Data
Reutilización de la historia clínica electrónica
 Investigación clínica
 transformar
t
f
los
l métodos
ét d tradicionales
t di i
l
 grandes cohortes con datos de múltiples dimensiones
 Epidemiología
 registros de morbilidad
 Evaluación y calidad asistencial
 efectividad,, resultados de la asistencia,,
 Utilización de recursos
 comparaciones, ajustes de riesgos, asignación de financiación
 Innovación en la atención sanitaria
 nuevas modalidades de asistencia
A áli i sociales:
Análisis
i l incorporar
i
ell punto de
d vista
i
de
d los
l pacientes
i
 percepción, consejos de pacientes
Marco regulatorio
Uso secundarios de información clínica
 Protección de datos
 Confidencialidad de los datos de salud
¿suficiente la anonimización?
 Utilidad: justificación
 Comités éticos de la investigación
¿evaluarlos como proyectos?
 Modelo de negocio
 Retorno económico
¿cómo un biobanco?
 Gobernanza
 Código ético, seguridad, normalización, arquitectura, responsabilidades
 Trasparencia
 Comunicación a la sociedad
 Destinatarios: investigadores, profesionales y pacientes
Desafíos del significado clínico
 interoperabilidad semántica
Compartir y combinar con pleno significado los datos de la historia de
salud
l d entre
t los
l sistemas
i t
heterogéneos
h t
é
 inferencia
Implementación y utilización segura de alarmas y vías clínicas
informáticas por los sistemas de HCE
 usos secundarios
Asegurar
segu a la
a necesaria
ecesa a ca
calidad
dad y co
consistencia
s ste c a de los
os datos pa
para
a pe
permitir
t
el uso fiable y con significado
Big data
Respuestas al desafío
Normalizar la captura, recuperación y
comunicación
ó de
d los
l d
datos clínicos
lí
(HCE)
( C )
 Modelos de referencia genéricos
UNE-EN-ISO 13606 parte 1
 Arquetipos
Representación formal del conocimiento de dominio en
la HCE
 Sistemas de terminología clínica
SNOMED CT,
CT MedDRA…
M dDRA
Agenda
 Big data en atención sanitaria
 Experiencias con grandes
d volúmenes
l
d
de d
datos y
analítica avanzada
S. Farmacia
Repositorio de información clínica normalizado
para Usos secundarios
HC federada ISO EN 13606
Combinación de medicación de dos
orígenes de datos
Procesamiento del lenguaje natural y Alergias
“Contrastar la viabilidad del procesamiento del
lenguaje natural para el tratamiento de los registros
de antecedentes alérgicos en AP-Madrid como
método para Normalizar y etiquetar con SNOMED
SNOMED”
A t
d t
Antecedente
alérgico
PLN
g
Antecedente alérgico
Normalizado y
etiquetado
diciembre de 2014
Etiquetado con
SNOMED/Nomenclátor
Página 12
Procesamiento del lenguaje natural y Alergias
Lecciones aprendidas
 Hemos conocido el significado que actualmente los
médicos incluyen sin estructura sobre alergias
 Lo compararnos con el que habíamos definido
previamente en el Modelo Alertas
 Concuerda con el modelo de información definido
 Confirma la necesidad de ampliar la definición del modelo a un
conjunto de arquetipos
 Necesidad de expresar la exclusión y la ausencia de información
 La validez es insuficiente para la minimización de riesgos a
nivel de paciente
Medidas poblacionales de casuística
Combinación
de fuentes datos
Medidas poblacionales de casuística
Volúmenes
V
lú
d
de
datos
A. Primaria
A Especializada
A.
Hospitalización
CMA
HDM
CEX
Urgencias
Farmacia Receta
Farmacia Hospital
Total
Pacientes únicos
Código diagnóstico diferente
Código procedimiento diferente
Código ATC diferente
Contactos
472.908
492 789
492.789
14.981
8.633
17.380
424 527
424.527
27.268
163.526
12.729
965.697
177.709
3.913
951
1.306
2011
Diagnósticos Procedimientos
472.908
0
601 364
601.364
276 745
276.745
100.822
83.894
18.820
11.655
30.849
47.973
417 913
417.913
133 224
133.224
32.960
0
1.074.272
276.745
ATC
2.453.675
701.274
3.154.949
Nivel de estructuración de datos
NIVEL I
(estructurada, normalizada,
validez/fiabilidad estudiada)
CMBD
Farmacia. Receta
Farmacia Hospital
NIVEL II
(estructurada, normalizada,
validez/fiabilidad no estudiada )
Codificación Primaria: CIAP
Codificación A Especializada
NIVEL III
(estructurada y no normalizada)
Formularios
Resultados laboratorio
NIVEL IV
(lenguaje natural y contexto
estructurado )
Informes clínicos, Anotaciones
Minería de
datos
Información
de salud
relevante
Información clínica para el uso secundario
 Anonimizada: cuestión de grado
• psuedoanonimazada
• agregada
 Estructurada y normalizada
• modelo de referencia, arquetipos y terminologías
 Combinada: orígenes heterogéneos
• con máximo
á
significado
f d
 Relacionada: identificadores de caso
• ell mayor valor
l d
de nuestro
t SNS
 Enlazada: razonamiento clínico
• indicado por
 Temporal:
• persistencia y evento
Conclusiones
 Datos
 Métodos
 Inferencia
 Aplicaciones
all data
mas que big
análisis tradicionales
y avanzados
d
generar hipótesis
g
p
descriptivos
correlaciones no causalidad
correlaciones,
conocer mejor la realidad
acelerar
l
lla innovación
i
ió