Download Un desafío latente para IT: añadir predicción y precisión al

Document related concepts

Diagnósticos asistidos por ordenador wikipedia , lookup

Imagen médica wikipedia , lookup

Radiología wikipedia , lookup

Técnico en radiología wikipedia , lookup

Tomografía axial computarizada wikipedia , lookup

Transcript
1
Un desafío latente para IT: añadir predicción y
precisión al diagnóstico de imágenes médicas.
Javier E. Barthe – [email protected]
Profesor: Ana Darcacha – [email protected]
Fecha Presentación: 11/07/2013

Abstract- Este trabajo describe un problema cotidiano con el
que nos encontramos cada uno de nosotros en el momento en el
cual sufrimos una lesión o malestar y la misma requiere de una
imagen médica como método de diagnóstico. Dependiendo del
centro y de la infraestructura implementado por cada uno, será
la calidad final de la imagen la cual al ser analizada por el
profesional podrá en base a esta brindar una mejor o peor
perspectiva de la misma. Se describen soluciones informáticas ya
existentes como lo son herramientas de minerías de datos, PACS,
bases de datos multimedia y ficheros DICOM.
Estas
herramientas son la base de acción para formar una nueva
solución final que busca obtener las imágenes relacionadas a un
diagnostico dado para así, de esta manera, el profesional podrá
comparar entre las distintas imágenes y obtener una perspectiva
mejor. Teniendo como base una base de datos multimedia esta
solución se vuelve dinámica y escalable, abierta a nuevos
requerimientos de los usuarios. Este trabajo pretende convertirse
en al menos un relevamiento de viabilidad para las empresas del
rubro de la salud ya sean privadas como públicas.
Index Terms- Sistemas PACS, Estándar DICOM, Diagnostico
Medico, Imágenes Médicas, Minería de Datos, Búsquedas
Avanzadas,
Cluster,
Arquitectura Web,
Fluoroscopía,
Resonancia Magnética, Tomografía, Ultrasonido, Radiografía,
Técnico de Imágenes, Proceso Diagnostico, Errores Radiológicos,
Herramientas Diagnosticas, Errores en Diagnósticos, BBDD
Multimedia, BBDD Referenciales y Descriptivas, Operaciones
con BBDD Multimedia, API DICOM, Oracle Multimedia
I. INTRODUCCIÓN
La calidad de vida de los habitantes del mundo desde hace
mucho tiempo, más allá de otros factores importantes,
depende del diagnóstico médico y del plan de acción llevado a
cabo por el médico en base a este diagnóstico. La medicación
es uno de los ingredientes del plan que depende que de que tan
certera sea la misma, los efectos que producirá en el paciente
podrán ser más o menos precisos para terminar con la
situación en cuestión. Es por esto que el trabajo busca terminar
con estas incertidumbres de la mano de las bases de datos
multimedia y de distintas herramientas informáticas que
iremos describiendo con el pasar del mismo, en pos de una
mayor predicción y precisión en lo que respecta al diagnóstico
y la salud del paciente.
II. JUSTIFICACIÓN
El diagnóstico por imágenes es uno de los estudios más
subjetivos en algún sentido que tiene la medicina. Esto se debe
a que varios profesionales pueden tener interpretaciones
distintas de lo visto en una imagen médica más allá de los
posibles errores humanos o tecnológicos que puedan suceder.
Es por esto que el trabajo busca reducir este margen o brecha
de error y las posibles discrepancias entre los profesionales en
situaciones en las cuales las imágenes no son totalmente claras
o situaciones en las cuales la experiencia profesional no es lo
suficientemente amplia como para dar un diagnóstico certero.
La informatización de sectores como este a lo largo del tiempo
fue mal visto por generaciones de profesionales quienes con el
pasar del mismo comenzaron a utilizar lo mejor de la
informática y la tecnología para poder brindar una atención
mucho más eficiente y eficaz dejando de lado inseguridades en
lo que respecta a interpretaciones personales de profesional.
No podemos perder de vista que lo que está en riesgo son
vidas humanas más allá del trabajo de los profesionales que
por falta de herramientas comenten errores que cualquier otro
humano puede cometer.
III. MARCO DE REFERENCIA TEÓRICA
Las imágenes médicas son el conjunto de técnicas y procesos
usados para crear imágenes del cuerpo humano, o partes de él,
con propósitos clínicos (procedimientos médicos que buscan
revelar, diagnosticar o examinar enfermedades) o para la
ciencia médica (incluyendo el estudio de la anatomía normal y
función). En el contexto clínico, la imagen médica se equipara
generalmente a la radiología o a la "imagen clínica" y al
profesional de la medicina responsable de interpretar (y a
veces de adquirir) las imágenes, que es el radiólogo. La
radiografía de diagnóstico designa a los aspectos técnicos de la
imagen médica y en particular la adquisición de imágenes
médicas. El radiógrafo o el tecnólogo de radiología es
responsable normalmente de adquirir las imágenes médicas
con calidad de diagnóstico, aunque algunas intervenciones
radiológicas son desarrolladas por radiólogos. Los diferentes
tipos de imágenes médicas que podemos encontrar son:
A. Fluoroscopía
La fluoroscopía produce imágenes en tiempo real de
estructuras internas del cuerpo, esto se produce de una manera
similar a la radiografía, pero emplea una entrada constante de
rayos x. Los medios de contraste, tales como el bario o el iodo,
y el aire son usados para visualizar cómo trabajan órganos
internos. La fluoroscopía es utilizada también en
procedimientos guiados por imagen cuando durante el proceso
se requiere una realimentación constante.
2
B. Imagen de resonancia magnética (MRI)
Un instrumento de imágenes por resonancia magnética
(Scanner MRI) usa imanes de elevada potencia para polarizar
y excitar núcleos de hidrógeno (protón único) en moléculas de
agua en tejidos humanos, produciendo una señal detectable
que está codificada espacialmente produciendo imágenes del
cuerpo. MRI no implica el uso de radiación ionizante y no está
por tanto asociada con los mismos riesgos para la salud; por
ejemplo, no hay efectos conocidos a largo plazo por la
exposición a campos estáticos fuertes y por tanto no hay límite
en el número de exploraciones a las que una persona puede ser
expuesto, en contrates con los rayos X. Un MRI puede "ver"
únicamente objetos basados en hidrógeno, así que los huesos,
que está basados en calcio, serán anulados en la imagen, y no
tendrán efectos en la visión de tejidos blandos. Esto lo hace
excelente para examinar el interior del cerebro y las
articulaciones.
C. Radiografía de proyección
Más conocidos comúnmente como rayos x, los radiógrafos se
usan a menudo para determinar el tipo y extensión de una
fractura, y también para detectar cambios patológicos en los
pulmones. Con el uso de medios de contraste radio-opacos,
tales como el bario, también pueden servir para visualizar la
estructura del estómago y los intestinos; esto puede ayudar a
diagnosticar úlceras o ciertos tipos de cáncer de colon.
D. Tomografía
La tomografía es un método de imagen de un sólo plano, o
corte, de un objeto, que da como resultado un tomograma. Hay
varios tipos de tomografía aunque la principal es la
Tomografía computarizada que es una técnica digital que
produce una imagen 2D de las estructuras de una sección
delgada transversal del cuerpo. Utiliza rayos X. Los aparatos
más modernos utilizan la técnica de TC helicoidal, en la que la
mesa con el paciente se va desplazando al mismo tiempo que
se realiza la imagen: de este modo la exploración se realiza
más rápido y son posibles las reconstrucciones multiplanares y
tridimensionales. Tiene una dosis de radiación ionizante
mayor que la radiografía de proyección, lo cual hace que las
exploraciones repetidas deban ser limitadas.
E. Ultrasonido
La ultrasonografía médica utiliza ondas acústicas de alta
frecuencia de entre dos y diez megahercios que son reflejadas
por el tejido en diversos grados para producir imágenes 2D,
normalmente en un monitor de TV. Esta técnica es utilizada a
menudo para visualizar el feto de una mujer embarazada.
Otros usos importantes son imágenes de los órganos
abdominales, corazón, genitales masculinos y venas de las
piernas. Mientras que puede proporcionar menos información
anatómica que técnicas como TC o MRI, tiene varias ventajas
que la hacen ideal test de primera línea en numerosas
situaciones, en particular las que estudian la función de
estructuras en movimiento en tiempo real. También es muy
segura, ya que el paciente no es expuesto radiación y los
ultrasonidos no parecen causar ningún efecto adverso.
Una vez que tenemos la imagen medica como herramienta
para realizar el diagnostico es necesario tener en cuenta el
proceso completo de diagnostico y de las herramientas que el
profesional posee a la hora de elaborar un diagnostico. El
diagnóstico o propedéutica clínica es el procedimiento por el
cual se identifica una enfermedad, entidad nosológica,
síndrome, o cualquier condición de salud-enfermedad (el
"estado de salud" también se diagnostica). En términos de la
3
práctica médica, el diagnóstico es un juicio clínico sobre el
estado psicofísico de una persona; representa una
manifestación en respuesta a una demanda para determinar tal
estado.

PROCESO DIAGNÓSTICO
El diagnóstico clínico requiere tener en cuenta los dos
aspectos de la lógica, es decir, el análisis y la síntesis,
utilizando diversas herramientas como la anamnesis, la
historia clínica, exploración física y exploraciones
complementarias. El diagnóstico médico establece a partir de
síntomas, signos y los hallazgos de exploraciones
complementarias, qué enfermedad padece una persona.
Generalmente una enfermedad no está relacionada de una
forma biunívoca con un síntoma, es decir, un síntoma no es
exclusivo de una enfermedad. Cada síntoma o hallazgo en una
exploración presenta una probabilidad de aparición en cada
enfermedad.
HERRAMIENTAS DIAGNÓSTICAS



Síntomas: Son las experiencias subjetivas negativas
físicas que refiere el paciente, recogidas por el médico en
la anamnesis durante la entrevista clínica, con un lenguaje
médico, es decir comprensible para todos los médicos.
Por ejemplo, los pacientes a la sensación de falta de aire o
percepción incómoda y desagradable en la respiración
(disnea), lo llaman ahogo, angustia, fatiga, cansancio
fácil...
Signos: Son los hallazgos objetivos que detecta el médico
observando al paciente, por ejemplo la taquipnea a más de
30 respiraciones por minuto. La semiótica médica o
semiología clínica es la parte de la medicina que trata de
los signos de las enfermedades desde el punto de vista del
diagnóstico y del pronóstico.
Exploración física o Semiotécnica: Consiste en diversas
maniobras que realiza el médico sobre el paciente, siendo
las principales la inspección, palpación, percusión, oler y
auscultación, con las que se obtienen signos clínicos más
específicos.
Todos los síntomas referidos en la anamnesis y los signos
objetivados en la exploración física son anotados en la historia
clínica del paciente. Generalmente, los signos y síntomas
definen un síndrome que puede estar ocasionado por varias
enfermedades. El médico debe formular una hipótesis sobre
las enfermedades que pueden estar ocasionando el síndrome y
para comprobar la certeza de la hipótesis solicita
exploraciones complementarias.
CARACTERÍSTICAS DE UNA PRUEBA DIAGNÓSTICA
Se considera que una prueba diagnóstica es buena cuando
ofrece resultados positivos en enfermos y negativos en
pacientes sanos, con el menor rango de error posible. Por lo
tanto, las condiciones que deben ser exigidas en un test
diagnóstico son principalmente tres:


Validez: Es el grado en que un test mide lo que se supone
que debe medir, es decir, la frecuencia con la que los
resultados obtenidos con este test pueden ser confirmados
por otros más complejos y rigurosos. Los parámetros que
miden la validez de una prueba diagnóstica son la
sensibilidad y la especificidad.
Reproductividad: Es la capacidad de un test de ofrecer
los mismos resultados cuando se repite su aplicación en
circunstancias similares. La reproductividad viene
determinada por la variabilidad biológica del hecho
observado, la introducida por el propio observador y la
derivada del propio test.
Seguridad: Es la certeza de que un test predecirá la
presencia o ausencia de enfermedad en un paciente. La
seguridad viene determinada por el valor predictivo de un
resultado positivo o negativo, es decir, la probabilidad de
que siendo un test positivo el paciente esté realmente
enfermo.
Por contrapartida a este proceso diagnostico y sus
herramientas y características, tenemos como resultado que no
siempre los diagnósticos son acertados y es aquí donde
aparecen los “errores radiológicos” a la hora de interpretar,
razonar o tomar una imagen medica.
ERRORES RADIOLÓGICOS
Muchos de estos errores son simples o excusables y no
constituyen mala praxis ni generan responsabilidad
profesional. De hecho, distintos estudios han reconocido la
alta variabilidad en la interpretación de radiografías simples
aún entre radiólogos experimentados. En un estudio
comparativo realizado con radiografías simples seleccionadas
al azar hubo discrepancias significativas entre el 5% al 9% de
los observadores. Incluso un mismo radiólogo leyendo la
misma radiografía en diferentes momentos puede discrepar
consigo mismo en el 20% de los casos. Otros errores de
diagnóstico pueden calificarse como negligentes o
inexcusables. La mala praxis no se configura por la sola
presencia del error. La presencia del mismo es una condición
necesaria pero no definitiva para determinar negligencia. El
error sólo sería punible cuando, a juicio de peritos expertos, ha
originado un daño al paciente por una actitud imprudente,
negligente o descuidada o generada por impericia, ignorancia
o desconocimiento básico de la propia ciencia.
A. Errores de percepción
Los errores de percepción se producen cuando el radiólogo no
aprecia características que están presentes en la imagen.
Pueden darse aún en profesionales experimentados que
interpretan imágenes de buena calidad y con la información
clínica disponible. Esta forma de falso negativo (la otra se
debe a mala técnica) es el error más frecuente en radiología,
representando entre el 60% al 80% de los errores en la
especialidad. Probablemente ningún evento sea más frustrante
para el profesional que el darse cuenta que pasó por alto un
hallazgo significativo que posteriormente se mostró evidente.
Los falsos negativos serían cinco veces más comunes que los
falsos positivos y los errores de percepción serían cuatro veces
4
más frecuentes que los errores por razonamientos equivocados
o por falta de conocimientos .Más allá de la falibilidad propia
del ser humano, pueden mencionarse distintos factores que
actuarían como inductores de este tipo de errores:
 La fatiga
 Las interrupciones y distracciones repetidas
 Malas condiciones de visualización,
 Lesiones múltiples.
B. Errores de razonamiento
Se producen cuando se identifican los hallazgos radiológicos,
pero los mismos son interpretados erróneamente como
resultado de un sesgo en la respuesta, una lógica diagnóstica
equivocada o a una “laguna” de conocimiento. En este tipo de
error se llegan a conclusiones incorrectas pese a una adecuada
formación del radiólogo y a una buena calidad de imagen con
adecuada exposición del hallazgo. Se trata de una forma de
error cognitivo diferente de las formas de error vinculadas a la
falta de formación y entrenamiento.
C. Errores aliterativos
El término “error aliterativo” fue acuñado por Smith. El
fenómeno se daría cuando el error cometido por un radiólogo
en la primera interpretación se vuelve a repetir en controles
posteriores realizados por él mismo o por otros colegas.
D. Errores por falta de conocimientos
Hay ciertos conocimientos que se consideran básicos y que
deberían poseer todos los radiólogos. Sin embargo, la práctica
de la radiología es cada vez más compleja y la cantidad de
investigaciones y técnicas posibles es cada vez más amplia. En
algunas áreas del diagnóstico por imágenes se requiere una
considerable subespecialización y es importante que los
radiólogos no trabajen más allá de sus capacidades. En general
en los grandes servicios los profesionales se subespecializan
según su interés y las necesidades de la organización. En los
servicios chicos, en cambio, puede requerirse que un mismo
radiólogo maneje un amplio espectro de procedimientos.
E. Errores por mala técnica (inadecuada posición o
exposición)
La precisión diagnóstica de un radiólogo nunca será mayor
que la calidad de las radiografías que se le entregan para su
interpretación. Si bien son los técnicos quienes físicamente
obtienen las imágenes, son los radiólogos los responsables de
determinar si la calidad del estudio permite una valoración
adecuada
En pos de reducir al mínimo estos errores es que la solución
utiliza un repositorio de datos e imágenes único llamado “Base
de Datos Multidimensional” con un sistema gestor de estos
tipos de datos que debe soportar tipos de datos multimedia y
proveer facilidades como los motores de base de datos
tradicionales, como lo son la creación de las bases de datos, el
modelado, el acceso y persistencia de la información, etc. Con
los grandes avances en materia de comunicaciones, estas bases
de datos tuvieron un gran auge ya que se beneficio el
intercambio entre distintos puntos de información multimedia.
Un documento introducido en una base de datos multimedia es
una composición temporal, en la cual hay que introducir los
diferentes tipos de datos, tanto como las relaciones de
configuración y temporales existentes entre ellos. Los datos
deben estar sincronizados, controlando tanto su estado como
su comportamiento. Los documentos multimedia se forman
mediante la agregación de los diferentes tipos de objetos,
objetos que pueden ser de gran tamaño, y llegan a mostrar
gran variedad en lo referido a estructura y representación. La
representación del documento multimedia busca comunicar de
forma efectiva no sólo el documento y su contenido, sino
también la semántica, los conceptos subyacentes y la relación
entre ellos. Uno de los enfoques básicos es el análisis de las
características de los usuarios del sistema, para lo cual es
indispensable conocer los patrones de comportamiento del
usuario en el acceso y comprensión de las estructuras
informativas. En el momento en el que se comienza a diseñar
e implantar una base de datos multimedia, el objeto de trabajo
ya no resulta ser el registro tradicional: el usuario está tratando
con un documento electrónico y con todo lo que ello conlleva
(texto, gráficos, imágenes, datos, imágenes animadas, sonidos
y videos). Además a esto hay que sumarle los grandes
volúmenes de información almacenadas en diferentes
plataformas y aplicaciones, distribuidas en diferentes
localizaciones geográficas.
TIPOS DE BBDD M ULTIMEDIA
A. BBDD Referenciales
Son bases de datos que se encargan de almacenar datos
concernientes a información sobre archivos multimedia, como
video o música. Una base de datos referencial, por ejemplo
podría ser la de una biblioteca. La información que es
almacenada en conjunto con los datos es llamada “metadato” y
la misma es indexada para poder realizar búsquedas de
información más veloces y performantes.
B. BBDD Descriptivas
Estas bases de datos no son tan comunes como las
referenciales, y todavía se encuentran en proceso de desarrollo
e investigación, puesto que su función es la de analizar el
contenido que almacenan, con el fin de poder aportar
información sobre él. Por eso, en el ámbito multimedia no es
una tarea sencilla desarrollar este tipo de sistemas, puesto que
analizar tanto imágenes como sonido, no es trivial. Una base
de datos descriptiva analiza los datos, por lo que aparte de
permitir la búsqueda de dichos archivos como antes, también
permitirá buscarlo por el contenido. El problema de estas
bases de datos reside en la dificultad para analizar una foto o
un video.
OPERACIONES CON UNA BBDD M ULTIMEDIA
A. Indexación de Imágenes
A la hora de indexar la información de una imagen, la cuestión
es optar por técnicas de reconocimiento y procesamiento de
imágenes o bien por la asignación manual de frases y
términos.
5
B. Recuperación de textos
Un problema que también está relacionado con la
recuperación de la información. Por un lado, y similar a lo
expuesto con las imágenes, hay problemas a la hora de indexar
correctamente frases. En contraposición a la utilización de
términos unitarios, parece que añadir descriptores supone una
mejora sustancial, estos deben ser buenos indicadores del
contenido.
Por otro lado, el vocabulario del usuario es usualmente
diferente del usado a la hora de indexar el documento, por lo
que sería ideal el uso de un diccionario de sinónimos para
ampliar la consulta del usuario.
C. Recuperación de imágenes
Para la recuperación de imágenes se utiliza el método CBIR, o
Recuperación de imágenes basada en contenido. Una primera
aproximación de esta técnica, conseguía recuperar imágenes
basándose en la forma y el color de éstas. Tras esto, la técnica
ha seguido evolucionando, y ahora se pueden recuperar
imágenes basándonos en color, forma, textura y texto. En la
actualidad, los sistemas CBIR se centran en tres aspectos
fundamentalmente:
 Extracción de las características de una imagen
 Mejora de la indexación con el fin de poder realizar
búsquedas más eficientes
 Mejorar las interfaces de usuarios para facilitarles la labor
Estas bases de datos pueden trabajar con distintos tipos de
archivos, los mismos son:






Texto: Puede ser estructurado o sin estructurar.
Gráficos: Se trata de dibujos e ilustraciones codificados
según un estándar de descripción de archivos. CMG,
PICT,Postcript,etc.
Imágenes: Son elementos gráficos codificados según
algún tipo de formato estándar.JPEG, MPEG, etc.
Animaciones: Representan secuencias temporales de
imágenes o datos.
Vídeo: Definen secuencias temporales de imágenes o
datos a una determinada velocidad (fps o tasa de frames
por segundo), codificados siguiendo un estándar. AVI,
MPEG-4, etc.
Audio: Dentro de esta categoría encontramos dos
tipologías distintas: el audio estructurado, que representa
una secuencia de sonidos identificados según nota,
duración, tono, etc... y el audio digital que define una
secuencia de sonidos digitales. WAV, MPEG-3, WMA,
etc.
Para poder sostener a estos objetos y dar soporte a las distintas
operaciones es que una base de datos multimedia consta de la
siguiente arquitectura de 3 niveles:
A. Nivel físico
Es el nivel más bajo de abstracción y el nivel real de los datos
almacenados. Este nivel define cómo se almacenan los datos
en el soporte físico, ya sea en registros o de cualquier otra
forma, así como los métodos de acceso. Este nivel lleva
asociada una representación de los datos, que es lo que
denominamos Esquema Físico.
B. Nivel conceptual
Es el correspondiente a una visión de la base de datos desde el
punto de visto del mundo real. Es decir se trata con la entidad
u objeto representado, sin importar como está representado o
almacenado éste. Este nivel lleva asociado un Esquema
Conceptual.
C. Nivel de visión
Son partes del esquema conceptual. El nivel conceptual
presenta toda la base de datos, mientras que los usuarios, por
lo general, sólo tienen acceso a pequeñas parcelas de ésta. El
nivel visión es el encargado de dividir estas parcelas. El
esquema asociado a éste nivel es el Esquema de Visión.
VENTAJAS E INCONVENIENTES DE UNA BBDD
M ULTIMEDIA
Como en todos los tipos de bases de datos, nuestra variante
presenta algunas ventajas e inconvenientes que vamos a
describir a continuación:
Ventajas:
 Versatilidad: Las BBDD multimedia ofrecen la
posibilidad de integrar en un único sistema una gran
diversidad de formatos (imágenes, texto, video, sonido,
etc).
 Variedad: Ofrecen un mayor abanico de posibilidades a la
hora de representar la información.
 Mercado potencial: El cuál augura que se siga
investigando activamente en el futuro.
Inconvenientes:
 Almacenamiento: Necesita grandes espacios para
almacenar toda la información que queremos.
 Ancho de banda alto: Este tipo de bases de datos
necesitan grandes anchos de banda para obtener un
rendimiento óptimo.
 Complejidad: En cuanto a programar operaciones, o
incluso la interfaz, debido a la alta cantidad de formatos
que hay que manejar, lo que puede repercutir en su
rendimiento.
 Costo, una diferencia a tener en cuenta cuando usamos
este tipo de bases de datos es su factibilidad económica,
ya que las DBMS pueden llegar a ser costosas si el
tamaño de los archivos es alto, esto se debe a que el
rendimiento de estas bases de datos depende, en gran
medida, de los componentes hardware utilizado para el
almacenamiento de los datos (servidores), y distribución
de los mismos (altas velocidades en las redes de
comunicación). Es por ello por lo que se requieren redes
de transmisión de datos con una buena Calidad de
Servicio, de modo que los datos se sirvan en el momento
oportuno.
Ahora bien, no solo es suficiente con una base de datos
multimedia para llevar a cabo la solución, sino mas bien, es
6
necesario un método de exploración y explotación de estos
datos y objetos para realizar proyecciones y búsquedas más
certeras. Con este fin es que utilizaremos a la minería de datos
y sus herramientas como ayuda al proceso de búsqueda.
M INERÍA DE DATOS
La minería de datos (DM, Data Mining) consiste en la
extracción no trivial de información que reside de manera
implícita en los datos. Dicha información era previamente
desconocida y podrá resultar útil para algún proceso. Bajo el
nombre de minería de datos se engloba todo un conjunto de
técnicas encaminadas a la extracción de conocimiento
procesable, implícito en las bases de datos. Con datos
históricos correctamente almacenados y depurados, la
aplicación de metodologías estadísticas permite "escarbar"
entre la información para detectar patrones. En resumen la
minería de datos es la “Exploración y análisis por medios
automáticos o semiautomáticos de datos para descubrir
patrones y reglas que hasta ese momento no se conocían”.
HERRAMIENTAS DE MINERÍA DE DATOS
Cluster es una herramienta indirecta cuyo principal propósito
es el de clasificar un conjunto de datos en grupos compuestos
por objetos similares. El algoritmo clasificara cada objeto
dentro del grupo más representativo, acorde a las
características de dicho objeto y reorganizara iterativamente la
conformación de cada grupo en función de las mismas.
Este análisis será realizado identificando el centroide en cada
iteración, el cual, será el objeto real más cercano a la media
del cluster, es decir, será el objeto más representativo del
mismo (mediana). La cantidad de grupos puede ser
predefinida (Algoritmo k-means) o puede ser la resultante del
algoritmo (jerárquicos). Los algoritmos jerárquicos pueden ser
TOP DOWN o BOTTOM UP, es decir que en principio cada
objeto del conjunto es un cluster o todo el conjunto es un
cluster y de manera iterativa se van definiendo grupos en base
a la cercanía entre cada uno de los objetos y el centroide. En
cambio el algoritmo k-means predefine la cantidad de grupos
en los cuales se separara el conjunto de datos. En la primera
iteración los centroides serán seleccionados al azar y serán
reemplazados por otros más precisos a medida que se recorre
el conjunto de datos en cada iteración.
IV. ESTADO DEL ARTE
En la actualidad existen algunas soluciones parciales,
productos, estándares y asociaciones independientes que nos
brindaran apoyo en la solución final. Como primer punto
tenemos un estándar mundial ya reconocido de imágenes
médicas digitales y de comunicación que describe
detalladamente los medios para dar formato e intercambiar
imágenes e información entre dispositivos diferentes. Este
estándar es llamado DICOM y surgió con las siguientes
motivaciones:
 Promover la comunicación entre imágenes digitales
independientemente del fabricante que las produjo.
 Ofrecer mayor flexibilidad a los sistemas de
almacenamiento y comunicación de imágenes.

Facilitar la creación y consulta a sistemas de diagnóstico
por diferentes dispositivos y en diversos lugares locales o
remotos.
Simplemente, DICOM es un estándar para la comunicación de
imágenes médicas y la información asociada. DICOM confía
en modelos explícitos y detallados de cómo las "cosas"
(pacientes, imágenes, informes, etc.) implicadas en
operaciones de radiología se describen y como se relacionan.
Estos modelos se llaman la entidad - relación (o E-R) los
modelos y son una manera para estas seguros que fabricantes
y los usuarios comprenden la base para desarrollar las
estructuras de datos que usa DICOM. Este proceso de
modelización se comenzó en uno de los grupos de trabajo que
ha creado a DICOM (WG VIII). Este grupo comenzó con la
tarea de definir los requisitos de interface entre un archivo de
imagen y una red de comunicaciones (PACS) y un sistema de
información de radiología u hospital (HIS o RIS).
DICOM tiene las siguientes características:

Intercambio de objetos en redes de comunicación y en
medios de almacenamiento a través de protocolos y
servicios, manteniendo sin embargo, independencia de la
red y del almacenamiento físico. Todo esto a través de
comandos definidos por una sintaxis y una semántica, a
los que se les asocian datos. Las versiones anteriores sólo
ofrecían comunicación punto a punto.

Especificación de diferentes niveles de compatibilidad.
Explícitamente se describe como definir un determinado
nivel de compatibilidad, para escoger sólo opciones
específicas de DICOM. En las versiones anteriores se
especifica un nivel mínimo únicamente.

Información explícita de Objetos a través de estructuras
de datos, que facilitan su manipulación como entidades
auto contenidas. Los Objetos no son únicamente imágenes
digitales y gráficas, sino también estudios, reportes, etc.

Identidad de objetos en forma única, como instancias con
operaciones permitidas definidas a través de clases.

Flexibilidad al definir nuevos servicios.

Interoperabilidad entre servicios y aplicaciones a través
de una configuración definida por el estándar,
manteniendo una comunicación eficiente entre el usuario
de servicios y el proveedor de los mismos.

Sigue las directivas de ISO en la estructura de su
documentación multi-partes. De esta forma facilita su
evolución, simplificando la adición de nuevas partes.
Los beneficios de implementar el estándar DICOM en
soluciones médicas son:
7

Contribuye a disminuir la cantidad de material fílmico
impreso, disminuyendo costos, tiempo de personal, etc.

Contribuye a aprovechar mejor el tiempo de trabajo de los
expertos en una institución, que muchas veces se
encuentran ocupados parcialmente por falta de casos de
estudios de la propia clínica, mediante la telé consulta de
profesionales de otras instituciones.

Posibilita brindar servicios a distancia.

Centraliza las imágenes de toda la institución, ahorrando
tiempos de acceso y búsqueda, y aumentando la facilidad
y comodidad del manejo y utilización de las mismas.

Permite implementar una política eficaz de copias de
seguridad y registro de todos los estudios de imágenes
realizados.
Ecografía, TC y Fluoroscopia digital (DSI) se realiza con
ayuda de un terminal de adquisición, donde se identifica al
paciente y estudio y se seleccionan las imágenes para
transferir al PACS. Para la visualización de las imágenes se
instalan estaciones de diagnóstico principales, predestinadas
para tal fin. Equipadas con monitores de alta resolución
(1280x1024 líneas) y con una gran capacidad de
almacenamiento en disco magnético. En caso que se requiera
acceso a redes externas, un ordenador dedicado (Gateway) da
salida a las exploraciones desde el DMS a una red Ethernet
que conecta con estaciones de visualización, centros de
impresión, o centros de almacenamiento a largo plazo.
SISTEMAS PACS
Un PACS (Picture Archiving Communicating System), es un
sistema de archivo y comunicación de imagen, (CommView,
AT& T-Philips) configurado por un conjunto de ordenadores
funcionando con sistema operativo como UNIX V.r.3 ó
WinNT, conectados por una red de estrella de fibra óptica por
ejemplo, que se despliega desde un nodo central . El nodo
central, constituido por el sistema de gestión de base de datos
(DMS), que permite almacenar unos 7 días de actividad en
pacientes ingresados. El sistema puede estar conectado a un
sistema de guardado histórico de imagenes. Una impresora
láser de película como por ejemplo Kodak Ektascan Laser
Printer, para la impresión opcional de copias pudiese estar
conectada al nodo central. Entre las imágenes de mayor
volumen informático encontramos: La Radiografía Computada
(RC), y la Digitalizadora Láser (DL) de película convencional.
Un sistema de RC es por ejemplo un Philips PCR Graphic II
basado en el Fuji FCR-901, que usa soportes de imagen de
fósforo estimulable por láser del tipo Fuji IP ST-III y HR, con
una resolución aproximada de 2000x2000 pixels. La unidad de
proceso de imagen seria luego conectada a una impresora láser
de alta resolución (4000x4000 pixels) que produce copias en
película (IRC, Philips), y a una estación de visualización y
reproceso de imágenes con memoria local en disco magnético
de capacidad para 90 imágenes (DMS-20 Philips) y dos
monitores de alta resolución (1Kx1K), y que a su vez podría
disponer de una unidad de archivo en disco óptico de escritura
irreversible. Las imágenes de Fluoroscopia Digital , pudieran
ser adquiridas por el PACS mediante la digitalización de la
imagen de video (frame-grabber), o mediante una conexión
digital directa. Un digitalizador de vídeo promedio, captura
imágenes con 256 niveles de gris (8 bits) y resolución
ajustable hasta 1024 líneas. De la misma manera, las imágenes
de ecografía son adquiridas mediante la digitalización de
vídeo, con una resolución aproximada de 800 líneas y 256
grises (8 bits). La TC usualmente se conecta al pacs por un
sistema de captura similar. Los equipos de Imagen por
Resonancia Magnética están conectados al PACS de forma
digital directa durante. La adquisición de las imágenes de
Las imágenes describen las distintas posibilidades de
implementaciones de sistemas y soluciones PACS siempre
teniendo como nodo central al repositorio donde se almacenan
las imágenes PACS y como nodos que adquieren las imágenes
a las maquinas que producen las imágenes MRI o CT. Todas
las imágenes una vez adquiridas son enviadas al nodo central
implementando interfaces de comunicación y almacenamiento
del estándar DICOM.
Actualmente existe una organización que reúne a todos los
profesionales de la radiología de las distintas asociaciones
argentinas llamada FAARDIT (Federación Argentina de
Asociaciones de Radiología, Diagnóstico por Imágenes y
Terapia Radiante). La misión según explica en su web oficial
es reunir a todos los especialistas en Radiología y Diagnóstico
por Imágenes de Argentina a través de las asociaciones
científicas locales, estableciendo con ellas vínculos científicos,
culturales, sociales, de resguardo de los principios éticos y de
protección de los intereses económicos de sus componentes,
elevando así el nivel profesional y científico de sus miembros.
También detallan su visión que es Unificar a todos los
Profesionales vinculados con el Diagnóstico por Imágenes en
una Sociedad Científica Referente Regional e Internacional,
8
capaz de colaborar y mantener la formación de Recursos
Humanos con alto nivel de profesionalismo y académico que
pueden interactuar en forma relevante en el mundo global.

V. DESARROLLO
La solución propuesta está basada en un repositorio DICOM
ya sea, con un sistema PACS para digitalizar las imágenes o
de un sistema propio mediante el cual se implemente el
estándar DICOM y un sistema de recolección / exploración del
reposito de imágenes médicas para así mediante el uso de
interfaces o procesos manuales almacenar las imágenes en una
base de datos multimedia en conjunto con un diagnostico
medico sobre la misma. Estas cargas estarán supervisadas por
la junta médica que rija en la institución para así de esta
manera validar o certificar el diagnostico brindado por el
profesional. Esta misma junta será la encargada de determinar
qué grupo de profesionales ve qué imágenes de que
profesionales, ya que esto puede no ser aceptado en su
totalidad teniendo en cuenta por una pasada generación de
profesionales. Con esta información dentro de la base de datos
multimedia la misma será explotada y consultada (mediante
técnicas de minería de datos como la técnica de “Cluster” para
agrupar las imágenes por diagnostico e identificar a que grupo
pertenece un nuevo diagnostico ingresado) por los distintos
profesionales para poder comparar imágenes obtenidas con las
imágenes ya certificadas por la junta médica. Es decir, una vez
que un profesional tiene un pre diagnóstico de una imagen, el
mismo podrá acercarse a una terminal que contenga el cliente
de consulta al sistema e ingresara en el menú de consulta por
diagnóstico. Una vez que el mismo ingrese el pre diagnóstico
se le brindaran una cantidad de imágenes relacionadas con el
mismo en conjunto con su respectivo diagnóstico y los
nombres de los profesionales que ingresaron al sistema la
imagen y quién validó la misma para así de esta manera poder
realizar consultas personales o directamente ya validar el
diagnóstico con este resultado. Cada una de las imágenes
contendrá un porcentaje de aceptación en la búsqueda ya que
las coincidencias pueden no ser totales sino que parciales.
La arquitectura de un sistema de estas características y los
aspectos tecnológicos relevantes serían los siguientes:
 La arquitectura podría ser 2 ó 3 capas, es decir, con una
aplicación de escritorio o mediante un navegador web
implementando un servidor de aplicación.
 El lenguaje a utilizar podría ser un lenguaje como java o
PHP para poder independizar al sistema de la plataforma
en la cual ejecuta.
 El sistema de base de datos multimedia podría ser el
Oracle Multimedia de la mano de una base de datos
Oracle 11g. La elección del producto se basa en la
posibilidad que el mismo provee de integración con
ficheros del tipo DICOM, las interfaces o APIs para la
explotación de un repositorio de imágenes y la cantidad
de documentación disponible de manera online.
 Interfaces de exploración / explotación.
 Comunicaciones de alta velocidad debido al tamaño de
los archivos que tienen que ser transferidos.
 Una caja de discos con grandes velocidades para realizar
operaciones de entrada y salida, acompañada con un
cache interno y discos de estados sólido para dejar en los


mismos las operaciones más realizadas y de esta manera
tener que esperar en menor cantidad a la hora de realizar
una consulta.
Un servidor con poder de procesamiento suficiente para
poder realizar los procesos de explotación y carga al
mismo tiempo que consultas.
Implementación de perfiles con privilegios para usuarios
para poder diferenciar las operaciones realizas entre los
profesionales y la junta médica, además del perfil
administrador del sistema.
Los clientes terminales en el caso de que la aplicación sea
web con cualquier navegador web es suficiente y los
requisitos serian mínimos de hardware.
Arquitectura de carga del Sistema PACS:
Integración con la solución propuesta:
VI. LÍNEAS DE FUTURA INVESTIGACIÓN
Para continuar con el trabajo en cuestión es que es necesario
realizar un análisis de implementación de la solución, en lo
que respecta a la infraestructura necesarias, el desarrollo de
software, las capacidades o competencias requeridas para el
uso de la herramienta. El trabajo menciona la solucione PACS,
la misma ya realiza la conversión de las imágenes en ficheros
DICOM, con lo cual también habría que relevar la posibilidad
de implementar una herramienta que tenga comunicación con
los distintos dispositivos y realice esta conversión a ficheros
DICOM. Por otro lado con respecto a la implementación y la
infraestructura necesaria hay puntos muy importantes para
éxito de la solución que son las comunicaciones y el hardware
que pueden derivar en un costo muy elevado y por ende la
baja viabilidad del proyecto. Por último es necesario relevar la
necesidad del cliente final en cuanto a que información desea
y de qué manera.
9
VII. CONCLUSIÓN
La apuesta de este trabajo es continuar con el desarrollo de
procesos informáticos en el campo de la medicina para poder
aportar en conjunto con infraestructura tecnología una
herramienta que brinde mayor precisión de diagnóstico y
posibles predicciones para prevenir distintos tipos de lesiones.
Estas soluciones utilizan herramientas en muchos casos ya
implementadas por los distintos centros de atención del país,
las bases de datos y el software es utilizado en un gran
porcentaje de ellas, no así una solución PACS. Estas
herramientas intentan aumentar la calidad de vida de los
habitantes de este planeta, reduciendo así la tasa de mortalidad
por errores en los diagnósticos médicos. Con respecto a los
costos invertidos en la implementación de esta solución,
inicialmente la solución PACS o implementar los estándares
DICOM para poder convertir las imágenes médicas en
ficheros informáticos puede ser costosa desde el punto de vista
del software y del hardware, ya que no obstante la solución es
necesario considerar los servidores sobre los cuales se va a
montar esta solución y las comunicaciones necesarias para que
esta solución esté disponible para todos los usuarios. Desde el
punto de vista del paciente final la solución brinda ahorros
invaluables en el tiempo insumido en la búsqueda de los
resultados finales ya que antes de ir al especialista asignado es
necesario ir al laboratorio en búsqueda de las imágenes. Hoy
en día las imágenes son opcionales para los pacientes ya que
los especialistas pueden visualizar con esta solución y con
otras más las imágenes digitales las cuales pueden brindar un
detalle mucho mayor y preciso sobre el estado médico de la
misma. Todo apunta a que estas soluciones amortizan su
precio a lo largo del tiempo ya que los costos insumidos en el
personal que realiza la impresión de la imagen y el material
para la impresión quedan supeditados a si las mismas son
solicitadas por los pacientes. La evolución de la tecnología y
en especial de estas soluciones en el campo de salud irá
abaratando los costos de fabricación lo que hará mucho más
accesibles estas soluciones.
VIII. REFERENCIAS
Gil Gayarre (2001), Manual de Radiología Clínica.
Madrid España, Impreso en España por Grafos S.A Arte Sobre Papel,
EdiDe S.L. Pp 49-103.
Ramez Elmasri y Shamkant B. Navathe (2007), Fundamentos de
Sistemas de Base de Datos. Madrid España, Addison Wesley
,Editorial Pearson Educacion SA. Pp. 703 – 707.
Servidores PACS / DICOM
http://www.hospitalelcruce.org/pdf/revista/nota5.pdf
http://es.wikipedia.org/wiki/Picture_Archiving_and_Communicati
on_System
[Accedidos 01 de mayo de 2013].
Imágenes Médicas
http://es.wikipedia.org/wiki/Imagen_m%C3%A9dica#Software_d
e_c.C3.B3digo_abierto_para_an.C3.A1lisis_de_im.C3.A1genes_
m.C3.A9dicas
http://imagenes.faardit.org.ar/revistas/vol1_n3/3_Praxis_medica.p
df
http://www.faardit.org.ar/recursos/buena_praxis/MalaPraxisDiagn
osticoPorImagenes.pdf
[Accedidos 01 de mayo de 2013].
Diagnostico Medico
http://es.wikipedia.org/wiki/Procedimiento_m%C3%A9dico
www.lanari.fmed.uba.ar/descargas/conferencia20100520.pdf
http://es.wikipedia.org/wiki/Diagn%C3%B3stico_m%C3%A9dico
[Accedidos 01 de mayo de 2013].
Herramientas de Minería de Datos
Catedra de Adrián Gonzalez, Análisis de la información y la
decisión Universidad de Palermo, UP Virtual, Curso 20161
[Accedido 01 de mayo de 2013].
IX. BIOGRAFÍA
Javier E. Barthe nacido en Tigre, Argentina el
22 de noviembre de 1988. Curso sus primeros
estudios en San Fernando y comenzó su carrera de
grado en la Tigre (Universidad Tecnológica
Nacional Regional Pacheco), terminándola
actualmente en la Universidad de Palermo
(Ciudad Autónoma de Buenos Aires).
Su experiencia laboral en el área de sistemas data
desde 2009, administrando bases de datos Sybase
ASE y ASIQ. Desde el año 2009 en Swiss
Medical Group como DBA, actualmente DBA Sénior y arquitecto líder de
plataforma Sybase. Desde 2012 consultor Sybase independiente brindando
soporte de motores de base de datos Sybase a distintas empresas.
Adicionalmente en Swiss Medical realice varios cursos de especialización en
Sybase ASE y plataformas UNIX como AIX. Actualmente buscando
oportunidad de ampliar los conocimientos de Sybase ASIQ (producto para
DW y BI de Sybase) y Redes Informáticas (CCNA de Cisco).