Proyectos CEIB-CS

MIDL (Medical Imaging Data Lake)

Un «Data Lake» permite a los usuarios analizar la variedad completa y el volumen de datos almacenados en el lago, permitiendo el estudio de diferentes patologías mediante múltiples fuentes de información

El proyecto

Data Lakes: agregando valor a los datos de Imagen Médica

La correlación clínica-radiológica permite reconocer como afectan las enfermedades en cada organismo, una patología sigue un curso distinto en cada cuerpo y para evaluar su impacto, las posibilidades de cura y las opciones más indicadas de tratamiento, se requiere acceder a la información de todos los historiales clínicos relevantes, información sobre los tratamientos, sin limitarse solamente a la información de un Data Warehouse procedente de una institución.

Esta tarea no es sencilla, sin la ayuda de la tecnología un profesional de la salud necesitaría semanas para acceder y leer todos los historiales clínicos relevantes y la información sobre tratamientos que se requiriese. Aun así, su trabajo estaría limitado por la información a su alcance, privándose de la riqueza que podría aportarle la consulta de fuentes externas.

Un Data Lake soporta todos los tipos de datos (estructurados, semiestructurados y no estructurados). Archivos Swift, pdf, Excel, txt, Dicom, Nifti, Xlm, Json etc… Esto permite al profesional de la salud absorber todo el conocimiento que se deriva de:

• Datos enviados desde los diversos hospitales de la Comunidad Valenciana.
• Datos históricos.
• Información proveniente de fuentes externas al hospital, como fuentes oficiales, estudios epidemiológicos, datos de otros hospitales e instituciones de investigación.
• Datos de imágenes anonimizadas almacenadas en el repositorio del banco de imágenes médicas de la Consellería de Sanitat (BIMCV), y otros bancos de imagen medica Federados en la comunidad europea.

De esta forma el valor científico de la información se incrementa, esto es, un “Data Lake” permite a los usuarios analizar la variedad completa y el volumen de datos almacenados en el lago, permitiendo el estudio de diferentes patologías mediante múltiples fuentes de información siendo de gran ayuda para una mejor caracterización de la enfermedad cualquier patología y por lo tanto un mejor diagnóstico, lo que supone un menor uso de recursos sanitarios y una posible mejor prescripción farmacológica.

Más información

MIDS (Medical Imaging Data Structure)

Investigador principal: Msc. Jhon Jairo Sáenz Gamboa