Resumen:
|
[EN] Nowadays hospitals store a large amount of radiology reports in different Radiology Information
Systems (RIS) from different modalities, such as ultrasound, MRI scans, CT scans, mammograms, Xrays,
etc. These reports ...[+]
[EN] Nowadays hospitals store a large amount of radiology reports in different Radiology Information
Systems (RIS) from different modalities, such as ultrasound, MRI scans, CT scans, mammograms, Xrays,
etc. These reports contain the data set observed by radiologists that can be of vital importance
for the diagnosis of many diseases such as breast cancer.
This work designs, implements and analyzes different data analysis algorithms using the MapReduce
paradigm to extract relevant factors to the diagnosis of breast cancer from the different diagnostic
reports obtained in the process (mammography, ultrasound and MRI). These factors correspond to
cross correlations between different modes and correlations with different grouping levels
(understanding the level 'n' as the analysis of the correlation of 'n' parameters with diagnostic factor).
These algorithms will perform distributed data processing on Hadoop clusters that are dynamically
provisioned from public Cloud infrastructures
(
[-]
[ES] Hoy en día los hospitales almacenan en los diferentes Sistemas de Información Radiológicos (RIS) una
gran cantidad de informes radiológicos de diferentes modalidades, como Ecografías, Resonancias
magnéticas, Tomografías ...[+]
[ES] Hoy en día los hospitales almacenan en los diferentes Sistemas de Información Radiológicos (RIS) una
gran cantidad de informes radiológicos de diferentes modalidades, como Ecografías, Resonancias
magnéticas, Tomografías Axiales Computarizadas, Mamografías, Rayos X, etc. y con formatos variados.
Dichos informes recogen el conjunto de datos observados por los radiólogos, además de aquella
información obtenida al aplicar procesos sobre las propias imágenes (biomarcadores, etc.), que pueden
ser de vital importancia para el diagnóstico de muchas enfermedades, como por ejemplo el cáncer de
mama.
El presente trabajo va a diseñar, implementar y analizar diferentes algoritmos de análisis de datos
utilizando el paradigma MapReduce para extraer a partir de los informes obtenidos en el proceso de
diagnóstico de cáncer de mama (mamografías, ecografías y resonancias magnéticas) factores
relevantes para el diagnóstico de cáncer de mama. Estos factores corresponderán a correlaciones
transversales entre las distintas modalidades y correlaciones con diferentes niveles de agrupación
(entendiendo el nivel ‘n’ como el análisis de la correlación de ‘n’ parámetros con el factor de
diagnóstico). Dichos algoritmos procesarán de forma distribuida los datos en clusters Hadoop virtuales
dinámicamente aprovisionados sobre infraestructuras Cloud públicas
[-]
|