Resumen:
|
[ES] El continuo crecimiento exponencial de la información en los entornos
empresariales comienza a suponer una amenaza para los analistas de datos.
Es necesario disponer de nuevas capacidades, tecnologías y modelos ...[+]
[ES] El continuo crecimiento exponencial de la información en los entornos
empresariales comienza a suponer una amenaza para los analistas de datos.
Es necesario disponer de nuevas capacidades, tecnologías y modelos que
nos permitan obtener ventajas sobre los actuales, basados en herramientas
tradicionales de gestión de datos.
Al igual que los entornos empresariales, los entes hospitalarios tienen el
mismo problema, por lo que el volumen de información que generan, su
velocidad de cambio y su variedad necesitan disponer de una serie de
herramientas que permitan su tratamiento y visualización. Esto se enmarca
en el ámbito Big Data, por lo que, es necesario solucionar la problemática
expuesta siguiendo dicho término.
Por ello, este proyecto desarrolla una solución a la problemática existente
con la indexación de los informes estructurados asociados a las imágenes
DICOM, gestionados a través de infraestructuras avanzadas basadas en
TRENCADIS, dentro del contexto de Big Data.
En esta tesis se ha desarrollado un modelo en el contexto Big Data basado
en la teoría de grafos y se han diseñado e implementado los componentes
necesarios para la integración del mismo en TRENCADIS, de forma que la
indexación se realizará bajo un entorno Grid y con una base de datos noSQL
basada en grafos.
Se presentan una serie de pruebas para comparar los modelos propuestos
con los ya existentes, y, aunque en un primer modelo el resultado no es el
esperado, al refinarlo y generar un segundo modelo los resultados obtenidos
mejoran la implementación actual, dando pie a futuros trabajos de
tratamiento y visualización de datos.
[-]
[EN] The continued exponential growth of information in enterprise environments
posses many challenges to data analysis, which cannot be resolved using
traditional tools. To cope with these challenges, new skills, ...[+]
[EN] The continued exponential growth of information in enterprise environments
posses many challenges to data analysis, which cannot be resolved using
traditional tools. To cope with these challenges, new skills, technologies
and models are needed that allow us to leverage the information.
This problem is not exclusively related to business, but also public health
is facing an unprecedented increase in the amount and diversity of data that
needs to be stored and analysed. Big Data is providing the new generation
tools for data processing and visualization.
This work presents a new system to index DICOM structured reports using
TRENCADIS, an advanced data infrastructure for DICOM objects.
The system developed in this thesis uses graph theory to model structured
reports and their interrelationships in a large noSQL database. We describe
the design and the implementation of the system, as well as the integration
in a Grid environment.
Finally, we present a series of experiments that compare the new model to
other previously published results. A second, refined model is also
presented that further improves performance. The conclusions suggest the
need for future lines of work in the context of data processing and
visualization.
[-]
|