Resumen:
|
La falta de garantías en la calidad de los datos en el ámbito biomédico puede llevar a tomar malas decisiones en el tratamiento de los pacientes y conclusiones erróneas en los estudios poblacionales. Para contribuir a ...[+]
La falta de garantías en la calidad de los datos en el ámbito biomédico puede llevar a tomar malas decisiones en el tratamiento de los pacientes y conclusiones erróneas en los estudios poblacionales. Para contribuir a resolver este problema, presentamos el desarrollo de un servicio web implementado en Java para medir la calidad de los datos biomédicos, conjuntamente con una interfaz accesible desde cualquier navegador web para poder hacer uso del servicio. Para la medición de la calidad, se ha empleado una aproximación resultante de combinar nueve dimensiones de calidad (Completeness, Consistency, Duplication, Correctness, Temporal Stability, Spatial Stability, y Contextualization), aplicadas a distintos ejes de los datos (Dataset, Attribute, Registry, Value, Source y Time). La arquitectura está diseñada según el patrón estrategia, que permite la implementación del método de medida de cada dimensión sobre la clase abstracta 'Axis', que se especializa en los seis posibles ejes. Como prueba de concepto, se ha procedido a la implementación de una dimensión de conteo llamada completitud, y otra basada en reglas, llamada consistencia. Las tecnologías utilizadas para poder realizar el proyecto han sido principalmente el entorno de desarrollo integrado Eclipse, el sistema de gestión de reglas de negocio Drools, el conjunto de herramientas para la implementación de servicios web Jersey, y el framework para la creación de interfaces gráficas de usuario web Vaadin. En el desarrollo se han respetado las condiciones de escalabilidad y rendimiento, que requiere un proyecto destinado al manejo de un volumen de datos que puede llegar a ser elevado. Además, se ha logrado realizar todo el proyecto empleando bibliotecas de código libre.
[-]
|