- -

Caracterización de la variabilidad temporal en bases de datos médicas y estudio de su impacto en modelos predictivos basados en inteligencia artificial

RiuNet: Repositorio Institucional de la Universidad Politécnica de Valencia

Compartir/Enviar a

Citas

Estadísticas

  • Estadisticas de Uso

Caracterización de la variabilidad temporal en bases de datos médicas y estudio de su impacto en modelos predictivos basados en inteligencia artificial

Mostrar el registro sencillo del ítem

Ficheros en el ítem

dc.contributor.advisor Sáez Silvestre, Carlos es_ES
dc.contributor.advisor Ferri Borredà, Pablo es_ES
dc.contributor.author Fernández Narro, David es_ES
dc.date.accessioned 2023-09-13T14:57:50Z
dc.date.available 2023-09-13T14:57:50Z
dc.date.created 2023-07-17
dc.date.issued 2023-09-13 es_ES
dc.identifier.uri http://hdl.handle.net/10251/196315
dc.description.abstract [ES] La variabilidad temporal en distribuciones de datos biomédicos es uno de los principales problemas hacia una inteligencia artificial basada en aprendizaje automático generalizable. La investigación y toma de decisiones en entornos biomédicos están centradas en el uso de los datos almacenados en los sistemas de información. Como consecuencia, una baja calidad en estos datos puede afectar negativamente a los procesos y resultados asociados a ellos, pudiendo dar lugar a decisiones subóptimas. En este trabajo, se lleva a cabo una caracterización exhaustiva de la variabilidad temporal de datos, uno de los problemas de calidad de datos más significativos para el aprendizaje automático, centrándose en el relevante conjunto de datos MIMIC-IV, con el fin de caracterizar diferentes tipos de variabilidad o “dataset shifts” como cambios de concepto, en las distribuciones marginales de las variables a predecir o en las covariables, tanto de forma gradual como abrupta. Para ello, se utilizará el Information Geometric Temporal plot, para obtener una visualización de la evolución temporal de las distribuciones de datos, basada en la proyección de la variedad estadística de las relaciones entre lotes temporales. Asimismo, los resultados serán contrastados con cambios temporales en el rendimiento de diferentes modelos predictivos basados en árboles de decisión, entrenados con subconjuntos de datos procedentes de distintos espacios temporales, con el fin de evaluar el impacto de la variabilidad temporal. Los resultados de este trabajo demuestran la relevancia de realizar un análisis de la variabilidad temporal previo al desarrollo de modelos predictivos en medicina basados en inteligencia artificial. es_ES
dc.description.abstract [EN] The temporal variability in distributions of biomedical data is one of the main challenges towards Artificial Intelligence based on generalizable machine learning. Research and decision-taking in biomedical environments are focused on the use of data stored in information systems. As a consequence, low quality in data can have a negative impact on the processes and results associated with them, leading to suboptimal decisions. In this project, an exhaustive characterization of temporal data variability is carried out, which is one of the most important data quality issues for machine learning, focusing on the relevant dataset MIMIC-IV, with the final purpose of characterizing different types of variability or "dataset shifts," such as concept drifts, prior probability shifts or covariate shifts, both in a gradual and abrupt manner. To accomplish it, the Information Geometric Temporal plot will be used to get a visualization of the temporal evolution of data distributions, based on the projection of the statistical variety of relationships between temporal batches. Additionally, the results will be compared with temporal changes in the performance of different predictive models based on decision trees, trained with subsets of data from different temporal spaces with the aim of evaluating the impact of the temporal variability. The results of this project show the importance of doing an analysis of the temporal variability prior to the development of predictive models in medicine based on Artificial Intelligence. es_ES
dc.format.extent 94 es_ES
dc.language Español es_ES
dc.publisher Universitat Politècnica de València es_ES
dc.rights Reserva de todos los derechos es_ES
dc.subject Calidad de datos es_ES
dc.subject Variabilidad temporal es_ES
dc.subject Inteligencia artificial es_ES
dc.subject Aprendizaje automático es_ES
dc.subject Enfoque generativo es_ES
dc.subject Enfoque discriminativo. es_ES
dc.subject Data quality es_ES
dc.subject Temporal variability es_ES
dc.subject Artificial intelligence es_ES
dc.subject Machine learning es_ES
dc.subject Generative approach es_ES
dc.subject Discriminative approach. es_ES
dc.subject.classification FISICA APLICADA es_ES
dc.subject.other Grado en Ingeniería Biomédica-Grau en Enginyeria Biomèdica es_ES
dc.title Caracterización de la variabilidad temporal en bases de datos médicas y estudio de su impacto en modelos predictivos basados en inteligencia artificial es_ES
dc.title.alternative Characterization of temporal variability in medical databases and study of its impact on predictive models based on artificial intelligence. es_ES
dc.title.alternative Caracterització de la variabilitat temporal en bases de dades mèdiques i estudi del seu impacte en models predictius basats en intel·ligència artificial es_ES
dc.type Proyecto/Trabajo fin de carrera/grado es_ES
dc.rights.accessRights Abierto es_ES
dc.contributor.affiliation Universitat Politècnica de València. Departamento de Física Aplicada - Departament de Física Aplicada es_ES
dc.contributor.affiliation Universitat Politècnica de València. Escuela Técnica Superior de Ingenieros Industriales - Escola Tècnica Superior d'Enginyers Industrials es_ES
dc.description.bibliographicCitation Fernández Narro, D. (2023). Caracterización de la variabilidad temporal en bases de datos médicas y estudio de su impacto en modelos predictivos basados en inteligencia artificial. Universitat Politècnica de València. http://hdl.handle.net/10251/196315 es_ES
dc.description.accrualMethod TFGM es_ES
dc.relation.pasarela TFGM\157563 es_ES


Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem