Mostrar el registro sencillo del ítem
dc.contributor.advisor | Sáez Silvestre, Carlos | es_ES |
dc.contributor.advisor | Ferri Borredà, Pablo | es_ES |
dc.contributor.author | Fernández Narro, David | es_ES |
dc.date.accessioned | 2023-09-13T14:57:50Z | |
dc.date.available | 2023-09-13T14:57:50Z | |
dc.date.created | 2023-07-17 | |
dc.date.issued | 2023-09-13 | es_ES |
dc.identifier.uri | http://hdl.handle.net/10251/196315 | |
dc.description.abstract | [ES] La variabilidad temporal en distribuciones de datos biomédicos es uno de los principales problemas hacia una inteligencia artificial basada en aprendizaje automático generalizable. La investigación y toma de decisiones en entornos biomédicos están centradas en el uso de los datos almacenados en los sistemas de información. Como consecuencia, una baja calidad en estos datos puede afectar negativamente a los procesos y resultados asociados a ellos, pudiendo dar lugar a decisiones subóptimas. En este trabajo, se lleva a cabo una caracterización exhaustiva de la variabilidad temporal de datos, uno de los problemas de calidad de datos más significativos para el aprendizaje automático, centrándose en el relevante conjunto de datos MIMIC-IV, con el fin de caracterizar diferentes tipos de variabilidad o “dataset shifts” como cambios de concepto, en las distribuciones marginales de las variables a predecir o en las covariables, tanto de forma gradual como abrupta. Para ello, se utilizará el Information Geometric Temporal plot, para obtener una visualización de la evolución temporal de las distribuciones de datos, basada en la proyección de la variedad estadística de las relaciones entre lotes temporales. Asimismo, los resultados serán contrastados con cambios temporales en el rendimiento de diferentes modelos predictivos basados en árboles de decisión, entrenados con subconjuntos de datos procedentes de distintos espacios temporales, con el fin de evaluar el impacto de la variabilidad temporal. Los resultados de este trabajo demuestran la relevancia de realizar un análisis de la variabilidad temporal previo al desarrollo de modelos predictivos en medicina basados en inteligencia artificial. | es_ES |
dc.description.abstract | [EN] The temporal variability in distributions of biomedical data is one of the main challenges towards Artificial Intelligence based on generalizable machine learning. Research and decision-taking in biomedical environments are focused on the use of data stored in information systems. As a consequence, low quality in data can have a negative impact on the processes and results associated with them, leading to suboptimal decisions. In this project, an exhaustive characterization of temporal data variability is carried out, which is one of the most important data quality issues for machine learning, focusing on the relevant dataset MIMIC-IV, with the final purpose of characterizing different types of variability or "dataset shifts," such as concept drifts, prior probability shifts or covariate shifts, both in a gradual and abrupt manner. To accomplish it, the Information Geometric Temporal plot will be used to get a visualization of the temporal evolution of data distributions, based on the projection of the statistical variety of relationships between temporal batches. Additionally, the results will be compared with temporal changes in the performance of different predictive models based on decision trees, trained with subsets of data from different temporal spaces with the aim of evaluating the impact of the temporal variability. The results of this project show the importance of doing an analysis of the temporal variability prior to the development of predictive models in medicine based on Artificial Intelligence. | es_ES |
dc.format.extent | 94 | es_ES |
dc.language | Español | es_ES |
dc.publisher | Universitat Politècnica de València | es_ES |
dc.rights | Reserva de todos los derechos | es_ES |
dc.subject | Calidad de datos | es_ES |
dc.subject | Variabilidad temporal | es_ES |
dc.subject | Inteligencia artificial | es_ES |
dc.subject | Aprendizaje automático | es_ES |
dc.subject | Enfoque generativo | es_ES |
dc.subject | Enfoque discriminativo. | es_ES |
dc.subject | Data quality | es_ES |
dc.subject | Temporal variability | es_ES |
dc.subject | Artificial intelligence | es_ES |
dc.subject | Machine learning | es_ES |
dc.subject | Generative approach | es_ES |
dc.subject | Discriminative approach. | es_ES |
dc.subject.classification | FISICA APLICADA | es_ES |
dc.subject.other | Grado en Ingeniería Biomédica-Grau en Enginyeria Biomèdica | es_ES |
dc.title | Caracterización de la variabilidad temporal en bases de datos médicas y estudio de su impacto en modelos predictivos basados en inteligencia artificial | es_ES |
dc.title.alternative | Characterization of temporal variability in medical databases and study of its impact on predictive models based on artificial intelligence. | es_ES |
dc.title.alternative | Caracterització de la variabilitat temporal en bases de dades mèdiques i estudi del seu impacte en models predictius basats en intel·ligència artificial | es_ES |
dc.type | Proyecto/Trabajo fin de carrera/grado | es_ES |
dc.rights.accessRights | Abierto | es_ES |
dc.contributor.affiliation | Universitat Politècnica de València. Departamento de Física Aplicada - Departament de Física Aplicada | es_ES |
dc.contributor.affiliation | Universitat Politècnica de València. Escuela Técnica Superior de Ingenieros Industriales - Escola Tècnica Superior d'Enginyers Industrials | es_ES |
dc.description.bibliographicCitation | Fernández Narro, D. (2023). Caracterización de la variabilidad temporal en bases de datos médicas y estudio de su impacto en modelos predictivos basados en inteligencia artificial. Universitat Politècnica de València. http://hdl.handle.net/10251/196315 | es_ES |
dc.description.accrualMethod | TFGM | es_ES |
dc.relation.pasarela | TFGM\157563 | es_ES |