Mostrar el registro sencillo del ítem
dc.contributor.advisor | Carot Sierra, José Miguel | es_ES |
dc.contributor.author | Sebastián Peris, Lucas | es_ES |
dc.date.accessioned | 2024-09-11T18:38:13Z | |
dc.date.available | 2024-09-11T18:38:13Z | |
dc.date.created | 2024-07-15 | |
dc.date.issued | 2024-09-11 | es_ES |
dc.identifier.uri | http://hdl.handle.net/10251/208001 | |
dc.description.abstract | [ES] El cáncer colorrectal (CCR) se trata de uno de los cánceres más comunes y mortales en España. Su comportamiento asintomático en estadios tempranos y el rápido aumento en mortalidad en diagnósticos tardíos, proponen la necesidad de establecer programas de cribado para el reconocimiento poblacional y la rápida detección de esta enfermedad. El programa de cribado de la Comunidad Valenciana se ha estandarizado hasta alcanzar la mayor parte de la población objetivo, esto permite reconocer un número mayor de casos de CCR, pero también aumenta el tiempo de espera medio para las pruebas endoscópicas, lo cual es especialmente notable tras la reciente pandemia por COVID19. En este trabajo se propone la elaboración de un algoritmo para la detección de casos de riesgo y su priorización para la colonoscopia. Para ello, se ha diseñado un proceso de transformación de datos para asegurar la disponibilidad de la información necesaria y relevante. Estos procesos incluyen la recodificación de casos, la selección de variables, la imputación de casos ausentes, el centrado y escalado de los datos y técnicas de muestreo como la generación de instancias artificiales. Tras ello, se ha estudiado el desempeño de una amplia gama de técnicas de clasificación, desde las más simples hasta algoritmos más complejos como las máquinas de vector soporte o los árboles de decisión. No solo se han estudiado estas técnicas de forma individual, sino también la combinación de diversos preprocesos junto con las variantes de los clasificadores, lo que generó un amplio conjunto de metodologías posibles. De entre ellas, se escogió junto con el equipo médico aquella que mejor se pudiera adaptar al contexto y las necesidades del proyecto. Como resultado de este TFG se ha obtenido un algoritmo de árbol de decisión. Este modelo emplea diversos biomarcadores reconocidos de CCR, con una alta interpretabilidad y un enfoque particular en la reducción de falsos positivos. Cuenta con una sensibilidad de 0.95 y una especificidad de 0.19. Esto permite priorizar alrededor del 5% de los participantes del programa de cribado, donde el 74% de los priorizados padece neoplasia avanzada y un 18.7% CCR. Finalmente, se han establecido una serie de necesidades y recomendaciones para la implementación del modelo al sistema de priorización de participantes en el programa de cribado. | es_ES |
dc.description.abstract | [EN] Colorectal cancer (CRC) is one of the most common and mortal cancer in Spain. Due to being asymptomatic and the rapid growth of mortality when diagnosed in late stages, proposes the necessity to establish screening programs for early diagnosis and faster detection. The screening programme in Comunidad Valenciana has been standardized up to the screening of most of the target population, which helps recognize more CRCs but also increases the average waiting time for endoscopic procedures, especially after the recent COVID19 pandemic. This paper proposes the development of an algorithm for the detection of at-risk cases and their prioritisation for colonoscopy. To this end, a data transformation process has been designed to ensure the availability of the necessary and relevant information. These processes include case recoding, variable selection, missing case imputation, data centring and scaling, and sampling techniques such as artificial instance generation. Following this, the performance of a wide range of classification techniques has been studied, from the simplest to more complex algorithms such as support vector machines or decision trees. Not only have these techniques been studied individually, but also the combination of different preprocesses together with variants of classifiers, which generated a wide set of possible methodologies. From these, the one that could be best adapted to the context and needs of the project was chosen together with the medical team. As a result of this thesis, a decision tree algorithm has been derived. This model uses several recognized CRC biomarkers, with high interpretability and a particular focus on reducing false positives. It has a sensitivity of 0.95 and a specificity of 0.19. This allows to prioritize about 5% of the participants of the screening programme, where 74% of those prioritized have advanced neoplasia and 18.7% CRC. Finally, a series of needs and recommendations have been established for the implementation of the model in the prioritization system for participants in the screening programme. | es_ES |
dc.format.extent | 60 | es_ES |
dc.language | Español | es_ES |
dc.publisher | Universitat Politècnica de València | es_ES |
dc.rights | Reserva de todos los derechos | es_ES |
dc.subject | Programa de cribado | es_ES |
dc.subject | Modelos de clasificación | es_ES |
dc.subject | Aprendizaje automático | es_ES |
dc.subject | Screening programme | es_ES |
dc.subject | Classification models | es_ES |
dc.subject | Machine learning | es_ES |
dc.subject | Cáncer colorrectal (CCR) | es_ES |
dc.subject | Colorrectal cancer (CRC) | es_ES |
dc.subject.classification | ESTADISTICA E INVESTIGACION OPERATIVA | es_ES |
dc.subject.other | Grado en Ciencia de Datos-Grau en Ciència de Dades | es_ES |
dc.title | Análisis de biomarcadores de cáncer colonorrectal (CCR) con técnicas de machine learning para la priorización en el cribado de colonoscopias | es_ES |
dc.title.alternative | Analysis of colorectal cancer (CCR) biomarkers with machine learning techniques for prioritization in colonospy screening | es_ES |
dc.title.alternative | Anàlisi de biomarcadors de càncer colonorrectal (CCR) amb tècniques de machine learning per a la priorització en el cribratge de colonoscòpies | es_ES |
dc.type | Proyecto/Trabajo fin de carrera/grado | es_ES |
dc.rights.accessRights | Abierto | es_ES |
dc.contributor.affiliation | Universitat Politècnica de València. Departamento de Estadística e Investigación Operativa Aplicadas y Calidad - Departament d'Estadística i Investigació Operativa Aplicades i Qualitat | es_ES |
dc.contributor.affiliation | Universitat Politècnica de València. Escola Tècnica Superior d'Enginyeria Informàtica | es_ES |
dc.description.bibliographicCitation | Sebastián Peris, L. (2024). Análisis de biomarcadores de cáncer colonorrectal (CCR) con técnicas de machine learning para la priorización en el cribado de colonoscopias. Universitat Politècnica de València. http://hdl.handle.net/10251/208001 | es_ES |
dc.description.accrualMethod | TFGM | es_ES |
dc.relation.pasarela | TFGM\162250 | es_ES |