- -

Análisis de biomarcadores de cáncer colonorrectal (CCR) con técnicas de machine learning para la priorización en el cribado de colonoscopias

RiuNet: Repositorio Institucional de la Universidad Politécnica de Valencia

Compartir/Enviar a

Citas

Estadísticas

  • Estadisticas de Uso

Análisis de biomarcadores de cáncer colonorrectal (CCR) con técnicas de machine learning para la priorización en el cribado de colonoscopias

Mostrar el registro sencillo del ítem

Ficheros en el ítem

dc.contributor.advisor Carot Sierra, José Miguel es_ES
dc.contributor.author Sebastián Peris, Lucas es_ES
dc.date.accessioned 2024-09-11T18:38:13Z
dc.date.available 2024-09-11T18:38:13Z
dc.date.created 2024-07-15
dc.date.issued 2024-09-11 es_ES
dc.identifier.uri http://hdl.handle.net/10251/208001
dc.description.abstract [ES] El cáncer colorrectal (CCR) se trata de uno de los cánceres más comunes y mortales en España. Su comportamiento asintomático en estadios tempranos y el rápido aumento en mortalidad en diagnósticos tardíos, proponen la necesidad de establecer programas de cribado para el reconocimiento poblacional y la rápida detección de esta enfermedad. El programa de cribado de la Comunidad Valenciana se ha estandarizado hasta alcanzar la mayor parte de la población objetivo, esto permite reconocer un número mayor de casos de CCR, pero también aumenta el tiempo de espera medio para las pruebas endoscópicas, lo cual es especialmente notable tras la reciente pandemia por COVID19. En este trabajo se propone la elaboración de un algoritmo para la detección de casos de riesgo y su priorización para la colonoscopia. Para ello, se ha diseñado un proceso de transformación de datos para asegurar la disponibilidad de la información necesaria y relevante. Estos procesos incluyen la recodificación de casos, la selección de variables, la imputación de casos ausentes, el centrado y escalado de los datos y técnicas de muestreo como la generación de instancias artificiales. Tras ello, se ha estudiado el desempeño de una amplia gama de técnicas de clasificación, desde las más simples hasta algoritmos más complejos como las máquinas de vector soporte o los árboles de decisión. No solo se han estudiado estas técnicas de forma individual, sino también la combinación de diversos preprocesos junto con las variantes de los clasificadores, lo que generó un amplio conjunto de metodologías posibles. De entre ellas, se escogió junto con el equipo médico aquella que mejor se pudiera adaptar al contexto y las necesidades del proyecto. Como resultado de este TFG se ha obtenido un algoritmo de árbol de decisión. Este modelo emplea diversos biomarcadores reconocidos de CCR, con una alta interpretabilidad y un enfoque particular en la reducción de falsos positivos. Cuenta con una sensibilidad de 0.95 y una especificidad de 0.19. Esto permite priorizar alrededor del 5% de los participantes del programa de cribado, donde el 74% de los priorizados padece neoplasia avanzada y un 18.7% CCR. Finalmente, se han establecido una serie de necesidades y recomendaciones para la implementación del modelo al sistema de priorización de participantes en el programa de cribado. es_ES
dc.description.abstract [EN] Colorectal cancer (CRC) is one of the most common and mortal cancer in Spain. Due to being asymptomatic and the rapid growth of mortality when diagnosed in late stages, proposes the necessity to establish screening programs for early diagnosis and faster detection. The screening programme in Comunidad Valenciana has been standardized up to the screening of most of the target population, which helps recognize more CRCs but also increases the average waiting time for endoscopic procedures, especially after the recent COVID19 pandemic. This paper proposes the development of an algorithm for the detection of at-risk cases and their prioritisation for colonoscopy. To this end, a data transformation process has been designed to ensure the availability of the necessary and relevant information. These processes include case recoding, variable selection, missing case imputation, data centring and scaling, and sampling techniques such as artificial instance generation. Following this, the performance of a wide range of classification techniques has been studied, from the simplest to more complex algorithms such as support vector machines or decision trees. Not only have these techniques been studied individually, but also the combination of different preprocesses together with variants of classifiers, which generated a wide set of possible methodologies. From these, the one that could be best adapted to the context and needs of the project was chosen together with the medical team. As a result of this thesis, a decision tree algorithm has been derived. This model uses several recognized CRC biomarkers, with high interpretability and a particular focus on reducing false positives. It has a sensitivity of 0.95 and a specificity of 0.19. This allows to prioritize about 5% of the participants of the screening programme, where 74% of those prioritized have advanced neoplasia and 18.7% CRC. Finally, a series of needs and recommendations have been established for the implementation of the model in the prioritization system for participants in the screening programme. es_ES
dc.format.extent 60 es_ES
dc.language Español es_ES
dc.publisher Universitat Politècnica de València es_ES
dc.rights Reserva de todos los derechos es_ES
dc.subject Programa de cribado es_ES
dc.subject Modelos de clasificación es_ES
dc.subject Aprendizaje automático es_ES
dc.subject Screening programme es_ES
dc.subject Classification models es_ES
dc.subject Machine learning es_ES
dc.subject Cáncer colorrectal (CCR) es_ES
dc.subject Colorrectal cancer (CRC) es_ES
dc.subject.classification ESTADISTICA E INVESTIGACION OPERATIVA es_ES
dc.subject.other Grado en Ciencia de Datos-Grau en Ciència de Dades es_ES
dc.title Análisis de biomarcadores de cáncer colonorrectal (CCR) con técnicas de machine learning para la priorización en el cribado de colonoscopias es_ES
dc.title.alternative Analysis of colorectal cancer (CCR) biomarkers with machine learning techniques for prioritization in colonospy screening es_ES
dc.title.alternative Anàlisi de biomarcadors de càncer colonorrectal (CCR) amb tècniques de machine learning per a la priorització en el cribratge de colonoscòpies es_ES
dc.type Proyecto/Trabajo fin de carrera/grado es_ES
dc.rights.accessRights Abierto es_ES
dc.contributor.affiliation Universitat Politècnica de València. Departamento de Estadística e Investigación Operativa Aplicadas y Calidad - Departament d'Estadística i Investigació Operativa Aplicades i Qualitat es_ES
dc.contributor.affiliation Universitat Politècnica de València. Escola Tècnica Superior d'Enginyeria Informàtica es_ES
dc.description.bibliographicCitation Sebastián Peris, L. (2024). Análisis de biomarcadores de cáncer colonorrectal (CCR) con técnicas de machine learning para la priorización en el cribado de colonoscopias. Universitat Politècnica de València. http://hdl.handle.net/10251/208001 es_ES
dc.description.accrualMethod TFGM es_ES
dc.relation.pasarela TFGM\162250 es_ES


Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem