Mostrar el registro sencillo del ítem
dc.contributor.advisor | Debón Aucejo, Ana María | es_ES |
dc.contributor.advisor | Álvaro Meca, Luis Alejandro | es_ES |
dc.contributor.author | Ochoa de Aspuru Díaz, Lucía | es_ES |
dc.date.accessioned | 2024-11-03T11:18:20Z | |
dc.date.available | 2024-11-03T11:18:20Z | |
dc.date.created | 2024-09-23 | |
dc.date.issued | 2024-11-03 | es_ES |
dc.identifier.uri | http://hdl.handle.net/10251/211200 | |
dc.description.abstract | [ES] El cáncer de colon (CRC) es una patología que presenta retos para la salud global por su alta morbilidad y mortalidad. Detectar y predecir este tipo de cáncer es crucial para permitir intervenciones tempranas y mejorar los resultados del tratamiento. En este trabajo fin de máster se parte de la secuenciación masiva del genoma y se consideran los genes marcadores de un proceso inflamatorio para predecir la presencia de tumores primarios en pacientes. Los datos constan de un total de 2045 individuos y 196 genes marcadores de inflamación, de los cuales 1234 son controles y 811 diagnosticados con CRC. Primeramente, se llevó a cabo un análisis exploratorio de los datos con técnicas no supervisadas como el PCA o el clustering. Ambas técnicas permitieron visualizar la segmentación de los dos grupos. Posteriormente, se emplearon modelos de minería de datos y el random forest tuvo el mejor rendimiento en diferentes conjuntos de validación. Además, se ajustaron los hiper-parámetros del modelo XGBoost, lo que resultó en una mejora significativa de su capacidad predictiva. Finalmente, la interpretación de los modelos reveló que los genes más determinantes para la clasificación del CRC son RIPK2, LPAR1 y TIMP1, entre otros. | es_ES |
dc.description.abstract | [EN] Colorectal cancer (CRC) is a pathology that presents global health challenges due to its high morbidity and mortality. Detecting and predicting this type of cancer is crucial to enable early interventions and improve treatment outcomes. This master’s thesis is based on massive genome sequencing and considers the marker genes of an inflammatory process to predict the presence of primary tumours in patients. The sample consists of 2045 individuals and 196 marker genes, of which 1234 are controls and 811 diagnosed with CRC. First, an exploratory analysis of the data was carried out using unsupervised techniques such as PCA or clustering. Both techniques allowed us to visualise the segmentation of the two groups. Subsequently, data mining models were used and the random forest performed best on different validation sets. In addition, the hyper-parameters of the XGBoost model were adjusted, resulting in a significant improvement of its predictive ability. Finally, the interpretation of the models revealed that the most determinant genes for CRC classification are RIPK2, LPAR1 and TIMP1, among others. | es_ES |
dc.format.extent | 66 | es_ES |
dc.language | Español | es_ES |
dc.publisher | Universitat Politècnica de València | es_ES |
dc.rights | Reserva de todos los derechos | es_ES |
dc.subject | Minería de datos | es_ES |
dc.subject | Cáncer de Colon | es_ES |
dc.subject | Random Forest | es_ES |
dc.subject | XGBoost | es_ES |
dc.subject | Valores SHAP | es_ES |
dc.subject.classification | ESTADISTICA E INVESTIGACION OPERATIVA | es_ES |
dc.subject.other | Máster Universitario en Ingeniería de Análisis de Datos, Mejora de Procesos y Toma de Decisiones-Màster Universitari en Enginyeria d'Anàlisi de Dades, Millora de Processos i Presa de decisions | es_ES |
dc.title | Comparación de métodos altamente competitivos para la clasificación de cáncer de colon en datos procedentes de secuenciación masiva del genoma | es_ES |
dc.title.alternative | Comparison of highly competitive methods for colon cancer classification using data from massive genome sequencing. | es_ES |
dc.title.alternative | Comparació de mètodes altament competitius per a la classificació de càncer de còlon en dades procedents de seqüenciació massiva del genoma | es_ES |
dc.type | Tesis de máster | es_ES |
dc.rights.accessRights | Cerrado | es_ES |
dc.contributor.affiliation | Universitat Politècnica de València. Departamento de Estadística e Investigación Operativa Aplicadas y Calidad - Departament d'Estadística i Investigació Operativa Aplicades i Qualitat | es_ES |
dc.description.bibliographicCitation | Ochoa De Aspuru Díaz, L. (2024). Comparación de métodos altamente competitivos para la clasificación de cáncer de colon en datos procedentes de secuenciación masiva del genoma. Universitat Politècnica de València. http://hdl.handle.net/10251/211200 | es_ES |
dc.description.accrualMethod | TFGM | es_ES |
dc.relation.pasarela | TFGM\165734 | es_ES |