- -

Comparación de métodos altamente competitivos para la clasificación de cáncer de colon en datos procedentes de secuenciación masiva del genoma

RiuNet: Repositorio Institucional de la Universidad Politécnica de Valencia

Compartir/Enviar a

Citas

Estadísticas

  • Estadisticas de Uso

Comparación de métodos altamente competitivos para la clasificación de cáncer de colon en datos procedentes de secuenciación masiva del genoma

Mostrar el registro sencillo del ítem

Ficheros en el ítem

dc.contributor.advisor Debón Aucejo, Ana María es_ES
dc.contributor.advisor Álvaro Meca, Luis Alejandro es_ES
dc.contributor.author Ochoa de Aspuru Díaz, Lucía es_ES
dc.date.accessioned 2024-11-03T11:18:20Z
dc.date.available 2024-11-03T11:18:20Z
dc.date.created 2024-09-23
dc.date.issued 2024-11-03 es_ES
dc.identifier.uri http://hdl.handle.net/10251/211200
dc.description.abstract [ES] El cáncer de colon (CRC) es una patología que presenta retos para la salud global por su alta morbilidad y mortalidad. Detectar y predecir este tipo de cáncer es crucial para permitir intervenciones tempranas y mejorar los resultados del tratamiento. En este trabajo fin de máster se parte de la secuenciación masiva del genoma y se consideran los genes marcadores de un proceso inflamatorio para predecir la presencia de tumores primarios en pacientes. Los datos constan de un total de 2045 individuos y 196 genes marcadores de inflamación, de los cuales 1234 son controles y 811 diagnosticados con CRC. Primeramente, se llevó a cabo un análisis exploratorio de los datos con técnicas no supervisadas como el PCA o el clustering. Ambas técnicas permitieron visualizar la segmentación de los dos grupos. Posteriormente, se emplearon modelos de minería de datos y el random forest tuvo el mejor rendimiento en diferentes conjuntos de validación. Además, se ajustaron los hiper-parámetros del modelo XGBoost, lo que resultó en una mejora significativa de su capacidad predictiva. Finalmente, la interpretación de los modelos reveló que los genes más determinantes para la clasificación del CRC son RIPK2, LPAR1 y TIMP1, entre otros. es_ES
dc.description.abstract [EN] Colorectal cancer (CRC) is a pathology that presents global health challenges due to its high morbidity and mortality. Detecting and predicting this type of cancer is crucial to enable early interventions and improve treatment outcomes. This master’s thesis is based on massive genome sequencing and considers the marker genes of an inflammatory process to predict the presence of primary tumours in patients. The sample consists of 2045 individuals and 196 marker genes, of which 1234 are controls and 811 diagnosed with CRC. First, an exploratory analysis of the data was carried out using unsupervised techniques such as PCA or clustering. Both techniques allowed us to visualise the segmentation of the two groups. Subsequently, data mining models were used and the random forest performed best on different validation sets. In addition, the hyper-parameters of the XGBoost model were adjusted, resulting in a significant improvement of its predictive ability. Finally, the interpretation of the models revealed that the most determinant genes for CRC classification are RIPK2, LPAR1 and TIMP1, among others. es_ES
dc.format.extent 66 es_ES
dc.language Español es_ES
dc.publisher Universitat Politècnica de València es_ES
dc.rights Reserva de todos los derechos es_ES
dc.subject Minería de datos es_ES
dc.subject Cáncer de Colon es_ES
dc.subject Random Forest es_ES
dc.subject XGBoost es_ES
dc.subject Valores SHAP es_ES
dc.subject.classification ESTADISTICA E INVESTIGACION OPERATIVA es_ES
dc.subject.other Máster Universitario en Ingeniería de Análisis de Datos, Mejora de Procesos y Toma de Decisiones-Màster Universitari en Enginyeria d'Anàlisi de Dades, Millora de Processos i Presa de decisions es_ES
dc.title Comparación de métodos altamente competitivos para la clasificación de cáncer de colon en datos procedentes de secuenciación masiva del genoma es_ES
dc.title.alternative Comparison of highly competitive methods for colon cancer classification using data from massive genome sequencing. es_ES
dc.title.alternative Comparació de mètodes altament competitius per a la classificació de càncer de còlon en dades procedents de seqüenciació massiva del genoma es_ES
dc.type Tesis de máster es_ES
dc.rights.accessRights Cerrado es_ES
dc.contributor.affiliation Universitat Politècnica de València. Departamento de Estadística e Investigación Operativa Aplicadas y Calidad - Departament d'Estadística i Investigació Operativa Aplicades i Qualitat es_ES
dc.description.bibliographicCitation Ochoa De Aspuru Díaz, L. (2024). Comparación de métodos altamente competitivos para la clasificación de cáncer de colon en datos procedentes de secuenciación masiva del genoma. Universitat Politècnica de València. http://hdl.handle.net/10251/211200 es_ES
dc.description.accrualMethod TFGM es_ES
dc.relation.pasarela TFGM\165734 es_ES


Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem