Mostrar el registro sencillo del ítem
dc.contributor.advisor | Llobet Azpitarte, Rafael![]() |
es_ES |
dc.contributor.advisor | Signol, François![]() |
es_ES |
dc.contributor.author | Pérez Argilés, Pilar![]() |
es_ES |
dc.date.accessioned | 2023-09-27T07:15:56Z | |
dc.date.available | 2023-09-27T07:15:56Z | |
dc.date.created | 2023-07-17 | |
dc.date.issued | 2023-09-27 | es_ES |
dc.identifier.uri | http://hdl.handle.net/10251/197148 | |
dc.description.abstract | [ES] Este TFG se centra en los desafíos actuales de la investigación del cáncer de mama, especialmente en el contexto de datos de alta dimensionalidad. El objetivo principal es explorar la relación entre los polimorfismos de un solo nucleótido (SNPs) y la densidad mamaria, un factor relevante en el desarrollo del cáncer de mama. Durante la investigación, se aplican técnicas de selección de características y Aprendizaje Automático en conjuntos de datos de alta dimensionalidad. Los resultados obtenidos revelan que la relación de los SNPs con la variable objetivo, el número de muestras y de variables influyen significativamente en la dificultad de la tarea. Se observa que una relación más fuerte entre los SNPs y la densidad mamaria facilita la predicción precisa de la variable objetivo. Además, a medida que aumenta el número de muestras disponibles para el análisis, se mejora la capacidad de los modelos para capturar patrones y realizar inferencias más sólidas. Dados estos resultados, se ha establecido una medida para cuantificar la dificultad de la tarea y se ha inferido una función que relaciona el rendimiento con la dificultad de la misma. Esto permite identificar la dificultad de la tarea real, extraer el subconjunto de SNPs relevantes para la densidad mamaria real y proporcionar una medida de confianza sobre su precisión y relevancia. | es_ES |
dc.description.abstract | [CA] Aquest TFG se centra en els reptes actuals de la investigació del càncer de mama, especialment en el context de les dades d’alta dimensionalitat. L’objectiu principal és explorar la relació entre els polimorfismes d’un sol nucleòtid (SNPs) i la densitat mamària, un factor rellevant en el desenvolupament del càncer de mama. Durant la investigació, s’apliquen tècniques de selecció de característiques i Aprenentatge Automàtic en conjunts de dades d’alta dimensionalitat. Els resultats obtinguts revelen que la relació dels SNPs amb la variable objectiu, el nombre de mostres i el nombre de variables influeixen significativament en la dificultat de la tasca. S’observa que una relació més forta entre els SNPs i la densitat mamària facilita la predicció precisa de la variable objectiu. A més, a mesura que augmenta el nombre de mostres disponibles per a l’anàlisi, es millora la capacitat dels models per capturar patrons i realitzar inferències més sòlides. Davant d’aquests resultats, s’ha establert una mesura per quantificar la dificultat de la tasca i s’ha inferit una funció que relaciona el rendiment amb la dificultat de la tasca. Això permet identificar la dificultat de la tasca real, extreure el subconjunt de SNPs rellevants per a la densitat mamària real i proporcionar una mesura de confiança sobre la seua precisió i rellevància. | es_ES |
dc.description.abstract | [EN] This study focuses on current challenges in breast cancer research, particularly in the context of high-dimensional data. The main objective is to explore the relationship between single nucleotide polymorphisms (SNPs) and breast density, a relevant factor in breast cancer development. During the research, feature selection techniques and Machine Learning are applied to high-dimensional datasets. The obtained results reveal that the relationship between SNPs and the target variable, the number of samples, and the number of variables significantly influence the task difficulty. It is observed that a stronger relationship between SNPs and breast density facilitates accurate prediction of the target variable. Furthermore, as the number of samples available for analysis increases, the models’ ability to capture patterns and make more robust inferences improves. Based on these results, a measure has been established to quantify the task difficulty, and a function has been inferred that relates performance to task difficulty. This allows identifying the difficulty of the actual task, extracting the subset of SNPs relevant to real breast density, and providing a measure of confidence regarding their accuracy and relevance. | es_ES |
dc.format.extent | 102 | es_ES |
dc.language | Español | es_ES |
dc.publisher | Universitat Politècnica de València | es_ES |
dc.rights | Reserva de todos los derechos | es_ES |
dc.subject | Densidad mamaria | es_ES |
dc.subject | SNP | es_ES |
dc.subject | GWAS | es_ES |
dc.subject | Seleccíon secuencial de características | es_ES |
dc.subject | Identificación de variables relevantes | es_ES |
dc.subject | SEQENS | es_ES |
dc.subject | Alta dimensionalidad | es_ES |
dc.subject | Aprendizaje automático | es_ES |
dc.subject | K-vecinos | es_ES |
dc.subject | Gradient Boosting | es_ES |
dc.subject | Breast density | es_ES |
dc.subject | Sequential feature selection | es_ES |
dc.subject | Identification of relevant variables | es_ES |
dc.subject | High dimensionality | es_ES |
dc.subject | Machine learning | es_ES |
dc.subject | K-neighbors | es_ES |
dc.subject.classification | LENGUAJES Y SISTEMAS INFORMATICOS | es_ES |
dc.subject.other | Grado en Ciencia de Datos-Grau en Ciència de Dades | es_ES |
dc.title | Identificación de variantes genéticas asociadas con la densidad mamaria | es_ES |
dc.title.alternative | Identification of genetic variants associated with breast density | es_ES |
dc.title.alternative | Identificació de variants genètiques associades amb la densitat mamària | es_ES |
dc.type | Proyecto/Trabajo fin de carrera/grado | es_ES |
dc.rights.accessRights | Cerrado | es_ES |
dc.contributor.affiliation | Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació | es_ES |
dc.contributor.affiliation | Universitat Politècnica de València. Escola Tècnica Superior d'Enginyeria Informàtica | es_ES |
dc.description.bibliographicCitation | Pérez Argilés, P. (2023). Identificación de variantes genéticas asociadas con la densidad mamaria. Universitat Politècnica de València. http://hdl.handle.net/10251/197148 | es_ES |
dc.description.accrualMethod | TFGM | es_ES |
dc.relation.pasarela | TFGM\152980 | es_ES |