Mostrar el registro sencillo del ítem
dc.contributor.advisor | Navarro Cerdán, José Ramón | es_ES |
dc.contributor.advisor | Signol, François | es_ES |
dc.contributor.author | Díaz Sydorenko, Karina | es_ES |
dc.date.accessioned | 2023-09-26T08:48:32Z | |
dc.date.available | 2023-09-26T08:48:32Z | |
dc.date.created | 2023-07-13 | |
dc.date.issued | 2023-09-26 | es_ES |
dc.identifier.uri | http://hdl.handle.net/10251/197101 | |
dc.description.abstract | [ES] La densidad mamaria es uno de los factores de riesgo del cáncer de mama, y depende directamente de la cantidad de tejido fibroglandular en proporción al tejido adiposo existente en la mama. En algunos casos, el historial familiar juega un papel importante en el desarrollo del tejido denso, por lo que, estudiar los biomarcadores que intervienen en su crecimiento, puede resultar decisivo a la hora de descubrir nuevas formas de prevenir y tratar el cáncer. Las técnicas de aprendizaje automático son cada vez más utilizadas en el ámbito de la salud, y concretamente, en la genética, logrando grandes avances tanto en la predicción como en la detección temprana de enfermedades. Es por esto que, en este proyecto se propone explorar vías de mejora del algoritmo de selección de características SEQENS, con el objetivo de identificar dichas variantes genéticas implicadas en el desarrollo de la densidad mamaria. Para conseguir esto, se plantea ampliar el entrenamiento de SEQENS incorporando la combinación de varios modelos heterogéneos, como una aproximación más estable respecto del rendimiento de los modelos individuales. La validación de los resultados obtenidos se lleva a cabo mediante la generación sintética de la variable objetivo y teniendo en cuenta un conjunto de variables relevantes ya identificadas en trabajos previos. | es_ES |
dc.description.abstract | [CA] La densitat mamària és un dels factors de risc del càncer de mama, i depén directament de la quantitat de teixit fibro glandular en proporció al teixit adipós existent en la mama. En alguns casos, l’historial familiar juga un paper important en el desenvolupament del teixit dens, per la qual cosa, estudiar els biomarcadors que intervenen en el seu creixement, pot resultar decisiu a l’hora de descobrir noves formes de previndre i tractar el càncer. Les tècniques d’aprenentatge automàtic són cada vegada més utilitzades en l’àmbit de la salut, i concretament, en la genètica, aconseguint grans avanços tant en la predicció com en la detecció primerenca de malalties. És per això que, en aquest projecte es proposa explorar vies de millora de l’algorisme de selecció de característiques SEQENS, amb l’objectiu d’identificar dites variants genètiques implicades en el desenvolupament de la densitat mamària. Per assolir això, es planteja ampliar l’entrenament de SEQENS incorporant la combinació de diversos models heterogenis, com una aproximació més estable respecte del rendiment dels models individuals. La validació dels resultats obtesos, es du a terme mitjançant la generació sintètica de la variable objectiu i tenint en compte un conjunt de variables rellevants ja identificades en treballs previs. | es_ES |
dc.description.abstract | [EN] Breast density is one of the risk factors for breast cancer, and it directly depens on the amount of fibroglandular tissue in proportion to the existing adipose tissue in the breast. In some cases, family history plays an important role on the development of dense tissue, so for that, studying those biomarkers involved in its growth can be decisive when discovering new ways of prevent and treat cancer. Machine learning techniques are increasingly used in health field, and specifcally in genetics, achieving great advances both in prediction and early detection of diseases. That is why, in this project, exploring new ways of improvement of the SEQENS feature selection algorithm is proposed, with the aim of identifying these genetic variants involved in the development of breast density. In order to achieve this, expanding the training of SEQENS by incorporating an ensemble of several heterogeneous models is proposed, as a more stable approximation regarding the performance of the individual models. Validation of the obtained results is carried out through the synthetic generation of the target variable and taking into account a set of relevant variables already identified in previous works. | es_ES |
dc.format.extent | 68 | es_ES |
dc.language | Español | es_ES |
dc.publisher | Universitat Politècnica de València | es_ES |
dc.rights | Reserva de todos los derechos | es_ES |
dc.subject | Aprendizaje automático | es_ES |
dc.subject | Cáncer de mama | es_ES |
dc.subject | Cliff | es_ES |
dc.subject | Densidad mamaria | es_ES |
dc.subject | Ensemble | es_ES |
dc.subject | Target sintético | es_ES |
dc.subject | SEQENS | es_ES |
dc.subject | Polimorfismo de un solo nucleótido | es_ES |
dc.subject | Machine learning | es_ES |
dc.subject | Breast cancer | es_ES |
dc.subject | Breast density | es_ES |
dc.subject | Synthetic target | es_ES |
dc.subject | Single nucleotide polymorphism | es_ES |
dc.subject.classification | ESTADISTICA E INVESTIGACION OPERATIVA | es_ES |
dc.subject.other | Grado en Ciencia de Datos-Grau en Ciència de Dades | es_ES |
dc.title | Combinación de modelos heterogéneos para la identificación de variantes genéticas implicadas en la densidad de mamaria. | es_ES |
dc.title.alternative | Combination of heterogeneous models for the identification of genetic variants involved in breast density | es_ES |
dc.title.alternative | Combinació de models heterogenis per a la identificació de variants genètiques implicades en la densitat mamària | es_ES |
dc.type | Proyecto/Trabajo fin de carrera/grado | es_ES |
dc.rights.accessRights | Cerrado | es_ES |
dc.contributor.affiliation | Universitat Politècnica de València. Departamento de Estadística e Investigación Operativa Aplicadas y Calidad - Departament d'Estadística i Investigació Operativa Aplicades i Qualitat | es_ES |
dc.contributor.affiliation | Universitat Politècnica de València. Escola Tècnica Superior d'Enginyeria Informàtica | es_ES |
dc.description.bibliographicCitation | Díaz Sydorenko, K. (2023). Combinación de modelos heterogéneos para la identificación de variantes genéticas implicadas en la densidad de mamaria. Universitat Politècnica de València. http://hdl.handle.net/10251/197101 | es_ES |
dc.description.accrualMethod | TFGM | es_ES |
dc.relation.pasarela | TFGM\152978 | es_ES |