- -

Combinación de modelos heterogéneos para la identificación de variantes genéticas implicadas en la densidad de mamaria.

RiuNet: Repositorio Institucional de la Universidad Politécnica de Valencia

Compartir/Enviar a

Citas

Estadísticas

  • Estadisticas de Uso

Combinación de modelos heterogéneos para la identificación de variantes genéticas implicadas en la densidad de mamaria.

Mostrar el registro sencillo del ítem

Ficheros en el ítem

dc.contributor.advisor Navarro Cerdán, José Ramón es_ES
dc.contributor.advisor Signol, François es_ES
dc.contributor.author Díaz Sydorenko, Karina es_ES
dc.date.accessioned 2023-09-26T08:48:32Z
dc.date.available 2023-09-26T08:48:32Z
dc.date.created 2023-07-13
dc.date.issued 2023-09-26 es_ES
dc.identifier.uri http://hdl.handle.net/10251/197101
dc.description.abstract [ES] La densidad mamaria es uno de los factores de riesgo del cáncer de mama, y depende directamente de la cantidad de tejido fibroglandular en proporción al tejido adiposo existente en la mama. En algunos casos, el historial familiar juega un papel importante en el desarrollo del tejido denso, por lo que, estudiar los biomarcadores que intervienen en su crecimiento, puede resultar decisivo a la hora de descubrir nuevas formas de prevenir y tratar el cáncer. Las técnicas de aprendizaje automático son cada vez más utilizadas en el ámbito de la salud, y concretamente, en la genética, logrando grandes avances tanto en la predicción como en la detección temprana de enfermedades. Es por esto que, en este proyecto se propone explorar vías de mejora del algoritmo de selección de características SEQENS, con el objetivo de identificar dichas variantes genéticas implicadas en el desarrollo de la densidad mamaria. Para conseguir esto, se plantea ampliar el entrenamiento de SEQENS incorporando la combinación de varios modelos heterogéneos, como una aproximación más estable respecto del rendimiento de los modelos individuales. La validación de los resultados obtenidos se lleva a cabo mediante la generación sintética de la variable objetivo y teniendo en cuenta un conjunto de variables relevantes ya identificadas en trabajos previos. es_ES
dc.description.abstract [CA] La densitat mamària és un dels factors de risc del càncer de mama, i depén directament de la quantitat de teixit fibro glandular en proporció al teixit adipós existent en la mama. En alguns casos, l’historial familiar juga un paper important en el desenvolupament del teixit dens, per la qual cosa, estudiar els biomarcadors que intervenen en el seu creixement, pot resultar decisiu a l’hora de descobrir noves formes de previndre i tractar el càncer. Les tècniques d’aprenentatge automàtic són cada vegada més utilitzades en l’àmbit de la salut, i concretament, en la genètica, aconseguint grans avanços tant en la predicció com en la detecció primerenca de malalties. És per això que, en aquest projecte es proposa explorar vies de millora de l’algorisme de selecció de característiques SEQENS, amb l’objectiu d’identificar dites variants genètiques implicades en el desenvolupament de la densitat mamària. Per assolir això, es planteja ampliar l’entrenament de SEQENS incorporant la combinació de diversos models heterogenis, com una aproximació més estable respecte del rendiment dels models individuals. La validació dels resultats obtesos, es du a terme mitjançant la generació sintètica de la variable objectiu i tenint en compte un conjunt de variables rellevants ja identificades en treballs previs. es_ES
dc.description.abstract [EN] Breast density is one of the risk factors for breast cancer, and it directly depens on the amount of fibroglandular tissue in proportion to the existing adipose tissue in the breast. In some cases, family history plays an important role on the development of dense tissue, so for that, studying those biomarkers involved in its growth can be decisive when discovering new ways of prevent and treat cancer. Machine learning techniques are increasingly used in health field, and specifcally in genetics, achieving great advances both in prediction and early detection of diseases. That is why, in this project, exploring new ways of improvement of the SEQENS feature selection algorithm is proposed, with the aim of identifying these genetic variants involved in the development of breast density. In order to achieve this, expanding the training of SEQENS by incorporating an ensemble of several heterogeneous models is proposed, as a more stable approximation regarding the performance of the individual models. Validation of the obtained results is carried out through the synthetic generation of the target variable and taking into account a set of relevant variables already identified in previous works. es_ES
dc.format.extent 68 es_ES
dc.language Español es_ES
dc.publisher Universitat Politècnica de València es_ES
dc.rights Reserva de todos los derechos es_ES
dc.subject Aprendizaje automático es_ES
dc.subject Cáncer de mama es_ES
dc.subject Cliff es_ES
dc.subject Densidad mamaria es_ES
dc.subject Ensemble es_ES
dc.subject Target sintético es_ES
dc.subject SEQENS es_ES
dc.subject Polimorfismo de un solo nucleótido es_ES
dc.subject Machine learning es_ES
dc.subject Breast cancer es_ES
dc.subject Breast density es_ES
dc.subject Synthetic target es_ES
dc.subject Single nucleotide polymorphism es_ES
dc.subject.classification ESTADISTICA E INVESTIGACION OPERATIVA es_ES
dc.subject.other Grado en Ciencia de Datos-Grau en Ciència de Dades es_ES
dc.title Combinación de modelos heterogéneos para la identificación de variantes genéticas implicadas en la densidad de mamaria. es_ES
dc.title.alternative Combination of heterogeneous models for the identification of genetic variants involved in breast density es_ES
dc.title.alternative Combinació de models heterogenis per a la identificació de variants genètiques implicades en la densitat mamària es_ES
dc.type Proyecto/Trabajo fin de carrera/grado es_ES
dc.rights.accessRights Cerrado es_ES
dc.contributor.affiliation Universitat Politècnica de València. Departamento de Estadística e Investigación Operativa Aplicadas y Calidad - Departament d'Estadística i Investigació Operativa Aplicades i Qualitat es_ES
dc.contributor.affiliation Universitat Politècnica de València. Escola Tècnica Superior d'Enginyeria Informàtica es_ES
dc.description.bibliographicCitation Díaz Sydorenko, K. (2023). Combinación de modelos heterogéneos para la identificación de variantes genéticas implicadas en la densidad de mamaria. Universitat Politècnica de València. http://hdl.handle.net/10251/197101 es_ES
dc.description.accrualMethod TFGM es_ES
dc.relation.pasarela TFGM\152978 es_ES


Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem