Resumen:
|
[ES] La densidad mamaria es uno de los factores de riesgo del cáncer de mama, y depende
directamente de la cantidad de tejido fibroglandular en proporción al tejido adiposo existente en la mama. En algunos casos, el ...[+]
[ES] La densidad mamaria es uno de los factores de riesgo del cáncer de mama, y depende
directamente de la cantidad de tejido fibroglandular en proporción al tejido adiposo existente en la mama. En algunos casos, el historial familiar juega un papel importante en el
desarrollo del tejido denso, por lo que, estudiar los biomarcadores que intervienen en su
crecimiento, puede resultar decisivo a la hora de descubrir nuevas formas de prevenir y
tratar el cáncer.
Las técnicas de aprendizaje automático son cada vez más utilizadas en el ámbito de la
salud, y concretamente, en la genética, logrando grandes avances tanto en la predicción
como en la detección temprana de enfermedades. Es por esto que, en este proyecto se
propone explorar vías de mejora del algoritmo de selección de características SEQENS,
con el objetivo de identificar dichas variantes genéticas implicadas en el desarrollo de la
densidad mamaria.
Para conseguir esto, se plantea ampliar el entrenamiento de SEQENS incorporando la
combinación de varios modelos heterogéneos, como una aproximación más estable respecto del rendimiento de los modelos individuales. La validación de los resultados obtenidos se lleva a cabo mediante la generación sintética de la variable objetivo y teniendo
en cuenta un conjunto de variables relevantes ya identificadas en trabajos previos.
[-]
[CA] La densitat mamària és un dels factors de risc del càncer de mama, i depén directament de la quantitat de teixit fibro glandular en proporció al teixit adipós existent en la
mama. En alguns casos, l’historial familiar ...[+]
[CA] La densitat mamària és un dels factors de risc del càncer de mama, i depén directament de la quantitat de teixit fibro glandular en proporció al teixit adipós existent en la
mama. En alguns casos, l’historial familiar juga un paper important en el desenvolupament del teixit dens, per la qual cosa, estudiar els biomarcadors que intervenen en el seu
creixement, pot resultar decisiu a l’hora de descobrir noves formes de previndre i tractar
el càncer.
Les tècniques d’aprenentatge automàtic són cada vegada més utilitzades en l’àmbit
de la salut, i concretament, en la genètica, aconseguint grans avanços tant en la predicció
com en la detecció primerenca de malalties. És per això que, en aquest projecte es proposa explorar vies de millora de l’algorisme de selecció de característiques SEQENS, amb
l’objectiu d’identificar dites variants genètiques implicades en el desenvolupament de la
densitat mamària.
Per assolir això, es planteja ampliar l’entrenament de SEQENS incorporant la combinació de diversos models heterogenis, com una aproximació més estable respecte del
rendiment dels models individuals. La validació dels resultats obtesos, es du a terme
mitjançant la generació sintètica de la variable objectiu i tenint en compte un conjunt de
variables rellevants ja identificades en treballs previs.
[-]
[EN] Breast density is one of the risk factors for breast cancer, and it directly depens on
the amount of fibroglandular tissue in proportion to the existing adipose tissue in the
breast. In some cases, family history ...[+]
[EN] Breast density is one of the risk factors for breast cancer, and it directly depens on
the amount of fibroglandular tissue in proportion to the existing adipose tissue in the
breast. In some cases, family history plays an important role on the development of dense
tissue, so for that, studying those biomarkers involved in its growth can be decisive when
discovering new ways of prevent and treat cancer.
Machine learning techniques are increasingly used in health field, and specifcally in
genetics, achieving great advances both in prediction and early detection of diseases.
That is why, in this project, exploring new ways of improvement of the SEQENS feature selection algorithm is proposed, with the aim of identifying these genetic variants
involved in the development of breast density.
In order to achieve this, expanding the training of SEQENS by incorporating an ensemble of several heterogeneous models is proposed, as a more stable approximation
regarding the performance of the individual models. Validation of the obtained results is
carried out through the synthetic generation of the target variable and taking into account
a set of relevant variables already identified in previous works.
[-]
|