- -

Modelos estadísticos multivariantes para la integración de datos multi-ómicos en el estudio del efecto del selenio en la diabetes

RiuNet: Repositorio Institucional de la Universidad Politécnica de Valencia

Compartir/Enviar a

Citas

Estadísticas

  • Estadisticas de Uso

Modelos estadísticos multivariantes para la integración de datos multi-ómicos en el estudio del efecto del selenio en la diabetes

Mostrar el registro sencillo del ítem

Ficheros en el ítem

dc.contributor.advisor Tarazona Campos, Sonia es_ES
dc.contributor.advisor Rodríguez Hernández, Zulema es_ES
dc.contributor.author Lucas Blázquez, Óscar es_ES
dc.date.accessioned 2023-10-24T14:34:26Z
dc.date.available 2023-10-24T14:34:26Z
dc.date.created 2023-09-25
dc.date.issued 2023-10-24 es_ES
dc.identifier.uri http://hdl.handle.net/10251/198717
dc.description.abstract [ES] El selenio es un micro-nutriente esencial para la mayoría de los organismos, incluidos los humanos, y juega un papel clave en una gran variedad de procesos biológicos mediados por las selenoproteínas. Tanto el exceso como el déficit de selenio pueden ser perjudiciales para la salud. Aunque se ha relacionado el selenio con diferentes enfermedades crónicas, poco se sabe sobre su papel, así como el de sus especies (selenoproteínas y selenometabolitos), en la diabetes tipo 2 y en la resistencia a la insulina, así como de los mecanismos moleculares alterados por causa del selenio en esta enfermedad. Es por ello que el Proyecto SelenOmics, en el cual se enmarca el presente trabajo, es innovador al plantear la integración de datos de distinta naturaleza (variables clínicas, sociodemográficas, moleculares, etc.) para evaluar la relación del selenio con la diabetes tipo 2 y la resistencia a la insulina y poder esclarecer los mecanismos biológicos que intervienen en dicha relación. En concreto, en este trabajo, se analizarán datos del estudio de Salud de los Trabajadores de Aragón, una cohorte española de la factoría Opel en Zaragoza que se compone de más de 1000 individuos. Para todos o parte de los individuos de la cohorte se ha recogido información que incluye: 43 variables clínicas, sociodemográficas, de exposición a metales y de especies de selenio (n=1890), y medidas moleculares obtenidas mediante técnicas de alto rendimiento (datos ómicos) como metilación (n=30, p=841553), genómica (n=1000, p~millones) y metabolómica (n=1681, p=73). El objetivo del trabajo es integrar todos estos tipos de datos mediante modelos estadísticos multivariantes que permitan analizar el efecto del selenio sobre la enfermedad e identificar qué mecanismos moleculares se ven alterados en este proceso. Dado el reto que supone analizar datos de tan diferente naturaleza y dimensionalidad, en primer lugar, se llevará a cabo un análisis exploratorio multivariante de cada uno de los bloques de datos por separado, empleando técnicas no supervisadas como el Análisis de Componentes Principales (PCA), que permitirá estudiar la relación entre las variables y detectar valores anómalos. Se realizará también un estudio de los valores faltantes en cada bloque de datos y se imputarán mediante métodos basados en modelos predictivos. Una vez procesados y explorados los distintos bloques de datos de manera independiente, se aplicarán distintas metodologías de integración estadística de datos ómicos y clínicos para el estudio de la diabetes (incluyendo técnicas de reducción de la dimensión, modelos lineales generalizados, etc.), cuyos resultados serán comparados tanto cuantitativa como cualitativamente para finalmente seleccionar la estrategia integradora más óptima para nuestros datos y pregunta de investigación, y se crearán redes de interacción entre las variables más relevantes. es_ES
dc.description.abstract [EN] Selenium is an essential micronutrient for most organisms, including humans, as it plays a key role in a wide variety of selenoprotein-mediated biological processes. Both excess and deficiency of selenium can be harmful to health. Although selenium has been associated with different chronic diseases, few studies have been carried out to analyze its influence, as well as that of ifs species (selenoproteins and selenometabolites), in type 2 diabetes and insulin resistance. That is why the SelenOmics Project, in which this work is framed, is innovative when proposing the integration of data of different nature (clinical, sociodemographic, molecular variables, etc.) to evaluate the relationship of selenium with type 2 diabetes and insulin resistance, and also to clarify the biological mechanisms involved in this relationship. Specifically, in this work, data from the Aragón Workers' Health study, a Spanish cohort from the Opel factory in Zaragoza that is made up of more than 1000 individuals, will be analyzed. For all or part of the individuals in the cohort, different information has been collected that includes: 43 clinical, sociodemographic, exposure to metals and selenium species variables (n=1890), and molecular measurements obtained using high-performance techniques (omics data) such as methylation (n=30, p=841553), genomics (n=1000, p~millions) and metabolomics (n=1681, p=73). The objective of this work is to integrate all these data types through multivariate statistical models that allow analyzing the effect of selenium on the disease and identifying which molecular mechanisms are altered in this process. Given the challenge of analyzing data of so different nature and dimensionality, an individual multivariate exploratory analysis of each of the data blocks will be first carried out by using unsupervised techniques such as Principal Component Analysis (PCA), which will allow us to study the relationship between the variables and detect outliers. Moreover, a study of missing values on each data block will also be performed and missing values will be imputed using methods based on predictive models. Once the different blocks of data have been preprocessed and explored independently, different statistical integration methodologies of omics and clinical data will be applied for the study of diabetes (including dimension reduction techniques, generalized linear models, etc.), whose results will be compared both quantitatively and qualitatively to finally select the most optimal integration strategy for our data and research question, and create interaction networks between the most relevant variables. es_ES
dc.format.extent 70 es_ES
dc.language Español es_ES
dc.publisher Universitat Politècnica de València es_ES
dc.rights Reserva de todos los derechos es_ES
dc.subject Selenio es_ES
dc.subject Diabetes es_ES
dc.subject Bioinformática es_ES
dc.subject Integración de datos es_ES
dc.subject Técnicas multivariantes es_ES
dc.subject Reducción de la dimensión es_ES
dc.subject Modelos predictivos es_ES
dc.subject Selenium es_ES
dc.subject Bioinformatics es_ES
dc.subject Data integration es_ES
dc.subject Multivariate techniques es_ES
dc.subject Dimension reduction es_ES
dc.subject Predictive models es_ES
dc.subject Ciencias ómicas es_ES
dc.subject.classification ESTADISTICA E INVESTIGACION OPERATIVA es_ES
dc.subject.other Grado en Ciencia de Datos-Grau en Ciència de Dades es_ES
dc.title Modelos estadísticos multivariantes para la integración de datos multi-ómicos en el estudio del efecto del selenio en la diabetes es_ES
dc.title.alternative Multivariate statistical models for multi-omics data integration for studying the effect of selenium on diabetes es_ES
dc.title.alternative Models estadístics multivariants per a la integració de dades multi-òmiques en l'estudi de l'efecte del seleni en la diabetis es_ES
dc.type Proyecto/Trabajo fin de carrera/grado es_ES
dc.rights.accessRights Cerrado es_ES
dc.contributor.affiliation Universitat Politècnica de València. Departamento de Estadística e Investigación Operativa Aplicadas y Calidad - Departament d'Estadística i Investigació Operativa Aplicades i Qualitat es_ES
dc.contributor.affiliation Universitat Politècnica de València. Escola Tècnica Superior d'Enginyeria Informàtica es_ES
dc.description.bibliographicCitation Lucas Blázquez, Ó. (2023). Modelos estadísticos multivariantes para la integración de datos multi-ómicos en el estudio del efecto del selenio en la diabetes. Universitat Politècnica de València. http://hdl.handle.net/10251/198717 es_ES
dc.description.accrualMethod TFGM es_ES
dc.relation.pasarela TFGM\156202 es_ES


Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem