Resumen:
|
[ES] El selenio es un micro-nutriente esencial para la mayoría de los organismos, incluidos los humanos, y juega un papel clave en una gran variedad de procesos biológicos mediados por las selenoproteínas. Tanto el exceso ...[+]
[ES] El selenio es un micro-nutriente esencial para la mayoría de los organismos, incluidos los humanos, y juega un papel clave en una gran variedad de procesos biológicos mediados por las selenoproteínas. Tanto el exceso como el déficit de selenio pueden ser perjudiciales para la salud. Aunque se ha relacionado el selenio con diferentes enfermedades crónicas, poco se sabe sobre su papel, así como el de sus especies (selenoproteínas y selenometabolitos), en la diabetes tipo 2 y en la resistencia a la insulina, así como de los mecanismos moleculares alterados por causa del selenio en esta enfermedad.
Es por ello que el Proyecto SelenOmics, en el cual se enmarca el presente trabajo, es innovador al plantear la integración de datos de distinta naturaleza (variables clínicas, sociodemográficas, moleculares, etc.) para evaluar la relación del selenio con la diabetes tipo 2 y la resistencia a la insulina y poder esclarecer los mecanismos biológicos que intervienen en dicha relación.
En concreto, en este trabajo, se analizarán datos del estudio de Salud de los Trabajadores de Aragón, una cohorte española de la factoría Opel en Zaragoza que se compone de más de 1000 individuos. Para todos o parte de los individuos de la cohorte se ha recogido información que incluye: 43 variables clínicas, sociodemográficas, de exposición a metales y de especies de selenio (n=1890), y medidas moleculares obtenidas mediante técnicas de alto rendimiento (datos ómicos) como metilación (n=30, p=841553), genómica (n=1000, p~millones) y metabolómica (n=1681, p=73).
El objetivo del trabajo es integrar todos estos tipos de datos mediante modelos estadísticos multivariantes que permitan analizar el efecto del selenio sobre la enfermedad e identificar qué mecanismos moleculares se ven alterados en este proceso. Dado el reto que supone analizar datos de tan diferente naturaleza y dimensionalidad, en primer lugar, se llevará a cabo un análisis exploratorio multivariante de cada uno de los bloques de datos por separado, empleando técnicas no supervisadas como el Análisis de Componentes Principales (PCA), que permitirá estudiar la relación entre las variables y detectar valores anómalos. Se realizará también un estudio de los valores faltantes en cada bloque de datos y se imputarán mediante métodos basados en modelos predictivos. Una vez procesados y explorados los distintos bloques de datos de manera independiente, se aplicarán distintas metodologías de integración estadística de datos ómicos y clínicos para el estudio de la diabetes (incluyendo técnicas de reducción de la dimensión, modelos lineales generalizados, etc.), cuyos resultados serán comparados tanto cuantitativa como cualitativamente para finalmente seleccionar la estrategia integradora más óptima para nuestros datos y pregunta de investigación, y se crearán redes de interacción entre las variables más relevantes.
[-]
[EN] Selenium is an essential micronutrient for most organisms, including humans, as it plays a key role in a wide variety of selenoprotein-mediated biological processes. Both excess and deficiency of selenium can be harmful ...[+]
[EN] Selenium is an essential micronutrient for most organisms, including humans, as it plays a key role in a wide variety of selenoprotein-mediated biological processes. Both excess and deficiency of selenium can be harmful to health. Although selenium has been associated with different chronic diseases, few studies have been carried out to analyze its influence, as well as that of ifs species (selenoproteins and selenometabolites), in type 2 diabetes and insulin resistance.
That is why the SelenOmics Project, in which this work is framed, is innovative when proposing the integration of data of different nature (clinical, sociodemographic, molecular variables, etc.) to evaluate the relationship of selenium with type 2 diabetes and insulin resistance, and also to clarify the biological mechanisms involved in this relationship.
Specifically, in this work, data from the Aragón Workers' Health study, a Spanish cohort from the Opel factory in Zaragoza that is made up of more than 1000 individuals, will be analyzed. For all or part of the individuals in the cohort, different information has been collected that includes: 43 clinical, sociodemographic, exposure to metals and selenium species variables (n=1890), and molecular measurements obtained using high-performance techniques (omics data) such as methylation (n=30, p=841553), genomics (n=1000, p~millions) and metabolomics (n=1681, p=73).
The objective of this work is to integrate all these data types through multivariate statistical models that allow analyzing the effect of selenium on the disease and identifying which molecular mechanisms are altered in this process. Given the challenge of analyzing data of so different nature and dimensionality, an individual multivariate exploratory analysis of each of the data blocks will be first carried out by using unsupervised techniques such as Principal Component Analysis (PCA), which will allow us to study the relationship between the variables and detect outliers. Moreover, a study of missing values on each data block will also be performed and missing values will be imputed using methods based on predictive models. Once the different blocks of data have been preprocessed and explored independently, different statistical integration methodologies of omics and clinical data will be applied for the study of diabetes (including dimension reduction techniques, generalized linear models, etc.), whose results will be compared both quantitatively and qualitatively to finally select the most optimal integration strategy for our data and research question, and create interaction networks between the most relevant variables.
[-]
|