Resumen:
|
[ES] Los enfoques multi-ómicos, que combinan información de varias capas de datos biológicos, se han vuelto cada vez más populares en los últimos años debido a su capacidad para proporcionar una comprensión profunda de los ...[+]
[ES] Los enfoques multi-ómicos, que combinan información de varias capas de datos biológicos, se han vuelto cada vez más populares en los últimos años debido a su capacidad para proporcionar una comprensión profunda de los sistemas biológicos.
Este estudio tiene como objetivo llevar a cabo una evaluación exhaustiva de MAMBA (Metabolic Adjustment via Multiomic Blocks Aggregation), una herramienta de integración multi-ómica que extiende el Análisis de Balance de Flujos mediante al incorporación conjunta de datos biológicos de diferentes capas moleculares. Saccharomyces cerevisiae, en concreto el Ciclo Metabólico de la Levadura, ofrece un escenario biológico interesante para este propósito debido a la extensa caracterización de su genoma y a la abundancia de datos experimentales. Los datos multi-ómicos correspondientes se extrajeron de repositorios públicos e incluyen información transcriptómica, epigenómica y metabolómica para 16 puntos de tiempo distribuidos a lo largo de las 3 fases del ciclo.
El análisis de expresión diferencial se aplicó de manera independiente a cada ómica. Posteriormente, el análisis funcional mediante métodos convencionales de enriquecimiento (Over Representation Analysis, Gene Set Enrichment Analysis) y mediante los nuevos métodos basados en restricciones (MAMBA) permitió realizar una evaluación comparativa del rendimiento de ambas metodologías.
ORA y GSEA identificaron vías metabólicas enriquecidas en genes diferencialmente expresados a lo largo de las tres fases. MAMBA también permitió identificar vías diferencialmente activas a partir de la predicción de flujos. El análisis de enriquecimiento permitió identificar los procesos biológicos clave en cada fase del ciclo, tales como la replicación del ADN o la síntesis de proteínas. Estas funciones globales no se observaron en los resultados de MAMBA, limitados a las reacciones metabólicas explícitamente incluidas en el modelo. Sin embargo, MAMBA demostró capturar con éxito los efectos aguas abajo de estos procesos fundamentales, en forma de reacciones y vías metabólicas específicas.
Con el objetivo de evaluar si ambos métodos eran capaces de capturar las diferencias biológicas entre las fases, se realizó un Análisis de Variación de Conjunto de Genes incluyendo únicamente las vías metabólicas identificadas como relevantes en los análisis previos. Las puntuaciones resultantes se utilizaron para agrupar las muestras de manera no supervisada. Pese a que en el análisis de los datos transcriptómicos no se observó una diferencia significativa entre el ORA y MAMBA, siendo ambos capaces de identificar y resumir las diferencias biológicas fundamentales entre ambos métodos, MAMBA demostró un desempeño claramente superior en el análisis basado en datos datos epigenéticos.
En conclusión, MAMBA emerge como una herramienta con gran potencial en la integración de datos epigenéticos y transcriptómicos para estudiar procesos biológicos complejos, tales como el Ciclo Metabólico de la Levadura. Sin embargo, sería conveniente optimizar la caracterización del modelo metabólico y desarrollar adaptaciones de MAMBA más específicas que tengan en cuenta la naturaleza de las distintas capas moleculares.
Este proyecto se enmarca dentro de los Objetivos de Desarrollo sostenible, en concreto contribuyendo a la Salud y Bienestar (ODS 3), Educación de calidad (ODS 4), Igualdad de Género (ODS 5), Acción por el clima (ODS 11) y Producción y consumo responsables (ODS 12).
[-]
[EN] Multi-omic approaches, which combine information from various biological data layers, have become increasingly popular in recent years because of their ability to provide a thorough understanding of biological systems. ...[+]
[EN] Multi-omic approaches, which combine information from various biological data layers, have become increasingly popular in recent years because of their ability to provide a thorough understanding of biological systems.
This study aims to conduct a comprehensive evaluation of MAMBA (Metabolic Adjustment via Multiomic Blocks Aggregation), a Constraint-Based Modeling approach recently developed in the Conesa Lab that extends Flux Balance Analysis by incorporating biological data from different molecular layers. Saccharomyces cerevisiae, specifically the Yeast Metabolic Cycle, provides an interesting biological scenario for this purpose due to its well-annotated genome and abundance of experimental data.
The corresponding multi-omic datasets were retrieved from public repositories, and include transcriptomic, epigenomic and metabolomic information for 16 time points distributed throughout the 3 phases of the cycle. The data were obtained using RNA-seq, ChIP-seq, and LC-MS techniques, respectively.
Differential expression analysis was independently applied to each omic. Further, functional analysis by means of conventional enrichment-based methods (ORA, GSEA) and using the novel constraint-based approaches (MAMBA) allowed to evaluate the performance of both types of approaches for the different omics.
ORA and GSEA identified metabolic pathways that contained differentially expressed genes across the three phases, aligning with previous knowledge on the Yeast Metabolic Cycle. The reaction activity prediction feature implemented in MAMBA also identified differentially active pathways, albeit with only partial overlap between the pathways identified by the enrichment methods. Enrichment analysis exposed regulation along the yeast metabolic cycle for critical biological functions, such as DNA replication, proteasome degradation, and mismatch repair. These differences were not observed in MAMBA's results as it is confined to the metabolic reactions within the model. However, MAMBA's results were more proficient in capturing the downstream effects of these fundamental processes, represented by specific reactions and metabolic pathways.
In order to evaluate the performance of both methods in terms of identifying and capturing the biological differences between conditions, a Gene Set Variation Analysis (GSVA) was applied only to those pathways identified as relevan. The resulting GSVA scores were then utilized to cluster the samples in an unsupervised manner. In the case of RNA-seq, pathways identified by both MAMBA and ORA accurately captured the underlying biological differences between conditions for both MAMBA and ORA. Notably, MAMBA exhibited superior performance when employing epigenetic information.
In conclusion, MAMBA shows great potential as an effective approach for integrating transcriptomic and epigenetic data to unravel the complexities of biological processes such as the yeast metabolic cycle. However, further research is needed to enhance the functional characterization of the metabolic model and optimize the incorporation of diverse omics datasets within the MAMBA framework. These efforts will contribute to improving the accuracy and reliability of MAMBA's predictions, thereby advancing our understanding of complex biological systems.
This project is related to the Sustainable Development Goals, specifically contributing to Health and Well-being (SDG 3), Quality Education (SDG 4), Gender Equality (SDG 5), Climate Action (SDG 11) and Responsible production and consumption (SDG 12).
[-]
|