Resumen:
|
[ES] Los avances en tecnologías de secuenciación masiva permiten obtener datos de expresión génica y también de sus elementos reguladores y productos. Integrar estas medidas multiómicas en un modelo estadístico que explique ...[+]
[ES] Los avances en tecnologías de secuenciación masiva permiten obtener datos de expresión génica y también de sus elementos reguladores y productos. Integrar estas medidas multiómicas en un modelo estadístico que explique los mecanismos de regulación génica es actualmente un reto importante en bioinformática.
El laboratorio de Genómica de la Expresión Génica participa en el proyecto STATegra, en el que se han generado datos de RNA-seq, miRNA-seq, methyl-seq, DNase-seq, ChIP-seq, proteómica y metabolómica, cuya misión es desarrollar modelos estadísticos para la integración de datos multiómicos.
El objetivo del trabajo es implementar los modelos desarrollados en una librería de R para Bioconductor, documentar las funciones y elaborar el manual de usuario. Además, el estudiante desarrollará un algoritmo para simular conjuntos de datos multiómicos que repliquen datos experimentales y abordará el problema de la visualización gráfica de los resultados de los modelos estadísticos de integración.
[-]
[EN] Advances in massive sequencing technologies allow obtaining gene expression
data and their regulators and products at the genome level. The integration of these multiomics
measures in a statistical model that explains ...[+]
[EN] Advances in massive sequencing technologies allow obtaining gene expression
data and their regulators and products at the genome level. The integration of these multiomics
measures in a statistical model that explains the regulatory mechanisms in the cell is now a
major challenge in bioinformatics and, therefore, it is important to have tools for validating such
models.
The Genomics of Gene Expression Lab at the Centro de Investigación Príncipe Felipe
participates in the European STATegra project, in which they have generated, among others,
RNA-seq, miRNA-seq, methyl-seq, DNase-seq and ChIP-seq data, and whose mission is to
develop statistical models for the integration of multiomic data.
This work consisted in the implementation of an algorithm to simulate multiomic data
that mimic real sequencing experiments to facilitate the validation (in silico) of statistical
integration models. This algorithm was programmed in R to be incorporated into the STATegRa
Bioconductor library, which meant to properly document the developed functions. The algorithm
was based on the study of experimental data from the STATegra project and can generate
gene and miRNA expression data, methylation data, transcription factor regulation data and
chromatin accessibility data at different experimental conditions and times points.
[-]
[CA] — Els avanços en tecnologies de seqüenciació massiva permeten l’obtenció de dades
d’expressió gènica així com dels seus elements reguladors i productes a nivell genòmic. La
integració d’aquestes mesures multiòmiques ...[+]
[CA] — Els avanços en tecnologies de seqüenciació massiva permeten l’obtenció de dades
d’expressió gènica així com dels seus elements reguladors i productes a nivell genòmic. La
integració d’aquestes mesures multiòmiques en un model estadístic que explique els mecanismes
de regulació en la cèl·lula és actualment un repte important en bioinformàtica i, per tant, és
important disposar d’eines per a la validació d’aquests models.
El laboratori de Genòmica de l’Expressió Gènica del Centro de Investigación Príncipe Felipe
participa en el projecte europeu STATegra, en el qual s’han generat dades, entre altres, de RNAseq,
miRNA-seq, methyl-seq, DNase-seq i ChIP-seq, i la seua missió és el desenvolupament de
models estadístics per a la integració de dades multiòmiques.
Aquest treball ha consistit en la implementació d’un algoritme de simulació de dades
multiòmiques que replique experiments reals de seqüenciació per a facilitar la validació (in silico)
dels models estadístics d’integració. L’algoritme s’ha programat en R per a ser incorporat en la
llibreria STATegRa de Bioconductor, la qual cosa ha comportat una apropiada documentació
de les funcions desenvolupades. L’algoritme s’ha basat en l’estudi de les dades experimentals
del projecte STATegra i permet generar dades d’expressió de gens i miRNAs, de metil·lació, de
regulació de factors de transcripció i d’accessibilitat de la cromatina per a diferents condicions
experimentals i en diferents instants de temps.
[-]
|