Resumen:
|
[EN] Transcriptome studies, by means of high-throughput technologies such as microarrays
and next-generation sequencing (RNA-seq), have yielded, in recent years, knowledge of a large
number of mechanisms that occur in ...[+]
[EN] Transcriptome studies, by means of high-throughput technologies such as microarrays
and next-generation sequencing (RNA-seq), have yielded, in recent years, knowledge of a large
number of mechanisms that occur in cells in different conditions. The complexity of transcriptome
is due to its dynamic regulation among stages of development, tissues and different conditions or
treatments to which cells are subjected, and determines the need of studying the level of gene
expression in each of the dimensions in which it varies with the aim of understanding the activity
of a particular type of cell, in a particular stage of development and under specific conditions.
The purpose of this study is to establish a novel classification of genes of the species Drosophila
melanogaster, animal model of interest in the biomedical field, in the different tissues that will
provide a new perspective of the fly genes and molecular mechanisms. This gene characterization
will enable a better understanding of the transcriptomic studies developed.
The expression levels were obtained from the data of the RNA-Seq studies performed by
modENCODE in the project “The Drosophila Transcriptome” in different tissues and stages of
development. The downloaded data, which is in SAM format (mapping files), will be processed,
which consists of the quantification of the reads per gene, and normalized, with the purpose of
removing technical and biological biases. Next, the classification of the data is performed using
hierarchical clustering with the correlation distance, which aims to classify the genes according
to their similarity in terms of trend of the gene expression. Once the groups of genes are obtained,
each cluster is functionally analyzed by using tools of single enrichment and protein-protein
interactions.
[-]
[ES] El estudio del transcriptoma, mediante tecnologías de alto rendimiento como los
microarrays y la secuenciación masiva (RNA-seq), ha permitido en los últimos años conocer una
gran cantidad de mecanismos que se producen ...[+]
[ES] El estudio del transcriptoma, mediante tecnologías de alto rendimiento como los
microarrays y la secuenciación masiva (RNA-seq), ha permitido en los últimos años conocer una
gran cantidad de mecanismos que se producen en las células en distintas condiciones. La
complejidad del transcriptoma reside en su regulación dinámica a lo largo de los distintos estadios
del desarrollo, en los tejidos y ante distintas condiciones o tratamientos a las que se vean
sometidas las células, y determina la necesidad de estudiar el nivel de expresión génica en cada
una de las dimensiones en las que varía, para así comprender la actividad de un tipo de célula
particular, en un estadio concreto y ante unas determinadas condiciones.
El objetivo de este trabajo es la determinación de una nueva clasificación de los genes de la
especie Drosophila melanogaster, modelo animal en el ámbito de la investigación biomédica, en
los distintos tejidos que proporcione una nueva visión de sus genes y mecanismos moleculares.
Esta caracterización de los genes permitirá una mejor comprensión de los estudios
transcriptómicos desarrollados.
Los niveles de expresión se obtuvieron a partir de los datos de los estudios de RNA-Seq
desarrollados por modENCODE en el proyecto “El transcriptoma de Drosophila” en diferentes
tejidos y estadíos del desarrollo. Tras la descarga de los ficheros de mapeo SAM, se cuantificaron
las lecturas por gen y a continuación se normalizó el conjunto de todos los niveles de expresión,
con el fin de eliminar los sesgos técnicos, debidos a la secuenciación, y biológicos. La
clasificación de los datos se realiza posteriormente mediante clustering jerárquico, que trata de
agrupar los datos en función de su similitud, para lo cual se emplea la distancia de correlación ya
que se pretende clasificar los genes en términos de tendencia de la expresión génica. Una vez
obtenidos los grupos de genes, se lleva a cabo la interpretación funcional de cada uno de los
clusters mediante técnicas de enriquecimiento en la herramienta web Babelomics y estudios de
interacción proteína-proteína con STRING.
[-]
|