Resumen:
|
Los avances recientes en las tecnologías de secuenciación nos han brindado una oportunidad sin precedentes para entender mejor el papel de la genómica, epigenética y transcriptómica en la regulación de la expresión génica. ...[+]
Los avances recientes en las tecnologías de secuenciación nos han brindado una oportunidad sin precedentes para entender mejor el papel de la genómica, epigenética y transcriptómica en la regulación de la expresión génica. Un análisis integrativo de experimentos en los que se han medido varias de estas ómicas proporciona una descripción más clara y completa de los procesos biológicos, fenotipos o enfermedades estudiados. Sin embargo, muchas de las estrategias de integración de datos descritas en la literatura consisten en analizar por separado cada tipo de datos ómicos y comparar "integrativamente" los resultados, ya que todavía se carece de herramientas estadísticas para la integración de datos que puedan ser utilizadas por investigadores que no son expertos en estadística.
El desarrollo de una herramienta estadística para la integración de datos multi-ómicos plantea no pocos desafíos. Primero, la gran cantidad de variables ómicas (miles de genes) en comparación con los pequeños tamaños de muestra en este tipo de experimentos (por lo general, no más de decenas de muestras biológicas). En segundo lugar, el nivel inherente de ruido en las tecnologías ómicas. Y tercero, el diseño de una herramienta que sirva para una amplia gama de escenarios biológicos o diseños experimentales y ayude a interpretar los resultados y a responder a las preguntas biológicas. En este trabajo, exploraremos diversas metodologías estadísticas que superen estas limitaciones para obtener modelos útiles que expliquen la regulación de la expresión génica, y generaremos una librería en el lenguaje estadístico R que pueda ser utilizada por otros investigadores de este campo.
[-]
Recent advances in sequencing technologies have given us an unprecedented opportunity to better understand the role of genomic, epigenetic and transcriptomic features in the regulation of gene expression. An integrative ...[+]
Recent advances in sequencing technologies have given us an unprecedented opportunity to better understand the role of genomic, epigenetic and transcriptomic features in the regulation of gene expression. An integrative analysis of experiments in which several of these omics have been measured provide a more full and clear picture of the studied biological processes, phenotypes or diseases. However, many of the data integration strategies described in the literature consist on separately analysing each omic data type and "integratively" comparing the results since there is still a lack of statistical tools to perform data integration that can be used by researchers that are not expert on statistics.
Developing a statistical tool for multi-omic data integration poses no few challenges. First, the huge number of omic variables (thousands of genes) compared with the small sample sizes in this type of experiments (usually not more than tens of biological samples). Second, the inherent level of noise in the omic technologies. And third, the design of a tool that serves for a wide range of biological scenarios or experimental designs and helps to interpret the results and answer the biological questions. In this work, we will explore diverse statistical methodologies that overcome these limitations to obtain useful models that explain the regulation of gene expression, and will generate an R library that can be used by other researchers in the field.
[-]
|