Resumen:
|
[ES] La detección de variantes de ADN es una tarea importante y difícil en la Genómica. Las tecnologías de secuenciación de una sola molécula han conseguido revolucionar la detección de variantes genéticas, el ensamblaje ...[+]
[ES] La detección de variantes de ADN es una tarea importante y difícil en la Genómica. Las tecnologías de secuenciación de una sola molécula han conseguido revolucionar la detección de variantes genéticas, el ensamblaje de genomas complejos y la detección de marcas epigenéticas (marcas químicas que se añaden al ADN y permiten su correcto funcionamiento) en los últimos años. En el caso de la secuenciación de una sola molécula, se tiene una tasa de error por nucleótido de entre 5 y 15%. Por lo que a pesar de los rápidos avances en las tecnologías de secuenciación, es difícil detectar variantes del genoma de un individuo a partir de miles de millones de lecturas de secuencias cortas y erróneas.
Debido a la masiva cantidad de lecturas del genoma y la alta tasa de error de secuenciación, aplicar Deep Learning para el aprendizaje de relaciones entre las secuencias de ADN, es el enfoque que mejores resultados obtiene, superando a las herramientas de última generación y métodos tradicionales de detección de variantes.
La naturaleza de la tarea que se propone enmarca este Trabajo Final de Máster dentro de la Genómica, concretamente en el problema de Detección de Variantes Genómicas aplicando Técnicas de Inteligencia Artificial y del Reconocimiento de Formas. Como primer objetivo se realiza un estudio de las diferentes herramientas de última generación, enfoques y particularidades. El segundo objetivo se centra en el tratamiento y manipulación de los datos genómicos con el fin de desarrollar una metodología robusta. En la metodología se incluye el análisis y diseño de arquitecturas de Redes Neuronales Artificiales para el problema que se trata y sus correspondientes experimentos. Finalmente, se discuten los resultados obtenidos y se declaran futuros desarrollos para continuar nuevas investigaciones en esta línea.
[-]
[EN] DNA variant detection is an important and challenging task in Genomics. Single-molecule sequencing technologies have revolutionized the detection of genetic variants, the assembly of complex genomes and the detection ...[+]
[EN] DNA variant detection is an important and challenging task in Genomics. Single-molecule sequencing technologies have revolutionized the detection of genetic variants, the assembly of complex genomes and the detection of epigenetic marks (chemical marks that are added to DNA and allow it to function correctly) in recent years. In the case of single molecule sequencing, there is a per nucleotide error rate of between 5 and 15%. So despite rapid advances in sequencing technologies, it is difficult to detect variants of an individual's genome from billions of short and erroneous sequence reads.
Due to the massive amount of genome reads and the high sequencing error rate, applying Deep Learning for learning relationships between DNA sequences is the approach that yields the best results, outperforming state-of-the-art tools and traditional variant detection methods.
The nature of the proposed task frames this Master's Thesis within Genomics, specifically in the problem of Genomic Variant Calling by applying Artificial Intelligence and Shape Recognition Techniques. The first objective is a study of the different state-of-the-art tools, approaches and particularities. The second objective focuses on the treatment and manipulation of genomic data in order to develop a robust methodology. The methodology includes the analysis and design of Artificial Neural Network architectures for the problem at hand and their corresponding experiments. Finally, the results obtained are discussed and future developments are stated in order to continue new research in this line.
[-]
|