[EN] Researchers manually amplify certain synthetic DNA sequences of the Human Papilloma Virus (HPV) to facilitate detection and discrimination of multiple HPV types. The goal of this research was to create a software that, ...[+]
[EN] Researchers manually amplify certain synthetic DNA sequences of the Human Papilloma Virus (HPV) to facilitate detection and discrimination of multiple HPV types. The goal of this research was to create a software that, using user-selected parameters, can automatically find appropriate primer binding sites. To amplify the DNA sequences, we had to previously detect specific sections called the Forward and Reverse Primer. This software will decrease the time and error involved in finding a primer pair that can identify various HPV types in the context of HPV detection. There are 170 million possible combinations of primer pairs. To speed up the whole process of testing each combination, and to be able to store all the data created, Parallel Computing has been applied. Due to the large number of possible combinations of the genomic sequence, to select the best ones for further testing in the laboratory, the K-Means Clustering Algorithm was also applied. This Machine Learning Algorithm was applied with two of the most relevant attributes to cluster the combinations by similarities and reduce the searchable set for humans to make the final selection.
[-]
[ES] Los investigadores amplifican manualmente determinadas secuencias sintéticas de ADN del virus del papiloma humano (VPH) para facilitar la detección y discriminación de múltiples tipos de VPH. El objetivo de esta ...[+]
[ES] Los investigadores amplifican manualmente determinadas secuencias sintéticas de ADN del virus del papiloma humano (VPH) para facilitar la detección y discriminación de múltiples tipos de VPH. El objetivo de esta investigación era crear un programa informático que, utilizando parámetros seleccionados por el usuario, pudiera encontrar automáticamente los sitios de unión de cebadores adecuados. Para amplificar las secuencias de ADN, había que detectar previamente unas secciones específicas denominadas cebador directo e inverso. Este software disminuirá el tiempo y el error que supone encontrar un par de cebadores que puedan identificar varios tipos de VPH en el contexto de la detección del VPH. Existen 170 millones de combinaciones posibles de pares de cebadores. Para acelerar todo el proceso de prueba de cada combinación y poder almacenar todos los datos creados, se ha aplicado la computación en paralelo. Debido al gran número de combinaciones posibles de la secuencia genómica, para seleccionar las mejores para las pruebas posteriores en el laboratorio, también se aplicó el Algoritmo de Agrupación K-Means. Este Algoritmo de Aprendizaje Automático se aplicó con dos de los atributos más relevantes para agrupar las combinaciones por similitudes y reducir el conjunto buscable para que los humanos hicieran la selección final.
[-]
|