Resumen:
|
[ES] El estudio de los datos genómicos disponibles en repositorios nos permite su uso clínico para determinar las variaciones genéticas asociadas con enfermedades. Dichas asociaciones son claves para el desarrollo de la ...[+]
[ES] El estudio de los datos genómicos disponibles en repositorios nos permite su uso clínico para determinar las variaciones genéticas asociadas con enfermedades. Dichas asociaciones son claves para el desarrollo de la medicina de precisión. Sin embargo, la gran cantidad de datos dispersa en muchos repositorios heterogéneos, las distintas formas de representación de la misma información y los diferentes niveles de calidad de los datos, dificultan el proceso de estudio.
En este contexto, el método SILE proporciona una base metodológica sólida para utilizar una aproximación basada en IAE ("Inteligencia Artificial Explicable ), que permita diseñar un algoritmo para identificar de forma eficiente las variaciones genéticas con relevancia para el diagnóstico clínico. En un ámbito más convencional, trabajos previos han aplicado versiones iniciales del método en cuatro enfermedades: epilepsia, migraña, enfermedad de Crohn y cáncer de mama en varones, con buenos resultados tanto en fiabilidad como en utilidad de las variaciones genéticas asociadas con cada enfermedad.
Con la intención de consolidar el método y de extenderlo con "capabilidades" de IAE, este proyecto tiene dos objetivos principales. Primeramente, la utilización de técnicas IAE en el abordaje del problema a través del uso de un algoritmo de clasificación de variaciones genómicas relevantes. En segundo lugar, la adaptación del algoritmo general al caso práctico de la Fibrosis Quística, con el fin de sincronizar la generalidad del método con la particularidad de un fenotipo seleccionado y conseguir así una mejora de los resultados.
[-]
[EN] The study of genomic data available in repositories allows their clinical use to determine genomic variants associated with diseases. These associations are key to develop precision medicine. However, data management ...[+]
[EN] The study of genomic data available in repositories allows their clinical use to determine genomic variants associated with diseases. These associations are key to develop precision medicine. However, data management is really hard due to three main aspects: there is a huge amount of genomic data scattered across multiple heterogeneous repositories, information is also represented in diverse ways and there are different levels of quality.
In this context, the SILE method provides a solid methodological basis for using a XAI-based approach (explainable artificial intelligence) to design a workflow that efficiently identifies relevant genomic variants for clinical diagnosis. In a more conventional scope, previous works have applied initial versions of the method on four different diseases: epilepsy, migraine, Crohn disease and male breast cancer, with very good results both in reliability and usefulness of genomic variants associated with each disease.
With the intention of consolidating the method and improving it with XAI capabilities, this Project has two main goals. First of all, the use of XAI techniques to address the problem trough a classification workflow of relevant genomic variations. Second, the adaptation of the general workflow to the practical case of Cystic Fibrosis, in order to synchronize method generality with the particularity of a selected phenotype and thus to improve the results
[-]
|