Resumen:
|
[ES] La Esclerosis Lateral Amiotrófica es una enfermedad degenerativa de motoneurona caracterizada por su dificultad de diagnóstico: más del 90\% de los casos son esporádicos y no existe ninguna prueba paraclínica fiable ...[+]
[ES] La Esclerosis Lateral Amiotrófica es una enfermedad degenerativa de motoneurona caracterizada por su dificultad de diagnóstico: más del 90\% de los casos son esporádicos y no existe ninguna prueba paraclínica fiable capaz de detectarla. Es por ello que urge el desarrollo de biomarcadores que permitan el diagnóstico y la monitorización.
En este trabajo, se ha utilizado un conjunto de datos de 211 pacientes (114 ELA, 45 mimic, 30 portadores de mutación y 22 control) con atributos de radiómica (morfometría, depósitos de hierro) integrados con variables clínicas y con 6 variables de valoración semicuantitativa de depósitos de hierro.
Se ha enfocado el problema como una tarea de clasificación binaria entre pacientes con y sin ELA. Se ha seguido una metodología de modelado secuenciada abordada desde una perspectiva de mejora iterativa con técnicas de filtrado de variables, reducción de dimensionalidad (PCA, kernel PCA), sobremuestreo (SMOTE, ADASYN) y clasificación (regresión logística, LASSO, Ridge, ElasticNet, Support Vector Classifier, K-vecinos, random forest). Para cada arquitectura propuesta, se ha utilizado varios subconjuntos de los datos disponibles, planteando modelos con un solo conjunto de datos y modelos multimodales.
Los mejores resultados han sido proporcionados por un clasificador de votación compuesto por cinco clasificadores: accuracy=0.896, AUC=0.929, sensitividad=0.886, especificidad=0.929. Los mejores resultados sin uso de las variables semicuantitativas han sido proporcionados por Support Vector Classifier: accuracy=0.815, AUC=0.879, sensitividad=0.833, especificidad=0.794. En ambos clasificadores se ha utilizado un filtrado de variables por feature importance en LASSO.
Finalmente, se ha propuesto un prototipo para integrar la metodología existente necesaria para la obtención de los datos junto a la metodología desarrollada en el trabajo, orientada para diagnóstico y pronóstico en entornos clínicos.
[-]
[EN] Amyotrophic Lateral Sclerosis is a degenerative motor neuron disease characterized by its diagnostic difficulty: more than 90\% of cases are sporadic and there is no reliable paraclinical test capable of detecting it. ...[+]
[EN] Amyotrophic Lateral Sclerosis is a degenerative motor neuron disease characterized by its diagnostic difficulty: more than 90\% of cases are sporadic and there is no reliable paraclinical test capable of detecting it. The development of ALS biomarkers for diagnosis and monitoring is urgently needed.
This work has used a dataset of 211 patients (114 ALS, 45 mimic, 30 genetic carriers and 22 control) with radiomics attributes (morphometry, iron deposition) integrated with clinical variables and 6 semiquantitative visually-assessed indicators of iron deposition.
A binary classification task approach has been taken to classify patients with and without ALS. A sequential modeling methodology, understood from an iterative improvement perspective, has been followed. It has included variable filtering techniques, dimensionality reduction techniques (PCA, kernel PCA), oversampling techniques (SMOTE, ADASYN) and classification techniques (logistic regression, LASSO, Ridge, ElasticNet, Support Vector Classifier, K-neighbors, random forest). For each proposed architecture, several subsets of the available data have been used, proposing models with single data types and multimodal models.
The best results have been provided by a voting classifier composed of five classifiers: accuracy=0.896, AUC=0.929, sensitivity=0.886, specificity=0.929. The best results without the use of semiquantitative variables have been provided by Support Vector Classifier: accuracy=0.815, AUC=0.879, sensitivity=0.833, specificity=0.794. In both classifiers a filtering of variables by feature importance in LASSO has been used.
Finally, a prototype has been proposed to integrate the existing methodology necessary to obtain the data together with the methodology developed in this work, oriented to diagnosis and prognosis in clinical settings.
[-]
|