- -

A Study of Feature Selection Methods for Classification

RiuNet: Repositorio Institucional de la Universidad Politécnica de Valencia

Compartir/Enviar a

Citas

Estadísticas

  • Estadisticas de Uso

A Study of Feature Selection Methods for Classification

Mostrar el registro sencillo del ítem

Ficheros en el ítem

dc.contributor.advisor Vergara Domínguez, Luís es_ES
dc.contributor.advisor Salazar Afanador, Addisson es_ES
dc.contributor.author Liu, Chenyu es_ES
dc.date.accessioned 2022-05-10T14:51:34Z
dc.date.available 2022-05-10T14:51:34Z
dc.date.created 2022-05-06 es_ES
dc.date.issued 2022-05-10 es_ES
dc.identifier.uri http://hdl.handle.net/10251/182468
dc.description.abstract [ES] En este proyecto se implementarán varias técnicas de selección de características que se aplican para mejorar el rendimiento de la clasificación automática. Se analizarán varios problemas de clasificación de un repositorio de bases de datos disponible públicamente correspondiente al análisis de datos biofísicos. Esos problemas podrían incluir los siguientes temas médicos: arritmia; cáncer de mama; insuficiencia cardiaca; y virus de la hepatitis C. Los datos consisten en características extraídas de señales electrocardiográficas (ECG), señales electroencefalográficas (EEG), imágenes médicas, anamnesis, etc. En algunos casos, podría ser necesario un paso de preprocesamiento para tratar la normalización, la eliminación de artefactos y los datos faltantes. El objetivo de los métodos de selección de características es obtener una lista ordenada del conjunto completo de características de acuerdo con algunos criterios definidos. A partir de esta clasificación de características se puede obtener un conjunto más pequeño de características que permite mejorar el rendimiento de la clasificación y evitar un posible sobreajuste del modelo de clasificación entrenado. En este proyecto, se realiza una comparación de los métodos SF, incluidos los métodos de selección de características secuenciales (SFS) y basados ​​en relieve. Como clasificadores, consideraremos el análisis discriminante lineal (LDA), el análisis discriminante cuadrático (QDA) y la máquina de vectores de soporte (SVM), entre otros. La calidad de los resultados de la clasificación se evaluará utilizando diferentes rangos de la lista de clasificación de características y varios índices como precisión, precisión equilibrada, matriz de confusión, ¿ Además, se estimará el costo computacional de los diferentes casos de clasificación. es_ES
dc.description.abstract [EN] This project will implement several techniques of feature selection applied to improve automatic classification performance. Several classification problems from a publicly available database repository corresponding to biophysical data analysis will be analyzed. Those problems could include the following medical subjects: arrhythmia; breast cancer; heart failure; and hepatitis C virus. The data consist of features extracted from electrocardiographic (ECG) signals, electroencephalographic (EEG) signals, medical images, anamnesis, etc. In some cases, a preprocessing step could be required to deal with normalization, artifact removing, and missing data. The objective of feature selection methods is to obtain a sorted list of the full set of features according to some defined criteria. From this ranking of features a smaller set of features can be obtained that allows the classification performance be improved and avoid possible overfitting of the trained classification model. In this project, a comparison of SF methods is made including Relief-based and sequential feature selection (SFS) methods. As classifiers we will consider linear discriminant analysis (LDA), quadratic discriminant analysis (QDA), and support vector machine (SVM) among others. The quality of classification results will be evaluated using different ranges of the feature ranking list and several indices such as accuracy, balanced accuracy, confusion matrix, ¿ Besides, computational cost of the different cases of classification will be estimated. en_EN
dc.format.extent 41 es_ES
dc.language Español es_ES
dc.publisher Universitat Politècnica de València es_ES
dc.rights Reserva de todos los derechos es_ES
dc.subject Selección de características es_ES
dc.subject Clasificación es_ES
dc.subject Reconocimiento de formas es_ES
dc.subject Aprendizaje máquina es_ES
dc.subject Análisis de datos biofísicos es_ES
dc.subject Feature selection en_EN
dc.subject Classification en_EN
dc.subject Pattern recognition en_EN
dc.subject Machine learning en_EN
dc.subject Biophysical data analysis en_EN
dc.subject.classification TEORIA DE LA SEÑAL Y COMUNICACIONES es_ES
dc.subject.other Grado en Ingeniería de Tecnologías y Servicios de Telecomunicación-Grau en Enginyeria de Tecnologies i Serveis de Telecomunicació es_ES
dc.title A Study of Feature Selection Methods for Classification es_ES
dc.type Proyecto/Trabajo fin de carrera/grado es_ES
dc.rights.accessRights Abierto es_ES
dc.contributor.affiliation Universitat Politècnica de València. Departamento de Comunicaciones - Departament de Comunicacions es_ES
dc.contributor.affiliation Universitat Politècnica de València. Escuela Técnica Superior de Ingenieros de Telecomunicación - Escola Tècnica Superior d'Enginyers de Telecomunicació es_ES
dc.description.bibliographicCitation Liu, C. (2022). A Study of Feature Selection Methods for Classification. Universitat Politècnica de València. http://hdl.handle.net/10251/182468 es_ES
dc.description.accrualMethod TFGM es_ES
dc.relation.pasarela TFGM\148191 es_ES


Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem