dc.contributor.advisor |
Vergara Domínguez, Luís
|
es_ES |
dc.contributor.advisor |
Salazar Afanador, Addisson
|
es_ES |
dc.contributor.author |
Liu, Chenyu
|
es_ES |
dc.date.accessioned |
2022-05-10T14:51:34Z |
|
dc.date.available |
2022-05-10T14:51:34Z |
|
dc.date.created |
2022-05-06 |
es_ES |
dc.date.issued |
2022-05-10 |
es_ES |
dc.identifier.uri |
http://hdl.handle.net/10251/182468 |
|
dc.description.abstract |
[ES] En este proyecto se implementarán varias técnicas de selección de características que se aplican para mejorar el rendimiento de la clasificación automática. Se analizarán varios problemas de clasificación de un repositorio de bases de datos disponible públicamente correspondiente al análisis de datos biofísicos. Esos problemas podrían incluir los siguientes temas médicos: arritmia; cáncer de mama; insuficiencia cardiaca; y virus de la hepatitis C. Los datos consisten en características extraídas de señales electrocardiográficas (ECG), señales electroencefalográficas (EEG), imágenes médicas, anamnesis, etc. En algunos casos, podría ser necesario un paso de preprocesamiento para tratar la normalización, la eliminación de artefactos y los datos faltantes. El objetivo de los métodos de selección de características es obtener una lista ordenada del conjunto completo de características de acuerdo con algunos criterios definidos. A partir de esta clasificación de características se puede obtener un conjunto más pequeño de características que permite mejorar el rendimiento de la clasificación y evitar un posible sobreajuste del modelo de clasificación entrenado. En este proyecto, se realiza una comparación de los métodos SF, incluidos los métodos de selección de características secuenciales (SFS) y basados ​​en relieve. Como clasificadores, consideraremos el análisis discriminante lineal (LDA), el análisis discriminante cuadrático (QDA) y la máquina de vectores de soporte (SVM), entre otros. La calidad de los resultados de la clasificación se evaluará utilizando diferentes rangos de la lista de clasificación de características y varios índices como precisión, precisión equilibrada, matriz de confusión, ¿ Además, se estimará el costo computacional de los diferentes casos de clasificación. |
es_ES |
dc.description.abstract |
[EN] This project will implement several techniques of feature selection applied to improve automatic classification performance. Several classification problems from a publicly available database repository corresponding to biophysical data analysis will be analyzed. Those problems could include the following medical subjects: arrhythmia; breast cancer; heart failure; and hepatitis C virus. The data consist of features extracted from electrocardiographic (ECG) signals, electroencephalographic (EEG) signals, medical images, anamnesis, etc. In some cases, a preprocessing step could be required to deal with normalization, artifact removing, and missing data. The objective of feature selection methods is to obtain a sorted list of the full set of features according to some defined criteria. From this ranking of features a smaller set of features can be obtained that allows the classification performance be improved and avoid possible overfitting of the trained classification model. In this project, a comparison of SF methods is made including Relief-based and sequential feature selection (SFS) methods. As classifiers we will consider linear discriminant analysis (LDA), quadratic discriminant analysis (QDA), and support vector machine (SVM) among others. The quality of classification results will be evaluated using different ranges of the feature ranking list and several indices such as accuracy, balanced accuracy, confusion matrix, ¿ Besides, computational cost of the different cases of classification will be estimated. |
en_EN |
dc.format.extent |
41 |
es_ES |
dc.language |
Español |
es_ES |
dc.publisher |
Universitat Politècnica de València |
es_ES |
dc.rights |
Reserva de todos los derechos |
es_ES |
dc.subject |
Selección de características |
es_ES |
dc.subject |
Clasificación |
es_ES |
dc.subject |
Reconocimiento de formas |
es_ES |
dc.subject |
Aprendizaje máquina |
es_ES |
dc.subject |
Análisis de datos biofísicos |
es_ES |
dc.subject |
Feature selection |
en_EN |
dc.subject |
Classification |
en_EN |
dc.subject |
Pattern recognition |
en_EN |
dc.subject |
Machine learning |
en_EN |
dc.subject |
Biophysical data analysis |
en_EN |
dc.subject.classification |
TEORIA DE LA SEÑAL Y COMUNICACIONES |
es_ES |
dc.subject.other |
Grado en Ingeniería de Tecnologías y Servicios de Telecomunicación-Grau en Enginyeria de Tecnologies i Serveis de Telecomunicació |
es_ES |
dc.title |
A Study of Feature Selection Methods for Classification |
es_ES |
dc.type |
Proyecto/Trabajo fin de carrera/grado |
es_ES |
dc.rights.accessRights |
Abierto |
es_ES |
dc.contributor.affiliation |
Universitat Politècnica de València. Departamento de Comunicaciones - Departament de Comunicacions |
es_ES |
dc.contributor.affiliation |
Universitat Politècnica de València. Escuela Técnica Superior de Ingenieros de Telecomunicación - Escola Tècnica Superior d'Enginyers de Telecomunicació |
es_ES |
dc.description.bibliographicCitation |
Liu, C. (2022). A Study of Feature Selection Methods for Classification. Universitat Politècnica de València. http://hdl.handle.net/10251/182468 |
es_ES |
dc.description.accrualMethod |
TFGM |
es_ES |
dc.relation.pasarela |
TFGM\148191 |
es_ES |