Mostrar el registro sencillo del ítem
dc.contributor.advisor | Fernández Diego, Marta![]() |
es_ES |
dc.contributor.advisor | González Ladrón de Guevara, Fernando Raimundo![]() |
es_ES |
dc.contributor.author | Ajenjo Vicente, Iván Iñaki![]() |
es_ES |
dc.date.accessioned | 2020-10-06T12:14:48Z | |
dc.date.available | 2020-10-06T12:14:48Z | |
dc.date.created | 2020-09-14 | |
dc.date.issued | 2020-10-06 | es_ES |
dc.identifier.uri | http://hdl.handle.net/10251/151255 | |
dc.description.abstract | [ES] Hoy en día hay poco trabajo de investigación centrado en las técnicas de Feature Selection (FS), incluidas las características categóricas y continuas en la literatura de Estimación del esfuerzo de desarrollo de software. Este documento aborda el problema de seleccionar las características más relevantes del conjunto de datos de ISBSG (International Software Benchmarking Standards Group) para su uso en la estimación de esfuerzo de desarrollo software. El objetivo es mostrar la utilidad de dividir en dos la lista clasificada de características proporcionadas por un enfoque secuencial de FS basado en información mutua, con respecto a características categóricas y continuas. Estas listas se recombinan posteriormente de acuerdo con la precisión de un modelo de razonamiento basado en casos. Por lo tanto, se comparan cuatro algoritmos de FS utilizando un conjunto de datos completo con 621 proyectos y 12 características de ISBSG. Por un lado, dos algoritmos solo consideran la relevancia, mientras que los dos restantes siguen el criterio de maximizar la relevancia y también minimizar la redundancia entre cualquier característica independiente y las características ya seleccionadas. Por otro lado, los algoritmos que no discriminan entre características continuas y categóricas consideran solo una lista, mientras que los que las diferencian utilizan dos listas que luego se combinan. Como resultado, los algoritmos que utilizan dos listas presentan un mejor rendimiento que los algoritmos que utilizan una sola lista. Por lo tanto, es significativo considerar dos listas diferentes de características para que las características categóricas se puedan seleccionar con mayor frecuencia. | es_ES |
dc.description.abstract | [EN] There is still little research work focused on feature selection (FS) techniques including both categorical and continuous features in Software Development Effort Estimation (SDEE) literature. This paper addresses the problem of selecting the most relevant features from ISBSG (International Software Benchmarking Standards Group) dataset to be used in SDEE. The aim is to show the usefulness of splitting the ranked list of features provided by a mutual information-based sequential FS approach in two, regarding categorical and continuous features. These lists are later recombined according to the accuracy of a case-based reasoning model. Thus, four FS algorithms are compared using a complete dataset with 621 projects and 12 features from ISBSG. On the one hand, two algorithms just consider the relevance, while the remaining two follow the criterion of maximizing relevance and also minimizing redundancy between any independent feature and the already selected features. On the other hand, the algorithms that do not discriminate between continuous and categorical features consider just one list, whereas those that differentiate them use two lists that are later combined. As a result, the algorithms that use two lists present better performance than those algorithms that use one list. Thus, it is meaningful to consider two different lists of features so that the categorical features may be selected more frequently. | es_ES |
dc.format.extent | 76 | es_ES |
dc.language | Español | es_ES |
dc.publisher | Universitat Politècnica de València | es_ES |
dc.rights | Reserva de todos los derechos | es_ES |
dc.subject | Feature selection | es_ES |
dc.subject | Información mútua | es_ES |
dc.subject | Desarrollo software | es_ES |
dc.subject | Estimación de esfuerzo | es_ES |
dc.subject | ISBSG | es_ES |
dc.subject | k-nearest neighbor | es_ES |
dc.subject | Agile | es_ES |
dc.subject | Mutual Information | es_ES |
dc.subject | Software development | es_ES |
dc.subject | Effort estimation | es_ES |
dc.subject.classification | ORGANIZACION DE EMPRESAS | es_ES |
dc.subject.other | Grado en Ingeniería Informática-Grau en Enginyeria Informàtica | es_ES |
dc.title | Algoritmos de Feature Selection utilizados en estimación de esfuerzo de proyectos de desarrollo software | es_ES |
dc.type | Proyecto/Trabajo fin de carrera/grado | es_ES |
dc.rights.accessRights | Abierto | es_ES |
dc.contributor.affiliation | Universitat Politècnica de València. Departamento de Organización de Empresas - Departament d'Organització d'Empreses | es_ES |
dc.contributor.affiliation | Universitat Politècnica de València. Escola Tècnica Superior d'Enginyeria Informàtica | es_ES |
dc.description.bibliographicCitation | Ajenjo Vicente, II. (2020). Algoritmos de Feature Selection utilizados en estimación de esfuerzo de proyectos de desarrollo software. http://hdl.handle.net/10251/151255 | es_ES |
dc.description.accrualMethod | TFGM | es_ES |
dc.relation.pasarela | TFGM\95355 | es_ES |