- -

Algoritmos de Feature Selection utilizados en estimación de esfuerzo de proyectos de desarrollo software

RiuNet: Institutional repository of the Polithecnic University of Valencia

Share/Send to

Cited by

Statistics

Algoritmos de Feature Selection utilizados en estimación de esfuerzo de proyectos de desarrollo software

Show simple item record

Files in this item

dc.contributor.advisor Fernández Diego, Marta es_ES
dc.contributor.advisor González Ladrón de Guevara, Fernando Raimundo es_ES
dc.contributor.author Ajenjo Vicente, Iván Iñaki es_ES
dc.date.accessioned 2020-10-06T12:14:48Z
dc.date.available 2020-10-06T12:14:48Z
dc.date.created 2020-09-14
dc.date.issued 2020-10-06 es_ES
dc.identifier.uri http://hdl.handle.net/10251/151255
dc.description.abstract [ES] Hoy en día hay poco trabajo de investigación centrado en las técnicas de Feature Selection (FS), incluidas las características categóricas y continuas en la literatura de Estimación del esfuerzo de desarrollo de software. Este documento aborda el problema de seleccionar las características más relevantes del conjunto de datos de ISBSG (International Software Benchmarking Standards Group) para su uso en la estimación de esfuerzo de desarrollo software. El objetivo es mostrar la utilidad de dividir en dos la lista clasificada de características proporcionadas por un enfoque secuencial de FS basado en información mutua, con respecto a características categóricas y continuas. Estas listas se recombinan posteriormente de acuerdo con la precisión de un modelo de razonamiento basado en casos. Por lo tanto, se comparan cuatro algoritmos de FS utilizando un conjunto de datos completo con 621 proyectos y 12 características de ISBSG. Por un lado, dos algoritmos solo consideran la relevancia, mientras que los dos restantes siguen el criterio de maximizar la relevancia y también minimizar la redundancia entre cualquier característica independiente y las características ya seleccionadas. Por otro lado, los algoritmos que no discriminan entre características continuas y categóricas consideran solo una lista, mientras que los que las diferencian utilizan dos listas que luego se combinan. Como resultado, los algoritmos que utilizan dos listas presentan un mejor rendimiento que los algoritmos que utilizan una sola lista. Por lo tanto, es significativo considerar dos listas diferentes de características para que las características categóricas se puedan seleccionar con mayor frecuencia. es_ES
dc.description.abstract [EN] There is still little research work focused on feature selection (FS) techniques including both categorical and continuous features in Software Development Effort Estimation (SDEE) literature. This paper addresses the problem of selecting the most relevant features from ISBSG (International Software Benchmarking Standards Group) dataset to be used in SDEE. The aim is to show the usefulness of splitting the ranked list of features provided by a mutual information-based sequential FS approach in two, regarding categorical and continuous features. These lists are later recombined according to the accuracy of a case-based reasoning model. Thus, four FS algorithms are compared using a complete dataset with 621 projects and 12 features from ISBSG. On the one hand, two algorithms just consider the relevance, while the remaining two follow the criterion of maximizing relevance and also minimizing redundancy between any independent feature and the already selected features. On the other hand, the algorithms that do not discriminate between continuous and categorical features consider just one list, whereas those that differentiate them use two lists that are later combined. As a result, the algorithms that use two lists present better performance than those algorithms that use one list. Thus, it is meaningful to consider two different lists of features so that the categorical features may be selected more frequently. es_ES
dc.format.extent 76 es_ES
dc.language Español es_ES
dc.publisher Universitat Politècnica de València es_ES
dc.rights Reserva de todos los derechos es_ES
dc.subject Feature selection es_ES
dc.subject Información mútua es_ES
dc.subject Desarrollo software es_ES
dc.subject Estimación de esfuerzo es_ES
dc.subject ISBSG es_ES
dc.subject k-nearest neighbor es_ES
dc.subject Agile es_ES
dc.subject Mutual Information es_ES
dc.subject Software development es_ES
dc.subject Effort estimation es_ES
dc.subject.classification ORGANIZACION DE EMPRESAS es_ES
dc.subject.other Grado en Ingeniería Informática-Grau en Enginyeria Informàtica es_ES
dc.title Algoritmos de Feature Selection utilizados en estimación de esfuerzo de proyectos de desarrollo software es_ES
dc.type Proyecto/Trabajo fin de carrera/grado es_ES
dc.rights.accessRights Abierto es_ES
dc.contributor.affiliation Universitat Politècnica de València. Departamento de Organización de Empresas - Departament d'Organització d'Empreses es_ES
dc.contributor.affiliation Universitat Politècnica de València. Escola Tècnica Superior d'Enginyeria Informàtica es_ES
dc.description.bibliographicCitation Ajenjo Vicente, II. (2020). Algoritmos de Feature Selection utilizados en estimación de esfuerzo de proyectos de desarrollo software. http://hdl.handle.net/10251/151255 es_ES
dc.description.accrualMethod TFGM es_ES
dc.relation.pasarela TFGM\95355 es_ES


This item appears in the following Collection(s)

Show simple item record