Clustering de Documentos con Restricciones de Tamaño

Vallejo Huanga, Diego Fernando

Identificarse

Buscar en RiuNet

Listar

Todo RiuNet
Esta colección

Mi cuenta

Acceder

Estadísticas

Ver Estadísticas de uso

Ayuda RiuNet

Admin. UPV

Compartir/Enviar a

Citas

Estadísticas

Clustering de Documentos con Restricciones de Tamaño

Mostrar el registro sencillo del ítem

Ficheros en el ítem

Nombre: VALLEJO - Clustering ...

Tamaño: 6.366Mb

Formato: PDF

Abrir

dc.contributor.advisor	Ferri Ramírez, César	es_ES
dc.contributor.author	Vallejo Huanga, Diego Fernando	es_ES
dc.date.accessioned	2016-09-08T10:11:59Z
dc.date.available	2016-09-08T10:11:59Z
dc.date.created	2016-07-18
dc.date.issued	2016-09-08	es_ES
dc.identifier.uri	http://hdl.handle.net/10251/69089
dc.description.abstract	[EN] El análisis de clusters tiene por objetivo dividir objetos de datos en grupos, de tal manera que los objetos dentro de un mismo grupo sean muy similares entre sí y diferentes de los objetos de otros grupos. Tradicionalmente, el clustering es visto como un método de aprendizaje no supervisado, que agrupa los objetos de datos basándose únicamente en la información presentada en el conjunto de datos, sin información externa. El K-Medoides es uno de los más famosos y sencillos algoritmos de agrupamiento, donde el usuario define el número de clusters deseados. En muchas aplicaciones del mundo real, tales como: codificación de imágenes, agrupamientos espaciales en geo-informática, segmentación de clientes o agrupamiento de documentos, por lo general hay restricciones o prioridades en la definición del problema que limitan, el espacio de posibles soluciones, al problema o rango de interés de las soluciones. Este tipo de problemas se tratan mediante métodos de agrupamiento semi-supervisados. El presente trabajo pretende diseñar, implementar y probar modificaciones en los algoritmos de clustering tradicionales, para incorporar restricciones de tamaño en cada cluster. Específicamente, se proponen dos nuevos algoritmos de agrupamiento semisupervisado, basados en: programación lineal entera binaria con restricciones del tipo cannot-link y en una variación del algoritmo K-Medoides, respectivamente. Para mostrar la aplicabilidad de los métodos de agrupación semi-supervisados propuestos, se aborda el problema de configuración automática del programa de una conferencia, con agrupación de artículos por similitud. Se incluyen experimentos, aplicando las nuevas técnicas, sobre conjuntos de datos de conferencias reales: ICMLA- 2014, AAAI-2013 y AAAI-2014. Los resultados de estos experimentos muestran que los nuevos métodos son capaces de resolver problemas prácticos y reales.	es_ES
dc.description.abstract	[EN] Cluster analysis aims to divide data objects in groups, so that objects within a group are very similar and different of those objects from other groups. Traditionally, clustering is known as a method of unsupervised learning, which groups data objects only based on the information presented in the dataset, without external information. The K-Medoids is one of the most famous and simple clustering algorithms, where the user defines the desired number of clusters. In many real-world applications, such as image coding, spatial clustering in geoinformatics, customer segmentation or grouping of documents, there are usually constraints or priorities in the problem definition that limit the space of possible solutions to the problem or rank the interest of the solutions. This kind of problems are addressed by semi-supervised clustering methods. This paper aims to design, implement and test modifications in traditional clustering algorithms to incorporate size constraints in each cluster. Specifically, two new algorithms are proposed to semi-supervised clustering, based on: binary integer linear programming with cannot-link constraints and a variation of the K-Medoids algorithm, respectively. The applicability of the proposed semi-supervised clustering methods is illustrated by addressing the problem of automatic configuration of conference schedules by clustering articles by similarity. We include experiments, applying the new techniques, over real conferences datasets: ICMLA-2014, AAAI-2013 and AAAI-2014. The results of these experiments show that the new methods are able to solve practical and real problems.	es_ES
dc.format.extent	106	es_ES
dc.language	Español	es_ES
dc.publisher	Universitat Politècnica de València	es_ES
dc.rights	Reserva de todos los derechos	es_ES
dc.subject	Mineria de datos	es_ES
dc.subject	Agrupamiento con restricciones	es_ES
dc.subject	Restricción de tamaño	es_ES
dc.subject	K-Medoides	es_ES
dc.subject	Programación lineal	es_ES
dc.subject	Data Mining	es_ES
dc.subject	Clustering with constraints	es_ES
dc.subject	Size constraint	es_ES
dc.subject	Linear programming	es_ES
dc.subject.classification	LENGUAJES Y SISTEMAS INFORMATICOS	es_ES
dc.subject.other	Máster Universitario en Gestión de la Información-Màster universitari en Gestió de la Informació	es_ES
dc.title	Clustering de Documentos con Restricciones de Tamaño	es_ES
dc.type	Tesis de máster	es_ES
dc.rights.accessRights	Abierto	es_ES
dc.contributor.affiliation	Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació	es_ES
dc.contributor.affiliation	Universitat Politècnica de València. Escola Tècnica Superior d'Enginyeria Informàtica	es_ES
dc.description.bibliographicCitation	Vallejo Huanga, DF. (2016). Clustering de Documentos con Restricciones de Tamaño. http://hdl.handle.net/10251/69089.	es_ES
dc.description.accrualMethod	TFGM	es_ES
dc.relation.pasarela	TFGM\46918	es_ES

Este ítem aparece en la(s) siguiente(s) colección(ones)

ETSINF - Trabajos académicos [5160]
Escola Tècnica Superior d'Enginyeria Informàtica

Mostrar el registro sencillo del ítem

Clustering de Documentos con Restricciones de Tamaño

RiuNet: Repositorio Institucional de la Universidad Politécnica de Valencia

Buscar en RiuNet

Listar

Todo RiuNet

Esta colección

Mi cuenta

Estadísticas

Ayuda RiuNet

Admin. UPV

Compartir/Enviar a

Citas

Estadísticas

Clustering de Documentos con Restricciones de Tamaño

Ficheros en el ítem

Este ítem aparece en la(s) siguiente(s) colección(ones)