- -

Clustering Iterativo de Textos Cortos con Representaciones basadas en Conceptos

RiuNet: Repositorio Institucional de la Universidad Politécnica de Valencia

Compartir/Enviar a

Citas

Estadísticas

  • Estadisticas de Uso

Clustering Iterativo de Textos Cortos con Representaciones basadas en Conceptos

Mostrar el registro sencillo del ítem

Ficheros en el ítem

dc.contributor.author INGARAMO, Diego Alejandro es_ES
dc.contributor.author ROSAS, María Verónica es_ES
dc.contributor.author Errecalde, Marcelo Luis es_ES
dc.contributor.author Rosso, Paolo
dc.date.accessioned 2013-05-14T12:21:11Z
dc.date.available 2013-05-14T12:21:11Z
dc.date.issued 2011 es_ES
dc.identifier.issn 1135-5948
dc.identifier.uri http://hdl.handle.net/10251/28832
dc.description.abstract [ES] : La tendencia actual a trabajar con documentos cortos (blogs, mensajes de textos, y otros), ha generado un interés creciente en las técnicas de procesamiento automáticas de documentos con estas características. En este contexto, el "cluste- ring" (agrupamiento) de textos cortos es un tarea muy importante de investigación, que puede jugar un rol fundamental en organizar estos grandes volúmenes de textos cortos, en un número pequeño de grupos signicativos. Recientemente, el uso de métodos de clustering bio-inspirados iterativos, ha producido resultados muy interesantes utilizando representaciones de vector de términos clásicas. En este trabajo, extendemos este enfoque utilizando representaciones de documentos enriquecidas con información semántica (conceptos) obtenida con métodos de desambiguación basados en conocimiento. Los resultados experimentales, permiten concluir que el enfoque de clustering iterativo utilizado puede verse beneficiado significativamente con la incorporación de información semántica en la representación de documentos, mostrando un desempeño superior al exhibido por varios de los métodos de clustering más difundidos en el área, en la mayoría de las instancias experimentales. es_ES
dc.description.abstract [EN] The current trend to work with short documents (e.g. blogs, text mes- saging and others), has produced an increasing interest in automatic processing techniques of documents with these features. In this context, short-text clustering is a very important research area, which can play a fundamental role in organizing these large volumes of short texts in a small number of meaningful groups. Recently, the use of bio-inspired, iterative clustering methods has produced very interesting results with standard term-vector representations. In this work, we extend this ap- proach by using representations of documents that also include semantic information (concepts) obtained with knowledge-based WSD methods. The experimental results allow to conclude that our iterative clustering approach can be signi-cantly improved with the addition of this semantic information in the representation of documents, showing a better performance than several well-known methods in this area, in most of the considered experimental instances. en_EN
dc.language Español
dc.publisher Sociedad Española para el Procesamiento del Lenguaje Natural (SEPLN) es_ES
dc.relation.ispartof PROCESAMIENTO DEL LENGUAJE NATURAL es_ES
dc.rights Reserva de todos los derechos es_ES
dc.subject Agrupamiento iterativo es_ES
dc.subject Desambigüación es_ES
dc.subject Colecciones de textos cortos es_ES
dc.subject Iterative clustering es_ES
dc.subject Word sense disambiguation en_EN
dc.subject Short-text corpora en_EN
dc.subject.classification LENGUAJES Y SISTEMAS INFORMATICOS es_ES
dc.title Clustering Iterativo de Textos Cortos con Representaciones basadas en Conceptos
dc.type Artículo es_ES
dc.rights.accessRights Abierto
dc.contributor.affiliation Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació es_ES
dc.description.bibliographicCitation Ingaramo, DA.; Rosas, MV.; Errecalde, ML.; Rosso, P. (2011). Clustering Iterativo de Textos Cortos con Representaciones basadas en Conceptos. PROCESAMIENTO DEL LENGUAJE NATURAL. 46:19-26. http://hdl.handle.net/10251/28832 es_ES
dc.description.accrualMethod S es_ES
dc.relation.publisherversion http://journal.sepln.org/sepln/ojs/ojs/index.php/pln/issue/archive
dc.description.upvformatpinicio 19 es_ES
dc.description.upvformatpfin 26 es_ES
dc.type.version info:eu-repo/semantics/publishedVersion es_ES
dc.description.volume 46 es_ES
dc.relation.senia 215393 es_ES


Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem