- -

Disambiguating Company Names in Microblog Text Using Clustering for Online Reputation Management

RiuNet: Repositorio Institucional de la Universidad Politécnica de Valencia

Compartir/Enviar a

Citas

Estadísticas

  • Estadisticas de Uso

Disambiguating Company Names in Microblog Text Using Clustering for Online Reputation Management

Mostrar el registro sencillo del ítem

Ficheros en el ítem

dc.contributor.author Perez Tellez, Fernando es_ES
dc.contributor.author Cardiff, John es_ES
dc.contributor.author Rosso, Paolo es_ES
dc.contributor.author Pinto Avendaño, David es_ES
dc.date.accessioned 2016-05-04T12:36:57Z
dc.date.available 2016-05-04T12:36:57Z
dc.date.issued 2015
dc.identifier.issn 0035-0451
dc.identifier.uri http://hdl.handle.net/10251/63627
dc.description.abstract [EN] Twitter is used by millions of users to publish brief messages (tweets) with the purpose of sharing experiences and/or opinions about a product or service. There is a clear need for systems that can mine these messages in order to derive information about the collective thinking of twitterers (e.g. for opinion or sentiment analysis). Tweet analysis is a very important task because comments, opinions, suggestions, complaints etc. can be used for marketing strategies or for determining information on a company s reputation. For this purpose, it is necessary to automatically establish whether a tweet refers to a company or not, when the company name is ambiguous. This task is not a straightforward keyword search process as there may be multiple contexts in which a name can be used. The aim of this study is to present and compare four different approaches which improve the representation of short texts for better performance of the clustering task that determine whether a given tweet refers to a particular company or not. For this purpose, we have used a variety of enriching methodologies based on term expansion via the semantic similarity hidden behind the lexical structure, in order to improve the representation of tweets and as a consequence the performance of the task. We have used two different tweet datasets of company names which contain different levels of ambiguity. The results are promising although they highlight the difficulty of this task. es_ES
dc.description.abstract [ES] Twitter es utilizado por millones de personas con la finalidad de publicar mensajes cortos con el propósito de compartir experiencias y/u opiniones acerca de un determinado producto o servicio. Existe una clara necesidad de crear sistemas que sean capaces de analizar estos mensajes a fin de derivar información sobre el pensamiento colectivo de las personas que los publican. El análisis de los tweets se ha convertido en una tarea muy importante para las grandes compañías, debido a que los comentarios, sugerencias y quejas pueden ser usados como estrategias de mercadotecnia o para determinar la reputación de cierta compañía. Entre otras tareas, es necesario construir métodos que permitan determinar, de forma automática, cuando un tweet se refiere a una compañía o no, en el caso de que el nombre de la compañía sea ambiguo. El objetivo de este trabajo es presentar y comparar cuatro diferentes aproximaciones, para la desambiguación de nombres de compañías mediante métodos de agrupamiento. Para este propósito hemos propuesto una variedad de metodologías de enriquecimiento basada en la expansión de términos vía la similitud semántica escondida detrás de la estructura léxica, todo esto con el objetivo de mejorar la representación de los tweets y como consecuencia el desempeño de la tarea de categorización. En los experimentos se han usado dos conjuntos de tweets, los cuales contienen nombres de compañías con diferentes niveles de ambigüedad. Los resultados obtenidos son prometedores y al mismo tiempo demuestran la dificultad de la tarea. es_ES
dc.language Inglés es_ES
dc.publisher Pontificia Universidad Católica de Valparaíso, Instituto de Literatura y Ciencias del Lenguaje es_ES
dc.relation.ispartof Revista Signos es_ES
dc.rights Reserva de todos los derechos es_ES
dc.subject Clustering of tweets es_ES
dc.subject Opinion analysis es_ES
dc.subject Disambiguation es_ES
dc.subject Online reputation management es_ES
dc.subject.classification LENGUAJES Y SISTEMAS INFORMATICOS es_ES
dc.title Disambiguating Company Names in Microblog Text Using Clustering for Online Reputation Management es_ES
dc.type Artículo es_ES
dc.identifier.doi 10.4067/S0718-09342015000100003
dc.rights.accessRights Cerrado es_ES
dc.contributor.affiliation Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació es_ES
dc.description.bibliographicCitation Perez Tellez, F.; Cardiff, J.; Rosso, P.; Pinto Avendaño, D. (2015). Disambiguating Company Names in Microblog Text Using Clustering for Online Reputation Management. Revista Signos. 48(87):54-76. doi:10.4067/S0718-09342015000100003 es_ES
dc.description.accrualMethod S es_ES
dc.relation.publisherversion http://dx.doi.org/10.4067/S0718-09342015000100003 es_ES
dc.description.upvformatpinicio 54 es_ES
dc.description.upvformatpfin 76 es_ES
dc.type.version info:eu-repo/semantics/publishedVersion es_ES
dc.description.volume 48 es_ES
dc.description.issue 87 es_ES
dc.relation.senia 306229 es_ES
dc.identifier.eissn 0718-0934


Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem