- -

Detección de plagio translingüe utilizando el diccionario estadístico de BabelNet

RiuNet: Institutional repository of the Polithecnic University of Valencia

Share/Send to

Cited by

Statistics

Detección de plagio translingüe utilizando el diccionario estadístico de BabelNet

Show simple item record

Files in this item

dc.contributor.author Franco Salvador, Marc es_ES
dc.contributor.author Gupta, Parth Alokkumar es_ES
dc.contributor.author Rosso, Paolo es_ES
dc.date.accessioned 2015-01-16T08:33:40Z
dc.date.available 2015-01-16T08:33:40Z
dc.date.issued 2012-12
dc.identifier.issn 1405-5546
dc.identifier.uri http://hdl.handle.net/10251/46125
dc.description.abstract [EN] In recent years there have been important advances in the field of automatic plagiarism detection. One variant is cross-language plagiarism detection, which tries to detect plagiarism between documents in different languages. Most of the existing approaches to this task make use of statistical dictionaries to deal with the translations of words in the documents. A statistical dictionary provides, for a given word, the list of possible translations with their respective probabilities. The objective of this paper is to analyze the performance of the statistical dictionary of multilingual semantic network - Babelnet for cross-language plagiarism detection. In the evaluation we compare its results with those offered by a statistical dictionary trained by the well-known IBM M1 aligment model, both using state-of-the-art model CL-ASA as a base. The results of the experiments indicate that Babelnet is a good alternative as statistical dictionary. es_ES
dc.description.abstract [ES] En los últimos años ha habido importantes avances en el campo de la detección de plagio automática. Uno de ellos es la detección de plagio translingüe, la cual trata de detectar el plagio entre documentos en diferentes idiomas. La mayoría de aproximaciones que existen para esta tarea hacen uso de diccionarios estadísticos para lidiar con las traducciones de las palabras de los documentos. Un diccionario estadístico nos proporciona, para una palabra dada, la lista de traducciones posibles con sus respectivas probabilidades. El objetivo de este trabajo es analizar el rendimiento del diccionario estadistico de la red semántica multiling üe BabelNet para la tarea de detección de plagio translingüe. En la evaluación comparamos sus resultados con los ofrecidos por un diccionario estadístico entrenado con el conocido modelo de alineamiento IBM M1, ambos utilizando el modelo estado del arte CL-ASA como base. Los resultados de los experimentos indican que BabelNet es una buena alternativa como diccionario estadístico. es_ES
dc.description.sponsorship En primer lugar agradecer a la Consellerıa D'educacio, Formació i Ocupació de la Generalitat Valenciana por la financiacion por parte del programa Geronimo Forteza, sin el cual no hubiera sido posible llevar a cabo la investigacion del ´ primer autor que ha llevado a esta publicacion. Este trabajo se ha hecho dentro del ambito del VLC/CAMPUS Microcluster on Multimodal Interaction in Intelligent Systems y como parte del proyecto de la Comision Europea WIQ-EI IRSES (no. 269180). Por otro lado agradecer a Roberto Navigili por haber desarrollado BabelNet y ofrecer su ayuda para familiarizarnos con el API sistema. Finalmente a Alberto Barron Cedeño por desarrollar la version inicial del modelo CL-ASA.
dc.language Español es_ES
dc.publisher Instituto Politécnico Nacional es_ES
dc.relation.ispartof Computación y Sistemas es_ES
dc.rights Reconocimiento - No comercial (by-nc) es_ES
dc.subject Detección de plagio translingüe es_ES
dc.subject Similitud textual es_ES
dc.subject Diccionario estadístico es_ES
dc.subject BabelNet es_ES
dc.subject Cross-language plagiarism detection es_ES
dc.subject Textual similarity es_ES
dc.subject Statistical dictionary es_ES
dc.subject.classification LENGUAJES Y SISTEMAS INFORMATICOS es_ES
dc.title Detección de plagio translingüe utilizando el diccionario estadístico de BabelNet es_ES
dc.title.alternative Cross-language Plagiarism Detection Using BabelNet’s Statistical Dictionary
dc.type Artículo es_ES
dc.relation.projectID info:eu-repo/grantAgreement/EC/FP7/269180/EU
dc.rights.accessRights Abierto es_ES
dc.contributor.affiliation Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació es_ES
dc.description.bibliographicCitation Franco Salvador, M.; Gupta, PA.; Rosso, P. (2012). Detección de plagio translingüe utilizando el diccionario estadístico de BabelNet. Computación y Sistemas. 16(4):383-390. http://hdl.handle.net/10251/46125 es_ES
dc.description.accrualMethod Senia es_ES
dc.relation.publisherversion http://cys.cic.ipn.mx/ojs/index.php/CyS/article/view/1439 es_ES
dc.description.upvformatpinicio 383 es_ES
dc.description.upvformatpfin 390 es_ES
dc.type.version info:eu-repo/semantics/publishedVersion es_ES
dc.description.volume 16 es_ES
dc.description.issue 4 es_ES
dc.relation.senia 232473
dc.contributor.funder Generalitat Valenciana
dc.contributor.funder European Commission


This item appears in the following Collection(s)

Show simple item record