- -

Text similarity by using GloVe word vector representations

RiuNet: Repositorio Institucional de la Universidad Politécnica de Valencia

Compartir/Enviar a

Citas

Estadísticas

  • Estadisticas de Uso

Text similarity by using GloVe word vector representations

Mostrar el registro sencillo del ítem

Ficheros en el ítem

dc.contributor.advisor Hurtado Oliver, Lluis Felip es_ES
dc.contributor.advisor Segarra Soriano, Encarnación es_ES
dc.contributor.author Sánchez Rodríguez, Iván es_ES
dc.date.accessioned 2017-10-26T06:33:27Z
dc.date.available 2017-10-26T06:33:27Z
dc.date.created 2017-09-28
dc.date.issued 2017-10-26 es_ES
dc.identifier.uri http://hdl.handle.net/10251/90045
dc.description.abstract Word embeddings are word representations in the form of vectors that allow to maintain certain semantic information of the words. There exist different ways of taking profit of the semantic information the words have, as there exist different ways of generating the word vectors that represent those words (e.g. Word2Vec model vs. GloVe model). By using the semantic information the word embeddings capture, we can build approximations to compare semantic information between phrases or even documents instead of words. In this project, we propose the use of the GloVe tool, presented by Stanford University, to train Spanish word embeddings, use them to compare semantic differences between Spanish phrases and compare the accuracy of the system with prior results in which other models were used, for example, Word2Vec. es_ES
dc.description.abstract Los word embeddings son representaciones de palabras en forma de vector que permiten mantener cierta información semántica de estas. Existen diferentes maneras de aprovechar la información semántica que las palabras tienen, así como también existen diferentes maneras de generar los vectores de palabras que representan dichas palabras (por ejemplo, los modelos Word2Vec frente al modelo GloVe). Si se usa la información que los word embeddings capturan, se pueden construir aproximaciones para comparar información semántica entre frases o incluso documentos, en lugar de palabras. En este proyecto, proponemos el uso de la herramienta GloVe, presentada por la Universidad de Stanford, para entrenar representaciones vectoriales de palabras en español, así como su uso para comparar diferencias semánticas entre frases en español y comparar el rendimiento frente a resultados previos en los que otros modelos fueron utilizados, por ejemplo, Word2Vec. es_ES
dc.language Inglés es_ES
dc.publisher Universitat Politècnica de València es_ES
dc.rights Reconocimiento - Compartir igual (by-sa) es_ES
dc.subject Similitud entre textos es_ES
dc.subject Vectores de palabras en español es_ES
dc.subject Similitud semántica es_ES
dc.subject Diferencia semántica es_ES
dc.subject Representación vectorial de frases es_ES
dc.subject Word vector representations es_ES
dc.subject Word embeddings es_ES
dc.subject Text similarity es_ES
dc.subject Spanish word embeddings es_ES
dc.subject Semantic difference es_ES
dc.subject Phrase embeddings es_ES
dc.subject Phrase similarity es_ES
dc.subject Global Vectors es_ES
dc.subject GloVe es_ES
dc.subject Similitud entre frases es_ES
dc.subject.classification LENGUAJES Y SISTEMAS INFORMATICOS es_ES
dc.subject.other Máster Universitario en Inteligencia Artificial, Reconocimiento de Formas e Imagen Digital-Màster Universitari en Intel·Ligència Artificial: Reconeixement de Formes i Imatge Digital es_ES
dc.title Text similarity by using GloVe word vector representations es_ES
dc.title.alternative Similitud de textos haciendo uso de representaciones vectoriales de las palabras es_ES
dc.type Tesis de máster es_ES
dc.rights.accessRights Abierto es_ES
dc.contributor.affiliation Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació es_ES
dc.description.bibliographicCitation Sánchez Rodríguez, I. (2017). Text similarity by using GloVe word vector representations. http://hdl.handle.net/10251/90045 es_ES
dc.description.accrualMethod TFGM es_ES
dc.relation.pasarela TFGM\57471 es_ES


Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem