Mostrar el registro sencillo del ítem
dc.contributor.advisor | Hurtado Oliver, Lluis Felip | es_ES |
dc.contributor.advisor | Segarra Soriano, Encarnación | es_ES |
dc.contributor.author | Sánchez Rodríguez, Iván | es_ES |
dc.date.accessioned | 2017-10-26T06:33:27Z | |
dc.date.available | 2017-10-26T06:33:27Z | |
dc.date.created | 2017-09-28 | |
dc.date.issued | 2017-10-26 | es_ES |
dc.identifier.uri | http://hdl.handle.net/10251/90045 | |
dc.description.abstract | Word embeddings are word representations in the form of vectors that allow to maintain certain semantic information of the words. There exist different ways of taking profit of the semantic information the words have, as there exist different ways of generating the word vectors that represent those words (e.g. Word2Vec model vs. GloVe model). By using the semantic information the word embeddings capture, we can build approximations to compare semantic information between phrases or even documents instead of words. In this project, we propose the use of the GloVe tool, presented by Stanford University, to train Spanish word embeddings, use them to compare semantic differences between Spanish phrases and compare the accuracy of the system with prior results in which other models were used, for example, Word2Vec. | es_ES |
dc.description.abstract | Los word embeddings son representaciones de palabras en forma de vector que permiten mantener cierta información semántica de estas. Existen diferentes maneras de aprovechar la información semántica que las palabras tienen, así como también existen diferentes maneras de generar los vectores de palabras que representan dichas palabras (por ejemplo, los modelos Word2Vec frente al modelo GloVe). Si se usa la información que los word embeddings capturan, se pueden construir aproximaciones para comparar información semántica entre frases o incluso documentos, en lugar de palabras. En este proyecto, proponemos el uso de la herramienta GloVe, presentada por la Universidad de Stanford, para entrenar representaciones vectoriales de palabras en español, así como su uso para comparar diferencias semánticas entre frases en español y comparar el rendimiento frente a resultados previos en los que otros modelos fueron utilizados, por ejemplo, Word2Vec. | es_ES |
dc.language | Inglés | es_ES |
dc.publisher | Universitat Politècnica de València | es_ES |
dc.rights | Reconocimiento - Compartir igual (by-sa) | es_ES |
dc.subject | Similitud entre textos | es_ES |
dc.subject | Vectores de palabras en español | es_ES |
dc.subject | Similitud semántica | es_ES |
dc.subject | Diferencia semántica | es_ES |
dc.subject | Representación vectorial de frases | es_ES |
dc.subject | Word vector representations | es_ES |
dc.subject | Word embeddings | es_ES |
dc.subject | Text similarity | es_ES |
dc.subject | Spanish word embeddings | es_ES |
dc.subject | Semantic difference | es_ES |
dc.subject | Phrase embeddings | es_ES |
dc.subject | Phrase similarity | es_ES |
dc.subject | Global Vectors | es_ES |
dc.subject | GloVe | es_ES |
dc.subject | Similitud entre frases | es_ES |
dc.subject.classification | LENGUAJES Y SISTEMAS INFORMATICOS | es_ES |
dc.subject.other | Máster Universitario en Inteligencia Artificial, Reconocimiento de Formas e Imagen Digital-Màster Universitari en Intel·Ligència Artificial: Reconeixement de Formes i Imatge Digital | es_ES |
dc.title | Text similarity by using GloVe word vector representations | es_ES |
dc.title.alternative | Similitud de textos haciendo uso de representaciones vectoriales de las palabras | es_ES |
dc.type | Tesis de máster | es_ES |
dc.rights.accessRights | Abierto | es_ES |
dc.contributor.affiliation | Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació | es_ES |
dc.description.bibliographicCitation | Sánchez Rodríguez, I. (2017). Text similarity by using GloVe word vector representations. http://hdl.handle.net/10251/90045 | es_ES |
dc.description.accrualMethod | TFGM | es_ES |
dc.relation.pasarela | TFGM\57471 | es_ES |