Sistema de recuperació d'informació semàntica multilingüe

Casamayor Segarra, Andreu

RiuNet repositorio UPV
:
Docencia
:
Trabajos académicos
:
Servicio de alumnado - Trabajos académicos
:
Ver ítem

Identificarse

Buscar en RiuNet

Listar

Todo RiuNet
Esta colección

Mi cuenta

Acceder

Estadísticas

Ver Estadísticas de uso

Ayuda RiuNet

Admin. UPV

Compartir/Enviar a

Citas

Estadísticas

Sistema de recuperació d'informació semàntica multilingüe

Mostrar el registro sencillo del ítem

Ficheros en el ítem

Nombre: Casamayor - Sistema ...

Tamaño: 9.710Mb

Formato: PDF

Abrir

dc.contributor.advisor	Hurtado Oliver, Lluis Felip	es_ES
dc.contributor.advisor	Ahuir Esteve, Vicent	es_ES
dc.contributor.author	Casamayor Segarra, Andreu	es_ES
dc.date.accessioned	2023-10-04T08:36:06Z
dc.date.available	2023-10-04T08:36:06Z
dc.date.created	2023-09-19
dc.date.issued	2023-10-04	es_ES
dc.identifier.uri	http://hdl.handle.net/10251/197525
dc.description.abstract	[ES] Impulsada por la potencia de los modelos neuronales, la recuperación de información semántica ha experimentado un gran avance en los últimos años. A diferencia de la recuperación de información clásica, la recuperación semántica permite relacionar documentos semánticamente similares aun cuando tengan contenido textual distinto. Los modelos de lenguaje basados en aprendizaje profundo (Large Language Models) permiten la representación de frases mediante vectores densos (sentence embeddings) que capturan en gran medida el significado de las oraciones. Este Trabajo Final de Máster tiene como objetivo principal el desarrollo de un motor de recuperación de información semántica que permita el indexado y recuperación de grandes colecciones de texto en catalán, castellano e inglés. El trabajo se enmarca dentro del proyecto AMIC-PoC (Desarrollo de un Prototipo Precompetitivo para el Análisis Afectivo de Información Multimedia, PDC2021-120846-C44) subvencionado por el Ministerio de Ciencia e Innovación. Se espera que el motor desarrollado en el TFM se integre en el demostrador final del proyecto. Para la construcción del motor se realizará un análisis de las herramientas existentes y se seleccionará la más adecuada en función de su escalabilidad y facilidad de integración con los demás componentes del sistema. En cuanto a los modelos de representación semántica, además del uso de modelos existentes se podrá entrenar modelos en la medida que sea necesario. El motor desarrollado deberá ser escalable y de dominio general. Además, para la correcta evaluación del sistema desarrollado será necesario la creación de un corpus de evaluación etiquetado.	es_ES
dc.description.abstract	[EN] Driven by the power of neural models, semantic information retrieval has experienced great progress in recent years. Unlike classical information retrieval, semantic retrieval allows to relate semantically similar documents even when they have different textual content. Language models based on deep learning (Large Language Models) allow the representation of sentences using dense vectors (sentence embeddings) that capture the meaning of sentences. The main objective of this Master Thesis is the development of a semantic information retrieval engine that allows the indexing and retrieval of large text collections in Catalan, Spanish and English. The work is part of the AMIC-PoC project (Development of a Precompetitive Prototype for the Affective Analysis of Multimedia Information, PDC2021-120846-C44) funded by the Spanish Ministerio de Ciencia e Innovación. The engine developed in this Master Thesis is expected to be integrated into the final demonstrator of the project. For the construction of the engine, an analysis of the existing tools will be carried out and the most appropriate one will be selected based on its scalability and ease of integration with the other components of the system. Regarding the semantic representation models, in addition to the use of existing models, they can be trained as necessary. The engine developed must be scalable and general domain. In addition, for the correct evaluation of the developed system it will be necessary to create a labeled evaluation corpus.	es_ES
dc.format.extent	156	es_ES
dc.language	Catalán	es_ES
dc.publisher	Universitat Politècnica de València	es_ES
dc.rights	Reserva de todos los derechos	es_ES
dc.subject	Incrustaciones de palabras	es_ES
dc.subject	Recuperación semántica de la información	es_ES
dc.subject	Procesamiento del Lenguaje Natural (PLN)	es_ES
dc.subject	Recuperación de la información	es_ES
dc.subject	Recuperación de información semántica	es_ES
dc.subject	Sentence embeddings	es_ES
dc.subject	Semantic Information Retrieval	es_ES
dc.subject	Information retrieval	es_ES
dc.subject	Natural Language Processing (NLP)	es_ES
dc.subject.classification	LENGUAJES Y SISTEMAS INFORMATICOS	es_ES
dc.subject.other	Máster Universitario en Inteligencia Artificial, Reconocimiento de Formas e Imagen Digital-Màster Universitari en Intel·ligència Artificial, Reconeixement de Formes i Imatge Digital	es_ES
dc.title	Sistema de recuperació d'informació semàntica multilingüe	es_ES
dc.title.alternative	Sistema de recuperación de información semántica multilingüe	es_ES
dc.title.alternative	Multilingual semantic information retrieval system	es_ES
dc.type	Tesis de máster	es_ES
dc.rights.accessRights	Abierto	es_ES
dc.contributor.affiliation	Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació	es_ES
dc.description.bibliographicCitation	Casamayor Segarra, A. (2023). Sistema de recuperació d'informació semàntica multilingüe. Universitat Politècnica de València. http://hdl.handle.net/10251/197525	es_ES
dc.description.accrualMethod	TFGM	es_ES
dc.relation.pasarela	TFGM\158320	es_ES

Este ítem aparece en la(s) siguiente(s) colección(ones)

Servicio de alumnado - Trabajos académicos [7391]

Mostrar el registro sencillo del ítem

Sistema de recuperació d'informació semàntica multilingüe

RiuNet: Repositorio Institucional de la Universidad Politécnica de Valencia

Buscar en RiuNet

Listar

Todo RiuNet

Esta colección

Mi cuenta

Estadísticas

Ayuda RiuNet

Admin. UPV

Compartir/Enviar a

Citas

Estadísticas

Sistema de recuperació d'informació semàntica multilingüe

Ficheros en el ítem

Este ítem aparece en la(s) siguiente(s) colección(ones)