Generación automática de resúmenes de textos utilizando técnicas de puesta a punto de modelos de lenguaje pre-entrenados

Carpena Caicedo, Moisés

Identificarse

Buscar en RiuNet

Listar

Todo RiuNet
Esta colección

Mi cuenta

Acceder

Estadísticas

Ver Estadísticas de uso

Ayuda RiuNet

Admin. UPV

Compartir/Enviar a

Citas

Estadísticas

Generación automática de resúmenes de textos utilizando técnicas de puesta a punto de modelos de lenguaje pre-entrenados

Mostrar el registro sencillo del ítem

Ficheros en el ítem

Nombre: Carpena - Generacion ...

Tamaño: 1.184Mb

Formato: PDF

Abrir

dc.contributor.advisor	Casacuberta Nolla, Francisco	es_ES
dc.contributor.author	Carpena Caicedo, Moisés	es_ES
dc.date.accessioned	2024-09-03T18:43:49Z
dc.date.available	2024-09-03T18:43:49Z
dc.date.created	2024-07-12
dc.date.issued	2024-09-03	es_ES
dc.identifier.uri	http://hdl.handle.net/10251/207242
dc.description.abstract	[CA] L'objectiu d'este treball és desenvolupar un sistema que genere automàticament resums de documents utilitzant tècniques d'aprenentatge automàtic, concretament grans models de llenguatge neuronals. Per a aconseguir això, utilitzem un enfocament que es base en la posada a punt “fine-tuning” de models de llenguatge pre-entrenats de tipus *Transformer, per a adaptar-ho a la tasca específica de generació de resums. Treballem amb un corpus de textos prèviament processat i preparat que servix per a entrenar el model i ajudar al fet que aprenga les característiques i estructures necessàries. Posteriorment, s'estudia una tasca sobre la qual fer experiments i proves amb este sistema, més concretament una aplicació mòbil, permetent als usuaris carregar documents i obtindre resums d'ells de manera automàtica.	es_ES
dc.description.abstract	[ES] El objetivo de este Trabajo Final de Grado (TFG) es desarrollar un sistema que genere automáticamente resúmenes de documentos utilizando técnicas de aprendizaje automático (APR) y concretamente grandes modelos de lenguaje neuronales. Para lograr esto, se utilizará un enfoque que se basará en la puesta apunto ("fine-tuning") de modelos de lenguaje pre-entrenados. Ésta es una técnica que permite ajustar un modelo de lenguaje pre-entrenado, en este caso de tipo Transformer, para poder adaptarlo a la tarea específica de generación de resúmenes. Trabajaremos con un corpus de textos previamente procesado y preparado (palabras clave, eliminación de caracteres extraños, etc.), que servirá para entrenar el modelo y ayudarle a que aprenda las características y estructuras necesarias. Posteriormente, habrá una parte del trabajo donde se estudiará una tarea sobre la que poder hacer experimentos con este sistema como puede ser una aplicación móvil, permitiendo a los usuarios cargar documentos y obtener resúmenes de ellos de manera automática. En resumen, este TFG se centrará en el desarrollo de un sistema de resúmenes automáticos usando "fine-tuning" de modelos pre-entrenados Transformer. Se utilizará un corpus parecido a CNN/Daily-mail, que se encuentra en Hugging Face, para la adaptación a la tarea de generación de resúmenes.	es_ES
dc.description.abstract	[EN] The objective of this Final Degree Project (TFG) is to develop a system that automatically generates document summaries using machine learning techniques (APR) and specifically large neural language models. To achieve this, an approach will be used that will be based on the fine-tuning of pre-trained language models. This is a technique that allows adjusting a pre-trained language model, in this case of a Transformer based model, in order to adapt it to the specific task of generating summaries. We will work with a previously processed and prepared corpus of texts (keywords, removal of strange characters, etc.), which will serve to train the model and help it learn the necessary features and structures. Subsequently, there will be a part of the work where a task will be studied on which to be able to do experiments with this system, such as a mobile application, allowing users to upload documents and obtain summaries of them automatically. In summary, this TFG will focus on the development of an automatic summarization system using fine-tuning of Transformer pre-trained models. A corpus similar to CNN/Daily-mail, found in Hugging Face, will be used for adaptation to the summary generation task.	es_ES
dc.format.extent	78	es_ES
dc.language	Español	es_ES
dc.publisher	Universitat Politècnica de València	es_ES
dc.rights	Reserva de todos los derechos	es_ES
dc.subject	Aprendizaje automático	es_ES
dc.subject	Modelos de lenguaje pre-entrenados	es_ES
dc.subject	Generación de resúmenes.	es_ES
dc.subject	Machine learning	es_ES
dc.subject	Pre-trained language models	es_ES
dc.subject	Summarizing.	es_ES
dc.subject	Fine-Tuning	es_ES
dc.subject.classification	LENGUAJES Y SISTEMAS INFORMATICOS	es_ES
dc.subject.other	Grado en Ingeniería Informática-Grau en Enginyeria Informàtica	es_ES
dc.title	Generación automática de resúmenes de textos utilizando técnicas de puesta a punto de modelos de lenguaje pre-entrenados	es_ES
dc.title.alternative	Automatic generation of text summaries using fine-tuning of pre-trained language models	es_ES
dc.title.alternative	Generació automàtica de resums de textos utilitzant tècniques de posada a punt de models de llenguatge pre-entrenats	es_ES
dc.type	Proyecto/Trabajo fin de carrera/grado	es_ES
dc.rights.accessRights	Abierto	es_ES
dc.contributor.affiliation	Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació	es_ES
dc.contributor.affiliation	Universitat Politècnica de València. Escola Tècnica Superior d'Enginyeria Informàtica	es_ES
dc.description.bibliographicCitation	Carpena Caicedo, M. (2024). Generación automática de resúmenes de textos utilizando técnicas de puesta a punto de modelos de lenguaje pre-entrenados. Universitat Politècnica de València. http://hdl.handle.net/10251/207242	es_ES
dc.description.accrualMethod	TFGM	es_ES
dc.relation.pasarela	TFGM\158810	es_ES

Este ítem aparece en la(s) siguiente(s) colección(ones)

ETSINF - Trabajos académicos [5160]
Escola Tècnica Superior d'Enginyeria Informàtica

Mostrar el registro sencillo del ítem

Generación automática de resúmenes de textos utilizando técnicas de puesta a punto de modelos de lenguaje pre-entrenados

RiuNet: Repositorio Institucional de la Universidad Politécnica de Valencia

Buscar en RiuNet

Listar

Todo RiuNet

Esta colección

Mi cuenta

Estadísticas

Ayuda RiuNet

Admin. UPV

Compartir/Enviar a

Citas

Estadísticas

Generación automática de resúmenes de textos utilizando técnicas de puesta a punto de modelos de lenguaje pre-entrenados

Ficheros en el ítem

Este ítem aparece en la(s) siguiente(s) colección(ones)