- -

Resum abstractiu de notícies en català basat en models neuronals extractius i abstractius

RiuNet: Repositorio Institucional de la Universidad Politécnica de Valencia

Compartir/Enviar a

Citas

Estadísticas

  • Estadisticas de Uso

Resum abstractiu de notícies en català basat en models neuronals extractius i abstractius

Mostrar el registro sencillo del ítem

Ficheros en el ítem

dc.contributor.advisor Segarra Soriano, Encarnación es_ES
dc.contributor.advisor Hurtado Oliver, Lluis Felip es_ES
dc.contributor.author Marco García, Pere es_ES
dc.date.accessioned 2022-10-21T07:26:01Z
dc.date.available 2022-10-21T07:26:01Z
dc.date.created 2022-09-21 es_ES
dc.date.issued 2022-10-21 es_ES
dc.identifier.uri http://hdl.handle.net/10251/188480
dc.description.abstract [ES] La tarea de resumen automático de texto se ha abordado en la literatura mediante enfoques abstractivos, extractivos y mixtos. Los enfoques extractivos componen resúmenes seleccionando oraciones o palabras directamente de los documentos, mientras que los enfoques abstractivos construyen los resúmenes reescribiendo las principales oraciones de los documentos, más similares a los que suelen generar los humanos. Los sistemas de resumen tanto extractivos como abstractivos del estado del arte estan basados en modelos neuronales. Uno de los retos en el caso de los modelos abstractivos aplicados a documentos periodísticos es el gran tamaño que presentan la mayor parte de estos artículos. Es por ello que se ha planteado la posibilidad de preprocesar los artículos para conseguir una versión más corta de los mismos antes de alimentar el modelo abstractivo. En este trabajo se propone construir un modelo para resumen abstractivo basado en la conexión secuencial de un modelo neuronal extractivo con un modelo neuronal abstractivo, ambos modelos ya desarrolados previamente y basados en redes neuronales de tipo transformer. Dado un artículo periodístico, en un primer paso se aplicará el modelo de resumen extractivo para generar un primer resumen del documento de longitud adecuada. En un segundo paso este resumen se ofrecerá como entrada al modelo de resumen abstractivo. Esta propuesta se aplicará a un corpus de noticias en catalán que proporciona una colección de pares (artículo, resumen), en la que la mayor parte de los resúmenes son de naturaleza abstractiva. es_ES
dc.description.abstract [EN] The automatic text summarization task has been approached in the literature using abstractive, extractive, and mixed approaches. Extractive approaches compose summaries by selecting sentences or words directly from documents, while abstractive approaches build summaries by rewriting the main sentences of documents, more similar to those typically generated by humans. State-of-the-art abstractive and extractive summary systems are based on neural models. One of the challenges in the case of abstractive models applied to journalistic documents is the large size of most of these articles. That is why the possibility of preprocessing the articles to obtain a shorter version of them before feeding the abstractive model has been considered. In this work, it is proposed to build a model for abstractive summarization based on the sequential connection of an extractive neural model with an abstractive neural model, both models already developed previously and based on transformers. Given a journalistic article, in a first step the extractive summary model will be applied to generate a first summary of the document of an adequate length. In a second step, this summary will be offered as input to the abstractive summary model. This proposal will be applied to a corpus of news in Catalan that provides a collection of pairs (article, abstract), in which most of the abstracts are of an abstract nature. en_EN
dc.format.extent 53 es_ES
dc.language Catalán es_ES
dc.publisher Universitat Politècnica de València es_ES
dc.rights Reserva de todos los derechos es_ES
dc.subject Resumen de textos periodísticos es_ES
dc.subject Resumen extractivo es_ES
dc.subject Resumen abstractivo es_ES
dc.subject Transformers es_ES
dc.subject Catalán es_ES
dc.subject Summarization of journalistic texts en_EN
dc.subject Extractive summaries en_EN
dc.subject Abstractive summaries en_EN
dc.subject Catalan en_EN
dc.subject.classification LENGUAJES Y SISTEMAS INFORMATICOS es_ES
dc.subject.other Máster Universitario en Inteligencia Artificial, Reconocimiento de Formas e Imagen Digital-Màster Universitari en Intel·Ligència Artificial: Reconeixement de Formes i Imatge Digital es_ES
dc.title Resum abstractiu de notícies en català basat en models neuronals extractius i abstractius es_ES
dc.title.alternative Resumen abstractivo de noticias en catalán basado en modelos neuronales extractivos y abstractivos es_ES
dc.title.alternative Abstractive summarization of news in Catalan based on extractive and abstractive neural models es_ES
dc.type Tesis de máster es_ES
dc.rights.accessRights Abierto es_ES
dc.contributor.affiliation Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació es_ES
dc.description.bibliographicCitation Marco García, P. (2022). Resum abstractiu de notícies en català basat en models neuronals extractius i abstractius. Universitat Politècnica de València. http://hdl.handle.net/10251/188480 es_ES
dc.description.accrualMethod TFGM es_ES
dc.relation.pasarela TFGM\151085 es_ES


Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem