- -

Generación de resúmenes abstractivos en lenguaje simplificado

RiuNet: Repositorio Institucional de la Universidad Politécnica de Valencia

Compartir/Enviar a

Citas

Estadísticas

  • Estadisticas de Uso

Generación de resúmenes abstractivos en lenguaje simplificado

Mostrar el registro sencillo del ítem

Ficheros en el ítem

dc.contributor.advisor Hurtado Oliver, Lluis Felip es_ES
dc.contributor.advisor Segarra Soriano, Encarnación es_ES
dc.contributor.advisor Ahuir Esteve, Vicent es_ES
dc.contributor.author Torres Bertomeu, Diego es_ES
dc.date.accessioned 2024-09-09T07:56:56Z
dc.date.available 2024-09-09T07:56:56Z
dc.date.created 2024-07-25
dc.date.issued 2024-09-09 es_ES
dc.identifier.uri http://hdl.handle.net/10251/207678
dc.description.abstract [ES] El propòsit final de la generació automàtica de resums és tornar un text considerablement més breu que l'original però mantenint les idees i els aspectes principals. Amb aquesta acció es pot col·laborar a agilitzar les tasques de tractament d informació en àmbits tan diversos com la bibliografia mèdica, documents legals, articles periodístics, etc. Els sistemes principals de resum automàtic de l'estat de l'art són abstractius, és a dir, construeixen els resums reescrivint la informació més rellevant dels documents, i estan basats en xarxes neuronals profundes (transformers i longformers principalment). Les publicacions biomèdiques contenen les darreres investigacions sobre temes destacats relacionats amb la salut, que van des de malalties comunes fins a pandèmies globals. Sovint això pot fer que el contingut sigua d'interès per a una àmplia varietat d'audiències, inclosos investigadors, professionals mèdics, periodistes i fins i tot el públic en general. No obstant això, el llenguatge altament tècnic i especialitzat que s'utilitza en aquests articles normalment dificulta que el públic no expert en comprenga el contingut. La tasca que es pretén abordar gira al voltant del resum abstractiu d'articles biomèdics, amb èmfasi a atendre audiències no expertes mitjançant la generació de resums que siguin més llegibles, que continguen més informació general i menys terminologia tècnica, cosa que es coneix com a llenguatge simplificat. En concret, tenint en compte el resum tècnic i el text principal d'un article com a entrada, l'objectiu d'aquest treball consisteix a construir un model que genere el resum en llenguatge simplificat. Es disposa de dos conjunts de dades, PLOS i eLife, del domini biomèdic, amb els triplets (article, resum tècnic, resum en llenguatge simplificat). Es proposa l ús de models longformer a causa de la longitud de l entrada, així com l'ús de diferents estratègies per millorar els resultats. Entre d'altres, es pot treballar amb la incorporació de coneixement extern derivat de grafs de coneixement, generació condicionada de text o tècniques d'augment de dades (Data Augmentation). es_ES
dc.description.abstract [EN] The final purpose of automatic summary generation is to return a text considerably shorter than the original but retaining the main ideas and aspects. With this action you can collaborate in streamlining information processing tasks in areas as diverse as medical bibliography, legal documents, journalistic articles, etc. The main state-of-the-art automatic summary systems are abstractive, that is, they construct summaries by rewriting the most relevant information in the documents, and are based on deep neural networks (mainly transformers and longformers). Biomedical journals contain the latest research on prominent health-related topics, ranging from common diseases to global pandemics. This can often make their content of interest to a wide variety of audiences, including researchers, medical professionals, journalists, and even the general public. However, the highly technical and specialized language used in such articles typically makes it difficult for non-expert audiences to understand their content. The task to be addressed focuses on the abstractive summary of biomedical articles, with an emphasis on serving non-expert audiences by generating summaries that are more readable, containing more general information and less technical terminology, known as simplified language. Specifically, given the technical summary and the main text of an article as input, the objective of this work is to build a model that generates the corresponding simplified language summary. Two data sets, PLOS and eLife, are available from the biomedical domain, with the triplets (article, technical summary, summary in simplified language). The use of longformer models is proposed due to the length of the input, as well as the use of different strategies to improve the results. Among others, we can work with the incorporation of external knowledge derived from knowledge graphs, the conditioned generation of text, or data augmentation techniques. es_ES
dc.format.extent 64 es_ES
dc.language Catalán es_ES
dc.publisher Universitat Politècnica de València es_ES
dc.rights Reconocimiento (by) es_ES
dc.subject Resum abstractiu es_ES
dc.subject Transformers es_ES
dc.subject Longformers es_ES
dc.subject Llenguatge simplificat es_ES
dc.subject Abstractive summarization es_ES
dc.subject Simplified language es_ES
dc.subject.classification LENGUAJES Y SISTEMAS INFORMATICOS es_ES
dc.subject.other Máster Universitario en Inteligencia Artificial, Reconocimiento de Formas e Imagen Digital-Màster Universitari en Intel·ligència Artificial, Reconeixement de Formes i Imatge Digital es_ES
dc.title Generación de resúmenes abstractivos en lenguaje simplificado es_ES
dc.title.alternative Generación de resúmenes abstractivos en lenguaje simplificado es_ES
dc.title.alternative Generation of abstractive summaries in simplified language es_ES
dc.type Tesis de máster es_ES
dc.rights.accessRights Abierto es_ES
dc.contributor.affiliation Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació es_ES
dc.description.bibliographicCitation Torres Bertomeu, D. (2024). Generación de resúmenes abstractivos en lenguaje simplificado. Universitat Politècnica de València. http://hdl.handle.net/10251/207678 es_ES
dc.description.accrualMethod TFGM es_ES
dc.relation.pasarela TFGM\164035 es_ES


Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem