Resumen:
|
[ES] Actualmente, el acceso a internet está al alcance de la mano de la mayor parte de la población, lo que facilita la publicación y consumo de información. Todos los días se publican una gran cantidad de noticias nuevas ...[+]
[ES] Actualmente, el acceso a internet está al alcance de la mano de la mayor parte de la población, lo que facilita la publicación y consumo de información. Todos los días se publican una gran cantidad de noticias nuevas a un ritmo difícil de seguir. Es por ello que, para poder estar al día y seleccionar aquellas noticias que realmente son de interés de forma rápida, surge la utilidad de este trabajo. Su objetivo es la generación automática de los resúmenes de dichas noticias y la extracción de las ideas principales que contienen. Para ello, se utilizarán noticias reales como base de datos pertenecientes al campo de interés de la empresa colaboradora ForwardKeys, así como otras bases de datos externas para el entrenamiento de modelos. Estos datos se modelarán a partir de modelos preentrenados de las familias de Pegasus y T5, contando con un modelo de generación de resúmenes general y otro específico entrenado únicamente con texto de noticias. La evaluación de estos modelos se hará a través de la métrica ROUGE y sus variantes.
[-]
[EN] Nowadays, access to Internet is within the reach of most population, which facilitates the publication and consumption of information. Every day, a large amount of new news is published at a pace that is difficult to ...[+]
[EN] Nowadays, access to Internet is within the reach of most population, which facilitates the publication and consumption of information. Every day, a large amount of new news is published at a pace that is difficult to keep up with. This is why, to keep up to date and select those news that are of real interest quickly, the usefulness of this work arises. Its aim is the automatic generation of summaries of the aforementioned news and the extraction of the key ideas they contain. With this aim, real news shall be used as a database belonging to the field of interest of the collaborating company ForwardKeys, as well as other external databases for model training. These data will be modeled from pre-trained models of the Pegasus and T5 families, with a general summary generation model and a specific model trained only with news text. The evaluation of these models will be performed through the ROUGE metric and its variants.
[-]
|