- -

Diseño e implementación de un extractor de noticias automatizado

RiuNet: Repositorio Institucional de la Universidad Politécnica de Valencia

Compartir/Enviar a

Citas

Estadísticas

  • Estadisticas de Uso

Diseño e implementación de un extractor de noticias automatizado

Mostrar el registro sencillo del ítem

Ficheros en el ítem

dc.contributor.advisor Sáez Barona, Sergio es_ES
dc.contributor.advisor Garcia Martinez, Maria Mercedes es_ES
dc.contributor.author Gilabert i Perea, Xavier es_ES
dc.date.accessioned 2021-10-08T11:11:03Z
dc.date.available 2021-10-08T11:11:03Z
dc.date.created 2021-09-20
dc.date.issued 2021-10-08 es_ES
dc.identifier.uri http://hdl.handle.net/10251/174252
dc.description.abstract [ES] El presente trabajo de final de grado se enfoca, para la industria del lenguaje, en el diseño e implementación de un extractor de noticias automatizado. Esta aplicación tiene la funcionalidad tanto de extraer automáticamente noticias de las fuentes que nosotros le insertamos al sistema, y categorizarlas en diferentes sectores y categorías. Además, podemos valorar las noticias en una escala de relevancia para que el sistema aprenda y en un futuro sepa por ella misma cuales son las noticias que nos pueden interesar más y cuáles no. Gracias a esta aplicación podemos analizar una a una las noticias de multitud de páginas web de las que podemos cambiar el título y tener un pequeño resumen para guardarlo en nuestra base de datos. Con esta herramienta se abre una oportunidad para el ahorro de tiempo muy importante a la hora del minado de datos que nos pueda interesar, ya sea por idioma o por categoría. La herramienta incorpora mucha variedad de noticias de muchas fuentes diferentes. En un futuro es posible que la extracción no sea únicamente de noticias que puede aplicándola a otro tipo de texto siendo más útil para más gente. es_ES
dc.description.abstract [CA] El present treball de final de grau s'enfoca, per a la indústria del llenguatge, en el disseny i implementació d'un extractor de notícies automatitzat. Aquesta aplicació té la funcionalitat tant d'extraure automàticament notícies de les fonts que nosaltres li inserim al sistema, i categoritzarles en diferents sectors i categories. A més, podem valorar les notícies en una escala de rellevància perquè el sistema aprenga i en un futur sàpia per ella mateixa quals són les notícies que ens poden interessar més i quins no. Gràcies a aquesta aplicació podem analitzar una a una les notícies de multitud de pàgines web de les quals podem canviar el títol i tindre un xicotet resum per a guardarlo en la nostra base de dades. Amb aquesta ferramenta s'obri una oportunitat per a l'estalvi de temps molt important a l'hora del minat de dades que ens puga interessar, ja siga per idioma o per categoria. La ferramenta incorpora molta varietat de notícies de moltes fonts diferents. En un futur és possible que l'extracció no siga únicament de notícies que pot aplicant-la a un altre tipus de text sent més útil per a més gent. es_ES
dc.description.abstract [EN] This final degree project focuses on the design and implementation of an automated news extractor for the language industry. This application has the functionality to both automatically extract news from the sources we insert into the system and categorise them into different sectors and categories. In addition, we can rate the news on a scale of relevance so that the system learns and, in the future, knows for itself which are the news that may interest us more and which are not. Thanks to this application we can analyse one by one the news of a multitude of web pages of which we can change the title and have a small summary to save it in our database. This tool opens up a very important time-saving opportunity when it comes to mining data that may be of interest to us, either by language or by category. The tool incorporates a wide variety of news from many different sources. In the future it is possible that the extraction will not only be of news but can be applied to other types of text making it more useful for more people. es_ES
dc.format.extent 95 es_ES
dc.language Español es_ES
dc.publisher Universitat Politècnica de València es_ES
dc.rights Reserva de todos los derechos es_ES
dc.subject Extracción automática de texto es_ES
dc.subject Noticias es_ES
dc.subject Categorización es_ES
dc.subject Base de datos es_ES
dc.subject Automatización es_ES
dc.subject Minería de datos es_ES
dc.subject Inteligencia Artificial es_ES
dc.subject Automatic text extraction es_ES
dc.subject News es_ES
dc.subject Categorisation es_ES
dc.subject Database es_ES
dc.subject Automation es_ES
dc.subject Data mining es_ES
dc.subject Artificial Intelligence es_ES
dc.subject.classification ARQUITECTURA Y TECNOLOGIA DE COMPUTADORES es_ES
dc.subject.other Grado en Ingeniería Informática-Grau en Enginyeria Informàtica es_ES
dc.title Diseño e implementación de un extractor de noticias automatizado es_ES
dc.type Proyecto/Trabajo fin de carrera/grado es_ES
dc.rights.accessRights Abierto es_ES
dc.contributor.affiliation Universitat Politècnica de València. Departamento de Informática de Sistemas y Computadores - Departament d'Informàtica de Sistemes i Computadors es_ES
dc.contributor.affiliation Universitat Politècnica de València. Escola Tècnica Superior d'Enginyeria Informàtica es_ES
dc.description.bibliographicCitation Gilabert I Perea, X. (2021). Diseño e implementación de un extractor de noticias automatizado. Universitat Politècnica de València. http://hdl.handle.net/10251/174252 es_ES
dc.description.accrualMethod TFGM es_ES
dc.relation.pasarela TFGM\143610 es_ES


Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem