[ES] El presente trabajo de final de grado se enfoca, para la industria del lenguaje, en el diseño e
implementación de un extractor de noticias automatizado. Esta aplicación tiene la funcionalidad
tanto de extraer ...[+]
[ES] El presente trabajo de final de grado se enfoca, para la industria del lenguaje, en el diseño e
implementación de un extractor de noticias automatizado. Esta aplicación tiene la funcionalidad
tanto de extraer automáticamente noticias de las fuentes que nosotros le insertamos al sistema, y
categorizarlas en diferentes sectores y categorías. Además, podemos valorar las noticias en una
escala de relevancia para que el sistema aprenda y en un futuro sepa por ella misma cuales son
las noticias que nos pueden interesar más y cuáles no. Gracias a esta aplicación podemos analizar
una a una las noticias de multitud de páginas web de las que podemos cambiar el título y tener un
pequeño resumen para guardarlo en nuestra base de datos.
Con esta herramienta se abre una oportunidad para el ahorro de tiempo muy importante a la
hora del minado de datos que nos pueda interesar, ya sea por idioma o por categoría. La
herramienta incorpora mucha variedad de noticias de muchas fuentes diferentes. En un futuro es
posible que la extracción no sea únicamente de noticias que puede aplicándola a otro tipo de texto
siendo más útil para más gente.
[-]
[CA] El present treball de final de grau s'enfoca, per a la indústria del llenguatge, en el disseny i
implementació d'un extractor de notícies automatitzat. Aquesta aplicació té la funcionalitat tant
d'extraure automàticament ...[+]
[CA] El present treball de final de grau s'enfoca, per a la indústria del llenguatge, en el disseny i
implementació d'un extractor de notícies automatitzat. Aquesta aplicació té la funcionalitat tant
d'extraure automàticament notícies de les fonts que nosaltres li inserim al sistema, i categoritzarles en diferents sectors i categories. A més, podem valorar les notícies en una escala de rellevància
perquè el sistema aprenga i en un futur sàpia per ella mateixa quals són les notícies que ens poden
interessar més i quins no. Gràcies a aquesta aplicació podem analitzar una a una les notícies de
multitud de pàgines web de les quals podem canviar el títol i tindre un xicotet resum per a guardarlo en la nostra base de dades.
Amb aquesta ferramenta s'obri una oportunitat per a l'estalvi de temps molt important a l'hora
del minat de dades que ens puga interessar, ja siga per idioma o per categoria. La ferramenta
incorpora molta varietat de notícies de moltes fonts diferents. En un futur és possible que
l'extracció no siga únicament de notícies que pot aplicant-la a un altre tipus de text sent més útil
per a més gent.
[-]
[EN] This final degree project focuses on the design and implementation of an automated news
extractor for the language industry. This application has the functionality to both automatically
extract news from the sources ...[+]
[EN] This final degree project focuses on the design and implementation of an automated news
extractor for the language industry. This application has the functionality to both automatically
extract news from the sources we insert into the system and categorise them into different sectors
and categories. In addition, we can rate the news on a scale of relevance so that the system learns
and, in the future, knows for itself which are the news that may interest us more and which are
not. Thanks to this application we can analyse one by one the news of a multitude of web pages
of which we can change the title and have a small summary to save it in our database.
This tool opens up a very important time-saving opportunity when it comes to mining data that
may be of interest to us, either by language or by category. The tool incorporates a wide variety
of news from many different sources. In the future it is possible that the extraction will not only
be of news but can be applied to other types of text making it more useful for more people.
[-]
|