Resumen:
|
[CA] La quantitat d’informació que disposem actualment no ha fet més que incrementar
enormement a les últimes dècades. En conseqüència, disposem d’un gran nombre de
textos dels quals cal determinar la utilitat per a ...[+]
[CA] La quantitat d’informació que disposem actualment no ha fet més que incrementar
enormement a les últimes dècades. En conseqüència, disposem d’un gran nombre de
textos dels quals cal determinar la utilitat per a qualsevol activitat concreta. En aquest
context, l’existència de resums adjunts a aquests textos, com pot ser el cas dels articles
d’investigació o les notícies d’alguns periòdics, resulten de gran utilitat per agilitzar
aquesta tasca. D’acord amb aquest últim fet extraiem el benefici que suposaria tindre
accés a resums fidedignes dels textos que trobem a internet.
En el present treball es tractarà d’elaborar resums d’un conjunt de noticies tant en
català com en espanyol. En aquest procés, s’utilitzaran diferents tecnologies per a la
creació dels resums mitjançant tècniques tradicionals no supervisades i sistemes basats en
xarxes neuronals. Aquests resums s’avaluaran mitjançant mètriques de caràcter sintàctic
i semàntic per poder comparar la qualitat dels resums.
Finalment, s’obtindran els resums extrets mitjançant l’ús de xarxes neuronals, s’analitzaran els resums generats i es contrastaran amb els textos de referència.
[-]
[ES] La cantidad de información de la que disponemos actualmente no ha hecho más que
incrementar enormemente en las últimas décadas. En consecuencia, disponemos de un
gran número de textos se los que es necesario determinar ...[+]
[ES] La cantidad de información de la que disponemos actualmente no ha hecho más que
incrementar enormemente en las últimas décadas. En consecuencia, disponemos de un
gran número de textos se los que es necesario determinar su utilidad para cualquier tarea
concreta. En este contexto, la existencia de resúmenes adjuntos a estos textos, como puede
ser el caso de artículos de investigación o las noticias de algunos periódicos, resultan de
gran utilidad para agilizar dicha tarea. En base a este último hecho, extraemos el beneficio
que supondría tener acceso a resúmenes fiables de los textos que encontramos en internet.
En el presente trabajo se tratará de elaborar resúmenes de un conjunto de noticias tanto en catalán como en español. En este proceso se utilizarán diferentes tecnologías para
la creación de resúmenes mediante técnicas tradicionales no supervisadas i sistemas basados en redes neuronales. Estos resúmenes se evaluarán mediante métricas de carácter
sintáctico i semántico para poder comparar la calidad de los resumenes.
Finalmente, se obtendrán los resúmenes extraídos mediante el uso de redes neuronales, se analizarán los resúmenes generados y se contrastarán con los textos de referencia.
[-]
[EN] The amount of information available to us today has only increased enormously in
recent decades. Consequently, we have a large number of texts which it is necessary to
determine their usefulness for any specific ...[+]
[EN] The amount of information available to us today has only increased enormously in
recent decades. Consequently, we have a large number of texts which it is necessary to
determine their usefulness for any specific task. In this context, the existence of summaries attached to these texts, such as research articles or news from some newspapers,
are very useful to speed up this labour. Based on this last fact, we extract the benefit of
having access to reliable summaries of the texts that we find on the internet.
In this work we will try to prepare summaries of a set of news in both Catalan and
Spanish. In this process, different technologies will be used to create summaries using
traditional unsupervised techniques and neural network based systems. These results
will be evaluated using syntactic and semantic metrics to be able to compare the quality
of the summaries.
Finally, the abstracts extracted through the use of neural networks will be obtained,
the results generated will be analyzed and they will be contrasted with the reference texts.
[-]
|