Resumen:
|
[EN] This work is focused on solving several Natural Language Processing tasks, for which an
approach based on machine learning algorithms was used.
The tasks addressed were: language identification, sentiment analysis ...[+]
[EN] This work is focused on solving several Natural Language Processing tasks, for which an
approach based on machine learning algorithms was used.
The tasks addressed were: language identification, sentiment analysis and author profi-
ling. These tasks were proposed by international competitions which have led to publish
several papers.
A data set of social media texts were used in these tasks, mainly from Twitter. Overall,
these texts present some characteristics (short and ungramatical texts) that are challenging
for Natural Language Processing techniques.
For each task, the state-of-the-art is studied and a model to solve the task is proposed.
In order to create a valid model, several resources and supervised machine learning tech-
niques were used. Finally, the results obtained were analyzed and improvements to the
model were proposed to enhance the behavior of the model.
[-]
[ES] Este trabajo se centra en la resolución de distintas tareas propias del procesamiento automático del lenguaje natural, para lo cual se emplea una aproximación basada en aprendizaje automático.
Las tareas consideradas ...[+]
[ES] Este trabajo se centra en la resolución de distintas tareas propias del procesamiento automático del lenguaje natural, para lo cual se emplea una aproximación basada en aprendizaje automático.
Las tareas consideradas son: la detección del idioma, el análisis de sentimientos y la creación de perfiles de usuario. Se trata de tareas propuestas en competiciones internacionales y que han dado lugar a diversas publicaciones.
Todas estas tareas se plantearon utilizando datos extraídos de redes sociales, en particular textos de Twitter. En general, los textos que pueden encontrarse en estos medios poseen una serie de características (textos cortos y agramaticales) que plantean nuevos retos para el procesamiento del lenguaje natural.
En cada caso, se estudia el estado del arte y se propone un modelo que se ajuste a los requisitos de la tarea. Para ello, se emplean los recursos y los algoritmos de aprendizaje automático supervisado más adecuados. Finalmente, se ha analizado los resultados y se plantean futuras modificaciones que mejoren el comportamiento de los sistemas planteados.
[-]
|