[ES] En este proyecto se ha desarrollado una aplicación que permite identificar la temática
predominante en usuarios de la red social Twitter mediante el análisis del contenido
textual generado por el usuario atendiendo ...[+]
[ES] En este proyecto se ha desarrollado una aplicación que permite identificar la temática
predominante en usuarios de la red social Twitter mediante el análisis del contenido
textual generado por el usuario atendiendo principalmente a las relaciones semánticas
que presentan los textos. Se utiliza un algoritmo de clasificación basado en word
embeddings, en concreto se usa un modelo preentrenado Word2Vec para calcular la
distancia semántica entre los temas, cuentas y tweets.
El proyecto se centra en la red social Twitter, utilizando los tweets como la unidad
básica a clasificar. Mediante un conjunto semilla de cuentas etiquetadas manualmente
por temática se crea un modelo de representación vectorial. El modelo está creado en
función de las representaciones de las cuentas en las que predominan dichos temas.
Este modelado nos ha permitido crear una aplicación para clasificar cuentas de usuarios
y tweets de forma automática en los temas considerados.
[-]
[EN] The objective of this project is to develop an application which will allow to identify the
predominant topic in user profiles on Twitter social network. This is done by analysing
the textual content generated by ...[+]
[EN] The objective of this project is to develop an application which will allow to identify the
predominant topic in user profiles on Twitter social network. This is done by analysing
the textual content generated by the users, mainly paying attention to the semantic
relationships presented in the texts. A classification algorithm based on word
embeddings is used. Concretely, a pre trained Word2Vec model is used to calculate the
semantic distance between the topics, accounts and tweets.
The project is focused within the Twitter social network, using tweets as the basic unit
to be classified. By a seed set of accounts manually labelled by topic, a vector
representation model is created. The model is created based on the representations of
the accounts in which these topics predominate. This modelling allows us to create an
application to classify user accounts and tweets automatically into the topics considered.
[-]
|