Resumen:
|
[ES] Twitter se ha convertido en una herramienta popular de comunicación en la que los usuarios
expresan opiniones sobre una gran cantidad de temas. La recolección y análisis de esta
información ha despertado gran interés ...[+]
[ES] Twitter se ha convertido en una herramienta popular de comunicación en la que los usuarios
expresan opiniones sobre una gran cantidad de temas. La recolección y análisis de esta
información ha despertado gran interés en la comunidad científica con el objetivo de extraer
información relevante sobre un gran número de temas.
En este TFG se propone la creación de una aplicación que realice la captura, gestión, análisis
y almacenamiento de mensajes capturados desde la API de Twitter.
La aplicación deberá permitir realizar consultas de diferente naturaleza, por temas, hashtags,
usuarios, etc., así como buscar una manera adecuada de estructurar toda esta información.
Esto conlleva solucionar diferentes problemas impuestos por el API como el límite de
consultas, número de mensajes a recuperar, control de errores, control de tweets duplicados, etc.
Por otra parte, obtener los tweets en un determinado intervalo de tiempo también supone un reto
para garantizar la obtención del mayor número de tweets posibles.
Respecto al almacenamiento de los tweets se propone el uso de un sistema de bases de datos
no relacional como MongoDB debido a que se adapta perfectamente al formato interno de los
tweets devueltos por la API, así como poder definir diferentes colecciones asociadas a los temas
de interés.
La herramienta también debe permitir realizar un seguimiento histórico de las consultas que
se hayan realizado, tanto utilizando la API como la web de Twitter.
Con todo esto, se podrá visualizar y monitorizar los temas de interés mediante una interfaz
gráfica que presente diferente información estadística interesante.
Como caso práctico se presentará el uso de la herramienta para hacer un seguimiento de las
opiniones sobre los líderes políticos atendiendo al número de ‘likes’ obtenidos de Twitter.
[-]
[EN] Twitter has become a popular communication tool in which users express opinions on a large
number of topics. The collection and analysis of this information has aroused great interest in the
scientific community ...[+]
[EN] Twitter has become a popular communication tool in which users express opinions on a large
number of topics. The collection and analysis of this information has aroused great interest in the
scientific community with the aim of extracting relevant information on a large number of
subjects.
In this TFG we propose the creation of an application that captures, manages, analyzes and stores
messages captured from the Twitter API.
The application should allow queries of different kinds, by topic, hashtags, users, etc., as well as
find an appropriate way to structure all this information.
This involves solving different problems imposed by the API such as the limit of queries, number
of messages to recover, error control, control of duplicate tweets, etc. Moreover, getting as many
tweets as possible in a certain time interval is also a challenge.
Regarding the storage of the tweets, the use of a non-relational database system such as MongoDB
is proposed because it adapts perfectly to the internal format of the tweets returned by the API, as
well as being able to define different collections associated with the topics of interest.
The tool should also allow a historical tracking of the queries that have been made, both using the
API and the Twitter web.
With all this, you can visualize and monitor the topics of interest through a graphical interface
that presents different interesting statistical information.
As a practical case, the use of the tool will be presented to follow up the opinions on the political
leaders attending to the number of 'likes' obtained from Twitter.
[-]
|