Resumen:
|
[ES] La información que proviene de redes sociales es una fuente muy valiosa de conocimiento para el análisis de patrones de comportamiento de los turistas cuando visitan una ciudad. Existen muchos trabajos en este sentido ...[+]
[ES] La información que proviene de redes sociales es una fuente muy valiosa de conocimiento para el análisis de patrones de comportamiento de los turistas cuando visitan una ciudad. Existen muchos trabajos en este sentido y una gran parte de ellos utiliza Twitter como fuente de datos. Los tuits son mensajes de hasta 140 caracteres que, además, pueden incluir, entre otra, información espacial y temporal. Estos tuits se pueden utilizar, por ejemplo, para analizar la cantidad de turistas que visitan una determinada atracción. Uno de los principales inconvenientes de esta fuente es que, en ocasiones, la localización del tuit cerca de un lugar no es suficiente para determinar que un tuit se debe asociar a ese lugar, especialmente cuando se desea realizar un análisis de grano fino (por ejemplo, determinar si los locales de restauración cerca de una atracción se frecuentan cuando se visita esa atracción). Por esta razón, este trabajo se centra en realizar esta asociación de bajo nivel, es decir, se trata de analizar diversos aspectos del tuit (texto, localización, hora de publicación, etc.) para determinar con mayor precisión a qué se refiere dicho tuit. Para ello, se utilizarán técnicas de reconocimiento de entidades nombradas (concretamente, resolución de topónimos), información de OpenStreetMaps sobre los lugares cercanos a la localización de tuit y otra información auxiliar. Finalmente, se evaluará la precisión de la asignación obtenida.
[-]
[EN] Information collected from social media is a very valuable source of knowledge for the analysis of behaviour patterns of tourists visiting a city. There are many studies in this regard, and many them use Twitter as a ...[+]
[EN] Information collected from social media is a very valuable source of knowledge for the analysis of behaviour patterns of tourists visiting a city. There are many studies in this regard, and many them use Twitter as a data source. Tweets are messages limited to 140 characters that can also include spatial and temporal information, among other details. These tweets can be used, for instance, to analyse the number of tourists visiting a specific attraction. One of the main drawbacks of this source of information is that, on occasion, the geographical proximity of the tweet location to a place is not sufficient to conclude that the tweet should be associated with that place, especially if we want to perform a thorough analysis to determine, for instance, whether or not people visiting an attraction also visit nearby food establishments. For that reason, this research work focuses on this low-level association, and it aims at analysing different aspects of a tweet (text, location, time, etc.) in order to determine more precisely the information contained in that tweet. To that end, named entity recognition techniques will be used (in particular, toponym resolution), as well as OpenStreetMaps information about places close to the tweet location, and additional supporting information. Finally, the accuracy of the results obtained will be assessed.
[-]
|