[ES] En este trabajo se realiza un análisis del comportamiento de los hashtags en
una conversación de Twitter, estudiando cómo se distribuye su frecuencia de
acuerdo a su popularidad. Se ha observado que se sigue una ...[+]
[ES] En este trabajo se realiza un análisis del comportamiento de los hashtags en
una conversación de Twitter, estudiando cómo se distribuye su frecuencia de
acuerdo a su popularidad. Se ha observado que se sigue una distribución potencial,
según lo esperado por la Ley de Zipf, que indica que existen pocos hashtags
con mucha repercusión y muchos que no han tenido mucho éxito. Debido al comportamiento
humano en estas redes, muchos de los hashtags no han alcanzado
gran repercusión debido a que contienen alguna falta de ortografía o están mal
escritos. Para corregir esto se han utilizado distancias de edición de cadenas que
han permitido agrupar los hashtags similares entre sí para disminuir el efecto de
los hashtags escritos de manera errónea en los estudios realizados.
También se muestra la aplicación que tiene la Ley de Benford aplicada al estudio
del comportamiento de los usuarios en las redes sociales, donde las distribuciones
del primer y segundo dígito más significativo de las frecuencias de los
hashtags siguen la distribución esperada por Benford. Esto permite que se pueda
utilizar para validar datos provenientes de Twitter y analizarlos en busca de
comportamientos sospechosos.
[-]
[EN] This paper presents an analysis of hashtag’s behaviour in a conversation in
Twitter by studying the frecuency distribution according to their popularity. It
has been observed that follows a power law, as espected ...[+]
[EN] This paper presents an analysis of hashtag’s behaviour in a conversation in
Twitter by studying the frecuency distribution according to their popularity. It
has been observed that follows a power law, as espected by Zipf’s Law, which
states that there are few hastags with huge impact and many others who have
not been very successful. Due to the human’s behaviour in social networks, many
hashtags have not achieved a great impact because they contain mispelling errors.
String distances has been used to correct the errors to group similar hashtags
together to decrease the possible impact of these hashtags for future studies.
It is also shown that Benford’s Law could be applied to study the user’s behaviour
in social networks, where the first and second significant digit distribution
of hashtag’s frequencies follow the expected Benford’s distribution and allow
it’s use to validate data from Twitter and analyze it for suspicious behaviours.
[-]
|