[EN] Sentiment analysis on Twitter offers possibilities of great interest to evaluate the currents of opinion disseminated through this medium. The huge volumes of texts require tools able to automatically process these ...[+]
[EN] Sentiment analysis on Twitter offers possibilities of great interest to evaluate the currents of opinion disseminated through this medium. The huge volumes of texts require tools able to automatically process these messages without losing reliability. This paper describes two different types of approaching this problem. The first strategy is based on Supervised Learning processes, developed in the field of artificial intelligence. Its application requires some tools from natural language processing along with a classifed corpus as a starting point. The second approach is based on polarity dictionaries. SentiStrength tool is located in this line. It is increasingly applied to studies of Twitter in English. The paper assesses the most advanced studies using each of these approaches for analyzing tweets in Spanish. Finally, the advantages and limitations of each of these approaches for researching political communication are assessed. While supervised learning allows taking into account the context thanks to its ability to detect patterns of words, the researcher who uses this approach requires having data analyst skills to better refine the process. Instead, SentiStrength is more oriented to the semantic content of the terms of the message. It requires more of a competence in linguistics by the researcher. The main conclusion of this study is that both automated methods of analysis can not do without a demanding manual coding if they are to be used reliably in research.
[-]
[ES] El análisis del sentimiento en los mensajes publicados en Twitter ofrece posibilidades de gran interés para evaluar las corrientes de opinión difundidas a través de este medio. Los enormes volúmenes de textos requieren ...[+]
[ES] El análisis del sentimiento en los mensajes publicados en Twitter ofrece posibilidades de gran interés para evaluar las corrientes de opinión difundidas a través de este medio. Los enormes volúmenes de textos requieren de herramientas capaces de procesar automáticamente estos mensajes sin perder fiabilidad. Este artículo describe dos tipos de técnicas para abordar este problema. La primera estrategia se basa en los procesos de Aprendizaje Automático Supervisado. Su aplicación requiere integrar algunas herramientas del Procesamiento de Lenguajes Naturales y tomar como punto de partida un corpus clasifcado. El segundo enfoque está basado en diccionarios de polaridad. En esta línea se sitúa la herramienta de SentiStrength, la cual se está aplicando cada vez más a los estudios de Twitter en inglés. El artículo evalúa los estudios más avanzados que utilizan cada uno de estos enfoques para el análisis de los tweets en castellano. Por último, se señalan las ventajas y limitaciones de cada uno de estos enfoques para su aplicación a la investigación en comunicación política. Si bien el aprendizaje automático supervisado permite tener en cuenta el contexto, el investigador requiere competencias de analista de datos con el fin de afinar mejor el proceso. En cambio, SentiStrength está más orientado al contenido semántico de los términos del mensaje, y se requiere más bien una competencia en lingüística por parte del investigador. La principal conclusión es que ambos métodos automáticos de análisis no pueden prescindir de una exigente codificación manual si se desea utilizarlos con fiabilidad en la investigación.
[-]
|