Resumen:
|
[ES] La difusión masiva de noticias falsas en los medios de comunicación constituye un riesgo global importante que influye negativamente en múltiples aspectos de nuestra vida como, elecciones, temas sociales de interés ...[+]
[ES] La difusión masiva de noticias falsas en los medios de comunicación constituye un riesgo global importante que influye negativamente en múltiples aspectos de nuestra vida como, elecciones, temas sociales de interés como educación, sanidad, etc. Este fenómeno tiene una especial relevancia en las redes sociales. Recientes estudios concluyen que presuntos bots en las redes sociales influyeron en decisiones cruciales como las elecciones presidenciales de EEUU o el Brexit. La comunidad científica viene dedicando grandes esfuerzos para estudiar las causas complejas de la difusión viral de la información errónea digital y desarrollar soluciones para implementar contramedidas. Las cuentas que difunden activamente información errónea son significativamente más propensas a ser bots. Las cuentas automatizadas son particularmente activas en las primeras fases de propagación de los mensajes virales y tienden a dirigirse a usuarios influyentes. Los humanos son vulnerables a esta manipulación, retuiteando mensajes generados por bots que publican noticias falsas. Frenar los bots sociales puede ser una estrategia efectiva para mitigar la propagación de la desinformación en línea. Para abordar este problema utilizando aproximaciones de aprendizaje automático se han utilizado diferentes características que han resultado útiles en redes sociales como Twitter. Estas características pueden ser: metadatos que describen la identidad de la cuenta (nombre de la cuenta, fecha de creación, perfil, lengua, localización, ...); relaciones de la cuenta con los demás usuarios (followers, friends, ...) y, por último, el comportamiento y el análisis del contenido de los mensajes de la cuenta. En este trabajo se pretende utilizar técnicas de aprendizaje automático, aprendizaje profundo y procesamiento del lenguaje natural con el objeto de detectar bots y noticias falsas en usuarios de Twitter. Es de especial interés su aplicación a textos en español. Se realizará una comparativa de las distintas aproximaciones utilizadas y se intentará contrastar los resultados obtenidos utilizando conjunto de datos estándar utilizados en competiciones internacionales relacionadas con esta temática.
[-]
[EN] The massive diffusion of fake news in the media constitutes an important global risk that negatively influences multiple aspects of our lives such as elections, social issues of interest such as education, health, ...[+]
[EN] The massive diffusion of fake news in the media constitutes an important global risk that negatively influences multiple aspects of our lives such as elections, social issues of interest such as education, health, etc. This phenomenon has a special relevance in social networks. Recent studies conclude that alleged bots on social networks influenced crucial decisions such as the US presidential elections or Brexit. The scientific community has been dedicating great efforts to study the complex causes of the viral spread of digital misinformation and develop solutions to implement countermeasures. Accounts that actively spread misinformation are significantly more likely to be bots. Automated accounts are particularly active in the early stages of the spread of viral messages and tend to target influential users. Humans are vulnerable to this manipulation, retweeting messages generated by bots that publish fake news. Curbing social bots can be an effective strategy to mitigate the spread of misinformation online. To address this problem using machine learning approaches, different features have been used that have been useful in social networks such as Twitter. These characteristics can be: metadata that describes the identity of the account (account name, date of creation, profile, language, location ...); account relationships with other users (followers, friends ...); finally, the behavior and analysis of the content of the messages of the account. This work is intended to use machine learning, deep learning and natural language processing techniques in order to detect bots and fake news in Twitter users. Its application to texts in Spanish is of special interest. A comparison of the different approaches used will be carried out and an attempt will be made to contrast the results obtained using a standard data set used in international competitions related to this topic.
[-]
|