- -

Sexism Identification on TikTok: a Multimodal AI Approach with Text, Audio, and Video

RiuNet: Repositorio Institucional de la Universidad Politécnica de Valencia

Compartir/Enviar a

Citas

Estadísticas

  • Estadisticas de Uso

Sexism Identification on TikTok: a Multimodal AI Approach with Text, Audio, and Video

Mostrar el registro sencillo del ítem

Ficheros en el ítem

dc.contributor.advisor Rosso, Paolo es_ES
dc.contributor.advisor Chulvi Ferriols, María Alberta es_ES
dc.contributor.author Arcos Gabaldón, Iván es_ES
dc.date.accessioned 2024-09-04T18:04:31Z
dc.date.available 2024-09-04T18:04:31Z
dc.date.created 2024-07-12
dc.date.issued 2024-09-04 es_ES
dc.identifier.uri http://hdl.handle.net/10251/207334
dc.description.abstract [EN] Sexism persists as a pervasive issue in society, particularly evident on social media platforms like TikTok. This phenomenon encompasses a spectrum of expressions, ranging from subtle biases to explicit misogyny, posing unique challenges for detection and analysis. While previous research has predominantly focused on textual analysis, the dynamic nature of TikTok demands a more comprehensive approach. This study leverages advancements in Artificial Intelligence (AI), specifically multimodal deep learning, to establish a robust framework for identifying and interpreting sexism on TikTok. We compiled the first dataset of TikTok videos tailored for analyzing sexism in both English and Spanish. This dataset not only provides a foundational resource for current analysis but also serves as an initial benchmark for comparing models or for future investigations in this area. By integrating text, linguistic features, emotions, audio, and video features, this study identifies unique indicators of sexist content. Multimodal analysis surpasses text-only methods, particularly in understanding the intentions behind sexism, achieving remarkable results with F1-macro scores of 0.753 and 0.768 for English and Spanish, respectively. Notably, this configuration led to an improvement of 4.4% and 4.8% over the best unimodal models. Further, employing fine-tuning to a multimodal model (TAVL - Fine-Tuning), the results improve for all tasks, with a 5.5% increase in F1-macro for detecting sexism in English and a 2.2% improvement in Spanish. Additionally, for source intention, the improvements are 7.3% and 9.4%, respectively. Notably, for categories of sexism, there is a significant enhancement particularly in Spanish, where the categories are better represented and there are more sexist videos than in English. es_ES
dc.description.abstract [ES] El sexismo persiste como un problema generalizado en la sociedad, particularmente evidente en plataformas de redes sociales como TikTok. Este fenómeno abarca un espectro de expresiones, que van desde sesgos sutiles hasta misoginia explícita, planteando desafíos únicos para su detección y análisis. Mientras que investigaciones previas se han centrado predominantemente en el análisis textual, la naturaleza dinámica de TikTok exige un enfoque más integral. Este estudio aprovecha los avances en Inteligencia Artificial (IA), específicamente el aprendizaje profundo multimodal, para establecer un marco robusto para identificar e interpretar el sexismo en TikTok. Compilamos el primer conjunto de datos de videos de TikTok diseñados para analizar el sexismo tanto en inglés como en español. Este conjunto de datos no solo proporciona un recurso fundamental para el análisis actual, sino que también sirve como un referente inicial para comparar modelos o para futuras investigaciones en esta área. Integrando texto, características lingüísticas, emociones, audio y características de video, este estudio identifica indicadores únicos de contenido sexista. El análisis multimodal supera los métodos solo textuales, particularmente en la comprensión de las intenciones detrás del sexismo, logrando resultados notables con puntajes F1-macro de 0.753 y 0.768 para inglés y español, respectivamente. Notablemente, esta configuración llevó a una mejora del 4.4% y 4.8% sobre los mejores modelos unimodales. Además, empleando el ajuste fino a un modelo multimodal (TAVL - Fine-Tuning), los resultados mejoran para todas las tareas, con un aumento del 5.5% en F1-macro para detectar sexismo en inglés y una mejora del 2.2% en español. Adicionalmente, para la intención de fuente, las mejoras son del 7.3% y 9.4%, respectivamente. Notablemente, para las categorías de sexismo, hay un mejoramiento significativo particularmente en español, donde las categorías están mejor representadas y hay más videos sexistas que en inglés. es_ES
dc.format.extent 80 es_ES
dc.language Español es_ES
dc.publisher Universitat Politècnica de València es_ES
dc.rights Reserva de todos los derechos es_ES
dc.subject Sexismo es_ES
dc.subject TikTok es_ES
dc.subject Aprendizaje profundo multimodal es_ES
dc.subject Inteligencia artificial (IA) es_ES
dc.subject Análisis de texto es_ES
dc.subject Análisis de audio es_ES
dc.subject Análisis de vídeo es_ES
dc.subject Sexism es_ES
dc.subject Multimodal deep learning es_ES
dc.subject Artificial intelligence (AI) es_ES
dc.subject Text analysis es_ES
dc.subject Audio analysis es_ES
dc.subject Video analysis es_ES
dc.subject.classification LENGUAJES Y SISTEMAS INFORMATICOS es_ES
dc.subject.other Grado en Ciencia de Datos-Grau en Ciència de Dades es_ES
dc.title Sexism Identification on TikTok: a Multimodal AI Approach with Text, Audio, and Video es_ES
dc.title.alternative Identificació de sexisme a TikTok: un enfocament multimodal d'IA amb text, àudio i vídeo es_ES
dc.title.alternative Identificación del sexismo en TikTok: un enfoque de IA multimodal con texto, audio y vídeo es_ES
dc.type Proyecto/Trabajo fin de carrera/grado es_ES
dc.rights.accessRights Abierto es_ES
dc.contributor.affiliation Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació es_ES
dc.contributor.affiliation Universitat Politècnica de València. Escola Tècnica Superior d'Enginyeria Informàtica es_ES
dc.description.bibliographicCitation Arcos Gabaldón, I. (2024). Sexism Identification on TikTok: a Multimodal AI Approach with Text, Audio, and Video. Universitat Politècnica de València. http://hdl.handle.net/10251/207334 es_ES
dc.description.accrualMethod TFGM es_ES
dc.relation.pasarela TFGM\163023 es_ES


Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem