Resumen:
|
[ES] Este trabajo de fin de grado se enfoca en la detección de estereotipos en textos en español, una tarea vital para mitigar el discurso de odio en internet. Los estereotipos son
ideas preconcebidas sobre diferentes ...[+]
[ES] Este trabajo de fin de grado se enfoca en la detección de estereotipos en textos en español, una tarea vital para mitigar el discurso de odio en internet. Los estereotipos son
ideas preconcebidas sobre diferentes grupos sociales basadas en su raza, género, religión,
entre otros factores. Con el auge de las redes sociales y la gran cantidad de información
generada a diario, la detección manual de estos estereotipos se vuelve insostenible. Este proyecto utiliza modelos de aprendizaje automático, así como modelos de lenguaje
masivo como el conocido GPT para identificar y clasificar estereotipos en grandes volúmenes de datos. La evaluación de estos modelos se realiza en el marco de la competición
DETESTS-Dis, que se centra en la detección de estereotipos en español. A lo largo del
estudio, se utilizarán técnicas comunes de PLN y se compararán diferentes modelos y
sus resultados con el objetivo de mostrar cuál de ellos es más eficaz ejerciendo la tarea de
clasificación de estereotipos y así, poder proporcionar nuevas posibilidades para mejorar
la moderación de contenido en línea.
[-]
[EN] This final degree project focuses on the stereotypes detection in Spanish texts, a vital
task to mitigate hate speech on the internet. Stereotypes are preconceived ideas about
different social groups based on their ...[+]
[EN] This final degree project focuses on the stereotypes detection in Spanish texts, a vital
task to mitigate hate speech on the internet. Stereotypes are preconceived ideas about
different social groups based on their race, gender, religion, among other factors. With
the rise of social media and the large amount of information daily generated, manual detection of these stereotypes becomes unsustainable. This project uses machine learning
models, as well as large language models such as the well-known GPT to identify and
classify stereotypes in large volumes of data. The evaluation of these models is carried
out within the framework of the DETESTS-Dis competition, which focuses on the detection of stereotypes in Spanish. Throughout the study, common NLP techniques will
2
be used and different models and their results will be compared with the aim of showing which of them is most effective in performing the task of stereotype classification and
thus, being able to provide new possibilities to improve the moderation of online content.
[-]
[CA] Aquest treball de fi de grau s’enfoca en la detecció d’estereotips en textos en espanyol,
una tasca vital per a mitigar el discurs d’odi a internet. Els estereotips són idees preconcebudes sobre diferents grups socials ...[+]
[CA] Aquest treball de fi de grau s’enfoca en la detecció d’estereotips en textos en espanyol,
una tasca vital per a mitigar el discurs d’odi a internet. Els estereotips són idees preconcebudes sobre diferents grups socials basades en la raça, gènere, religió, entre altres factors.
Amb l’apogeu de les xarxes socials i la gran quantitat d’informació generada diàriament,
la detecció manual d’aquests estereotips es torna insostenible. Aquest projecte utilitza
models d’aprenentatge automàtic, així com models de llenguatge massiu com el conegut
GPT per identificar i classificar estereotips en grans volums de dades. L’avaluació d’aquests models es realitza en el marc de la competició DETESTS-Dis, que se centra en la
detecció d’estereotips en espanyol. Al llarg de l’estudi, s’utilitzaran tècniques comunes
de PLN i es compararan diferents models i els seus resultats, amb l’objectiu de mostrar
quin és més eficaç exercint la tasca de classificació d’estereotips i així, poder proporcionar
noves possibilitats per millorar la moderació de contingut en línia.
[-]
|