- -

Métodos de aprendizaje automático y modelos de lenguaje masivos para la detección de estereotipos en comentarios de texto en español

RiuNet: Repositorio Institucional de la Universidad Politécnica de Valencia

Compartir/Enviar a

Citas

Estadísticas

  • Estadisticas de Uso

Métodos de aprendizaje automático y modelos de lenguaje masivos para la detección de estereotipos en comentarios de texto en español

Mostrar el registro sencillo del ítem

Ficheros en el ítem

dc.contributor.advisor Rosso, Paolo es_ES
dc.contributor.advisor Pelechano Ferragud, Vicente es_ES
dc.contributor.author Francés Pérez, Nerea es_ES
dc.date.accessioned 2024-10-17T11:41:37Z
dc.date.available 2024-10-17T11:41:37Z
dc.date.created 2024-09-19
dc.date.issued 2024-10-17 es_ES
dc.identifier.uri http://hdl.handle.net/10251/210426
dc.description.abstract [ES] Este trabajo de fin de grado se enfoca en la detección de estereotipos en textos en español, una tarea vital para mitigar el discurso de odio en internet. Los estereotipos son ideas preconcebidas sobre diferentes grupos sociales basadas en su raza, género, religión, entre otros factores. Con el auge de las redes sociales y la gran cantidad de información generada a diario, la detección manual de estos estereotipos se vuelve insostenible. Este proyecto utiliza modelos de aprendizaje automático, así como modelos de lenguaje masivo como el conocido GPT para identificar y clasificar estereotipos en grandes volúmenes de datos. La evaluación de estos modelos se realiza en el marco de la competición DETESTS-Dis, que se centra en la detección de estereotipos en español. A lo largo del estudio, se utilizarán técnicas comunes de PLN y se compararán diferentes modelos y sus resultados con el objetivo de mostrar cuál de ellos es más eficaz ejerciendo la tarea de clasificación de estereotipos y así, poder proporcionar nuevas posibilidades para mejorar la moderación de contenido en línea. es_ES
dc.description.abstract [EN] This final degree project focuses on the stereotypes detection in Spanish texts, a vital task to mitigate hate speech on the internet. Stereotypes are preconceived ideas about different social groups based on their race, gender, religion, among other factors. With the rise of social media and the large amount of information daily generated, manual detection of these stereotypes becomes unsustainable. This project uses machine learning models, as well as large language models such as the well-known GPT to identify and classify stereotypes in large volumes of data. The evaluation of these models is carried out within the framework of the DETESTS-Dis competition, which focuses on the detection of stereotypes in Spanish. Throughout the study, common NLP techniques will 2 be used and different models and their results will be compared with the aim of showing which of them is most effective in performing the task of stereotype classification and thus, being able to provide new possibilities to improve the moderation of online content. es_ES
dc.description.abstract [CA] Aquest treball de fi de grau s’enfoca en la detecció d’estereotips en textos en espanyol, una tasca vital per a mitigar el discurs d’odi a internet. Els estereotips són idees preconcebudes sobre diferents grups socials basades en la raça, gènere, religió, entre altres factors. Amb l’apogeu de les xarxes socials i la gran quantitat d’informació generada diàriament, la detecció manual d’aquests estereotips es torna insostenible. Aquest projecte utilitza models d’aprenentatge automàtic, així com models de llenguatge massiu com el conegut GPT per identificar i classificar estereotips en grans volums de dades. L’avaluació d’aquests models es realitza en el marc de la competició DETESTS-Dis, que se centra en la detecció d’estereotips en espanyol. Al llarg de l’estudi, s’utilitzaran tècniques comunes de PLN i es compararan diferents models i els seus resultats, amb l’objectiu de mostrar quin és més eficaç exercint la tasca de classificació d’estereotips i així, poder proporcionar noves possibilitats per millorar la moderació de contingut en línia. es_ES
dc.format.extent 74 es_ES
dc.language Español es_ES
dc.publisher Universitat Politècnica de València es_ES
dc.rights Reserva de todos los derechos es_ES
dc.subject Estereotipos es_ES
dc.subject Inmigración es_ES
dc.subject Procesamiento del lenguaje natural es_ES
dc.subject Redes sociales es_ES
dc.subject Transformers es_ES
dc.subject GPT es_ES
dc.subject Regresión logística es_ES
dc.subject Support vector machine (SVM) es_ES
dc.subject Stereotypes es_ES
dc.subject Immigration es_ES
dc.subject Natural language processing es_ES
dc.subject Social networks es_ES
dc.subject Logistic regression es_ES
dc.subject.classification LENGUAJES Y SISTEMAS INFORMATICOS es_ES
dc.subject.other Grado en Ingeniería Informática-Grau en Enginyeria Informàtica es_ES
dc.title Métodos de aprendizaje automático y modelos de lenguaje masivos para la detección de estereotipos en comentarios de texto en español es_ES
dc.title.alternative Machine learning methods and large language models for the detection of stereotypes in text comments in Spanish es_ES
dc.title.alternative Mètodes d'aprenentatge automàtic i models de llenguatge massius per a la detecció d'estereotips en comentaris de text en espanyol es_ES
dc.type Proyecto/Trabajo fin de carrera/grado es_ES
dc.rights.accessRights Abierto es_ES
dc.contributor.affiliation Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació es_ES
dc.contributor.affiliation Universitat Politècnica de València. Escola Tècnica Superior d'Enginyeria Informàtica es_ES
dc.description.bibliographicCitation Francés Pérez, N. (2024). Métodos de aprendizaje automático y modelos de lenguaje masivos para la detección de estereotipos en comentarios de texto en español. Universitat Politècnica de València. http://hdl.handle.net/10251/210426 es_ES
dc.description.accrualMethod TFGM es_ES
dc.relation.pasarela TFGM\163047 es_ES


Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem