- -

Generación no supervisada de datos para la clasificación de queries en un sistema de diálogo

RiuNet: Repositorio Institucional de la Universidad Politécnica de Valencia

Compartir/Enviar a

Citas

Estadísticas

  • Estadisticas de Uso

Generación no supervisada de datos para la clasificación de queries en un sistema de diálogo

Mostrar el registro sencillo del ítem

Ficheros en el ítem

dc.contributor.advisor Casacuberta Nolla, Francisco es_ES
dc.contributor.author Valero Antón, Francisco de Borja es_ES
dc.date.accessioned 2020-10-14T06:38:48Z
dc.date.available 2020-10-14T06:38:48Z
dc.date.created 2020-09-24
dc.date.issued 2020-10-14 es_ES
dc.identifier.uri http://hdl.handle.net/10251/151669
dc.description.abstract [ES] En este trabajo se experimenta con tres técnicas de aumentados de datos para ayudar al clasificador de texto a incrementar su rendimiento. Para la experimentación se han seleccionado un gran número de corpus donde la mayoría de ellos pertenecen al dominio de la detección de intents, ya que, el objetivo de la investigación realizada en este proyecto es aprovechar el conocimiento adquirido para posteriormente aplicarlo en chatbots dedicados a servicio al cliente. Estos chatbots tendrán que detectar los intents de las queries enviadas por los usuarios para posteriormente responder consecuentemente. Los dos modelos empleados en la experimentación son de naturaleza distinta. El primero de ellos es XGBoost que es un modelo de aprendizaje automático clásico y el segundo de ellos utiliza la versión pre-entrenada de RoBERTa que es un modelo aprendizaje automático profundo, el cual actualmente es el estado del arte en la clasificación de texto. Finalmente, vemos que el uso de estas técnicas no aporta una mejora considerable con respecto de no utilizarlas. es_ES
dc.description.abstract [EN] In this work we experiment with three data augmentation techniques in order to help the classifier to improve its performance. For the experimentation we chose a big number of corpus where the majority of them belong to the field of intent classification, because the knowledge obtained in this research will be used for applying in a customer service chatbot. This chatbot will answer the queries of the user, but previously it will have to detect the intent correctly. The two models that we use for the experimentation belong to different nature. The first one is XGBoost that belongs to the classical machine learning models, and the second one uses the pre-trained version of RoBERTa that belongs to the deep learning models, that actually are the state of the art in text classification. Finally, we will see that the use of these data augmentation techniques in natural language processing do not help to improve considerably the performance of the classifiers. es_ES
dc.format.extent 53 es_ES
dc.language Español es_ES
dc.publisher Universitat Politècnica de València es_ES
dc.rights Reserva de todos los derechos es_ES
dc.subject Sistemas de Diálogo es_ES
dc.subject Aprendizaje Automático es_ES
dc.subject Clasificación de Texto es_ES
dc.subject Redes Neuronales Profundas es_ES
dc.subject Aumentado de datos es_ES
dc.subject Modelos pre-entrenados. es_ES
dc.subject Dialog Systems es_ES
dc.subject Machine Learning es_ES
dc.subject Text Classification es_ES
dc.subject Deep Neural Networks es_ES
dc.subject Data augmentation es_ES
dc.subject Pre-trained models. es_ES
dc.subject.classification LENGUAJES Y SISTEMAS INFORMATICOS es_ES
dc.subject.other Máster Universitario en Inteligencia Artificial, Reconocimiento de Formas e Imagen Digital-Màster Universitari en Intel·Ligència Artificial: Reconeixement de Formes i Imatge Digital es_ES
dc.title Generación no supervisada de datos para la clasificación de queries en un sistema de diálogo es_ES
dc.type Tesis de máster es_ES
dc.rights.accessRights Abierto es_ES
dc.contributor.affiliation Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació es_ES
dc.description.bibliographicCitation Valero Antón, FDB. (2020). Generación no supervisada de datos para la clasificación de queries en un sistema de diálogo. http://hdl.handle.net/10251/151669 es_ES
dc.description.accrualMethod TFGM es_ES
dc.relation.pasarela TFGM\129518 es_ES


Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem