Resumen:
|
[ES] El proyecto se enmarca en uno de los procesos a realizar para atender a los clientes en una compañía de seguros. Los clientes dan de alta un siniestro rellenando un campo de texto abierto. Parte del tratamiento del ...[+]
[ES] El proyecto se enmarca en uno de los procesos a realizar para atender a los clientes en una compañía de seguros. Los clientes dan de alta un siniestro rellenando un campo de texto abierto. Parte del tratamiento del siniestro pasa por redirigir la resolución del mismo a alguno de los diferentes operadores (fontanería, carpintería, cristalería, etc.), por lo que la automatización de este proceso resulta de gran interés para la compañía.
La clasificación de textos en un conjunto de categorías predeterminado es una tarea ampliamente abordada dentro del área del Procesamiento del Lenguaje Natural. Se dispone de diferentes métodos supervisados que permiten obtener clasificadores a partir de conjuntos de datos convenientemente etiquetados. Para el desarrollo de este trabajo se dispone de un corpus de descripciones textuales de siniestros, etiquetados según un amplio conjunto de categorías. En este trabajo se hará un estudio del conjunto de etiquetas que maneja la compañía actualmente, se realizarán diferentes propuestas de agrupamiento de estas etiquetas para conseguir hacer abordable la construcción de diferentes clasificadores, y se entrenarán y evaluarán dichos clasificadores.
[-]
[EN] The project is part of one of the processes to be carried out to serve customers of an insurance company. Customers register a claim by filling in an open text field. Part of the treatment of the claim involves ...[+]
[EN] The project is part of one of the processes to be carried out to serve customers of an insurance company. Customers register a claim by filling in an open text field. Part of the treatment of the claim involves redirecting its resolution to one of the different operators (plumbing, carpentry, glassware, etc.), so the automation of this process is of great interest to the company.
The classification of texts in a predetermined set of categories is a task widely addressed within the area of Natural Language Processing. There are different supervised methods that to obtaining classifiers from labeled data sets. For the development of this work, a corpus of textual descriptions of claims is available, labeled according to a wide set of categories. In this work, a study will be made of the set of labels that the company currently manages, different proposals of clustering of these labels will be made in order to make the construction of different classifiers affordable, and those classifiers will be trained and evaluated.
[-]
|