- -

Automated classification of service reports using natural language processing techniques

RiuNet: Repositorio Institucional de la Universidad Politécnica de Valencia

Compartir/Enviar a

Citas

Estadísticas

  • Estadisticas de Uso

Automated classification of service reports using natural language processing techniques

Mostrar el registro sencillo del ítem

Ficheros en el ítem

dc.contributor.advisor Morillas Gómez, Samuel es_ES
dc.contributor.advisor Berg, Kare Olav es_ES
dc.contributor.author Gilyarovskaya, Elizaveta Alexeevna es_ES
dc.coverage.spatial east=9.651371240615845; north=59.65187502250799; name=MM22+QG Kongsberg, Noruega es_ES
dc.date.accessioned 2022-10-21T17:53:35Z
dc.date.available 2022-10-21T17:53:35Z
dc.date.created 2022-09-22
dc.date.issued 2022-10-21 es_ES
dc.identifier.uri http://hdl.handle.net/10251/188547
dc.description.abstract [CA] Kongsberg Maritime és una empresa tecnològica que lliura sistemes de posicionament, topografia, navegació i automatització a vaixells mercants i instal·lacions a alta mar. És de vital importància tenir un sistema madur i eficaç de gestió de reports que permeti analitzar i classificar tota la informació disponible i recolzar així el procés de la presa de decisions. L’empresa es beneficiarà de la proposta desenvolupada en aquest projecte de forma directa ja que permet automatitzar el procés de revisar i extreure informació dels informes i dedicar els recursos antigament implicats en això a altres àrees del negoci ComapartdeEquipd’Innovació de Dades he desenvolupat aquest projecte amb l’objectiu d’automatitzar els processos interns de la companyia aplicant tècniques d’intel·ligència artificial, més concretament de processament del llenguatge natural, a les tasques de revisió i classificació dels informes de manteniment realitzats pels enginyers de servei. En primer lloc, s’ha desenvolupat un model d’aprenentatge semisupervisat, few-shot learning, per a la tasca de classificar el text d’un informe a les categories d’interès. Quan les prediccions d’aquest model han estat corregides per experts del domini i s’han generat suficients dades etiquetades, s’han entrenat classificadors supervisats per millorar les prediccions i arribar a un model definitiu per posar-lo en producció. També es va entrenar un model deep learning de tipus red transformers mitjançant la tècnica transfer learning. Finalment, s’ha dissenyat custom rule-based matching per al reconeixement i l’extracció d’entitats i paraules clau d’interès. Per posar el programa enproducció, s’ha desenvolupat una interfície d’usuari que mostra la sortida dels models de forma gràfica i permet als agents encarregats de supervisar-lo introduir les correccions a les prediccions del model per a ajustar-les i millorar-les posteriorment. es_ES
dc.description.abstract [ES] Kongsberg Maritime es una empresa tecnológica que entrega sistemas de posicionamiento, topografía, navegación y automatización a buques mercantes e instalaciones en alta mar. Es de vital importancia para ellos tener un sistema ma- duro y eficaz de gestión de reportes que permita analizar y clasificar toda la in- formación disponible y apoyar de esta forma el proceso de la toma de decisiones. La empresa se beneficiará de la propuesta desarollada en este proyecto de forma directa ya que permite automatizar el proceso de revisar y extraer información de los informes y dedicar los recursos antiguamente implicados en eso a otras áreas del negocio. Como parte del Equipo de Innovación de Datos he desarrollado este proyecto con el objetivo de automatizar los procesos internos de la compañía aplicando técnicas de inteligencia artificial, más concretamente de procesamiento del lenguaje natural, a las tareas de revisión y clasificación de los informes de mantenimiento realizados por los ingenieros de servicio. En primer lugar, se ha desarrollado un modelo de aprendizaje semisupervisado, few-shot learning, para la tarea de clasificar el texto de un informe en las categorías de interés. Una vez que las pre- dicciones de este modelo han sido corregidas por expertos del dominio y se han generado suficientes datos etiquetados, se han entrenado clasificadores supervisados para mejorar las predicciones y llegar a un modelo definitivo para ponerlo en producción. También se entrenó un modelo deep learning de tipo red trans- formers mediante la técnica transfer learning. Por último, se ha diseñado custom rule-based matching para el reconocimiento y extracción de entidades y palabras clave de interés. Para poner la herramienta en producción, se ha desarrollado una interfaz de usuario que muestra la salida de los modelos de forma gráfica y permite a los agentes encargados de supervisarlo introducir las correcciones a las predicciones del modelo para su posterior ajuste y mejora. es_ES
dc.description.abstract [EN] Kongsberg Maritime is a technology enterprise that delivers systems for positioning, surveying, navigation, and automation to merchant vessels and offshore installations. It is of critical importance for them to have a mature and effective reporting management system that allows analyzing and classifying all the available information to support the decision-making process. The company will benefit directly from this proposal since it will allow automating the process of reviewing and extracting information from the reports and dedicate the resources formerly involved in that to other areas of the business. As part of the Data Innovation Team, I have developed this project with the aim of automating the company's internal processes by applying artificial intelligence, more specifically, natural language processing techniques to the tasks of reviewing and classifying maintenance reports made by service engineers. First, a semi-supervised learning model, few-shot learning, has been developed for the task of classifying the text of a report into categories of interest. Once the predictions of this model have been corrected by domain experts and enough labeled data has been generated, supervised classifiers were then trained to improve the predictions and come up with a definitive model to put into production. A deep learning transformers type of model was also trained using the transfer learning technique. Finally, custom rule-based matching has been designed for the recognition and extraction of entities and keywords of interest. A user interface has been designed and developed to put the tool into production. It displays the output of the models graphically and interacts with internal databases to allow the agents in charge of supervising the model performance to introduce corrections to the predictions for later fine-tuning and improvement of the model. es_ES
dc.description.sponsorship I would like to express my deepest gratitude to my advisor and mentor Jan Erik Hjelseth who offered guidance and support throughout my whole internship and made this project possible. His experience and approach to research and data science is a source of inspiration for me. Jan Erik Ofsti, Tore Tveit, Steve May are amazing team and I truly appreciate having the opportunity to work with such a professionals. es_ES
dc.format.extent 61 es_ES
dc.language Inglés es_ES
dc.publisher Universitat Politècnica de València es_ES
dc.rights Reserva de todos los derechos es_ES
dc.subject Informes de ingeniería de servicios es_ES
dc.subject Procesamiento de lenguaje natural es_ES
dc.subject Aprendizaje automático es_ES
dc.subject Clasificación de texto no supervisada es_ES
dc.subject Clasificación de texto supervisada es_ES
dc.subject Extracción de entidades personalizadas es_ES
dc.subject Automatización es_ES
dc.subject Natural language processing es_ES
dc.subject Machine learning es_ES
dc.subject Unsupervised text classification es_ES
dc.subject Supervised text classification es_ES
dc.subject Custom entities extraction es_ES
dc.subject Automating es_ES
dc.subject Mejora empresarial es_ES
dc.subject Business improvement es_ES
dc.subject Service Engineering Reports es_ES
dc.subject.classification MATEMATICA APLICADA es_ES
dc.subject.other Grado en Ciencia de Datos-Grau en Ciència de Dades es_ES
dc.title Automated classification of service reports using natural language processing techniques es_ES
dc.title.alternative Classificació automàtica d'informes de servei mitjançant tècniques de processament de llenguatge natural es_ES
dc.title.alternative Clasificación automática de informes de servicio mediante técnicas de procesamiento de lenguaje natural es_ES
dc.type Proyecto/Trabajo fin de carrera/grado es_ES
dc.rights.accessRights Abierto es_ES
dc.contributor.affiliation Universitat Politècnica de València. Departamento de Matemática Aplicada - Departament de Matemàtica Aplicada es_ES
dc.contributor.affiliation Universitat Politècnica de València. Escola Tècnica Superior d'Enginyeria Informàtica es_ES
dc.description.bibliographicCitation Gilyarovskaya, EA. (2022). Automated classification of service reports using natural language processing techniques. Universitat Politècnica de València. http://hdl.handle.net/10251/188547 es_ES
dc.description.accrualMethod TFGM es_ES
dc.relation.pasarela TFGM\152629 es_ES


Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem