- -

Development and experimentation of a deep learning system for convolutional and recurrent neural networks

RiuNet: Repositorio Institucional de la Universidad Politécnica de Valencia

Compartir/Enviar a

Citas

Estadísticas

  • Estadisticas de Uso

Development and experimentation of a deep learning system for convolutional and recurrent neural networks

Mostrar el registro sencillo del ítem

Ficheros en el ítem

dc.contributor.advisor Vidal Ruiz, Enrique es_ES
dc.contributor.advisor Puigcerver I Pérez, Joan es_ES
dc.contributor.author Mocholí Calvo, Carlos es_ES
dc.date.accessioned 2018-09-11T15:53:01Z
dc.date.available 2018-09-11T15:53:01Z
dc.date.created 2018-07-12
dc.date.issued 2018-09-11 es_ES
dc.identifier.uri http://hdl.handle.net/10251/107062
dc.description.abstract [EN] At present, there are very few deep learning toolkits focused on the task of Handwritten Text Recognition (HTR). HTR refers to the problem of recognizing a sequence of characters in an input image. For this reason, we have decided to build PyLaia, a toolkit for performing handwritten text document analysis experiments. PyLaia is flexible, open-source, device-agnostic, and can be used to express a wide variety of experiments, including training and inference over Convolutional and Recurrent based deep Neural Network models. It has been used for conducting research over the IAM and RIMES datasets. PyLaia is also a successor to Laia, written in Lua. This work describes the implementation of the system that we have built using PyTorch as the basis for our toolkit. The software is extensible and easily configurable and provides a rich set of functional layers with a particular focus on HTR. Additionally, we also describe the implementation of our custom model architecture which combines convolutional and recurrent layers to compete with current state-of-the-art architectures in the field. A wide array of experiments have been carried out to validate our implementation. The experiments presented achieve improved results over those done using the toolkit’s predecessor. We also compare the impact of several features such as the usage of a model which allows inputs of variable height or the use of dropout. PyLaia is mantained as an open-source package under the MIT license and is available at https://github.com/jpuigcerver/PyLaia es_ES
dc.description.abstract [ES] En la actualidad, hay muy pocos toolkits de aprendizaje profundo centrado en la tarea de Reconocimiento de Texto Manuscrito (HTR). HTR se refiere al problema de reconocer una secuencia de caracteres en una imagen de entrada. Por este motivo, hemos decidido crear PyLaia, un conjunto de herramientas para realizar experimentos de análisis de documentos de texto manuscrito. PyLaia es flexible, de código abierto, independiente del dispositivo en el que se ejecuta y se puede utilizar para expresar una amplia variedad de experimentos, incluido el entrenamiento y la inferencia sobre modelos de redes neuronales profundas convolucionales y recurrentes. Se ha utilizado para realizar investigaciones sobre los conjuntos de datos IAM y RIMES. PyLaia también es un sucesor de Laia, escrito en Lua. Este trabajo describe la implementación del sistema que hemos construido utilizando PyTorch como base para nuestro toolkit. El software es extensible y fácilmente configurable y proporciona un amplio conjunto de capas funcionales con un enfoque particular en HTR. Además, también describimos la implementación de la arquitectura de nuestro modelo personalizado que combina capas convolucionales y recurrentes para competir con las arquitecturas actuales de vanguardia en el campo. Una amplia gama de experimentos se han llevado a cabo para validar nuestra implementación. Los experimentos presentados logran mejores resultados que los obtenidos con el predecesor del toolkit. También comparamos el impacto de varias características, como el uso del modelo que permite la entrada de imagenes de altura variable o el uso del dropout. PyLaia se mantiene como un paquete de código abierto bajo la licencia de MIT y está disponible en https://github.com/jpuigcerver/PyLaia es_ES
dc.description.abstract [CA] En l’actualitat, hi ha molt pocs toolkits d’aprenentatge profund centrat en la tasca de Reconeixement de Text Manuscrit (HTR) . HTR es referix al problema de reconéixer una seqüència de caràcters en una imatge d’entrada. Per aquest motiu, hem decidit crear PyLaia, un toolkit per a realitzar experiments d’anàlisi de documents manuscrits. PyLaia és flexible, de codi obert, independent del dispositiu en què s’executa i es pot utilitzar per a expressar una àmplia varietat d’experiments, inclòs l’entrenament i la inferència sobre models de xarxes neuronals profundes convolucionals i recurrents. S’ha utilitzat per a realitzar investigacions sobre els conjunts de dades IAM i RIMES. PyLaia també és un successor de Laia, escrit en Lua. Este treball descriu la implementació del sistema que hem construït utilitzant PyTorch com a base per al nostre toolkit. El programari és extensible i fàcilment configurable i proporciona un ampli conjunt de capes funcionals amb un enfocament particular en HTR. A més, també descrivim la implementació de l’arquitectura del nostre model personalitzat que combina capes convolucionals i recurrents per a competir amb les arquitectures actuals d’avantguarda en el camp. Una àmplia gamma d’experiments s’han dut a terme per a validar la nostra implementació. Els experiments presentats aconseguixen millors resultats que els obtinguts amb el predecessor del toolkit. També comparem l’impacte de diverses característiques, com l’ús del model que permet l’entrada d’imatges d’altura variable o l’ús del dropout. PyLaia es manté com un paquet de codi obert sota la llicència de MIT i està disponible en https://github.com/jpuigcerver/PyLaia es_ES
dc.format.extent 56 es_ES
dc.language Inglés es_ES
dc.publisher Universitat Politècnica de València es_ES
dc.rights Reconocimiento (by) es_ES
dc.subject Aprendizaje Automático es_ES
dc.subject Redes Neuronales es_ES
dc.subject Redes Neuronales Convolucionales es_ES
dc.subject Redes Neuronales Recurrentes es_ES
dc.subject Reconocimiento de Texto Manuscrito es_ES
dc.subject PyTorch es_ES
dc.subject Machine Learning es_ES
dc.subject Neural Networks es_ES
dc.subject Convolutional Neural Networks es_ES
dc.subject Recurrent Neural Networks es_ES
dc.subject Handwritten Text Recognition es_ES
dc.subject Aprenentatge automàtic es_ES
dc.subject Xarxes neuronals es_ES
dc.subject Xarxes neuronals convolucionals es_ES
dc.subject Xarxes neuronals recurrents es_ES
dc.subject Reconeixement de text manuscrit es_ES
dc.subject.classification LENGUAJES Y SISTEMAS INFORMATICOS es_ES
dc.subject.other Grado en Ingeniería Informática-Grau en Enginyeria Informàtica es_ES
dc.title Development and experimentation of a deep learning system for convolutional and recurrent neural networks es_ES
dc.type Proyecto/Trabajo fin de carrera/grado es_ES
dc.rights.accessRights Abierto es_ES
dc.contributor.affiliation Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació es_ES
dc.contributor.affiliation Universitat Politècnica de València. Escola Tècnica Superior d'Enginyeria Informàtica es_ES
dc.description.bibliographicCitation Mocholí Calvo, C. (2018). Development and experimentation of a deep learning system for convolutional and recurrent neural networks. http://hdl.handle.net/10251/107062 es_ES
dc.description.accrualMethod TFGM es_ES
dc.relation.pasarela TFGM\84912 es_ES


Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem