- -

Writer identification in handwritten text images using deep neural networks

RiuNet: Repositorio Institucional de la Universidad Politécnica de Valencia

Compartir/Enviar a

Citas

Estadísticas

  • Estadisticas de Uso

Writer identification in handwritten text images using deep neural networks

Mostrar el registro sencillo del ítem

Ficheros en el ítem

dc.contributor.advisor Vidal Ruiz, Enrique es_ES
dc.contributor.advisor Prieto Fontcuberta, José Ramón es_ES
dc.contributor.author Punjabi Punjabi, Akshay es_ES
dc.date.accessioned 2020-09-28T08:32:10Z
dc.date.available 2020-09-28T08:32:10Z
dc.date.created 2020-07-14
dc.date.issued 2020-09-28 es_ES
dc.identifier.uri http://hdl.handle.net/10251/150804
dc.description.abstract [EN] The identification of the writer who has written a piece of text is needed in several applications of document analysis and recognition. In particular, it is required for the organization of historical manuscripts in archives and libraries. Traditional methods used to relay on a segmentation of the written text into individual characters, followed by more or less heuristic analysis of the shape of the characters. This approach has provided some results in simple cases where the text is clear enough to allow the detection and extraction of individual characters. However, it fails dramatically when the writing is sloppy and/or when ancient scripts are considered. Therefore, modern works follow holistic approaches where the writing style is analyzed without character or word detection or extraction. Moreover, machine learning techniques are proving highly adequate to tackle the writer's identification problem in a fully holistic, segmentation-free way. In this direction, deep convolutional neural networks are the most promising models tried so far. This proposal consists of the development of deep learning methods for the classification of a handwritten image, or a part thereof, into several classes corresponding to possible hands which have written the text. This work will also include experimentation on public-domain, benchmark datasets, as well as on other real-world datasets consisting of historical manuscripts. es_ES
dc.description.abstract [ES] La identificación del escritor que ha escrito un texto es necesaria en varias aplicaciones de análisis y reconocimiento de documentos. En particular, se requiere para la organización de manuscritos históricos en archivos y bibliotecas. Los métodos tradicionales solían basarse en una segmentación del texto escrito en caracteres individuales, seguido de un análisis más o menos heurístico de la forma de los caracteres. Este enfoque ha proporcionado algunos resultados en casos simples donde el texto es lo suficientemente claro como para permitir la detección y extracción de caracteres individuales. Pero falla completamente cuando la escritura es informal o desordenada y/o cuando se consideran estilos de escritura antiguos. Por lo tanto, los trabajos modernas siguen enfoques holísticos en los que se analiza el estilo de escritura sin detección o extracción previa de caracteres o palabras. Además, las técnicas de aprendizaje automático están demostrando ser muy adecuadas para abordar el problema de identificación del escritor de una manera totalmente holística y sin segmentación. En esta dirección, las redes neuronales convolucionales profundas son los modelos más prometedores que se han probado hasta ahora. Esta propuesta consiste en el desarrollo de métodos de aprendizaje profundo para la clasificación de una imagen de texto, o una parte de ella, en clases correspondientes a las posibles manos que han escrito el texto. El trabajo también incluirá la experimentación con conjuntos de datos públicos de referencia, así como en otros conjuntos de datos del mundo real, que consisten en manuscritos históricos. es_ES
dc.description.abstract [CA] La identificació de l’escriptor que ha escrit un text és necessària en diverses aplicacions d’anàlisi i reconeixement de documents. En particular, es requereix per a l’organització de manuscrits històrics en arxius i biblioteques. Els mètodes tradicionals solien basar-se en una segmentació de l’ text escrit en caràcters individuals, seguit d’una anàlisi més o menys heurístic de la forma dels caràcters. Aquest enfocament ha proporcionat alguns resultats en casos simples on el text és prou clar com per permetre la detecció i extracció de caràcters individuals. però falla completament quan l’escriptura és informal o desordenada i / o quan es consideren estils d’escriptura antics. Per tant, els treballs modernes segueixen enfocaments holístics en els que s’analitza l’estil d’escriptura sense detecció o extracció prèvia de caràcters o paraules. A més, les tècniques de aprenentatge automàtic estan demostrant ser molt adequades per a abordar el problema d’identificació de l’escriptor d’una manera totalment holística i sense segmentació. En aquesta direcció, les xarxes neuronals convolucionals profundes són els models més prometedors que s’han provat fins ara. Aquesta proposta consisteix en el desenvolupament de mètodes d’aprenentatge profund per a la classificació d’una imatge de text, o una part d’ella, en classes corresponents a les possibles mans que han escrit el text. El treball també inclourà l’experimentació amb conjunts de dades públiques de referència, així com en altres conjunts de dades del món real, que consisteixen en manuscrits històrics. es_ES
dc.format.extent 62 es_ES
dc.language Español es_ES
dc.publisher Universitat Politècnica de València es_ES
dc.rights Reserva de todos los derechos es_ES
dc.subject Writer identification es_ES
dc.subject Deep learning es_ES
dc.subject Neural networks es_ES
dc.subject Convolutional neural network es_ES
dc.subject Handwritten pages es_ES
dc.subject Document image processing es_ES
dc.subject Historical document writer identification es_ES
dc.subject Pattern recognition es_ES
dc.subject Identificación del escritor es_ES
dc.subject Aprendizaje profundo es_ES
dc.subject Redes neuronales es_ES
dc.subject CNN es_ES
dc.subject Red neuronal convolucional es_ES
dc.subject Páginas escritas a mano es_ES
dc.subject Procesamiento de imágenes de documentos es_ES
dc.subject Identificación del escritor de documentos históricos es_ES
dc.subject Reconocimiento de patrones es_ES
dc.subject.classification LENGUAJES Y SISTEMAS INFORMATICOS es_ES
dc.subject.other Grado en Ingeniería Informática-Grau en Enginyeria Informàtica es_ES
dc.title Writer identification in handwritten text images using deep neural networks es_ES
dc.title.alternative Identificación del escritor en imágenes de texto manuscrito mediante redes neuronales profundas es_ES
dc.type Proyecto/Trabajo fin de carrera/grado es_ES
dc.rights.accessRights Abierto es_ES
dc.contributor.affiliation Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació es_ES
dc.contributor.affiliation Universitat Politècnica de València. Escola Tècnica Superior d'Enginyeria Informàtica es_ES
dc.description.bibliographicCitation Punjabi Punjabi, A. (2020). Writer identification in handwritten text images using deep neural networks. http://hdl.handle.net/10251/150804 es_ES
dc.description.accrualMethod TFGM es_ES
dc.relation.pasarela TFGM\129976 es_ES


Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem