- -

Análisis de Maquetación ("Layout") en imágenes de texto manuscrito mediante Redes Neuronales

RiuNet: Repositorio Institucional de la Universidad Politécnica de Valencia

Compartir/Enviar a

Citas

Estadísticas

  • Estadisticas de Uso

Análisis de Maquetación ("Layout") en imágenes de texto manuscrito mediante Redes Neuronales

Mostrar el registro sencillo del ítem

Ficheros en el ítem

dc.contributor.advisor Vidal Ruiz, Enrique es_ES
dc.contributor.advisor Toselli, Alejandro Héctor es_ES
dc.contributor.advisor Quirós Díaz, Lorenzo es_ES
dc.contributor.author Prieto Fontcuberta, José Ramón es_ES
dc.date.accessioned 2019-10-30T10:42:38Z
dc.date.available 2019-10-30T10:42:38Z
dc.date.created 2019-07-22
dc.date.issued 2019-10-30 es_ES
dc.identifier.uri http://hdl.handle.net/10251/130017
dc.description.abstract [ES] Existen grandes colecciones de manuscritos, las cuales contienen información muy valiosa sobre aspectos cruciales de la historia de nuestra sociedad. Existe tal cantidad de documentos que de forma manual se tardarían años, o incluso siglos, en poder extraer toda la información, cuya mayoría es textual. Debido a esto, se trata de utilizar técnicas de maquetación y reconocimiento de texto manuscrito de las imágenes de forma automática a fin de poder comprender mejor, y de manera m´as eficiente, la información que nos proporcionan estas colecciones. Este Trabajo de Fin de Máster se ha centrado en el desarrollo y evaluación de diferentes técnicas de aprendizaje profundo para realizar la maquetación de páginas con alto valor histórico. Por lo que este trabajo gira en torno a dos tareas. La primera, la segmentación de zonas en un corpus del siglo XIV al siglo XIX. Dicho corpus está compuesto mayormente por tablas, habilitando un posterior análisis para permitir realizar consultas estructuradas. La segunda tarea trata de la separación de registros en una colección del siglo XIV al siglo XV dictados por el rey de Francia. Dicha separación ayudaría a la búsqueda de temas concretos de la época, así como posibles sentencias escritas en dichos registros. Además, se ha utilizado la información textual disponible en ambas colecciones para fusionarla con la información gráfica de la página y analizar así su impacto sobre los resultados. Tras experimentar con diferentes arquitecturas de redes convolucionales, se han mejorado los resultados base en una de las tareas. Por otro lado, la información textual extraída del contenido textual de los documentos ha ayudado a obtener mejoras en los resultados en ambas tareas. es_ES
dc.description.abstract [EN] There are large collections of manuscripts which contain very valuable information on crucial aspects of the history of our society. There are such large quantity of documents that it would take years, of even centuries, to manually extract all the information, most of it is textual. Due to this, there are automatic image document layout analysis and handwritten text recognition techniques that helps to get a better understanding –and more efficiently –of the information provided by these collections. This Master Thesis has focused on the development and evaluation of different deep learning techniques to make the layout of pages with high historical value. This work revolves around two tasks. The first one, the zone segmentation in a corpus of the century XIV to the century XIX. This corpus is mostly composed by tables, enabling a subsequent analysis to allow structured queries. The second task deals with the separation of records in a collection of the century XIV to the century XV dictated by the King of France. This separation would help the search for specific issues of the time, as well as possible sentences written in those records. In addition, we have tried to use the textual information available in both collections used for merge this information with the graphic information of the page and checking its impact on the results. We have experimented with different architectures of convolutional networks and the base results have been improved in one of the tasks. It also shows how the extracted textual information helps to obtain improvements in the results in both tasks. es_ES
dc.description.abstract [CA] Existeixen grans col·leccions de manuscrits, els quals contenen informació molt valuosa sobre aspectes crucials de la història de la nostra societat. Existeix tal quantitat de documents que de forma manual trigaríem anys, o inclús segles, en poder extraure tota la informació, on la majoria és textual. A causa d’això, es tracta d’utilitzar tècniques de maquetació i reconeixement de text manuscrit de les imatges de forma automàtica a fi de poder comprendre millor, i de manera més eficient, la informació que proporcionen aquestes col·leccions. Aquest Treball de Fi de Màster s’ha centrat en el desenvolupament i avaluació de diferents tècniques d’aprenentatge profund per a realitzar la maquetació de pàgines amb alt valor històric. Pel que aquest treball gira en torna a dues tasques. La primera, la segmentació de zones en un corpus del segle XIV al segle XIX. Dit corpus està compost majorment per taules, habilitant un posterior anàlisi per permetre realitzar consultes estructurades. La segona tasca tracta de la separació de registres en una col·lecció del segle XIV al segle XV dictats pel rei de França. Dita separació ajudaria a la recerca de temes concrets de l’època, així com possibles sentències escrites en els dits registres. A més, s’ha tractat d’utilitzar la informació textual disponible en ambdues col·leccions fusionant-les amb la informació gràfica de la pàgina i analitzant el seu impacte sobre els resultats. Després d’experimentar amb diferents arquitectures de xarxes convolucionals, s’han trobat millores en els resultats base d’una de les tasques. Per una altra banda, la informació textual extreta ha ajudat a obtenir millores en els resultats d’ambdues tasques. es_ES
dc.language Español es_ES
dc.publisher Universitat Politècnica de València es_ES
dc.rights Reconocimiento - No comercial (by-nc) es_ES
dc.subject Reconocimiento de formas es_ES
dc.subject Procesado de imágenes es_ES
dc.subject Documentos manuscritos es_ES
dc.subject Análisis de maquetación es_ES
dc.subject Redes Neuronales Artificiales es_ES
dc.subject Redes Convolucionales es_ES
dc.subject Aprendizaje profundo es_ES
dc.subject Pattern Recognition es_ES
dc.subject Image Processing es_ES
dc.subject Handwritten Documents es_ES
dc.subject Layout Analysis es_ES
dc.subject Artificial Neural Networks es_ES
dc.subject Convolutional Networks es_ES
dc.subject Deep Learning es_ES
dc.subject.classification ESTADISTICA E INVESTIGACION OPERATIVA es_ES
dc.subject.classification LENGUAJES Y SISTEMAS INFORMATICOS es_ES
dc.subject.other Máster Universitario en Inteligencia Artificial, Reconocimiento de Formas e Imagen Digital-Màster Universitari en Intel·Ligència Artificial: Reconeixement de Formes i Imatge Digital es_ES
dc.title Análisis de Maquetación ("Layout") en imágenes de texto manuscrito mediante Redes Neuronales es_ES
dc.type Tesis de máster es_ES
dc.rights.accessRights Abierto es_ES
dc.contributor.affiliation Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació es_ES
dc.description.bibliographicCitation Prieto Fontcuberta, JR. (2019). Análisis de Maquetación ("Layout") en imágenes de texto manuscrito mediante Redes Neuronales. http://hdl.handle.net/10251/130017 es_ES
dc.description.accrualMethod TFGM es_ES
dc.relation.pasarela TFGM\113134 es_ES


Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem