Análisis de Maquetación ("Layout") en imágenes de texto manuscrito mediante Redes Neuronales

Prieto Fontcuberta, José Ramón

RiuNet repositorio UPV
:
Docencia
:
Trabajos académicos
:
Servicio de alumnado - Trabajos académicos
:
Ver ítem

Identificarse

Buscar en RiuNet

Listar

Todo RiuNet
Esta colección

Mi cuenta

Acceder

Estadísticas

Ver Estadísticas de uso

Ayuda RiuNet

Admin. UPV

Compartir/Enviar a

Citas

Estadísticas

Análisis de Maquetación ("Layout") en imágenes de texto manuscrito mediante Redes Neuronales

Mostrar el registro sencillo del ítem

Ficheros en el ítem

Nombre: Prieto - Análisis ...

Tamaño: 28.76Mb

Formato: PDF

Abrir

dc.contributor.advisor	Vidal Ruiz, Enrique	es_ES
dc.contributor.advisor	Toselli, Alejandro Héctor	es_ES
dc.contributor.advisor	Quirós Díaz, Lorenzo	es_ES
dc.contributor.author	Prieto Fontcuberta, José Ramón	es_ES
dc.date.accessioned	2019-10-30T10:42:38Z
dc.date.available	2019-10-30T10:42:38Z
dc.date.created	2019-07-22
dc.date.issued	2019-10-30	es_ES
dc.identifier.uri	http://hdl.handle.net/10251/130017
dc.description.abstract	[ES] Existen grandes colecciones de manuscritos, las cuales contienen información muy valiosa sobre aspectos cruciales de la historia de nuestra sociedad. Existe tal cantidad de documentos que de forma manual se tardarían años, o incluso siglos, en poder extraer toda la información, cuya mayoría es textual. Debido a esto, se trata de utilizar técnicas de maquetación y reconocimiento de texto manuscrito de las imágenes de forma automática a fin de poder comprender mejor, y de manera m´as eficiente, la información que nos proporcionan estas colecciones. Este Trabajo de Fin de Máster se ha centrado en el desarrollo y evaluación de diferentes técnicas de aprendizaje profundo para realizar la maquetación de páginas con alto valor histórico. Por lo que este trabajo gira en torno a dos tareas. La primera, la segmentación de zonas en un corpus del siglo XIV al siglo XIX. Dicho corpus está compuesto mayormente por tablas, habilitando un posterior análisis para permitir realizar consultas estructuradas. La segunda tarea trata de la separación de registros en una colección del siglo XIV al siglo XV dictados por el rey de Francia. Dicha separación ayudaría a la búsqueda de temas concretos de la época, así como posibles sentencias escritas en dichos registros. Además, se ha utilizado la información textual disponible en ambas colecciones para fusionarla con la información gráfica de la página y analizar así su impacto sobre los resultados. Tras experimentar con diferentes arquitecturas de redes convolucionales, se han mejorado los resultados base en una de las tareas. Por otro lado, la información textual extraída del contenido textual de los documentos ha ayudado a obtener mejoras en los resultados en ambas tareas.	es_ES
dc.description.abstract	[EN] There are large collections of manuscripts which contain very valuable information on crucial aspects of the history of our society. There are such large quantity of documents that it would take years, of even centuries, to manually extract all the information, most of it is textual. Due to this, there are automatic image document layout analysis and handwritten text recognition techniques that helps to get a better understanding –and more efficiently –of the information provided by these collections. This Master Thesis has focused on the development and evaluation of different deep learning techniques to make the layout of pages with high historical value. This work revolves around two tasks. The first one, the zone segmentation in a corpus of the century XIV to the century XIX. This corpus is mostly composed by tables, enabling a subsequent analysis to allow structured queries. The second task deals with the separation of records in a collection of the century XIV to the century XV dictated by the King of France. This separation would help the search for specific issues of the time, as well as possible sentences written in those records. In addition, we have tried to use the textual information available in both collections used for merge this information with the graphic information of the page and checking its impact on the results. We have experimented with different architectures of convolutional networks and the base results have been improved in one of the tasks. It also shows how the extracted textual information helps to obtain improvements in the results in both tasks.	es_ES
dc.description.abstract	[CA] Existeixen grans col·leccions de manuscrits, els quals contenen informació molt valuosa sobre aspectes crucials de la història de la nostra societat. Existeix tal quantitat de documents que de forma manual trigaríem anys, o inclús segles, en poder extraure tota la informació, on la majoria és textual. A causa d’això, es tracta d’utilitzar tècniques de maquetació i reconeixement de text manuscrit de les imatges de forma automàtica a fi de poder comprendre millor, i de manera més eficient, la informació que proporcionen aquestes col·leccions. Aquest Treball de Fi de Màster s’ha centrat en el desenvolupament i avaluació de diferents tècniques d’aprenentatge profund per a realitzar la maquetació de pàgines amb alt valor històric. Pel que aquest treball gira en torna a dues tasques. La primera, la segmentació de zones en un corpus del segle XIV al segle XIX. Dit corpus està compost majorment per taules, habilitant un posterior anàlisi per permetre realitzar consultes estructurades. La segona tasca tracta de la separació de registres en una col·lecció del segle XIV al segle XV dictats pel rei de França. Dita separació ajudaria a la recerca de temes concrets de l’època, així com possibles sentències escrites en els dits registres. A més, s’ha tractat d’utilitzar la informació textual disponible en ambdues col·leccions fusionant-les amb la informació gràfica de la pàgina i analitzant el seu impacte sobre els resultats. Després d’experimentar amb diferents arquitectures de xarxes convolucionals, s’han trobat millores en els resultats base d’una de les tasques. Per una altra banda, la informació textual extreta ha ajudat a obtenir millores en els resultats d’ambdues tasques.	es_ES
dc.language	Español	es_ES
dc.publisher	Universitat Politècnica de València	es_ES
dc.rights	Reconocimiento - No comercial (by-nc)	es_ES
dc.subject	Reconocimiento de formas	es_ES
dc.subject	Procesado de imágenes	es_ES
dc.subject	Documentos manuscritos	es_ES
dc.subject	Análisis de maquetación	es_ES
dc.subject	Redes Neuronales Artificiales	es_ES
dc.subject	Redes Convolucionales	es_ES
dc.subject	Aprendizaje profundo	es_ES
dc.subject	Pattern Recognition	es_ES
dc.subject	Image Processing	es_ES
dc.subject	Handwritten Documents	es_ES
dc.subject	Layout Analysis	es_ES
dc.subject	Artificial Neural Networks	es_ES
dc.subject	Convolutional Networks	es_ES
dc.subject	Deep Learning	es_ES
dc.subject.classification	ESTADISTICA E INVESTIGACION OPERATIVA	es_ES
dc.subject.classification	LENGUAJES Y SISTEMAS INFORMATICOS	es_ES
dc.subject.other	Máster Universitario en Inteligencia Artificial, Reconocimiento de Formas e Imagen Digital-Màster Universitari en Intel·Ligència Artificial: Reconeixement de Formes i Imatge Digital	es_ES
dc.title	Análisis de Maquetación ("Layout") en imágenes de texto manuscrito mediante Redes Neuronales	es_ES
dc.type	Tesis de máster	es_ES
dc.rights.accessRights	Abierto	es_ES
dc.contributor.affiliation	Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació	es_ES
dc.description.bibliographicCitation	Prieto Fontcuberta, JR. (2019). Análisis de Maquetación ("Layout") en imágenes de texto manuscrito mediante Redes Neuronales. http://hdl.handle.net/10251/130017	es_ES
dc.description.accrualMethod	TFGM	es_ES
dc.relation.pasarela	TFGM\113134	es_ES

Este ítem aparece en la(s) siguiente(s) colección(ones)

Servicio de alumnado - Trabajos académicos [7391]

Mostrar el registro sencillo del ítem

Análisis de Maquetación ("Layout") en imágenes de texto manuscrito mediante Redes Neuronales

RiuNet: Repositorio Institucional de la Universidad Politécnica de Valencia

Buscar en RiuNet

Listar

Todo RiuNet

Esta colección

Mi cuenta

Estadísticas

Ayuda RiuNet

Admin. UPV

Compartir/Enviar a

Citas

Estadísticas

Análisis de Maquetación ("Layout") en imágenes de texto manuscrito mediante Redes Neuronales

Ficheros en el ítem

Este ítem aparece en la(s) siguiente(s) colección(ones)