Mostrar el registro sencillo del ítem
dc.contributor.advisor | Vidal Ruiz, Enrique | es_ES |
dc.contributor.advisor | Toselli, Alejandro Héctor | es_ES |
dc.contributor.advisor | Quirós Díaz, Lorenzo | es_ES |
dc.contributor.author | Prieto Fontcuberta, José Ramón | es_ES |
dc.date.accessioned | 2019-10-30T10:42:38Z | |
dc.date.available | 2019-10-30T10:42:38Z | |
dc.date.created | 2019-07-22 | |
dc.date.issued | 2019-10-30 | es_ES |
dc.identifier.uri | http://hdl.handle.net/10251/130017 | |
dc.description.abstract | [ES] Existen grandes colecciones de manuscritos, las cuales contienen información muy valiosa sobre aspectos cruciales de la historia de nuestra sociedad. Existe tal cantidad de documentos que de forma manual se tardarían años, o incluso siglos, en poder extraer toda la información, cuya mayoría es textual. Debido a esto, se trata de utilizar técnicas de maquetación y reconocimiento de texto manuscrito de las imágenes de forma automática a fin de poder comprender mejor, y de manera m´as eficiente, la información que nos proporcionan estas colecciones. Este Trabajo de Fin de Máster se ha centrado en el desarrollo y evaluación de diferentes técnicas de aprendizaje profundo para realizar la maquetación de páginas con alto valor histórico. Por lo que este trabajo gira en torno a dos tareas. La primera, la segmentación de zonas en un corpus del siglo XIV al siglo XIX. Dicho corpus está compuesto mayormente por tablas, habilitando un posterior análisis para permitir realizar consultas estructuradas. La segunda tarea trata de la separación de registros en una colección del siglo XIV al siglo XV dictados por el rey de Francia. Dicha separación ayudaría a la búsqueda de temas concretos de la época, así como posibles sentencias escritas en dichos registros. Además, se ha utilizado la información textual disponible en ambas colecciones para fusionarla con la información gráfica de la página y analizar así su impacto sobre los resultados. Tras experimentar con diferentes arquitecturas de redes convolucionales, se han mejorado los resultados base en una de las tareas. Por otro lado, la información textual extraída del contenido textual de los documentos ha ayudado a obtener mejoras en los resultados en ambas tareas. | es_ES |
dc.description.abstract | [EN] There are large collections of manuscripts which contain very valuable information on crucial aspects of the history of our society. There are such large quantity of documents that it would take years, of even centuries, to manually extract all the information, most of it is textual. Due to this, there are automatic image document layout analysis and handwritten text recognition techniques that helps to get a better understanding –and more efficiently –of the information provided by these collections. This Master Thesis has focused on the development and evaluation of different deep learning techniques to make the layout of pages with high historical value. This work revolves around two tasks. The first one, the zone segmentation in a corpus of the century XIV to the century XIX. This corpus is mostly composed by tables, enabling a subsequent analysis to allow structured queries. The second task deals with the separation of records in a collection of the century XIV to the century XV dictated by the King of France. This separation would help the search for specific issues of the time, as well as possible sentences written in those records. In addition, we have tried to use the textual information available in both collections used for merge this information with the graphic information of the page and checking its impact on the results. We have experimented with different architectures of convolutional networks and the base results have been improved in one of the tasks. It also shows how the extracted textual information helps to obtain improvements in the results in both tasks. | es_ES |
dc.description.abstract | [CA] Existeixen grans col·leccions de manuscrits, els quals contenen informació molt valuosa sobre aspectes crucials de la història de la nostra societat. Existeix tal quantitat de documents que de forma manual trigaríem anys, o inclús segles, en poder extraure tota la informació, on la majoria és textual. A causa d’això, es tracta d’utilitzar tècniques de maquetació i reconeixement de text manuscrit de les imatges de forma automàtica a fi de poder comprendre millor, i de manera més eficient, la informació que proporcionen aquestes col·leccions. Aquest Treball de Fi de Màster s’ha centrat en el desenvolupament i avaluació de diferents tècniques d’aprenentatge profund per a realitzar la maquetació de pàgines amb alt valor històric. Pel que aquest treball gira en torna a dues tasques. La primera, la segmentació de zones en un corpus del segle XIV al segle XIX. Dit corpus està compost majorment per taules, habilitant un posterior anàlisi per permetre realitzar consultes estructurades. La segona tasca tracta de la separació de registres en una col·lecció del segle XIV al segle XV dictats pel rei de França. Dita separació ajudaria a la recerca de temes concrets de l’època, així com possibles sentències escrites en els dits registres. A més, s’ha tractat d’utilitzar la informació textual disponible en ambdues col·leccions fusionant-les amb la informació gràfica de la pàgina i analitzant el seu impacte sobre els resultats. Després d’experimentar amb diferents arquitectures de xarxes convolucionals, s’han trobat millores en els resultats base d’una de les tasques. Per una altra banda, la informació textual extreta ha ajudat a obtenir millores en els resultats d’ambdues tasques. | es_ES |
dc.language | Español | es_ES |
dc.publisher | Universitat Politècnica de València | es_ES |
dc.rights | Reconocimiento - No comercial (by-nc) | es_ES |
dc.subject | Reconocimiento de formas | es_ES |
dc.subject | Procesado de imágenes | es_ES |
dc.subject | Documentos manuscritos | es_ES |
dc.subject | Análisis de maquetación | es_ES |
dc.subject | Redes Neuronales Artificiales | es_ES |
dc.subject | Redes Convolucionales | es_ES |
dc.subject | Aprendizaje profundo | es_ES |
dc.subject | Pattern Recognition | es_ES |
dc.subject | Image Processing | es_ES |
dc.subject | Handwritten Documents | es_ES |
dc.subject | Layout Analysis | es_ES |
dc.subject | Artificial Neural Networks | es_ES |
dc.subject | Convolutional Networks | es_ES |
dc.subject | Deep Learning | es_ES |
dc.subject.classification | ESTADISTICA E INVESTIGACION OPERATIVA | es_ES |
dc.subject.classification | LENGUAJES Y SISTEMAS INFORMATICOS | es_ES |
dc.subject.other | Máster Universitario en Inteligencia Artificial, Reconocimiento de Formas e Imagen Digital-Màster Universitari en Intel·Ligència Artificial: Reconeixement de Formes i Imatge Digital | es_ES |
dc.title | Análisis de Maquetación ("Layout") en imágenes de texto manuscrito mediante Redes Neuronales | es_ES |
dc.type | Tesis de máster | es_ES |
dc.rights.accessRights | Abierto | es_ES |
dc.contributor.affiliation | Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació | es_ES |
dc.description.bibliographicCitation | Prieto Fontcuberta, JR. (2019). Análisis de Maquetación ("Layout") en imágenes de texto manuscrito mediante Redes Neuronales. http://hdl.handle.net/10251/130017 | es_ES |
dc.description.accrualMethod | TFGM | es_ES |
dc.relation.pasarela | TFGM\113134 | es_ES |