Resumen:
|
[CA] En l’actualitat, comptem amb una gran col·lecció de documents manuscrits a a nivell mundial que emmagatzemen informació valuosa. Gràcies als avanços tecnològics en el camp de la Intel·ligència Artificial, disposem de ...[+]
[CA] En l’actualitat, comptem amb una gran col·lecció de documents manuscrits a a nivell mundial que emmagatzemen informació valuosa. Gràcies als avanços tecnològics en el camp de la Intel·ligència Artificial, disposem de les ferramentes necessàries per poder portar a cap l’extracció d’aquesta informació. Aquests projecte es centra en l’estudi sobre les diferents tècniques que es poden utilitzar, així comenlacorrecta elecció de les arquitectures utilitzades, la qual cosa pot suposar una gran impacte pel que fa a la qualitat de la informació que s’obté, però, sobre tot, pel que fa a l’eficiència en relació a recursos i costs. Al llarg d’aquest treball s’utilitzaren diferents tècniques d’aprenentatge profund. Per una part, es va realitzar un estudi de l’impacte dels paràmetres de les xarxes neuronals sobre l’eficiència d’aquestes. Seguidament, amb els resultats que es vanobtindre d’aquest estudi, es van provar arquitectures de xarxes neuronals convolucionals alternatives a les ja utilitzades, amb la finalitat de millorar el rendiment del’arquitectura Mask R-CNN enles tasques desegmentació i detecció d’objectes. Per a la realització dels experiments es va utilitzar un corpus d’imatges dedocumentsmanuscritsmusicals. Elsresultats obtinguts en els experiments es van comparar, amb els obtinguts pel meu company Lorenzo Quirós a la seua Tesis Doctoral
[-]
[ES] En la actualidad, contamos con una gran colección de documentos manuscritos a nivel mundial que encierran información valiosa. Gracias a los avances en el campo de la Inteligencia Artificial, disponemos de las ...[+]
[ES] En la actualidad, contamos con una gran colección de documentos manuscritos a nivel mundial que encierran información valiosa. Gracias a los avances en el campo de la Inteligencia Artificial, disponemos de las herramientas necesarias para poder llevar a cabo la extracción de dicha información. Este proyecto se centra en el estudio sobre las diferentes técnicas que se pueden utilizar, así como en la correcta elección de las arquitecturas empleadas, lo que puede suponer ungran impacto en cuanto a la calidad de la información que se obtiene, pero, sobretodo, en cuanto a eficiencia en relación a recursos y costes. Alo largo de este trabajo se utilizaron diferentes técnicas de aprendizaje profundo. Por una parte, se realizó un estudio del impacto de los parámetros de las redes neuronales sobre la eficiencia de estas. Seguidamente, con los resultados que se obtuvieron de este estudio, se probaron arquitecturas de redes neuronales convolucionales alternativas a las ya utilizadas, con la finalidad de mejorar el rendimiento de la arquitectura Mask R-CNN en las tareas de segmentación y detección de objetos. Para la realización de los experimentos se utilizó un corpus de imágenes de documentos manuscritos musicales. Los resultados obtenidos en los experimentos se compararon con los obtenidos por mi compañero Lorenzo Quirós en su Tesis Doctoral.
[-]
[EN] Nowadays, we have a large collection of handwritten documents worldwide, which contain valuable information. As a result of the techonological advances made in the field of Arfificial Intelligence, we have the crucial ...[+]
[EN] Nowadays, we have a large collection of handwritten documents worldwide, which contain valuable information. As a result of the techonological advances made in the field of Arfificial Intelligence, we have the crucial tools to carry out the extraction of such information. This project focuses on the study of the different techniques that can be used, as well as on the correct choice of the architectures put into practice, which can have a great impact concerning the quality of the information acquired, but, above all, concerning the efficiency in regard to resources and costs. Throughout this work, different deep learning techniques were used. On the one hand, it was done an study of the impact of the neural networks parameters ontheefficiency of them. Then, with the results obtained from this study, alternative convolutional neural network architectures were tested to those already used with the aim of improving the performance of the Mask R-CNN architecture in segmentation and object detection tasks. In order to perform the experiments, it was used a corpus of images of musical manuscript documents. The results obtained in the experiments were compared with those obtained by my colleague Lorenzo Quirós in his doctoral thesis.
[-]
|