Resumen:
|
[ES] Las recientes técnicas de aprendizaje de modelos basadas en aprendizaje profundo
(Deep Learning), en visión por computador, prometen altas tasas de reconocimiento. Pero
el proceso de elaboración de los conjuntos de ...[+]
[ES] Las recientes técnicas de aprendizaje de modelos basadas en aprendizaje profundo
(Deep Learning), en visión por computador, prometen altas tasas de reconocimiento. Pero
el proceso de elaboración de los conjuntos de imágenes de entrenamiento y test, el número
y complejidad de redes que los implementan y el número de parámetros a evaluar
hace difícil su utilización de manera contrastada.
Este trabajo consiste en el desarrollo de una herramienta que asiste a la creación de
esos modelos de aprendizaje profundo cuyos resultados puedan ser empleados para la
puesta en práctica en problemas enfocados a la visión por computador.
El desarrollo de la herramienta ha de permitir al usuario la creación y manipulación
de un conjunto de datos de forma gráfica, la creación y entrenamiento de una red neuronal
convolucional y la posibilidad de probar la efectividad de los diferentes modelos
entrenados. Para la implementación ha sido necesario la utilización de múltiples tecnologías
y la implantación de diferentes comunicaciones entre estas.
Por último se plantea un problema completo de reconocimiento de objetos donde la
herramienta implementada servirá para la resolución de una parte de este. Se ha buscado
un problema con restricciones temporales importantes para estudiar el uso de los reconocedores
y evaluar la necesidad de introducir otras técnicas y mejoras que permitan su uso
en aplicaciones con fuertes restricciones temporales. La segunda parte del problema se
proponen diferentes métodos utilizados en la visión por computador para la detección de
objetos, donde, para cada método utilizado se detalla la implementación y los resultados
obtenidos.
[-]
[CA] Les recents tècniques d’aprenentatge de models basades en aprenentatge profund
(Deep Learning), en visió per computador, prometen altes taxes de reconeixement. Però
el procés d’elaboració dels conjunts d’imatges ...[+]
[CA] Les recents tècniques d’aprenentatge de models basades en aprenentatge profund
(Deep Learning), en visió per computador, prometen altes taxes de reconeixement. Però
el procés d’elaboració dels conjunts d’imatges d’entrenament i test, el nombre i complexitat
de xarxes que els implementen i el nombre de paràmetres a avaluar fa difícil la seva
utilització de manera contrastada.
Aquest treball consisteix en el desenvolupament d’una eina que assisteix a la creació
d’eixos models d’aprenentatge profund on els resultats puguin ser emprats per a la
posada en pràctica en problemes enfocats a la visió per computador.
El desenvolupament de l’eina ha de permetre a l’usuari la creació i manipulació d’un
conjunt de dades de forma gràfica, la creació i entrenament d’una xarxa neuronal convolucional
i la possibilitat de provar l’efectivitat dels diferents models entrenats. Per a la
implementació ha estat necessari la utilització de múltiples tecnologies i la implantació
de diferents comunicacions entre aquestes.
Finalment es planteja un problema complet de reconeixement d’objectes on l’eina implementada
servirà per a la resolució d’una part d’aquest. S’ha buscat un problema amb
restriccions temporals importants per estudiar l’ús dels reconeixedors i avaluar la necessitat
d’introduir altres tècniques i millores que permetin el seu ús en aplicacions amb
fortes restriccions temporals. La segona part del problema es proposen diferents mètodes
utilitzats en la visió per computador per a la detecció d’objectes, on, per a cada mètode
utilitzat es detalla la implementació i els resultats obtinguts.
[-]
[EN] The recent learning techniques of models based on Deep Learning, in computer vision,
promise high recognition rates. But the process of preparing the sets of training and
test images, the number and complexity of ...[+]
[EN] The recent learning techniques of models based on Deep Learning, in computer vision,
promise high recognition rates. But the process of preparing the sets of training and
test images, the number and complexity of the networks that implement them and the
number of parameters to be evaluated make it difficult to use them in a contrasted way.
This work consists of the development of a tool based on deep learning models whose
results can be used for the implementation of problems focused on computer vision.
The development of the tool should allow the user to create and manipulate a set of
data in a graphical way, the creation and training of a convolutional neuronal network
and the possibility of testing the effectiveness of the different trained models. For the
implementation has been necessary the use of multiple technologies and the implementation
of different communications between them.
Finally, there is a complete problem of objects recognition where the implemented
tool will serve for the resolution of a part of it. A problem with important temporal
restrictions has been sought to study the use of recognizers and to evaluate the need to
introduce other techniques and improvements that allow their use in applications with
severe temporal restrictions. The second part of the problem proposes different methods
used in computer vision for the detection of objects, where, for each method used, the
implementation and the results obtained are detailed.
[-]
|