Resumen:
|
[CA] Les tècniques d’aprenentatge profund han revolucionat la visió per computador i, en particular, la classificació d’imatges. Es proposa comparar tècniques
d’aprenentatge profund per a la classificació i anàlisi d’imatges ...[+]
[CA] Les tècniques d’aprenentatge profund han revolucionat la visió per computador i, en particular, la classificació d’imatges. Es proposa comparar tècniques
d’aprenentatge profund per a la classificació i anàlisi d’imatges de peces de roba.
Entre d’altres, es vol fer ús del conjunt de dades Deep Fashion 2, publicat el 2019
en un congrés internacional de gran prestigi en visió per computador. Aquest
conjunt de dades conté vora mig milió d’imatges de 13 categories de roba populars, tant comercials com d’usuaris. A més de categories, les imatges de Deep
Fashion 2 estan anotades amb caixes d’inclusió mínima, punts de referència, màscares a nivell de píxel, etc. Encara que es pretén centrar-se en el problema de la
classificació d’imatges, es considerarà també la possibilitat de comparar tècniques
per a problemes relacionats, com ara la recuperació d’imatges semblants a una de
referència, o la segmentació de peces de roba. Després d’intentar reproduir els
experiments de DeepFashion2, ens adonem que no hi ha prou capacitat computacional per a reproduir el mateix experiment, i per fer els experiments caldrà
fer-los reduïts. Com al reduir la grandària del conjunt de dades resulta en uns resultats considerablement pitjors, ens assegurem que la quantitat d’imatges afecta
en el resultat. També utilitzem un model més actual per a realitzar experiments
amb el dataset DeepFashion2 i analitzem com resulta en una millora respecte del
resultat original.
[-]
[ES] Las técnicas de aprendizaje profundo han revolucionado la visión por computador y, en particular, la clasificación de imágenes. Se propone comparar técnicas
de aprendizaje profundo para la clasificación y análisis ...[+]
[ES] Las técnicas de aprendizaje profundo han revolucionado la visión por computador y, en particular, la clasificación de imágenes. Se propone comparar técnicas
de aprendizaje profundo para la clasificación y análisis de imágenes de prendas
de ropa. Entre otros, se quiere hacer uso del conjunto de datos Deep Fashion 2,
publicado el 2019 en un congreso internacional de gran prestigio en visión por
computador. Este conjunto de datos contiene aproximadamente medio millón de
imágenes de 13 categorías de ropa populares, tanto comerciales como de usuarios. Además de categorías, las imágenes de Deep Fashion 2 están anotadas con
cajas de inclusión mínima, puntos de referencia, máscaras a nivel de píxel, etc.
Aunque se pretende centrarse en el problema de la clasificación de imágenes, se
considerará también la posibilidad de comparar técnicas para problemas relacionados, como por ejemplo la recuperación de imágenes parecidas a una de referencia, o la segmentación de prendas de ropa. Después de intentar reproducir los
experimentos de DeepFashion2, nos damos cuenta de que no hay suficiente capacidad computacional para reproducir el mismo experimento, y para realizar los
experimentos habrá que hacerlos reducidos. Como al reducir el tamaño del conjunto de datos resulta en unos resultados considerablemente peores, nos aseguramos de que la cantidad de imágenes afecta al resultado. También utilizamos un modelo más actual para llevar a cabo experimentos con el dataset DeepFashion2
y analizamos cómo resulta en una mejora respecto al resultado original.
[-]
[EN] Deep learning techniques have revolutionized computer vision and, in particular, image classification. We propose to compare deep learning techniques for the classification and analysis of clothing items. Among others, ...[+]
[EN] Deep learning techniques have revolutionized computer vision and, in particular, image classification. We propose to compare deep learning techniques for the classification and analysis of clothing items. Among others, we want to make use of the Deep Fashion 2 dataset, published in 2019 at a prestigious international congress on computer vision. This dataset contains approximately half a million images of 13 popular clothing categories, both commercial and user images. In addition to categories, the images in Deep Fashion 2 are annotated with Bounding boxes, landmarks, pixel-level masks, etc. Although the focus is intended to be on the problem of image classification, we will also consider comparing techniques for related problems, such as the retrieval of images that are similar to a reference image, or clothing segmentation. After trying to reproduce the DeepFashion2 experiments, we realize that there is not enough computational capacity to reproduce the same experiment, and to perform the experiments, we will have to make them smaller. Since checking that reducing the size of the dataset results in considerably worse results, we make sure that the number of images affects the result. We then use a more current model to perform experiments with the dataset DeepFashion2 and we analyze how it results in an improvement over the original result.
[-]
|