Resumen:
|
[ES] En el campo del aprendizaje profundo (Deep Learning), la clasificación de imágenes es una de las tareas más exploradas. Asimismo, dentro de esta tarea hay un subdominio cuya principal característica es la dificultad ...[+]
[ES] En el campo del aprendizaje profundo (Deep Learning), la clasificación de imágenes es una de las tareas más exploradas. Asimismo, dentro de esta tarea hay un subdominio cuya principal característica es la dificultad de distinguir las clases ya que éstas son difícilmente distinguibles entre si (especies de pájaros, flores, animales o tipo de vehículos entre otros). En este trabajo se propone un estudio en la clasificación de vehículos al nivel específico de modelo. Para este fin, se utiliza el conjunto de datos de Cars196 o también llamado Standford Cars, y se entrenan redes neuronales profundas analizando distintas configuraciones de arquitecturas (ResNet, DenseNet, EfficientNet y Vit) con sus pesos pre-entrenados, así como diferentes técnicas de preprocesado de imágenes. También se estudia el efecto de distintas funciones de pérdida, así como distintas estrategias y configuración de valores de ratio de aprendizaje (learning rate). La precisión de los modelos obtenidos se acerca a los valores de los últimos trabajos publicados que abordan el problema de la detección automática del modelo de vehículo.
[-]
[EN] In the field of deep learning, image classification is one of the most explored tasks. Likewise, within this task there is a subdomain whose main characteristic is the difficulty of distinguishing the classes since ...[+]
[EN] In the field of deep learning, image classification is one of the most explored tasks. Likewise, within this task there is a subdomain whose main characteristic is the difficulty of distinguishing the classes since they are difficult to distinguish from each other (species of birds, flowers, animals or types of vehicles, among others). In this work, a study is proposed on the classification of vehicles at the specific model level. For this purpose, the dataset of Cars196 or also called Standford Cars is used, and deep neural networks are trained analyzing different architectures configurations (ResNet, DenseNet, EfficientNet and Vit) with their pre-trained weights, as well as different techniques of image preprocessing. The effect of different loss functions is also studied, as well as different strategies and configuration of learning rate values. The accuracy of the obtained models is close to the values of the latest published works that address the problem of automatic vehicle model detection.
[-]
|