Mostrar el registro sencillo del ítem
dc.contributor.advisor | Vergara Domínguez, Luís | es_ES |
dc.contributor.advisor | Salazar Afanador, Addisson | es_ES |
dc.contributor.author | Yu, Cenhua | es_ES |
dc.date.accessioned | 2024-09-26T15:47:43Z | |
dc.date.available | 2024-09-26T15:47:43Z | |
dc.date.created | 2024-04-30 | es_ES |
dc.date.issued | 2024-09-26 | es_ES |
dc.identifier.uri | http://hdl.handle.net/10251/208774 | |
dc.description.abstract | [ES] Este proyecto implementará varias técnicas de aumento de datos de imágenes para su clasificación mediante aprendizaje profundo. Esas técnicas son necesarias cuando la cantidad de muestras de datos etiquetadas disponibles para la capacitación es limitada. La escasez de muestras podría comprender todo el conjunto de datos de entrenamiento o solo algunas de las categorías de datos. Por lo tanto, el aumento de datos tiene como objetivo evitar el sobreajuste y el sesgo de desequilibrio de datos para los clasificadores. En este proyecto, se analizarán conjuntos de datos disponibles públicamente correspondientes a diferentes problemas de clasificación (por ejemplo, diagnóstico médico, reconocimiento de emociones). Se aplicarán transformaciones aleatorias a múltiples imágenes para obtener un conjunto de datos de entrenamiento aumentado. Así, se configurará un conjunto de opciones de preprocesamiento para el aumento de imágenes, como cambio de tamaño, rotación y reflexión. Las transformaciones para el aumento de imágenes incluirán lo siguiente: deformación aleatoria de la imagen; recortar; colores; ruido sintético y desenfoque sintético. Se implementarán diferentes esquemas de redes neuronales convolucionales (CNN); aunque también se podrían aplicar otro tipo de técnicas de aprendizaje profundo. Se compararán los resultados de diferentes esquemas de clasificación de aprendizaje profundo incluyendo o no una etapa de aumento de datos con los obtenidos por clasificadores clásicos. La calidad de los resultados de clasificación se evaluará mediante índices como precisión, precisión equilibrada, matriz de confusión, Además, el coste computacional de los distintos casos de clasificación, la varianza de los resultados y las curvas de característica operativa del receptor (ROC) (en el caso de clasificación de dos clases) será estimada y discutida. | es_ES |
dc.description.abstract | [EN] This project will implement several techniques of image data augmentation for classification using deep learning. Those techniques are required when the number of labeled data samples available for training is limited. The scarcity of the samples could comprise all the training dataset or only some of the data categories. Thus, data augmentation is intended to avoid overfitting and data unbalance bias for the classifiers. In this project, publicly available datasets corresponding to different classification problems (e.g., medical diagnosis, emotion recognition) will be analyzed. Random transformations to multiple images will be applied to obtain an augmented training dataset. Thus, a set of preprocessing options for image augmentation, such as resizing, rotation, and reflection will be configured. The transformations for image augmentation will include the following: random image warping; cropping; colors; synthetic noise, and synthetic blur. Different schemes of convolutional neural networks (CNNs) will be implemented; although other kind of deep learning techniques also could be applied. The results of different schemes of deep learning classification including or not a data augmentation stage will be compared with the ones obtained by classical classifiers. The quality of classification results will be evaluated using indices such as accuracy, balanced accuracy, confusion matrix, Besides, computational cost of the different cases of classification, variance of the results, and receiver operating characteristic (ROC) curves (in the case of two-class classification) will be estimated and discussed. | en_EN |
dc.format.extent | 72 | es_ES |
dc.language | Inglés | es_ES |
dc.publisher | Universitat Politècnica de València | es_ES |
dc.rights | Reserva de todos los derechos | es_ES |
dc.subject | Aumento de datos | es_ES |
dc.subject | Aprendizaje profundo | es_ES |
dc.subject | Clasificación | es_ES |
dc.subject | Procesamiento de imágenes | es_ES |
dc.subject | Aprendizaje máquina | es_ES |
dc.subject | Data augmentation | en_EN |
dc.subject | Deep learning | en_EN |
dc.subject | Classification | en_EN |
dc.subject | Image processing | en_EN |
dc.subject | Machine learning | en_EN |
dc.subject.classification | TEORÍA DE LA SEÑAL Y COMUNICACIONES | es_ES |
dc.subject.other | Grado en Ingeniería de Tecnologías y Servicios de Telecomunicación-Grau en Enginyeria de Tecnologies i Serveis de Telecomunicació | es_ES |
dc.title | A Study on Image Data Augmentation for Classification Based on Deep Learning | es_ES |
dc.title.alternative | Un estudio sobre el aumento de datos de imágenes para la clasificación basada en el aprendizaje profundo | es_ES |
dc.title.alternative | Un estudi sobre l'augment de dades d'imatges per a la classificació basada en l'aprenentatge profun | es_ES |
dc.type | Proyecto/Trabajo fin de carrera/grado | es_ES |
dc.rights.accessRights | Abierto | es_ES |
dc.contributor.affiliation | Universitat Politècnica de València. Departamento de Comunicaciones - Departament de Comunicacions | es_ES |
dc.contributor.affiliation | Universitat Politècnica de València. Escuela Técnica Superior de Ingenieros de Telecomunicación - Escola Tècnica Superior d'Enginyers de Telecomunicació | es_ES |
dc.description.bibliographicCitation | Yu, C. (2024). A Study on Image Data Augmentation for Classification Based on Deep Learning. Universitat Politècnica de València. http://hdl.handle.net/10251/208774 | es_ES |
dc.description.accrualMethod | TFGM | es_ES |
dc.relation.pasarela | TFGM\162799 | es_ES |