- -

Comparación y Evaluación de Modelos Transformer en la Clasificación de Imágenes Médicas del Dataset NIH Chest X-rays

RiuNet: Repositorio Institucional de la Universidad Politécnica de Valencia

Compartir/Enviar a

Citas

Estadísticas

  • Estadisticas de Uso

Comparación y Evaluación de Modelos Transformer en la Clasificación de Imágenes Médicas del Dataset NIH Chest X-rays

Mostrar el registro sencillo del ítem

Ficheros en el ítem

dc.contributor.advisor Paredes Palacios, Roberto es_ES
dc.contributor.author Huallpa Vargas, Yuri Vladimir es_ES
dc.date.accessioned 2023-10-23T07:52:26Z
dc.date.available 2023-10-23T07:52:26Z
dc.date.created 2023-09-21
dc.date.issued 2023-10-23 es_ES
dc.identifier.uri http://hdl.handle.net/10251/198542
dc.description.abstract [ES] Este trabajo de fin de máster se centra en una exhaustiva evaluación y comparación de tres modelos Transformer: ViT, Swin y MaxViT, que fueron preentrenados en ImageNet y adaptados al conjunto de datos médicos NIH Chest X-rays. El objetivo principal es analizar en profundidad el rendimiento de estas arquitecturas en la clasificación de 14 patologías en radiografías de tórax. Se busca una comprensión más detallada explorando métricas clave como el área bajo la curva ROC (AUC), la velocidad de inferencia (Throughput), la cantidad de parámetros y el numero de operaciones aritméticas de punto flotante (FLOPs). Para lograrlo, se establecen objetivos específicos que incluyen una revisión exhaustiva del estado del arte en la clasificación de imágenes y la adaptación de los modelos preentrenados al conjunto de datos médicos. Los modelos se ajustan en cuatro escalas diferentes y se evalúan para tres resoluciones de imagen distintas. La evaluación se realiza en términos de AUC y se compara el rendimiento de cada arquitectura en diversas configuraciones. Además, se realiza un análisis detallado del rendimiento en función del número de parámetros, FLOPs y Throughput, lo que brinda una comprensión más profunda de las capacidades de cada arquitectura. Este trabajo contribuye al campo de la clasificación de imágenes médicas al proporcionar información valiosa sobre el rendimiento de las arquitecturas Transformer en términos de rendimiento y eficiencia computacional. es_ES
dc.description.abstract [EN] This master's thesis focuses on a comprehensive evaluation and comparison of three Transformer models: ViT, Swin and MaxViT, which were pretrained on ImageNet and adapted to the medical dataset NIH Chest X-rays. The main objective is to deeply analyze the performance of these architectures in the classification of 14 pathologies in chest X-ray images. A more detailed understanding is sought by exploring key metrics such as the Area Under the ROC Curve (AUC), inference speed (throughput), the number of parameters, and floating-point arithmetic operations (FLOPs). To achieve this, specific objectives are set, including a comprehensive review of the state of the art in image classification and the adaptation of pretrained models to the medical dataset. The models are fine-tuned at four different scales and evaluated for three different image resolutions. The evaluation is conducted in terms of AUC, and the performance of each architecture is compared under various configurations. Furthermore, a detailed analysis of performance in terms of the number of parameters, FLOPs, and throughput is carried out, providing a deeper understanding of the capabilities of each architecture. This work contributes to the field of medical image classification by providing valuable insights into the performance of Transformer architectures in terms of both performance and computational eficiency. es_ES
dc.format.extent 65 es_ES
dc.language Español es_ES
dc.publisher Universitat Politècnica de València es_ES
dc.rights Reconocimiento (by) es_ES
dc.subject Eficiencia computacional es_ES
dc.subject Evaluación de rendimiento es_ES
dc.subject Clasificación de imágenes médicas es_ES
dc.subject Modelos transformer es_ES
dc.subject Conjunto de Datos NIH Chest X-rays es_ES
dc.subject Medical Image Classification es_ES
dc.subject NIH Chest X-rays Dataset es_ES
dc.subject Computational efficiency es_ES
dc.subject Performance evaluation es_ES
dc.subject Transformer models es_ES
dc.subject.classification LENGUAJES Y SISTEMAS INFORMATICOS es_ES
dc.subject.other Máster Universitario en Inteligencia Artificial, Reconocimiento de Formas e Imagen Digital-Màster Universitari en Intel·ligència Artificial, Reconeixement de Formes i Imatge Digital es_ES
dc.title Comparación y Evaluación de Modelos Transformer en la Clasificación de Imágenes Médicas del Dataset NIH Chest X-rays es_ES
dc.title.alternative Comparison and Evaluation of Transformer Models in the Classification of Medical Images from the NIH Chest X-rays Dataset es_ES
dc.title.alternative Comparació i Avaluació de Models Transformer en la Classificació d'Imatges Mèdiques del Conjunt de Dades de Radiografies Toràciques NIH es_ES
dc.type Tesis de máster es_ES
dc.rights.accessRights Abierto es_ES
dc.contributor.affiliation Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació es_ES
dc.description.bibliographicCitation Huallpa Vargas, YV. (2023). Comparación y Evaluación de Modelos Transformer en la Clasificación de Imágenes Médicas del Dataset NIH Chest X-rays. Universitat Politècnica de València. http://hdl.handle.net/10251/198542 es_ES
dc.description.accrualMethod TFGM es_ES
dc.relation.pasarela TFGM\158190 es_ES


Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem