- -

Adaptación del modelo InSPyRenet para producción

RiuNet: Repositorio Institucional de la Universidad Politécnica de Valencia

Compartir/Enviar a

Citas

Estadísticas

  • Estadisticas de Uso

Adaptación del modelo InSPyRenet para producción

Mostrar el registro sencillo del ítem

Ficheros en el ítem

dc.contributor.advisor Casacuberta Nolla, Francisco es_ES
dc.contributor.advisor Hernández Vicente, Daniel es_ES
dc.contributor.author Sarmiento Tendero, Manuel es_ES
dc.date.accessioned 2024-10-18T15:43:42Z
dc.date.available 2024-10-18T15:43:42Z
dc.date.created 2024-09-23
dc.date.issued 2024-10-18 es_ES
dc.identifier.uri http://hdl.handle.net/10251/210577
dc.description.abstract [CA] Aquest treball de fi de grau se centra en l’optimització i millora d’un model d’intel·ligència artificial anomenat InSPyReNet, que s’utilitza per a la detecció d’objectes destacats en imatges d’alta resolució. L’objectiu principal va ser abordar dos problemes importants: la reducció de la mida i el temps d’inferència en CPU del model per a millorar la seua eficiència computacional, i la millora de la precisió en la detecció d’objectes que ocupen la major part de la imatge, un desafiament identificat en les proves prèvies. Per a aconseguir aquests objectius, es van implementar diverses metodologies, començant amb la reducció del model mitjançant l’eliminació de components prescindibles, seguida de la quantificació del model per a convertir els seus paràmetres de punt flotant a enters, utilitzant eines com el repositori FasterTransformer i Pytorch en mode Eager. A més, es va entrenar el model des de zero amb un dataset modificat i amb tots els datasets amb els quals es va entrenar l’original excepte un que es va modificar. Això es va realitzar per a millorar la precisió en la detecció d’objectes que ocupen quasi tota la imatge. Finalment, es va integrar YOLO, un algorisme de detecció d’objectes en temps real, per a, igual que l’entrenament, millorar la precisió en el mateix problema. Els resultats obtinguts van indicar una millora significativa en l’eficiència del model, amb una reducció del 20% en el temps d’inferència i una millora en la precisió, especialment en les imatges problemàtiques. Aquesta experiència també em va permetre adquirir nous coneixements en el maneig d’eines avançades d’IA, com Pytorch, la quantificació de models i l’ús de transformers visuals. En conclusió, el projecte va complir amb els objectius plantejats i va proporcionar una solució pràctica i efectiva que podria ser implementada en entorns de producció. es_ES
dc.description.abstract [ES] Este trabajo de fin de grado se centra en la optimización y mejora de un modelo de inteligencia artificial llamado InSPyReNet, que se utiliza para la detección de objetos destacados en imágenes de alta resolución. El objetivo principal fue abordar dos problemas importantes: la reducción del tamaño y tiempo de inferencia en CPU del modelo para mejorar su eficiencia computacional, y la mejora de la precisión en la detección de objetos que ocupan la mayor parte de la imagen, un desafío identificado en las pruebas previas. Para lograr estos objetivos, se implementaron diversas metodologías, comenzando con la reducción del modelo mediante la eliminación de componentes prescindibles, seguido de la cuantificación del modelo para convertir sus parámetros de punto flotante a enteros, utilizando herramientas como el repositorio FasterTransformer y Pytorch en modo Eager. Además, se entrenó el modelo desde cero con un dataset modificado y con todos los datasets que se entrenó el original, excepto por uno modificado. Esto se realizó para mejorar la precisión en la detección de objetos que ocupan casi toda la imagen. Finalmente, se integró YOLO, un algoritmo de detección de objetos en tiempo real, para, al igual que el entrenamiento, mejorar la precisión en el mismo problema. Los resultados obtenidos indicaron una mejora significativa en la eficiencia del modelo, con una reducción del 20 % en el tiempo de inferencia y una mejora en la precisión, especialmente en las imágenes conflictivas. Esta experiencia también me permitió adquirir nuevos conocimientos en el manejo de herramientas avanzadas de IA, como Pytorch, la cuantificación de modelos y el uso de transformers visuales. En conclusión, el proyecto cumplió con los objetivos planteados y proporcionó una solución práctica y efectiva que podría ser implementada en entornos de producción es_ES
dc.description.abstract [EN] This final degree project focuses on the optimization and improvement of an artificial intelligence model called InSPyReNet, which is used for detecting prominent objects in high-resolution images. The primary objective was to address two important issues: reducing the model's size and CPU inference time to improve its computational efficiency, and enhancing the accuracy in detecting objects that occupy most of the image, a challenge identified in previous tests. To achieve these objectives, various methodologies were implemented, starting with model reduction by eliminating non-essential components, followed by model quantization to convert its floating-point parameters to integers, using tools such as the FasterTransformer repository and Pytorch in Eager mode. Additionally, the model was trained from scratch using a modified dataset and with all the datasets the original model was trained on, except for one that was modified. This was done to improve accuracy in detecting objects that occupy almost the entire image. Finally, YOLO, a real-time object detection algorithm, was integrated to enhance accuracy in the same problem area as the training. The results obtained showed a significant improvement in the model's efficiency, with a 20\% reduction in inference time and an improvement in accuracy, especially in problematic images. This experience also allowed me to acquire new knowledge in handling advanced AI tools, such as Pytorch, model quantization, and the use of visual transformers. In conclusion, the project met the stated objectives and provided a practical and effective solution that could be implemented in production environments. es_ES
dc.format.extent 67 es_ES
dc.language Español es_ES
dc.publisher Universitat Politècnica de València es_ES
dc.rights Reserva de todos los derechos es_ES
dc.subject Cuantificación es_ES
dc.subject IA es_ES
dc.subject Transformers visuales es_ES
dc.subject Visión por computador es_ES
dc.subject Entrenamiento de modelo es_ES
dc.subject Manipulación de datos es_ES
dc.subject Swin Transformer es_ES
dc.subject InSPyRenet. es_ES
dc.subject Quantification es_ES
dc.subject AI es_ES
dc.subject Visual Transformers es_ES
dc.subject Computer Vision es_ES
dc.subject Model Training es_ES
dc.subject Data Manipulation es_ES
dc.subject PyTorch es_ES
dc.subject Quantificació es_ES
dc.subject Transformadors visuals es_ES
dc.subject Visió per ordinador es_ES
dc.subject Entrenament de model es_ES
dc.subject Manipulació de dades es_ES
dc.subject.other Grado en Ingeniería Informática-Grau en Enginyeria Informàtica es_ES
dc.title Adaptación del modelo InSPyRenet para producción es_ES
dc.title.alternative Adapting the InSPyRenet Model for Production es_ES
dc.title.alternative Adaptació del model INSPyRenet per a producció es_ES
dc.type Proyecto/Trabajo fin de carrera/grado es_ES
dc.rights.accessRights Cerrado es_ES
dc.contributor.affiliation Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació es_ES
dc.contributor.affiliation Universitat Politècnica de València. Escola Tècnica Superior d'Enginyeria Informàtica es_ES
dc.description.bibliographicCitation Sarmiento Tendero, M. (2024). Adaptación del modelo InSPyRenet para producción. Universitat Politècnica de València. http://hdl.handle.net/10251/210577 es_ES
dc.description.accrualMethod TFGM es_ES
dc.relation.pasarela TFGM\163896 es_ES


Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem