Resumen:
|
[CA] Aquest treball de fi de grau se centra en l’optimització i millora d’un model d’intel·ligència artificial anomenat InSPyReNet, que s’utilitza per a la detecció d’objectes
destacats en imatges d’alta resolució. ...[+]
[CA] Aquest treball de fi de grau se centra en l’optimització i millora d’un model d’intel·ligència artificial anomenat InSPyReNet, que s’utilitza per a la detecció d’objectes
destacats en imatges d’alta resolució. L’objectiu principal va ser abordar dos problemes importants: la reducció de la mida i el temps d’inferència en CPU del model per a
millorar la seua eficiència computacional, i la millora de la precisió en la detecció d’objectes que ocupen la major part de la imatge, un desafiament identificat en les proves
prèvies.
Per a aconseguir aquests objectius, es van implementar diverses metodologies, començant amb la reducció del model mitjançant l’eliminació de components prescindibles, seguida de la quantificació del model per a convertir els seus paràmetres de punt
flotant a enters, utilitzant eines com el repositori FasterTransformer i Pytorch en mode
Eager. A més, es va entrenar el model des de zero amb un dataset modificat i amb tots
els datasets amb els quals es va entrenar l’original excepte un que es va modificar. Això
es va realitzar per a millorar la precisió en la detecció d’objectes que ocupen quasi tota la imatge. Finalment, es va integrar YOLO, un algorisme de detecció d’objectes en
temps real, per a, igual que l’entrenament, millorar la precisió en el mateix problema.
Els resultats obtinguts van indicar una millora significativa en l’eficiència del model, amb una reducció del 20% en el temps d’inferència i una millora en la precisió,
especialment en les imatges problemàtiques. Aquesta experiència també em va permetre adquirir nous coneixements en el maneig d’eines avançades d’IA, com Pytorch,
la quantificació de models i l’ús de transformers visuals. En conclusió, el projecte va
complir amb els objectius plantejats i va proporcionar una solució pràctica i efectiva
que podria ser implementada en entorns de producció.
[-]
[ES] Este trabajo de fin de grado se centra en la optimización y mejora de un modelo de inteligencia artificial llamado InSPyReNet, que se utiliza para la detección de objetos destacados en imágenes de alta resolución. El ...[+]
[ES] Este trabajo de fin de grado se centra en la optimización y mejora de un modelo de inteligencia artificial llamado InSPyReNet, que se utiliza para la detección de objetos destacados en imágenes de alta resolución. El objetivo principal fue abordar dos problemas importantes: la reducción del tamaño y tiempo de inferencia en CPU del modelo para mejorar su eficiencia computacional, y la mejora de la precisión en la detección de objetos que ocupan la mayor parte de la imagen, un desafío identificado en las pruebas previas.
Para lograr estos objetivos, se implementaron diversas metodologías, comenzando con la reducción del modelo mediante la eliminación de componentes prescindibles, seguido de la cuantificación del modelo para convertir sus parámetros de punto flotante a enteros, utilizando herramientas como el repositorio FasterTransformer y Pytorch en modo Eager. Además, se entrenó el modelo desde cero con un dataset modificado y con todos los datasets que se entrenó el original, excepto por uno modificado. Esto se realizó para mejorar la precisión en la detección de objetos que ocupan casi toda la imagen. Finalmente, se integró YOLO, un algoritmo de detección de objetos en tiempo real, para, al igual que el entrenamiento, mejorar la precisión en el mismo problema.
Los resultados obtenidos indicaron una mejora significativa en la eficiencia del modelo, con una reducción del 20 % en el tiempo de inferencia y una mejora en la precisión, especialmente en las imágenes conflictivas. Esta experiencia también me permitió adquirir nuevos conocimientos en el manejo de herramientas avanzadas de IA, como Pytorch, la cuantificación de modelos y el uso de transformers visuales. En conclusión, el proyecto cumplió con los objetivos planteados y proporcionó una solución práctica y efectiva que podría ser implementada en entornos de producción
[-]
[EN] This final degree project focuses on the optimization and improvement of an artificial intelligence model called InSPyReNet, which is used for detecting prominent objects in high-resolution images. The primary objective ...[+]
[EN] This final degree project focuses on the optimization and improvement of an artificial intelligence model called InSPyReNet, which is used for detecting prominent objects in high-resolution images. The primary objective was to address two important issues: reducing the model's size and CPU inference time to improve its computational efficiency, and enhancing the accuracy in detecting objects that occupy most of the image, a challenge identified in previous tests.
To achieve these objectives, various methodologies were implemented, starting with model reduction by eliminating non-essential components, followed by model quantization to convert its floating-point parameters to integers, using tools such as the FasterTransformer repository and Pytorch in Eager mode. Additionally, the model was trained from scratch using a modified dataset and with all the datasets the original model was trained on, except for one that was modified. This was done to improve accuracy in detecting objects that occupy almost the entire image. Finally, YOLO, a real-time object detection algorithm, was integrated to enhance accuracy in the same problem area as the training.
The results obtained showed a significant improvement in the model's efficiency, with a 20\% reduction in inference time and an improvement in accuracy, especially in problematic images. This experience also allowed me to acquire new knowledge in handling advanced AI tools, such as Pytorch, model quantization, and the use of visual transformers. In conclusion, the project met the stated objectives and provided a practical and effective solution that could be implemented in production environments.
[-]
|