Resumen:
|
[ES] La motivación de este trabajo radica en la importancia de mejorar la precisión y eficiencia en la generación automática de informes de radiología, un proceso que puede agilizar el diagnóstico y tratamiento de los ...[+]
[ES] La motivación de este trabajo radica en la importancia de mejorar la precisión y eficiencia en la generación automática de informes de radiología, un proceso que puede agilizar el diagnóstico y tratamiento de los pacientes, así como reducir la carga de trabajo de los médicos. Utilizaremos el dataset MIMIC-CXR, el cual contiene radiografías de pacientes y sus respectivos informes médicos para entrenar el modelo. La tarea específica consiste en generar informes detallados y precisos a partir de imágenes radiológicas utilizando un modelo VED (Vision Encoder Decoder). El objetivo principal de este trabajo es mejorar el rendimiento del modelo de generación de informes de radiología mencionado, aplicando técnicas como el text augmentation sobre el dataset mediante el uso de la API de ChatGPT. La estructura del trabajo se enfocará primero en intentar mejorar las prestaciones del modelo mediante diversas técnicas y, posteriormente, comparar las métricas obtenidas con el estado del arte actual, con el fin de evaluar la efectividad de los métodos implementados y determinar posibles avances en el campo.
[-]
[EN] The motivation of this work lies in the importance of improving the accuracy and efficiency in the automatic generation of radiology reports, a process that can speed up the diagnosis and treatment of patients, as ...[+]
[EN] The motivation of this work lies in the importance of improving the accuracy and efficiency in the automatic generation of radiology reports, a process that can speed up the diagnosis and treatment of patients, as well as reduce the workload of physicians. We will use the MIMIC-CXR dataset, which contains patient x-rays and their respective medical reports, to train the model. The specific task is to generate detailed and accurate reports from radiological images using a VED (Vision Encoder Decoder) model. The main objective of this work is to improve the performance of the mentioned radiology report generation model, applying techniques such as text augmentation on the dataset by using the OpenAI API. The structure of the work will first focus on trying to improve the performance of the model through various techniques and, subsequently, compare the obtained metrics with the current state of the art, in order to evaluate the effectiveness of the implemented methods and determine possible advances in the field.
[-]
|