- -

Investigación de sistemas de almacenamiento big data como apoyo a la generación de analíticas y modelos de aprendizaje automático en imagen médica.

RiuNet: Repositorio Institucional de la Universidad Politécnica de Valencia

Compartir/Enviar a

Citas

Estadísticas

  • Estadisticas de Uso

Investigación de sistemas de almacenamiento big data como apoyo a la generación de analíticas y modelos de aprendizaje automático en imagen médica.

Mostrar el registro sencillo del ítem

Ficheros en el ítem

dc.contributor.advisor Bosch Roig, Ignacio es_ES
dc.contributor.advisor Gomis Maya, Armando es_ES
dc.contributor.author Serra Gil, Jaime es_ES
dc.coverage.spatial east=-0.3760242462158203; north=39.443484498699114; name=Entrada Xufero, 5, 46026 València, Valencia, Espanya es_ES
dc.date.accessioned 2023-07-26T14:45:07Z
dc.date.available 2023-07-26T14:45:07Z
dc.date.created 2023-07-21 es_ES
dc.date.issued 2023-07-26 es_ES
dc.identifier.uri http://hdl.handle.net/10251/195554
dc.description.abstract [ES] Los sistemas de almacenamiento de imagen médica empleados en los hospitales (PACS) no han sido diseñados teniendo en cuenta la creación de herramientas analíticas o de aprendizaje automático, lo que hace que presenten ciertas limitaciones que dificultan el proceso de trabajo, dando lugar a que sea poco eficiente y automatizable. El auge del big data ha supuesto el surgimiento de nuevos sistemas de almacenamiento y herramientas de procesado de datos que agilizan las tareas analíticas y de aprendizaje automático con cualquier tipo de datos. Tanto en datos no estructurados (imágenes, video, audio, ¿) como en datos tabulados. Es por ello, que el objetivo del presente proyecto consiste en realizar una investigación comparativa de tecnologías big data para la creación de un repositorio de imagen médica que sea capaz de agilizar y facilitar el proceso de trabajo para los nuevos perfiles profesionales basados en datos que están surgiendo. Para el desarrollo del presente trabajo se han definido una serie de aproximaciones que son de interés comparativo para el estudio. Sin embargo, se abre la puerta a expandir la comparativa con nuevas tecnologías según inquietudes del alumno. Las tareas de interés iniciales para el trabajo son las siguientes: - Creación de un repositorio de prueba para el almacenamiento de imágenes utilizando herramientas del ecosistema hadoop (hdfs e hive). - Creación de un repositorio de prueba para el almacenamiento de imágenes empleando un sistema tipo s3 (minio, ceph, etc). - Generación de tablas con información enriquecida que permita la rápida identificación y filtrado de las imágenes médicas deseadas. Se comparará el rendimiento de sistemas de BBDDs tabulares como postgres frente al almacenamiento de archivos tabulares tipo data lake (orc, parquet, ¿) - Comparativa de tiempos de ejecución y requerimientos de almacenamiento para un caso de uso de analítica, teniendo en cuenta varias herramientas de procesado de datos como Spark o Trino en los repositorios de prueba anteriormente descritos. es_ES
dc.description.abstract [EN] The medical image storage systems used in hospitals (PACS) have not been designed with the creation of analytical or machine learning tools in mind, which means that they have certain limitations that hinder the work process, making it inefficient and difficult to automate. The rise of big data has led to the emergence of new storage systems and data processing tools that speed up analytical and machine learning tasks with any type of data. Both in unstructured data (images, video, audio, ...) and tabulated data. For this reason, the aim of this project is to carry out a comparative investigation of big data technologies for the creation of a medical image repository that is capable of speeding up and facilitating the work process for the new professional profiles based on data that are emerging. For the development of this work, a series of approaches have been defined that are of comparative interest for the study. However, the door is open to expand the comparative with new technologies according to the student's concerns. The initial tasks of interest for the work are as follows: - Creation of a test repository for image storage using tools from the hadoop ecosystem (hdfs and hive). - Creation of a test repository for image storage using an s3 type system (minio, ceph, etc). - Generation of tables with enriched information to allow rapid identification and filtering of the desired medical images. The performance of tabular DB systems such as postgres will be compared with the storage of tabular data lake files (orc, parquet, ...). - Comparison of execution times and storage requirements for an analytics use case, taking into account various data processing tools such as Spark or Trino in the test repositories described above. en_EN
dc.format.extent 42 es_ES
dc.language Español es_ES
dc.publisher Universitat Politècnica de València es_ES
dc.rights Reserva de todos los derechos es_ES
dc.subject Big data es_ES
dc.subject Aprendizaje automático es_ES
dc.subject Imagen médica es_ES
dc.subject Analítica es_ES
dc.subject Sistemas de almacenamiento. es_ES
dc.subject Machine learning en_EN
dc.subject Medical imaging en_EN
dc.subject Analytics en_EN
dc.subject Storage systems. en_EN
dc.subject.classification TEORÍA DE LA SEÑAL Y COMUNICACIONES es_ES
dc.subject.other Grado en Ingeniería de Tecnologías y Servicios de Telecomunicación-Grau en Enginyeria de Tecnologies i Serveis de Telecomunicació es_ES
dc.title Investigación de sistemas de almacenamiento big data como apoyo a la generación de analíticas y modelos de aprendizaje automático en imagen médica. es_ES
dc.title.alternative Research on big data storage systems to support the generation of analytics and machine learning models in medical imaging. es_ES
dc.title.alternative Investigació de sistemes d'emmagatzematge big data com a suport a la generació d'analítiques i models d'aprenentatge automàtic en imatge mèdica. es_ES
dc.type Proyecto/Trabajo fin de carrera/grado es_ES
dc.rights.accessRights Abierto es_ES
dc.contributor.affiliation Universitat Politècnica de València. Departamento de Comunicaciones - Departament de Comunicacions es_ES
dc.contributor.affiliation Universitat Politècnica de València. Escuela Técnica Superior de Ingenieros de Telecomunicación - Escola Tècnica Superior d'Enginyers de Telecomunicació es_ES
dc.description.bibliographicCitation Serra Gil, J. (2023). Investigación de sistemas de almacenamiento big data como apoyo a la generación de analíticas y modelos de aprendizaje automático en imagen médica. Universitat Politècnica de València. http://hdl.handle.net/10251/195554 es_ES
dc.description.accrualMethod TFGM es_ES
dc.relation.pasarela TFGM\157626 es_ES


Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem