Mostrar el registro sencillo del ítem
dc.contributor.advisor | Bosch Roig, Ignacio | es_ES |
dc.contributor.advisor | Gomis Maya, Armando | es_ES |
dc.contributor.author | Serra Gil, Jaime | es_ES |
dc.coverage.spatial | east=-0.3760242462158203; north=39.443484498699114; name=Entrada Xufero, 5, 46026 València, Valencia, Espanya | es_ES |
dc.date.accessioned | 2023-07-26T14:45:07Z | |
dc.date.available | 2023-07-26T14:45:07Z | |
dc.date.created | 2023-07-21 | es_ES |
dc.date.issued | 2023-07-26 | es_ES |
dc.identifier.uri | http://hdl.handle.net/10251/195554 | |
dc.description.abstract | [ES] Los sistemas de almacenamiento de imagen médica empleados en los hospitales (PACS) no han sido diseñados teniendo en cuenta la creación de herramientas analíticas o de aprendizaje automático, lo que hace que presenten ciertas limitaciones que dificultan el proceso de trabajo, dando lugar a que sea poco eficiente y automatizable. El auge del big data ha supuesto el surgimiento de nuevos sistemas de almacenamiento y herramientas de procesado de datos que agilizan las tareas analíticas y de aprendizaje automático con cualquier tipo de datos. Tanto en datos no estructurados (imágenes, video, audio, ¿) como en datos tabulados. Es por ello, que el objetivo del presente proyecto consiste en realizar una investigación comparativa de tecnologías big data para la creación de un repositorio de imagen médica que sea capaz de agilizar y facilitar el proceso de trabajo para los nuevos perfiles profesionales basados en datos que están surgiendo. Para el desarrollo del presente trabajo se han definido una serie de aproximaciones que son de interés comparativo para el estudio. Sin embargo, se abre la puerta a expandir la comparativa con nuevas tecnologías según inquietudes del alumno. Las tareas de interés iniciales para el trabajo son las siguientes: - Creación de un repositorio de prueba para el almacenamiento de imágenes utilizando herramientas del ecosistema hadoop (hdfs e hive). - Creación de un repositorio de prueba para el almacenamiento de imágenes empleando un sistema tipo s3 (minio, ceph, etc). - Generación de tablas con información enriquecida que permita la rápida identificación y filtrado de las imágenes médicas deseadas. Se comparará el rendimiento de sistemas de BBDDs tabulares como postgres frente al almacenamiento de archivos tabulares tipo data lake (orc, parquet, ¿) - Comparativa de tiempos de ejecución y requerimientos de almacenamiento para un caso de uso de analítica, teniendo en cuenta varias herramientas de procesado de datos como Spark o Trino en los repositorios de prueba anteriormente descritos. | es_ES |
dc.description.abstract | [EN] The medical image storage systems used in hospitals (PACS) have not been designed with the creation of analytical or machine learning tools in mind, which means that they have certain limitations that hinder the work process, making it inefficient and difficult to automate. The rise of big data has led to the emergence of new storage systems and data processing tools that speed up analytical and machine learning tasks with any type of data. Both in unstructured data (images, video, audio, ...) and tabulated data. For this reason, the aim of this project is to carry out a comparative investigation of big data technologies for the creation of a medical image repository that is capable of speeding up and facilitating the work process for the new professional profiles based on data that are emerging. For the development of this work, a series of approaches have been defined that are of comparative interest for the study. However, the door is open to expand the comparative with new technologies according to the student's concerns. The initial tasks of interest for the work are as follows: - Creation of a test repository for image storage using tools from the hadoop ecosystem (hdfs and hive). - Creation of a test repository for image storage using an s3 type system (minio, ceph, etc). - Generation of tables with enriched information to allow rapid identification and filtering of the desired medical images. The performance of tabular DB systems such as postgres will be compared with the storage of tabular data lake files (orc, parquet, ...). - Comparison of execution times and storage requirements for an analytics use case, taking into account various data processing tools such as Spark or Trino in the test repositories described above. | en_EN |
dc.format.extent | 42 | es_ES |
dc.language | Español | es_ES |
dc.publisher | Universitat Politècnica de València | es_ES |
dc.rights | Reserva de todos los derechos | es_ES |
dc.subject | Big data | es_ES |
dc.subject | Aprendizaje automático | es_ES |
dc.subject | Imagen médica | es_ES |
dc.subject | Analítica | es_ES |
dc.subject | Sistemas de almacenamiento. | es_ES |
dc.subject | Machine learning | en_EN |
dc.subject | Medical imaging | en_EN |
dc.subject | Analytics | en_EN |
dc.subject | Storage systems. | en_EN |
dc.subject.classification | TEORÍA DE LA SEÑAL Y COMUNICACIONES | es_ES |
dc.subject.other | Grado en Ingeniería de Tecnologías y Servicios de Telecomunicación-Grau en Enginyeria de Tecnologies i Serveis de Telecomunicació | es_ES |
dc.title | Investigación de sistemas de almacenamiento big data como apoyo a la generación de analíticas y modelos de aprendizaje automático en imagen médica. | es_ES |
dc.title.alternative | Research on big data storage systems to support the generation of analytics and machine learning models in medical imaging. | es_ES |
dc.title.alternative | Investigació de sistemes d'emmagatzematge big data com a suport a la generació d'analítiques i models d'aprenentatge automàtic en imatge mèdica. | es_ES |
dc.type | Proyecto/Trabajo fin de carrera/grado | es_ES |
dc.rights.accessRights | Abierto | es_ES |
dc.contributor.affiliation | Universitat Politècnica de València. Departamento de Comunicaciones - Departament de Comunicacions | es_ES |
dc.contributor.affiliation | Universitat Politècnica de València. Escuela Técnica Superior de Ingenieros de Telecomunicación - Escola Tècnica Superior d'Enginyers de Telecomunicació | es_ES |
dc.description.bibliographicCitation | Serra Gil, J. (2023). Investigación de sistemas de almacenamiento big data como apoyo a la generación de analíticas y modelos de aprendizaje automático en imagen médica. Universitat Politècnica de València. http://hdl.handle.net/10251/195554 | es_ES |
dc.description.accrualMethod | TFGM | es_ES |
dc.relation.pasarela | TFGM\157626 | es_ES |