- -

Desarrollo de un sistema automático de extracción eficiente y análisis de variables clínicas radiológicas y patológicas en informes de cáncer de próstata a través de técnicas de procesamiento de lenguaje natural basadas en expresiones regulares

RiuNet: Repositorio Institucional de la Universidad Politécnica de Valencia

Compartir/Enviar a

Citas

Estadísticas

  • Estadisticas de Uso

Desarrollo de un sistema automático de extracción eficiente y análisis de variables clínicas radiológicas y patológicas en informes de cáncer de próstata a través de técnicas de procesamiento de lenguaje natural basadas en expresiones regulares

Mostrar el registro sencillo del ítem

Ficheros en el ítem

dc.contributor.advisor Ramos Soler, David es_ES
dc.contributor.advisor Martínez Gironés, Pedro Miguel es_ES
dc.contributor.author Castro Anguita, Lourdes es_ES
dc.date.accessioned 2023-10-17T08:16:17Z
dc.date.available 2023-10-17T08:16:17Z
dc.date.created 2023-09-11
dc.date.issued 2023-10-17 es_ES
dc.identifier.uri http://hdl.handle.net/10251/198178
dc.description.abstract [ES] El proyecto ha sido llevado a cabo mediante la colaboración conjunta entre la Universitat Politècnica de València (UPV) y el Grupo de Investigación Biomédica en Imagen (GIBI230), perteneciente al Instituto de Investigación Sanitaria La Fe situado en el Hospital Universitario y Politécnico La Fe de Valencia, junto con el apoyo de los servicios de Anatomía Patológica y Radiología del propio hospital. El cáncer de próstata es una enfermedad que se origina en la glándula prostática, la cual está ubicada debajo de la vejiga y forma parte del sistema reproductor masculino. Estas lesiones ocurren cuando las células de la próstata comienzan a crecer de manera descontrolada, formando tumores que pueden invadir tejidos cercanos o diseminarse a otras partes del cuerpo. Dicho cáncer se encuentra entre los de mayor prevalencia a nivel mundial, aunque con un diagnóstico y tratamientos correctos se consigue que éste no sea de los de mayor tasa de mortalidad. Se diagnostica a partir del análisis visual de biopsias por medio del patólogo con la correspondiente clasificación de la diferenciación del tejido según la escala Gleason. Sin embargo, la obtención de biopsias es un proceso invasivo, con riesgos clínicos y que únicamente abarca unas regiones concretas del órgano. Por ello, la vigilancia y búsqueda del diagnóstico es apoyada por medio de pruebas de imagen no invasiva, como es el caso de la Resonancia Magnética Nuclear (RMN). En esta prueba se obtiene una visión global de las características del tumor, sus distintas localizaciones, formas, texturas y la posible afectación a los ganglios linfáticos u otros órganos. Una vez obtenido el diagnóstico, es muy importante determinar qué tipo de tratamiento es el más adecuado para cada paciente. Esto se realiza utilizando toda la información obtenida tanto a nivel de anatomía patológica como a nivel radiológico, la cual está documentada en informes clínicos de texto libre que pueden estar poco estructurados. Por esto, es un reto complejo utilizar esta información para entrenar modelos de Inteligencia Artificial que simulen a partir de estos datos los posibles efectos que tendrían los distintos tipos de tratamiento en cada paciente y así poder facilitar la toma de decisión del tratamiento. Mediante este trabajo se pretende solucionar este reto de disponer de información estructurada y de la mayor calidad posible, el cual es de vital importancia en el entorno clínico de investigación. Por lo tanto, el objetivo principal es el de extraer y analizar variables clínicas radiológicas y patológicas en cáncer de próstata a través de un sistema automático de procesamiento del lenguaje natural basado en expresiones regulares, dando lugar a bases de datos estructuradas con toda la información de diagnóstico de cáncer de próstata con directa aplicación al flujo de trabajo del entorno clínico real. Como objetivo secundario exploratorio se ha pretendido entrenar un clasificador de Matching Learning tipo KNN (K-Nearest Neighbors) que logre establecer la relación entre los valores de Gleason del tumor habiendo observado un PIRADS determinado en la imagen radiológica. es_ES
dc.description.abstract [CA] L'estudi ha estat realitzat mitjançant la col·laboració entre la Universitat Politècnica de València (UPV) i el Grup d'Investigació Biomèdica en Imatge (GIBI230), que forma part de l'Institut d'Investigació Sanitària La Fe, situat a l'Hospital Universitari i Politècnic La Fe de València, amb el suport dels serveis d'Anatomia Patològica i Radiologia de l'hospital. El càncer de pròstata és una malaltia que s'inicia a la glàndula prostàtica, ubicada sota la bufeta i integrada en el sistema reproductor masculí. Aquestes anomalies apareixen quan les cèl·lules de la pròstata comencen a créixer de manera descontrolada, formant tumors que poden envair teixits adjacents o estendre's a altres parts del cos. Malgrat la seua alta prevalença global, un diagnòstic i tractament adequats poden reduir la taxa de mortalitat. El diagnòstic es basa en l'anàlisi visual de biòpsies realitzades per patòlegs, utilitzant l'escala Gleason per classificar els teixits. No obstant això, les biòpsies són procediments invasius amb riscos clínics, que només cobreixen àrees específiques de l'òrgan. Per això, les proves d'imatge no invasives, com la Resonància Magnètica Nuclear (RMN), complementen la vigilància i el diagnòstic. Aquesta prova proporciona una visió global de les característiques tumorals, localitzacions, formes, textures i possibles afectacions als ganglis limfàtics i altres òrgans. Un cop es realitza el diagnòstic, és fonamental determinar el tractament més adequat per a cada pacient, utilitzant informació de l'anatomia patològica i radiologia, encara que sovint no està estructurada en els informes clínics. Per tant, l'ús de la intel·ligència artificial és un repte complex per entrenar models a partir d'aquestes dades i facilitar la presa de decisions sobre el tractament. Aquest treball busca resoldre aquest repte, proporcionant informació estructurada i de qualitat, crucial en la recerca clínica. L'objectiu principal és extreure i analitzar variables clíniques radiològiques i patològiques en el càncer de pròstata mitjançant un sistema automàtic de processament del llenguatge natural basat en expressions regulars. Això crea bases de dades estructurades amb tota la informació de diagnòstic del càncer de pròstata, amb aplicació directa a la pràctica clínica. Com a objectiu secundari exploratori, s'ha intentat entrenar un classificador de Matching Learning tipus KNN (K-Nearest Neighbors) per establir relacions entre els valors de Gleason del tumor i el PIRADS observat en la imatge radiològica. es_ES
dc.description.abstract [EN] The project has been carried out through joint collaboration between the Polytechnic University of Valencia (UPV) and the Biomedical Imaging Research Group (GIBI230), belonging to the La Fe Health Research Institute located at the La Fe University and Polytechnic Hospital in Valencia, along with the support of the Pathology and Radiology services of the hospital itself. Prostate cancer is a disease that originates in the prostate gland, which is located below the bladder and is part of the male reproductive system. These lesions occur when prostate cells begin to grow uncontrollably, forming tumors that can invade nearby tissues or spread to other parts of the body. This cancer is among the most prevalent worldwide, although with proper diagnosis and treatment it can have lower mortality rates. It is diagnosed by analyzing biopsies visually by the pathologist with the corresponding classification of tissue differentiation according to the Gleason scale. However, obtaining biopsies is an invasive process with clinical risks and only covers specific regions of the organ. Therefore, surveillance and diagnosis are supported by noninvasive imaging tests, such as Magnetic Resonance Imaging (MRI). In this test, a global view of the characteristics of the tumor, its different locations, shapes, textures, and possible lymph node or other organ involvement is obtained. Once the diagnosis is obtained, it is essential to determine which type of treatment is most appropriate for each patient. This is done using all the information obtained both at the pathological and radiological levels, which is documented in free-text clinical reports that may be poorly structured. Therefore, it is a complex challenge to use this information to train Artificial Intelligence models that simulate, based on this data, the possible effects that different types of treatment would have on each patient, thus facilitating treatment decisionmaking. This work aims to solve this challenge of having structured and high-quality information, which is of vital importance in the clinical research environment. Therefore, according to the main objective, radiological and pathological clinical variables in prostate cancer have been extracted and analyzed through an automatic natural language processing system based on regular expressions, resulting in structured databases with all the diagnostic information of prostate cancer with direct application to the real clinical workflow environment. The secondary and exploratory objective has pretended training a KNN (K-Nearest Neighbors) Matching Learning classifier to achieve a relationship between tumoral Gleason values and PIRADS category shown in the radiologic image. es_ES
dc.format.extent 59 es_ES
dc.language Español es_ES
dc.publisher Universitat Politècnica de València es_ES
dc.rights Reconocimiento - No comercial - Sin obra derivada (by-nc-nd) es_ES
dc.subject Cáncer de próstata es_ES
dc.subject Tumores es_ES
dc.subject Biopsias es_ES
dc.subject Resonancia Magnética Nuclear es_ES
dc.subject Diagnóstico es_ES
dc.subject Tratamiento es_ES
dc.subject Anatomía patológica es_ES
dc.subject Radiología es_ES
dc.subject Informes clínicos es_ES
dc.subject Inteligencia Artificial es_ES
dc.subject Procesamiento del lenguaje natural es_ES
dc.subject Expresiones regulares. es_ES
dc.subject Càncer de pròstata es_ES
dc.subject Biòpsies es_ES
dc.subject Resonància magnètica nuclear es_ES
dc.subject Diagnòstic es_ES
dc.subject Tractament es_ES
dc.subject Anatomia patològica es_ES
dc.subject Radiologia es_ES
dc.subject Informes clínics es_ES
dc.subject Intel·ligència artificial es_ES
dc.subject Processament del llenguatge natural es_ES
dc.subject Expressions regulars es_ES
dc.subject Prostate cancer es_ES
dc.subject Tumors es_ES
dc.subject Biopsies es_ES
dc.subject Nuclear Magnetic Resonance (NMR) es_ES
dc.subject Diagnosis es_ES
dc.subject Treatment es_ES
dc.subject Pathological anatomy es_ES
dc.subject Radiology es_ES
dc.subject Clinical reports es_ES
dc.subject Artificial Intelligence (AI) es_ES
dc.subject Natural language processing es_ES
dc.subject Regular expressions. es_ES
dc.subject.other Grado en Ingeniería Biomédica-Grau en Enginyeria Biomèdica es_ES
dc.title Desarrollo de un sistema automático de extracción eficiente y análisis de variables clínicas radiológicas y patológicas en informes de cáncer de próstata a través de técnicas de procesamiento de lenguaje natural basadas en expresiones regulares es_ES
dc.title.alternative Development of an automatic system for extraction and analysis of radiological and pathological clinical variables in prostate cancer reports through natural language processing techniques based on regular expressions es_ES
dc.title.alternative Desenvolupament d'un sistema automàtic d'extracció eficient i anàlisi de variables clíniques radiològiques i patològiques en informes de càncer de pròstata mitjançant tècniques de processament de llenguatge natural basades en expressions regulars es_ES
dc.type Proyecto/Trabajo fin de carrera/grado es_ES
dc.rights.accessRights Abierto es_ES
dc.contributor.affiliation Universitat Politècnica de València. Escuela Técnica Superior de Ingenieros Industriales - Escola Tècnica Superior d'Enginyers Industrials es_ES
dc.description.bibliographicCitation Castro Anguita, L. (2023). Desarrollo de un sistema automático de extracción eficiente y análisis de variables clínicas radiológicas y patológicas en informes de cáncer de próstata a través de técnicas de procesamiento de lenguaje natural basadas en expresiones regulares. Universitat Politècnica de València. http://hdl.handle.net/10251/198178 es_ES
dc.description.accrualMethod TFGM es_ES
dc.relation.pasarela TFGM\156662 es_ES


Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem