Resumen:
|
[ES] Dentro de las tareas de los colaboradores de los hospitales o centros médicos, refiriéndose específicamente a los médicos de diagnóstico en laboratorios, la mayor parte del esfuerzo y tiempo recae en la redacción de ...[+]
[ES] Dentro de las tareas de los colaboradores de los hospitales o centros médicos, refiriéndose específicamente a los médicos de diagnóstico en laboratorios, la mayor parte del esfuerzo y tiempo recae en la redacción de informes médicos. Debido a ello, el número de pacientes que se pueden atender y el servicio que pueden ofrecer se ve reducido. En este trabajo se propone el diseño y desarrollode un sistema de reconocimiento automático del habla (RAH) utilizando CMU Sphinx4 y Kylm para la elaboración de informes médicos y su implantación en el servicio de medicina nuclear del hospital Dr. Peset en Valencia. El desarrollo y adaptación de sistemas de RAH a problemas muy concretos es posible graciasa los avances en las últimas décadas en este campo y a la disponibilidad de datos accesibles en formato abierto. Los experimentos iniciales se realizan con un modelo acústico pre-entrenado en español del proyecto VoxForge y un corpus de texto que contiene un vocabulario con más de 18 000 palabras referentes a informes médicos de medicina nuclear. Como resultado de la experimentación, se ha obtenido un valor WER promedio de 26,6 % sin adaptación al locutor y se ha logrado mejorar a un WER promedio de 23,1 % con adaptación MAP indicando una reducción del error en 13,2 %. La aplicación y código fuente se encuentran disponible enhttps://sourceforge.net/projects/asr-for-medical-reporting/bajo licencia GNU (GPLv3).
[-]
[EN] Among the tasks of collaborators in hospitals or medical centers, specifically referring to diagnostic doctors in laboratories, most of the effort and time falls on the writing of medical reports. Due to this, the ...[+]
[EN] Among the tasks of collaborators in hospitals or medical centers, specifically referring to diagnostic doctors in laboratories, most of the effort and time falls on the writing of medical reports. Due to this, the number of patients that can be attended and the service they can offer is reduced. This work proposes the design and development of an automatic speech recognition (ASR) system using CMU Sphinx4 and Kylm for the preparation of medical reports and their implementation in the nuclear medicine service of the Dr. Peset hospital in Valencia. The development and adaptation of ASR systems to very specific problems is possible thanks to the advances in the last decades in this field and the availability of open data. Initial experiments are performed with a pre-trained acoustic model in Spanish from the VoxForge project and a corpus of text containing a vocabulary of more than 18 000 words referring to nuclear medicine medical reports. As a result of experimentation, an average WER value of 26,6% has been achieve without speaker adaptation and it has been possible to improve to an average WER of 23,1% with MAP adaptation indicating a reduction of error in 13,2% . The application and source code are available in https://sourceforge.net/projects/asr-for-medical-reporting/ under GNU (GPLv3) license.
[-]
[CA] Dins de les tasques dels col·laboradors als hospitals i centres mèdics, referintse específicament als metges de diagnòstic en laboratori, la major part del esforç i del temps es dedicat a la redacció de informes mèdics. ...[+]
[CA] Dins de les tasques dels col·laboradors als hospitals i centres mèdics, referintse específicament als metges de diagnòstic en laboratori, la major part del esforç i del temps es dedicat a la redacció de informes mèdics. A conseqüència, el nombre de pacients que es poden atendre i el servei que es pot oferir
es veu reduït. En aquest treball es proposa el disseny i desenvolupament d’un
sistema de reconeixement automàtic de la parla (RAP) utilitzant CMU Sphinx4
i Kylm per a l’elaboració d’informes mèdics i la seua implantació en el servei
de medicina nuclear de l’hospital Dr. Peset a València. El desenvolupament y
adaptació de sistemes RAH a problemes molt concrets es possible gràcies als
avanços en les últimes dècades en aquest camp i a la disponibilitat de dades
accessibles de forma oberta. Els experiments inicials es realitzen amb un model acústic prèviament entrenat en espanyol del projecte VoxForge i un corpus
de text que conté un vocabulari amb més de 18 000 paraules que fan referència a informes mèdics de medicina nuclear. Com a resultat de l’experimentació, s’ha obtingut un valor WER mitjà de 26,6% sense adaptació al locutor i s’-
ha aconseguit millorar a un WER mitjà de 23,1% amb adaptació MAP indicant
una reducció del error en 13,2%. L’aplicació i el codi font estan disponibles a
https://sourceforge.net/projects/asr-for-medical-reporting/ baix llicència GNU (GPLv3).
[-]
|