Resumen:
|
[ES] Este trabajo de fin de grado busca realizar un estudio de las diferentes tecnologías que existen
actualmente para la creación de un modelo de machine learning para la extracción de información
de documentos de ...[+]
[ES] Este trabajo de fin de grado busca realizar un estudio de las diferentes tecnologías que existen
actualmente para la creación de un modelo de machine learning para la extracción de información
de documentos de texto.
Para ello se analizarán las diferentes formas de implementar estos modelos de preguntas y
respuestas, que pueden ser extractivos o abstractivos, para definir cuales son los más óptimos para
la tarea. De esta manera, se tratarán cuáles son los recursos necesarios para la creación del modelo,
incluyendo la importancia de disponer de un ordenador con un GPU potente o la necesidad de
contar con una buena base de datos, así como la manera de crearla.
También se desarrollará el proceso a seguir para la creación del modelo, estudiando los grados
de libertad disponibles y los factores que más influyen en su rendimiento óptimo, así como las
métricas que se pueden utilizar para evaluarlo.
Para concretar el análisis, y sirviendo como caso práctico, se aplicarán las tecnologías
desarrolladas para la extracción de información en una base de datos de reportes radiológicos en
inglés
[-]
[EN] This final degree work aims to study the different technologies that currently exist for creating
a machine-learning model for extracting information from text documents.
For this purpose, the different ways of ...[+]
[EN] This final degree work aims to study the different technologies that currently exist for creating
a machine-learning model for extracting information from text documents.
For this purpose, the different ways of implementing these models of questions and answers,
which can be extractive or abstractive, will be analyzed to define the most optimal for the task. In
this way, the necessary resources for creating the model will be discussed, including the
importance of having a computer with a powerful GPU or the need to have a good database and
the way to create it.
The process to be followed for creating the model will also be developed, studying the
available degrees of freedom, the factors that most influence its optimal performance, and the
metrics that can be used to evaluate it.
The technologies developed for extracting information will be applied to a database of
radiological reports in English to make the analysis more concrete and act as a practical case.
[-]
|