Resumen:
|
En esta tesis se estudia el problema de la robustez en los sistemas de
reconocimiento automático de texto manuscrito off-line. Los sistemas de
reconocimiento automático de texto manuscrito estarán maduros para su uso ...[+]
En esta tesis se estudia el problema de la robustez en los sistemas de
reconocimiento automático de texto manuscrito off-line. Los sistemas de
reconocimiento automático de texto manuscrito estarán maduros para su uso
generalizado, cuando sean capaces de ofrecer a cualquier usuario, sin ningún
tipo de preparación o adiestramiento para su utilización, una productividad
razonable. Se hace necesario pues, construir sistemas flexibles y robustos en
cuanto a la entrada, de tal manera que no se requiera del escritor ningún
esfuerzo extra, que no haría si escribiese para ser leído por un humano.
La intención del preproceso de la señal es hacer el sistema invariante a
fuentes de variabilidad que no ayuden a la clasificación. En la actualidad no
hay definida una solución general para conseguir invariabilidad al estilo de
escritura, y cada sistema desarrolla la suya ad-hoc. En esta tesis se
explorarán diferentes métodos de normalización de la señal de entrada
off-line. Para ello se hace un amplio estudio de algoritmos de preproceso,
tanto a nivel de toda la imagen: umbralización, reducción del ruido y
corrección del desencuadre; como a nivel de texto: slope, slant y
normalización del tamaño de los caracteres.
Los sistemas dependientes del escritor obtienen mejores tasas de acierto
que los independientes del escritor. Por otra parte, los sistemas
independientes del escritor tienen más facilidad para reunir muestras de
entrenamiento. En esta tesis seestudiará la adaptación de sistemas
independientes del escritor para su utilizaciónpor un único escritor, con la
intención de que a partir de una pocas muestras producidas por este escritor
se mejore la productividad del sistema (para este escritor), o lo que es lo
mismo, que éste pueda escribir de manera más relajada sin que el
sistema pierda productividad. Los sistemas de reconocimiento de texto
manuscrito no están exentos de errores. No sólo interesa saber el número de
errores que producirá
[-]
|