[ES] En este trabajo presentamos una forma para realizar el análisis y la detección de líneas de
texto en documentos manuscritos basada en los Modelos Ocultos de Markov, una técnica
ampliamente utilizada en otras tareas ...[+]
[ES] En este trabajo presentamos una forma para realizar el análisis y la detección de líneas de
texto en documentos manuscritos basada en los Modelos Ocultos de Markov, una técnica
ampliamente utilizada en otras tareas del reconocimiento del texto manuscrito y del
habla. Mostamos que el análisis y la detección de líneas de texto puede realizarse
utilizando metodologías más formales en contraposición a los métodos heurístics que se
pueden encontrar en la literatura. Nuestro método no solo proporciona las mejores
coordenas de posición para cada una de las regiones verticales de la página sino que
también las etiqueta, de esta manera superando los métodos heurísticos tradicionales. En
nuestros experimentos demonstramos el rendimiento de nuestro método ( tanto en
detección como en classificación de líneas) y estudiamos el impacto de incrementalmente
restringidos "lenguajes de estructuración vertical de páginas" y modelos morfológicos
sobre la precisión de detección y clasificación. Mediante esta experimentación también
demostramos la mejora en calidad de las líneas base generadas por nuestro método en
comparación con un método heurístico estado del arte basado en perfiles de proyección
vertical.
[-]
[EN] In this paper we present an approach for text line analysis and detection in handwritten
documents based on Hidden Markov Models, a technique widely used in other handwritten
and speech recognition tasks. It is shown ...[+]
[EN] In this paper we present an approach for text line analysis and detection in handwritten
documents based on Hidden Markov Models, a technique widely used in other handwritten
and speech recognition tasks. It is shown that text line analysis and detection can be
solved using a more formal methodology in contraposition to most of the proposed
heuristic approaches found in the literature. Our approach not only provides the best
position coordinates for each of the vertical page regions but also labels them, in this
manner surpassing the traditional heuristic methods. In our experiments we demonstrate
the performance of the approach (both in line analysis and detection) and study the
impact of increasingly constrained ¿vertical layout language models¿ and morphologic
models on text line detection and classification accuracy. Through this experimentation
we also show the improvement in quality of the baselines yielded by our approach in
comparisonwith a state-of-the-art heuristic method based on vertical projection profiles.
[-]
|