- -

Detección de signos de puntuación en texto manuscrito

RiuNet: Repositorio Institucional de la Universidad Politécnica de Valencia

Compartir/Enviar a

Citas

Estadísticas

  • Estadisticas de Uso

Detección de signos de puntuación en texto manuscrito

Mostrar el registro sencillo del ítem

Ficheros en el ítem

dc.contributor.advisor Martínez Hinarejos, Carlos David es_ES
dc.contributor.author Pérez Muñoz, Ignacio es_ES
dc.date.accessioned 2016-05-13T12:11:09Z
dc.date.available 2016-05-13T12:11:09Z
dc.date.created 2016-04-27
dc.date.issued 2016-05-13 es_ES
dc.identifier.uri http://hdl.handle.net/10251/64029
dc.description.abstract [EN] The Handwriting Text Recognition (HTR) is principally oriented to re- cognize text lines, that is, the transcription is realized analyzing each different line of a text. In this framework the problem is that the lines can contain pieces of sentences whose sense does not match with the grammatical struc- ture of the handwriting text language, either by start or end by a splitted word as to have points between the line boundaries. In this work a new tool for HTR is presented as an alternative for current lines recognition systems, changing lines for complete sentences. In this way a better precision on the HTR system is expected because the sentence that the system has to recognize follows a regular language structure. With the final purpose of achieving the sentence recognition, it is ne- cessary detect first the sentence boundaries, which is equivalent to recognize punctuation. In this work a new technique for handwriting text image frag- ments classification is proposed, in which fragments must be identified as a punctuation mark or not. To do so, an ancient Spanish handwriting text from XIX century will be used, obtaining labeled fragments from a forced recognition. After that, the different classifiers will be trained and tested. es_ES
dc.description.abstract [ES] El reconocimiento de texto manuscrito (HTR) está fundamentalmente orientado al reconocimiento en las líneas de texto. Esto presenta el problema de que las líneas pueden recoger fragmentos de frases cuyo sentido no encaje en la estructura del idioma en que está escrito el texto, ya sea por iniciarse o finalizarse con una palabra partida como por tener puntos intermedios de fin e inicio de frase. Con el fin de conseguir una orientación del reconocimiento de frases, se hace necesario detectar los inicios y fin de frase en las líneas de texto, lo cual es equivalente a detectar signos de puntuación. En este trabajo se propone la exploración de diversas técnicas de clasificación de fragmentos de imagen de texto manuscrito que detecten si se da o no un signo de puntuación en dicho fragmento. Para ello se empleará un manuscrito en español del siglo XIX, debiendo obtenerse los fragmentos de imagen y sus etiquetas a través de reconocimiento forzado, y tras ello entrenar y probar los modelos de clasificación correspondientes. es_ES
dc.language Español es_ES
dc.publisher Universitat Politècnica de València es_ES
dc.rights Reconocimiento - No comercial (by-nc) es_ES
dc.subject Reconocimiento de texto manuscrito es_ES
dc.subject HTR es_ES
dc.subject Econocimiento de signos de puntuación es_ES
dc.subject Reconocimiento de puntos es_ES
dc.subject k-nn es_ES
dc.subject SVM es_ES
dc.subject.classification LENGUAJES Y SISTEMAS INFORMATICOS es_ES
dc.subject.other Máster Universitario en Inteligencia Artificial, Reconocimiento de Formas e Imagen Digital-Màster Universitari en Intel·Ligència Artificial: Reconeixement de Formes i Imatge Digital es_ES
dc.title Detección de signos de puntuación en texto manuscrito es_ES
dc.type Tesis de máster es_ES
dc.rights.accessRights Abierto es_ES
dc.contributor.affiliation Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació es_ES
dc.description.bibliographicCitation Pérez Muñoz, I. (2016). Detección de signos de puntuación en texto manuscrito. http://hdl.handle.net/10251/64029 es_ES
dc.description.accrualMethod TFGM es_ES
dc.relation.pasarela TFGM\39450 es_ES


Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem