- -

Detección de signos de puntuación en documentos de texto manuscrito

RiuNet: Repositorio Institucional de la Universidad Politécnica de Valencia

Compartir/Enviar a

Citas

Estadísticas

  • Estadisticas de Uso

Detección de signos de puntuación en documentos de texto manuscrito

Mostrar el registro sencillo del ítem

Ficheros en el ítem

dc.contributor.advisor Martínez Hinarejos, Carlos David es_ES
dc.contributor.author Hernández Salmerón, Miguel es_ES
dc.date.accessioned 2017-10-23T07:30:02Z
dc.date.available 2017-10-23T07:30:02Z
dc.date.created 2017-09-26
dc.date.issued 2017-10-23 es_ES
dc.identifier.uri http://hdl.handle.net/10251/89809
dc.description.abstract [EN] Handwriting recognition is a complex task and not always we obtain good results, either by the text conditions or by the kind of writing. That is why it remains research topic, where every time new techniques and methods are obtained . Currently text segmentation is done by line, as the recognition systems extract each line of the text and then analyze it. However, the extracted lines do not have to be coherent, since is normally does not coincide with a complete sentence. The goal of this project is to locate the punctuation marks found in the text to fragment it into complete sentences that have a coherent meaning. For this purpose, it has been decided to use a technique used to classify different types of images by using a convolutional neural network. The neural network has been trained with images of the different punctuation marks in order to recognize them throughout the text and to store the position in which they are. To make this project a manuscript of the year 1853 was used, from which the images of both the points and the commas have been obtained to generate the different corpus that have been used. es_ES
dc.description.abstract El reconocimiento de texto manuscrito (HTR) es una disciplina cuyo objetivo es la transcripción automática del contenido textual de documentos manuscritos. Habitualmente, el proceso de reconocimiento se realiza sobre las líneas segmentadas en una página, lo que implica que no se conservan estructuras sintácticas completas: las frases pueden quedar sin terminar, o terminar a mitad de la imagen procesada, o empezar de forma no natural, o presentar palabras cortadas al inicio y fin. Es de suponer que una entrada que consistiera en una frase presentaría mejores resultados. Para ello, sería necesario segmentar las páginas del documento en frases que pueden limitarse a una o varias líneas que habría que unir. La detección de frases podría aproximarse por la detección de ciertos carácteres clave como son los signos de puntuación, en particular los puntos. Así pues, el trabajo propuesto persigue detectar en una imagen de una página de texto manuscrito los signos de puntuación presentes, con el fin de aprovechar dicha detección para una posterior segmentación a nivel de frase de los contenidos de dicha página. El trabajo se limitará a la detección de los signos en un documento manuscrito en español del siglo XIX, empleando para ello diversos parámetros de extracción de características y modelos de clasificación, a fin de encontrar la combinación más apropiada para la resolución del problema. es_ES
dc.language Español es_ES
dc.publisher Universitat Politècnica de València es_ES
dc.rights Reconocimiento (by) es_ES
dc.subject Técnicas de clasificación es_ES
dc.subject Procesado de imagen es_ES
dc.subject Procesado de documentos es_ES
dc.subject Reconocimiento de texto manuscrito es_ES
dc.subject.classification LENGUAJES Y SISTEMAS INFORMATICOS es_ES
dc.subject.other Máster Universitario en Inteligencia Artificial, Reconocimiento de Formas e Imagen Digital-Màster Universitari en Intel·Ligència Artificial: Reconeixement de Formes i Imatge Digital es_ES
dc.title Detección de signos de puntuación en documentos de texto manuscrito es_ES
dc.type Tesis de máster es_ES
dc.rights.accessRights Abierto es_ES
dc.contributor.affiliation Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació es_ES
dc.description.bibliographicCitation Hernández Salmerón, M. (2017). Detección de signos de puntuación en documentos de texto manuscrito. http://hdl.handle.net/10251/89809 es_ES
dc.description.accrualMethod TFGM es_ES
dc.relation.pasarela TFGM\69495 es_ES


Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem