Indexación y búsqueda de expresiones matemáticas a gran escala en corpus masivos de documentos impresos

Noya García, Ernesto

RiuNet repositorio UPV
:
Docencia
:
Trabajos académicos
:
Servicio de alumnado - Trabajos académicos
:
Ver ítem

Identificarse

Buscar en RiuNet

Listar

Todo RiuNet
Esta colección

Mi cuenta

Acceder

Estadísticas

Ver Estadísticas de uso

Ayuda RiuNet

Admin. UPV

Compartir/Enviar a

Citas

Estadísticas

Indexación y búsqueda de expresiones matemáticas a gran escala en corpus masivos de documentos impresos

Mostrar el registro sencillo del ítem

Ficheros en el ítem

Nombre: Noya - Indexación ...

Tamaño: 847.9Kb

Formato: PDF

Abrir

dc.contributor.advisor	Benedí Ruiz, José Miguel	es_ES
dc.contributor.advisor	Sánchez Peiró, Joan Andreu	es_ES
dc.contributor.author	Noya García, Ernesto	es_ES
dc.date.accessioned	2020-09-04T07:58:29Z
dc.date.available	2020-09-04T07:58:29Z
dc.date.created	2020-07-24
dc.date.issued	2020-09-04	es_ES
dc.identifier.uri	http://hdl.handle.net/10251/149417
dc.description.abstract	[ES] En la actualidad existen grandes bases de datos de documentos científicos impresos digitalizados, muchos de los cuales incluyen expresiones matemáticas. La búsqueda de información textual en estos documentos es ya una posibilidad ampliamente explotada por los motores de búsqueda de la exploradores más utilizados. Sin embargo, la búsqueda mediante consultas en forma de expresiones matemáticas de documentos científicos impresos digitalizados en grandes colecciones es un campo apenas explorado. Los planteamientos que actualmente se han usado para abordar este problema se basan fundamentalmente en la búsqueda por similitud entre la imágenes lo cual es completamente inviable para búsqueda en colecciones masivas dado el elevado coste computacional de dichas aproximaciones. En este trabajo se propone estudiar el desarrollo de técnicas de indexación y búsqueda de expresiones matemáticas en grandes colecciones de imágenes digitalizadas. Los modelos que permitirán construir los índices de la colección y los modelos que permitirán representarán la consulta se basarán en modelos estocásticos estructurales capaces de dar cuenta de la ambigüedad que puede surgir en el proceso de reconocimiento, debido a los problemas de segmentación y a la propia ambigüedad que puede existir en las expresiones matemáticas. La preparación de los índices probabilísticos deberá incluir: medidas de confianza, estructuras de datos en forma de árbol sintáctico para realizar búsquedas estructurales y aprendizaje automático discriminativo de modelos estructurales.	es_ES
dc.description.abstract	[EN] Nowadays there exist large databases of digitized printed scientific documents, and many of them include mathematical expressions. The searching of textual information in these documents is currently a possibility widely exploited by the search engines of the most used web browsers. However, the searching in massive collections of digitized printed scientific documents with queries that are mathematical expressions is a research area scarcely explored. The methods that currently have been researched for tackling this problem are based on comparing images that is not realistic for searching in massive collections given the high computational cost of the above mentioned approaches. In this TFM, we propose to research indexing and searching techniques of mathematical expressions in large collections of digitized images. The models that will allow us to build up the indexes of the collection and the models que will allow us to represent the query will be based on stochastic structural models that will account for the ambiguity that can appear in the recognition process, due to segmentation problems and due to the ambiguity that the mathematical expression may have. The preparation of the probabilistic indices should include: confidence measures, data structures based on syntactic parse trees for structural search, discriminative machine learning of structural models.	es_ES
dc.description.sponsorship	Este trabajo ha sido parcialmente financiado por el Ministerio de Ciencia y Tecnología en el proyecto IBEM (TIN2017-91452-EXP) y por la Generalitat Valenciana en el proyecto DeepPattern (PROMETEO/2019/121).	es_ES
dc.format.extent	72	es_ES
dc.language	Español	es_ES
dc.publisher	Universitat Politècnica de València	es_ES
dc.rights	Reconocimiento (by)	es_ES
dc.subject	Búsqueda e indexación de expresiones matemáticas	es_ES
dc.subject	Reconocimiento de expresiones matemáticas	es_ES
dc.subject	Bibliotecas digitales	es_ES
dc.subject	Mathematical expression searching and indexing	es_ES
dc.subject	Mathematical expression recognition	es_ES
dc.subject	Digital libraries	es_ES
dc.subject.classification	LENGUAJES Y SISTEMAS INFORMATICOS	es_ES
dc.subject.other	Máster Universitario en Inteligencia Artificial, Reconocimiento de Formas e Imagen Digital-Màster Universitari en Intel·Ligència Artificial: Reconeixement de Formes i Imatge Digital	es_ES
dc.title	Indexación y búsqueda de expresiones matemáticas a gran escala en corpus masivos de documentos impresos	es_ES
dc.type	Tesis de máster	es_ES
dc.relation.projectID	info:eu-repo/grantAgreement/AEI//TIN2017-91452-EXP/ES/INDEXACION Y BUSQUEDA DE EXPRESIONES MATEMATICAS A GRAN ESCALA EN CORPUS MASIVOS DE DOCUMENTOS IMPRESOS/	es_ES
dc.relation.projectID	info:eu-repo/grantAgreement/GVA//PROMETEO%2F2019%2F121/ES/Deep learning for adaptative and multimodal interaction in pattern recognition/	es_ES
dc.rights.accessRights	Abierto	es_ES
dc.contributor.affiliation	Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació	es_ES
dc.description.bibliographicCitation	Noya García, E. (2020). Indexación y búsqueda de expresiones matemáticas a gran escala en corpus masivos de documentos impresos. Universitat Politècnica de València. http://hdl.handle.net/10251/149417	es_ES
dc.description.accrualMethod	TFGM	es_ES
dc.relation.pasarela	TFGM\125210	es_ES
dc.contributor.funder	Generalitat Valenciana	es_ES
dc.contributor.funder	Agencia Estatal de Investigación	es_ES

Este ítem aparece en la(s) siguiente(s) colección(ones)

Servicio de alumnado - Trabajos académicos [7391]

Mostrar el registro sencillo del ítem

Indexación y búsqueda de expresiones matemáticas a gran escala en corpus masivos de documentos impresos

RiuNet: Repositorio Institucional de la Universidad Politécnica de Valencia

Buscar en RiuNet

Listar

Todo RiuNet

Esta colección

Mi cuenta

Estadísticas

Ayuda RiuNet

Admin. UPV

Compartir/Enviar a

Citas

Estadísticas

Indexación y búsqueda de expresiones matemáticas a gran escala en corpus masivos de documentos impresos

Ficheros en el ítem

Este ítem aparece en la(s) siguiente(s) colección(ones)