dc.contributor.advisor	Llorens Sánchez, José	es_ES
dc.contributor.author	Rodríguez Luna, Manuela	es_ES
dc.date.accessioned	2013-07-29T11:35:53Z
dc.date.available	2013-07-29T11:35:53Z
dc.date.created	2013-07-14T22:00:00Z	es_ES
dc.date.issued	2013-07-29T11:35:48Z	es_ES
dc.identifier.uri	http://hdl.handle.net/10251/31517
dc.description.abstract	Se desarrolla e implementa un Sistema de Indización y Segmentación Automática para textos largos en español, contribuyendo a su categorización textual e indización automática. Para su desarrollo, se estudian y perfeccionan los métodos cuantitativos y leyes clásicas en Recuperación de Información, como son los modelos relativos al proceso de repetición de palabras (Zipf, 1949), (Mandelbrot, 1953) y al proceso de creación de vocabulario (Heaps, 1978). Se realiza una crítica de las circunstancias de aplicación de los modelos y se estudia la estabilidad de los parámetros de manera experimental mediante recuentos en textos y sus fragmentos. Se establecen recomendaciones a priori para los valores de sus parámetros, dependiendo de las circunstancias de aplicación y del tipo de texto analizado. Se observa el comportamiento de los parámetros de las fórmulas para vislumbrar una relación directa con la tipología de texto analizado. Se propone un nuevo modelo (Log-%) para la visualización de la distribución de frecuencias de las palabras de un texto. El objetivo final es detectar los cambios temáticos que se producen en un documento, para establecer su estructura temática y obtener la indización automática de cada una de sus partes. De este modo, se obtiene la categorización del texto o documento utilizando la enumeración de sus partes temáticas a modo de niveles o estructura arbórea. Una vez constituidas las partes temáticas del texto en sus niveles correspondientes con los términos indizados, estos se agrupan en bloques distribuidos jerárquicamente según se desglose el documento en cuestión. El bloque inicial describe el contenido global de todo el documento con una cantidad inicial de palabras o descriptores. Seguidamente este bloque inicial se subdivide en varios bloques, los cuales corresponden a distintas partes del documento total, cada uno de estos también contiene una serie de palabras que describe el contenido y así sucesivamente hasta poder formar las div....	es_ES
dc.language	Español	es_ES
dc.publisher	Universitat Politècnica de València	es_ES
dc.rights	Reserva de todos los derechos	es_ES
dc.source	Riunet	es_ES
dc.subject	Sistema de Indización y Segmentación Automática para textos en Español	es_ES
dc.subject	Métodos cuantitativos	es_ES
dc.subject	Leyes clásicas en Recuperación de la Información	es_ES
dc.subject	Indización Automática	es_ES
dc.subject	Segmentación Automática	es_ES
dc.subject	Métodos estadísticos	es_ES
dc.subject	Métodos probabilísticos	es_ES
dc.subject	Similitud entre palabras	es_ES
dc.subject	Lematización	es_ES
dc.subject	Ley de Zipf	es_ES
dc.subject	Ley de Heaps	es_ES
dc.title	Ampliación y perfeccionamiento de los métodos cuantitativos y leyes clásicas en recuperación de la información: desarrollo de un sistema de indización y segmentación automática para textos en español
dc.type	Tesis doctoral	es_ES
dc.identifier.doi	10.4995/Thesis/10251/31517	es_ES
dc.rights.accessRights	Abierto	es_ES
dc.contributor.affiliation	Universitat Politècnica de València. Departamento de Comunicación Audiovisual, Documentación e Historia del Arte - Departament de Comunicació Audiovisual, Documentació i Història de l'Art	es_ES
dc.description.bibliographicCitation	Rodríguez Luna, M. (2013). Ampliación y perfeccionamiento de los métodos cuantitativos y leyes clásicas en recuperación de la información: desarrollo de un sistema de indización y segmentación automática para textos en español [Tesis doctoral no publicada]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/31517	es_ES
dc.description.accrualMethod	Palancia	es_ES
dc.type.version	info:eu-repo/semantics/acceptedVersion	es_ES
dc.relation.tesis	9009	es_ES

Ampliación y perfeccionamiento de los métodos cuantitativos y leyes clásicas en recuperación de la información: desarrollo de un sistema de indización y segmentación automática para textos en español

RiuNet: Repositorio Institucional de la Universidad Politécnica de Valencia

Buscar en RiuNet

Listar

Todo RiuNet

Esta colección

Mi cuenta

Estadísticas

Ayuda RiuNet

Admin. UPV

Compartir/Enviar a

Citas

Estadísticas

Ampliación y perfeccionamiento de los métodos cuantitativos y leyes clásicas en recuperación de la información: desarrollo de un sistema de indización y segmentación automática para textos en español

Ficheros en el ítem

Este ítem aparece en la(s) siguiente(s) colección(ones)