- -

Técnicas de minería de datos para la detección de la visibilidad web de empresas españolas

RiuNet: Repositorio Institucional de la Universidad Politécnica de Valencia

Compartir/Enviar a

Citas

Estadísticas

  • Estadisticas de Uso

Técnicas de minería de datos para la detección de la visibilidad web de empresas españolas

Mostrar el registro sencillo del ítem

Ficheros en el ítem

dc.contributor.advisor Calduch Losa, Maria de los Angeles es_ES
dc.contributor.advisor Orduña Malea, Enrique es_ES
dc.contributor.author Muñoz Edo, Gloria Amparo es_ES
dc.date.accessioned 2016-10-10T10:33:12Z
dc.date.available 2016-10-10T10:33:12Z
dc.date.created 2016-09-14
dc.date.issued 2016-10-10 es_ES
dc.identifier.uri http://hdl.handle.net/10251/71530
dc.description.abstract [ES] La extracción de datos de la Web y su posterior análisis, le sirve a las empresas para la toma de decisiones a nivel estratégico. Pero para poder analizar esos datos, es necesario estructurarlos previamente en una base de datos. Cuando se trabaja con grandes cantidades de datos, estas tareas se hacen tediosas y repetitivas, por lo que se convierte en imprescindible la automatización de estos procedimientos. En este trabajo, se pretende establecer las bases tecnológicas para automatizar los procesos de estructuración de los datos Web, importación de éstos a una base de datos y posterior extracción de los mismos para que puedan ser analizados y visualizados. Para ello, se aplican las técnicas diseñadas a un caso de estudio concreto, como son las empresas españolas del sector vinícola. Estas técnicas consisten en la implementación de una serie de scripts en el lenguaje de programación Python (para realizar las tareas de estructuración e importación de los datos a una base de datos) y de otra serie de scripts en R (para la parte final de prueba del análisis y visualización). Se ha logrado automatizar gran parte de todo el proceso, queda pendiente de resolver, en el origen de la extracción de los datos, el problema de la existencia de caracteres mal codificados, imposibles de recodificar de manera automatizada tras su exportación a ficheros. es_ES
dc.description.abstract [EN] Data extraction and its subsequent analysis from the Web serve companies to decision-taking activities at strategic level. However, in order to correctly analyze these data, it is compelled to previously structure them in a database. When it comes to work with large amounts of data, these procedures turn tedious and repetitive, especially when data come from different sources and different formats, preventing their direct analysis. This work intends to establish the technological foundations to automate some web data structure processes by importing them into a database to be analyzed and visualized automatically through exporting routines. To do this, the designed techniques are applied to the case study of those Spanish companies belonging to the wine market. These techniques consist on the one hand of the implementation of a set of scripts written in Python (responsible for the structure and data import from the native files from to a database), and on the other hand a set of scripts written in R (responsible for the analysis and visualization of the results). Much of the whole process has been automated. However, the problem about characters wrongly codified in the data extraction starting process remains unresolved, since these characters could not been recodified automatically after exporting them into files. es_ES
dc.format.extent 119 es_ES
dc.language Español es_ES
dc.publisher Universitat Politècnica de València es_ES
dc.rights Reserva de todos los derechos es_ES
dc.subject Webmetría es_ES
dc.subject Indicadores web es_ES
dc.subject Bases de datos es_ES
dc.subject Motores de búsqueda es_ES
dc.subject Web data mining es_ES
dc.subject Automatización de procesos es_ES
dc.subject Web indicators es_ES
dc.subject.classification ESTADISTICA E INVESTIGACION OPERATIVA es_ES
dc.subject.other Grado en Ingeniería Informática-Grau en Enginyeria Informàtica es_ES
dc.title Técnicas de minería de datos para la detección de la visibilidad web de empresas españolas es_ES
dc.type Proyecto/Trabajo fin de carrera/grado es_ES
dc.rights.accessRights Abierto es_ES
dc.contributor.affiliation Universitat Politècnica de València. Escola Tècnica Superior d'Enginyeria Informàtica es_ES
dc.contributor.affiliation Universitat Politècnica de València. Departamento de Estadística e Investigación Operativa Aplicadas y Calidad - Departament d'Estadística i Investigació Operativa Aplicades i Qualitat es_ES
dc.description.bibliographicCitation Muñoz Edo, GA. (2016). Técnicas de minería de datos para la detección de la visibilidad web de empresas españolas. http://hdl.handle.net/10251/71530. es_ES
dc.description.accrualMethod TFGM es_ES
dc.relation.pasarela TFGM\49225 es_ES


Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem