- -

Data quality indicators for structured data sets

RiuNet: Repositorio Institucional de la Universidad Politécnica de Valencia

Compartir/Enviar a

Citas

Estadísticas

  • Estadisticas de Uso

Data quality indicators for structured data sets

Mostrar el registro sencillo del ítem

Ficheros en el ítem

dc.contributor.advisor Bernabeu Aubán, José Manuel es_ES
dc.contributor.author López-Larrainzar Salazar, Arantzazu es_ES
dc.date.accessioned 2023-06-19T11:17:10Z
dc.date.available 2023-06-19T11:17:10Z
dc.date.created 2023-05-26
dc.date.issued 2023-06-19 es_ES
dc.identifier.uri http://hdl.handle.net/10251/194363
dc.description.abstract [EN] The technological revolution in which this society is immersed is generating an everincreasing amount of data, with enormous potential value, which can only be useful if it is converted and transformed into information through a specific processing. Data profiling is among the techniques used to obtain this useful information. It uses different indicators to explore and analyze the data in order to obtain a deeper understanding of its content and structure. The problem lies in the fact that the same profiling cannot be performed on every type of data set, since it depends on the type of content the data is composed of. This bachelor’s thesis focuses on exposing and analyzing the most common quality indicators or metrics when profiling structured data, i.e., those data sets that are organized in a specific and predictable way, presenting a format that is easily processed by computers and that facilitate the data to be analyzed efficiently. Additionally, as part of the work carried out, an API has been implemented, which allows processing any data set, applying all the indicators studied. es_ES
dc.description.abstract [ES] La revolución tecnológica en la que está inmersa esta sociedad está generando cada vez un mayor número de datos, con un enorme valor potencial, que tan sólo podrá ser de utilidad si se convierten y transforman en información a través de un procesamiento específico. Entre las técnicas que se llevan a cabo para conseguir esta información útil, está el perfilado de datos que, mediante diferentes indicadores, los exploran y los analizan con el fin de obtener una compresión más profunda de su contenido y estructura. El problema reside en que no se puede realizar el mismo perfilado en todo tipo de conjunto de datos, dependiendo del tipo de contenido del que está compuesto. Este TFG se centra en exponer, y analizar los indicadores o métricas de calidad más comunes a la hora de la realización del perfilado de datos estructurados, es decir, aquellos conjuntos de datos que se organizan de manera específica y predecible, presentando un formato que es fácilmente procesable por computadoras y que facilitan que los datos se puedan analizar de manera eficiente. Adicionalmente, como parte del trabajo realizado, se ha implementado un API que permite procesar cualquier conjunto de datos, aplicando todos los indicadores estudiados. es_ES
dc.description.abstract [CA] La revolució tecnològica en la qual està immersa aquesta societat està generant cada vegada un major nombre de dades, amb un enorme valor potencial, que tan sols podrà ser d’utilitat si es converteixen i transformen en informació a través d’un processament específic. Entre les tècniques que es duen a terme per a aconseguir aquesta informació útil, està el perfilat de dades que, mitjançant diferents indicadors, els exploren i els analitzen amb la finalitat d’obtindre una compressió més profunda del seu contingut i estructura. El problema resideix en què no es pot realitzar el mateix perfilat en tota mena de conjunt de dades, depenent del tipus de contingut del qual està compost. Aquest TFG se centra en exposar, i analitzar els indicadors o mètriques de qualitat més comunes a l’hora de la realització del perfilat de dades estructurades, és a dir, aquells conjunts de dades que s’organitzen de manera específica i predictible, presentant un format que és fàcilment procesable per computadores i que faciliten que les dades es puguen analitzar de manera eficient. Addicionalment, com a part del treball realitzat, s’ha implementat un API que permet processar qualsevol conjunt de dades, aplicant tots els indicadors estudiats. es_ES
dc.format.extent 103 es_ES
dc.language Inglés es_ES
dc.publisher Universitat Politècnica de València es_ES
dc.rights Reserva de todos los derechos es_ES
dc.subject Data quality es_ES
dc.subject Data governance es_ES
dc.subject Data spaces es_ES
dc.subject Data profiling es_ES
dc.subject Calidad del dato es_ES
dc.subject Gobernanza del dato es_ES
dc.subject Espacios de datos es_ES
dc.subject Perfilado de datos es_ES
dc.subject.classification LENGUAJES Y SISTEMAS INFORMATICOS es_ES
dc.subject.other Grado en Ingeniería Informática-Grau en Enginyeria Informàtica es_ES
dc.title Data quality indicators for structured data sets es_ES
dc.title.alternative Indicadors de qualitat de la dada per a conjunts de dades estructurades es_ES
dc.title.alternative Indicadores de calidad de datos para conjuntos de datos estructurados es_ES
dc.type Proyecto/Trabajo fin de carrera/grado es_ES
dc.rights.accessRights Cerrado es_ES
dc.contributor.affiliation Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació es_ES
dc.contributor.affiliation Universitat Politècnica de València. Escola Tècnica Superior d'Enginyeria Informàtica es_ES
dc.description.bibliographicCitation López-Larrainzar Salazar, A. (2023). Data quality indicators for structured data sets. Universitat Politècnica de València. http://hdl.handle.net/10251/194363 es_ES
dc.description.accrualMethod TFGM es_ES
dc.relation.pasarela TFGM\155226 es_ES


Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem