Mostrar el registro sencillo del ítem
dc.contributor.advisor | Bernabeu Aubán, José Manuel | es_ES |
dc.contributor.author | López-Larrainzar Salazar, Arantzazu | es_ES |
dc.date.accessioned | 2023-06-19T11:17:10Z | |
dc.date.available | 2023-06-19T11:17:10Z | |
dc.date.created | 2023-05-26 | |
dc.date.issued | 2023-06-19 | es_ES |
dc.identifier.uri | http://hdl.handle.net/10251/194363 | |
dc.description.abstract | [EN] The technological revolution in which this society is immersed is generating an everincreasing amount of data, with enormous potential value, which can only be useful if it is converted and transformed into information through a specific processing. Data profiling is among the techniques used to obtain this useful information. It uses different indicators to explore and analyze the data in order to obtain a deeper understanding of its content and structure. The problem lies in the fact that the same profiling cannot be performed on every type of data set, since it depends on the type of content the data is composed of. This bachelor’s thesis focuses on exposing and analyzing the most common quality indicators or metrics when profiling structured data, i.e., those data sets that are organized in a specific and predictable way, presenting a format that is easily processed by computers and that facilitate the data to be analyzed efficiently. Additionally, as part of the work carried out, an API has been implemented, which allows processing any data set, applying all the indicators studied. | es_ES |
dc.description.abstract | [ES] La revolución tecnológica en la que está inmersa esta sociedad está generando cada vez un mayor número de datos, con un enorme valor potencial, que tan sólo podrá ser de utilidad si se convierten y transforman en información a través de un procesamiento específico. Entre las técnicas que se llevan a cabo para conseguir esta información útil, está el perfilado de datos que, mediante diferentes indicadores, los exploran y los analizan con el fin de obtener una compresión más profunda de su contenido y estructura. El problema reside en que no se puede realizar el mismo perfilado en todo tipo de conjunto de datos, dependiendo del tipo de contenido del que está compuesto. Este TFG se centra en exponer, y analizar los indicadores o métricas de calidad más comunes a la hora de la realización del perfilado de datos estructurados, es decir, aquellos conjuntos de datos que se organizan de manera específica y predecible, presentando un formato que es fácilmente procesable por computadoras y que facilitan que los datos se puedan analizar de manera eficiente. Adicionalmente, como parte del trabajo realizado, se ha implementado un API que permite procesar cualquier conjunto de datos, aplicando todos los indicadores estudiados. | es_ES |
dc.description.abstract | [CA] La revolució tecnològica en la qual està immersa aquesta societat està generant cada vegada un major nombre de dades, amb un enorme valor potencial, que tan sols podrà ser d’utilitat si es converteixen i transformen en informació a través d’un processament específic. Entre les tècniques que es duen a terme per a aconseguir aquesta informació útil, està el perfilat de dades que, mitjançant diferents indicadors, els exploren i els analitzen amb la finalitat d’obtindre una compressió més profunda del seu contingut i estructura. El problema resideix en què no es pot realitzar el mateix perfilat en tota mena de conjunt de dades, depenent del tipus de contingut del qual està compost. Aquest TFG se centra en exposar, i analitzar els indicadors o mètriques de qualitat més comunes a l’hora de la realització del perfilat de dades estructurades, és a dir, aquells conjunts de dades que s’organitzen de manera específica i predictible, presentant un format que és fàcilment procesable per computadores i que faciliten que les dades es puguen analitzar de manera eficient. Addicionalment, com a part del treball realitzat, s’ha implementat un API que permet processar qualsevol conjunt de dades, aplicant tots els indicadors estudiats. | es_ES |
dc.format.extent | 103 | es_ES |
dc.language | Inglés | es_ES |
dc.publisher | Universitat Politècnica de València | es_ES |
dc.rights | Reserva de todos los derechos | es_ES |
dc.subject | Data quality | es_ES |
dc.subject | Data governance | es_ES |
dc.subject | Data spaces | es_ES |
dc.subject | Data profiling | es_ES |
dc.subject | Calidad del dato | es_ES |
dc.subject | Gobernanza del dato | es_ES |
dc.subject | Espacios de datos | es_ES |
dc.subject | Perfilado de datos | es_ES |
dc.subject.classification | LENGUAJES Y SISTEMAS INFORMATICOS | es_ES |
dc.subject.other | Grado en Ingeniería Informática-Grau en Enginyeria Informàtica | es_ES |
dc.title | Data quality indicators for structured data sets | es_ES |
dc.title.alternative | Indicadors de qualitat de la dada per a conjunts de dades estructurades | es_ES |
dc.title.alternative | Indicadores de calidad de datos para conjuntos de datos estructurados | es_ES |
dc.type | Proyecto/Trabajo fin de carrera/grado | es_ES |
dc.rights.accessRights | Cerrado | es_ES |
dc.contributor.affiliation | Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació | es_ES |
dc.contributor.affiliation | Universitat Politècnica de València. Escola Tècnica Superior d'Enginyeria Informàtica | es_ES |
dc.description.bibliographicCitation | López-Larrainzar Salazar, A. (2023). Data quality indicators for structured data sets. Universitat Politècnica de València. http://hdl.handle.net/10251/194363 | es_ES |
dc.description.accrualMethod | TFGM | es_ES |
dc.relation.pasarela | TFGM\155226 | es_ES |