- -

Characterization of the missing companies in the SABI database

RiuNet: Repositorio Institucional de la Universidad Politécnica de Valencia

Compartir/Enviar a

Citas

Estadísticas

  • Estadisticas de Uso

Characterization of the missing companies in the SABI database

Mostrar el registro sencillo del ítem

Ficheros en el ítem

dc.contributor.advisor Doménech i de Soria, Josep es_ES
dc.contributor.author Huang Chen, Xin-Hui es_ES
dc.date.accessioned 2024-06-28T11:03:40Z
dc.date.available 2024-06-28T11:03:40Z
dc.date.created 2024-06-11
dc.date.issued 2024-06-28 es_ES
dc.identifier.uri http://hdl.handle.net/10251/205565
dc.description.abstract [EN] SABI is a database of companies widely used in both academic research and market research by the industry. The objective of the TFG (Final Degree Project) is to study possible representativeness issues of SABI by comparing it with the registrations in the Official Gazette of the Commercial Registry (BORME). This study aims to uncover parallels between the data issues observed in ORBIS and those in SABI, highlighting the need for cautious interpretation of both databases. By examining differences between entities present in SABI and those absent, insights into database representativeness are gained. Results indicate that SABI, like ORBIS, may not fully represent Spain’s business population. Furthermore, analysis suggests that newer, smaller companies are less likely to appear in SABI, impacting data comprehensiveness. Extending this analysis, predictive models have been developed to classify whether a company is registered in SABI or not. This way, it not only helps to know if a company is in the database but also to understand how distinguishable these two groups are. This study underscores the importance of careful data scrutiny and the consideration of database limitations in research and decision-making processes. es_ES
dc.description.abstract [ES] SABI es una base de datos de empresas ampliamente utilizada tanto en investigación académica como en investigación de mercados por parte de la industria. El objetivo del TFG es estudiar posibles problemas de representatividad de SABI a partir de su comparación con las inscripciones en el Boletín Oficial del Registro Mercantil (BORME). Este estudio tiene como objetivo descubrir paralelismos entre los problemas de datos observados en ORBIS y los de SABI, destacando la necesidad de una interpretación cautelosa de ambas bases de datos. Al examinar las diferencias entre las entidades presentes en SABI y las ausentes, se obtienen conocimientos sobre la representatividad de la base de datos. Los resultados indican que SABI, al igual que ORBIS, puede no representar completamente la población empresarial de España. Además, el análisis sugiere que las empresas más nuevas y pequeñas tienen menos probabilidades de aparecer en SABI, lo que afecta la exhaustividad de los datos. Extendiéndose este análisis, se han desarrollado modelos predictivos para clasificar si una empresa está registrada en SABI o no. De esta manera, no solo ayuda a saber si una empresa está en la base de datos, sino también a comprender cuán distinguibles son estos dos grupos. Este estudio subraya la importancia de un análisis de datos cuidadoso y la consideración de las limitaciones de las bases de datos en los procesos de investigación y toma de decisiones. es_ES
dc.format.extent 62 es_ES
dc.language Inglés es_ES
dc.publisher Universitat Politècnica de València es_ES
dc.rights Reserva de todos los derechos es_ES
dc.subject SABI es_ES
dc.subject BORME es_ES
dc.subject ORBIS es_ES
dc.subject Bias es_ES
dc.subject Prediction es_ES
dc.subject Python es_ES
dc.subject Sesgo es_ES
dc.subject Predicción es_ES
dc.subject.classification ECONOMIA APLICADA es_ES
dc.subject.other Grado en Ciencia de Datos-Grau en Ciència de Dades es_ES
dc.title Characterization of the missing companies in the SABI database es_ES
dc.title.alternative Caracterització de les empreses absents en la base de dades de SABI es_ES
dc.title.alternative Caracterización de las empresas ausentes en la base de datos de SABI es_ES
dc.type Proyecto/Trabajo fin de carrera/grado es_ES
dc.rights.accessRights Cerrado es_ES
dc.contributor.affiliation Universitat Politècnica de València. Departamento de Economía y Ciencias Sociales - Departament d'Economia i Ciències Socials es_ES
dc.contributor.affiliation Universitat Politècnica de València. Escola Tècnica Superior d'Enginyeria Informàtica es_ES
dc.description.bibliographicCitation Huang Chen, X. (2024). Characterization of the missing companies in the SABI database. Universitat Politècnica de València. http://hdl.handle.net/10251/205565 es_ES
dc.description.accrualMethod TFGM es_ES
dc.relation.pasarela TFGM\160076 es_ES


Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem