Resumen:
|
[ES] En el contexto de la digitalización y la analítica avanzada, este trabajo ha investigado cómo
la ciencia de datos puede transformar la gestión hotelera. El estudio se ha centrado en analizar y
predecir el impacto ...[+]
[ES] En el contexto de la digitalización y la analítica avanzada, este trabajo ha investigado cómo
la ciencia de datos puede transformar la gestión hotelera. El estudio se ha centrado en analizar y
predecir el impacto de diversas variables en la ocupación y calificación de un hotel en México,
con el fin de optimizar su cumplimiento de expectativas del cliente mediante el uso de datos de
reseñas de Google Maps, condiciones meteorológicas y niveles de ocupación. En este proyecto,
se ha utilizado el lenguaje de programación Python con la ayuda de los cuadernos de
JupyterLab.
Para resolver esta problemática, se ha seguido una metodología basada en el proceso de
Descubrimiento de Conocimiento en Bases de Datos (KDD), estructurando el enfoque en varias
fases: obtención de datos, preparación y transformación, análisis descriptivo, análisis predictivo
y análisis prescriptivo. Los orígenes de datos son diversos y la información ha sido recopilada
mediante técnicas de web scraping de reseñas en Google Maps, adquisición de variables
meteorológicas a través de una API y recepción de datos de la ocupación del hotel
proporcionados por el establecimiento en cuestión.
En la fase de preparación, se han gestionado datos faltantes e integrado las diversas fuentes de
información para construir conjuntos de datos coherentes. Estos han servido para realizar un análisis descriptivo.
Posteriormente, se ha realizado un análisis predictivo mediante la modelización ARIMA,
utilizando tanto variables exógenas como sin ellas, con el objetivo de prever la valoración
global del hotel y evaluar el impacto de factores externos.
Por último, el análisis prescriptivo se ha centrado en la maximización del rating del hotel,
considerando y excluyendo la variable temporal. Para ello, se han planteado funciones objetivo
y se han analizado condiciones concretas para establecer metas alcanzables. Este análisis ha
desembocado en la propuesta de recomendaciones prácticas y la implementación de un cuadro
de mandos en la herramienta Power BI de Microsoft.
Los resultados han indicado que, sobre todo, la calidad de las habitaciones y del servicio tienen
un impacto sustancial en la puntuación general de este hotel y que es posible mejorarla mediante
estrategias basadas en datos. En adición, las conclusiones del trabajo subrayan la importancia de
integrar múltiples fuentes de información y utilizar técnicas avanzadas de análisis de datos para
optimizar la gestión hotelera y aumentar la satisfacción de los huéspedes.
[-]
[CA] En el context de la digitalització i l'analítica avançada, aquest treball ha investigat com la
ciència de dades pot transformar la gestió hotelera. L'estudi s'ha centrat en analitzar i predir
l'impacte de diverses ...[+]
[CA] En el context de la digitalització i l'analítica avançada, aquest treball ha investigat com la
ciència de dades pot transformar la gestió hotelera. L'estudi s'ha centrat en analitzar i predir
l'impacte de diverses variables en l'ocupació i qualificació d'un hotel a Mèxic, amb la finalitat
d'optimitzar el seu compliment d'expectatives del client mitjançant l'ús de dades de ressenyes de
Google Maps, condicions meteorològiques i nivells d'ocupació. En aquest projecte, s'ha utilitzat
el llenguatge de programació Python amb l'ajuda dels quaderns de JupyterLab.
Per a resoldre aquesta problemàtica, s'ha seguit una metodologia basada en el procés de
Descobriment de Coneixement en Bases de dades (KDD), estructurant l'enfocament en diverses
fases: obtenció de dades, preparació i transformació, anàlisi descriptiva, anàlisi predictiva i
anàlisi prescriptiva. Els orígens de dades són diversos i la informació ha sigut recopilada
mitjançant tècniques de web scraping de ressenyes en Google Maps, adquisició de variables
meteorològiques a través d'una API i recepció de dades de l'ocupació de l'hotel proporcionades
per l'establiment en qüestió.
En la fase de preparació, s'han gestionat dades que manca i integrat les diverses fonts
d'informació per a construir conjunts de dades coherents. Aquests han servit per a dur a terme
una anàlisi descriptiva. Posteriorment, s'ha fet una anàlisi predictiva mitjançant la modelització ARIMA, utilitzant tan
variables exògenes com sense elles, amb l'objectiu de preveure la valoració global de l'hotel i
avaluar l'impacte de factors externs.
Finalment, l'anàlisi prescriptiva s'ha centrat en la maximització del ràting de l'hotel, considerant
i excloent la variable temporal. Per a això, s'han plantejat funcions objectiu i s'han analitzat
condicions concretes per a establir metes assolibles. Aquesta anàlisi ha desembocat en la
proposta de recomanacions pràctiques i la implementació d'un quadre de comandaments en
l'eina Power BI de Microsoft.
Els resultats han indicat que, sobretot, la qualitat de les habitacions i del servei tenen un impacte
substancial en la puntuació general d'aquest hotel i que és possible millorar-la mitjançant
estratègies basades en dades. En addició, les conclusions del treball subratllen la importància
d'integrar múltiples fonts d'informació i utilitzar tècniques avançades d'anàlisis de dades per a
optimitzar la gestió hotelera i augmentar la satisfacció dels hostes.
[-]
[EN] In the context of digitisation and advanced analytics, this paper has investigated how data
science can transform hotel management. The study focused on analysing and predicting the
impact of various variables on ...[+]
[EN] In the context of digitisation and advanced analytics, this paper has investigated how data
science can transform hotel management. The study focused on analysing and predicting the
impact of various variables on the occupancy and rating of a hotel in Mexico, in order to
optimise its compliance with customer expectations by using data from Google Maps reviews,
weather conditions and occupancy levels. In this project, the Python programming language has
been used with the help of the JupyterLab notebooks.
To solve this problem, a methodology based on the Knowledge Discovery Database (KDD)
process has been followed, structuring the approach in several phases: data collection,
preparation and transformation, descriptive analysis, predictive analysis and prescriptive
analysis. The data sources are diverse and the information has been collected through web
scraping techniques of reviews on Google Maps, acquisition of meteorological variables
through an API and reception of hotel occupancy data provided by the establishment in
question. During the preparation phase, missing data have been managed and the various sources of
information integrated to build coherent data sets. These have been used to perform a
descriptive analysis.
Subsequently, a predictive analysis was carried out by means of ARIMA modelling, using both
exogenous and non-exogenous variables, with the aim of forecasting the overall valuation of the
hotel and assessing the impact of external factors.
Finally, the prescriptive analysis focused on maximising the hotel rating, considering and
excluding the time variable. To this end, objective functions have been established and specific
conditions have been analysed in order to set achievable goals. This analysis has led to the
proposal of practical recommendations and the implementation of a dashboard in Microsoft's
Power BI tool.
The results have indicated that, above all, the quality of rooms and service have a substantial
impact on the overall score of this hotel and can be improved through data-driven strategies. In
addition, the findings underline the importance of integrating multiple sources of information
and using advanced data analysis techniques to optimise hotel management and increase guest
satisfaction.
[-]
|