Resumen:
|
[ES] El Trabajo de Fin de Grado se enfoca en la innovación en la gestión de campañas comerciales en Inditex, con el objetivo de obtener un modelo capaz de prever las ventas en cada una de las tiendas de una prenda nueva ...[+]
[ES] El Trabajo de Fin de Grado se enfoca en la innovación en la gestión de campañas comerciales en Inditex, con el objetivo de obtener un modelo capaz de prever las ventas en cada una de las tiendas de una prenda nueva clasificada según los parámetros modelo-calidad-color, que Inditex autodenomina MOCACO.
Para ello, empezamos entendiendo el comportamiento de las curvas de venta de los MOCACO en las tiendas, lo que nos permite clasificar los MOCACO en tres clases; fantasías, básicos y otros. A continuación, pasamos a la creación de los experimentos, en total haremos ocho; los dos primeros corresponden a los baseline, los tres siguientes a modelos de perceptrón multicapa y los tres últimos a modelos de XGBoost con entrenamiento distribuido. Mientras que los baselines tienen un preprocesamiento diferente al resto, los otros modelos tienen el mismo; los de perceptrón multicapa se llevarán a cabo con scikit-learn y los de XGBoost con pyspark.
El primer baseline consiste en desagregar las predicciones del modelo actual a nivel mundo por el peso de la tienda, calculado como el porcentaje de venta de la tienda. El segundo es similar al primero, con la diferencia de que cada tienda tiene un peso diferente por semana.
En cada uno de los experimentos vamos creando nuevas variables, cambiando la estructura del modelo o cubriendo las limitaciones del experimento anterior. Al comparar los modelos utilizamos dos métricas, una que mide el error semanal (WAPE) y otra que mide el error global del modelo (WWAPE), ambas se interpretan como porcentaje. Tras la evaluación, el mejor modelo es un XGBoost que lo encontramos en el último experimento. La información que tiene este modelo para realizar las predicciones es en relación con la descripción de los MOCACO; envío inicial y ventas de los MOCACO parecidos que han tenido una situación similar en la tienda, descripción de la situación de la tienda y venta de la familia en la tienda, principalmente. Para acabar realizamos la optimización de los hiperparámetros y su explicabilidad viendo la importancia de cada una de las siete variables a nivel global y semanal.
La principal limitación que hemos tenido a lo largo del desarrollo del proyecto es la memoria de los clústeres utilizados para ejecutar los modelos; que hemos conseguido resolver haciendo un muestreo de cara a garantizar la representatividad de la muestra.
Al obtener un modelo que cumple con el objetivo, hemos conseguido un gran impacto Puesto que la empresa consigue ahorrar costes al hacer una asignación correcta de los MOCACO en tienda durante el proceso de distribución. A su vez, permite obtener la máxima venta posible en tiendas que de otro modo hubieran recibido menos mercancía. En conclusión, se consigue ahorrar costes y aumentar los ingresos de la compañía al realizar una mejor gestión.
[-]
[EN] The Bachelor's Thesis focuses on innovation in commercial campaign management at Inditex, with the aim of developing a model capable of predicting sales in each store for a new garment classified according to the ...[+]
[EN] The Bachelor's Thesis focuses on innovation in commercial campaign management at Inditex, with the aim of developing a model capable of predicting sales in each store for a new garment classified according to the model-quality-color parameters, which Inditex refers to as MOCACO.
To achieve this, we begin by understanding the behavior of the sales curves of MOCACO in the stores, which allows us to classify MOCACO into three categories: fantasies, basics, and others. Next, we proceed to the creation of the experiments, with a total of eight; the first two are baselines, the next three are multilayer perceptron models, and the last three are XGBoost models with distributed training. While the baselines have different preprocessing from the rest, the other models share the same preprocessing; the multilayer perceptron models are implemented with scikit-learn, and the XGBoost models with PySpark.
The first baseline involves disaggregating the current global model predictions by the store s weight, calculated as the store's sales percentage. The second is similar to the first, with the difference that each store has a different weight per week.
In each experiment, we create new variables, change the model structure, or address the limitations of the previous experiment. To compare the models, we use two metrics: one that measures the weekly error (WAPE) and another that measures the overall model error (WWAPE), both interpreted as percentages. After evaluation, the best model is an XGBoost found in the last experiment. The information this model uses for predictions includes the description of MOCACO; initial shipment and sales of similar MOCACO that had a similar situation in the store, the store's situation description, and the family sales in the store.
Finally, we optimize the hyperparameters and explain the model by analyzing the importance of each of the seven variables globally and weekly. The main limitation throughout the project development was the memory of the clusters used to run the models; we solved this by sampling to ensure the sample's representativeness.
By achieving a model that meets the objective, we have made a significant impact as the company can save costs by correctly allocating MOCACO in stores during the distribution process. At the same time, it allows for maximizing sales in stores that would otherwise have received less merchandise. In conclusion, we save costs and increase the company's revenue by improving management.
[-]
[CA] El Treball de Fi de Grau se centra en la innovació en la gestió de campanyes
comercials en Inditex, amb l'objectiu d'obtenir un model capaç de preveure les vendes
en cadascuna de les tendes d'una peça nova classificada ...[+]
[CA] El Treball de Fi de Grau se centra en la innovació en la gestió de campanyes
comercials en Inditex, amb l'objectiu d'obtenir un model capaç de preveure les vendes
en cadascuna de les tendes d'una peça nova classificada segons els paràmetres modelqualitat-color, que Inditex anomena MOCACO.
Per a això, comencem entenent el comportament de les corbes de venda dels
MOCACO en les tendes, el que ens permet classificar els MOCACO en tres classes:
fantasies, bàsics i altres. A continuació, passem a la creació dels experiments, en total
farem huit; els dos primers corresponen als baseline, els tres següents a models de
perceptró multicapa i els tres últims a models de XGBoost amb entrenament distribuït.
Mentre que els baseline tenen un preprocessament diferent a la resta, els altres models
tenen el mateix; els de perceptró multicapa es portaran a terme amb scikit-learn i els de
XGBoost amb pyspark.
El primer baseline consisteix a desagregar les prediccions del model actual a
nivell mundial pel pes de la tenda, calculat com el percentatge de venda de la tenda. El
segon és similar al primer, amb la diferència que cada tenda té un pes diferent per
setmana.
En cadascun dels experiments anem creant noves variables, canviant
l'estructura del model o cobrint les limitacions de l'experiment anterior. En comparar els
models utilitzem dues mètriques, una que mesura l'error setmanal (WAPE) i una altra
que mesura l'error global del model (WWAPE), ambdues s'interpreten com a
percentatge. Després de l'avaluació, el millor model és un XGBoost que trobem en l'últim
experiment. La informació que té aquest model per a realitzar les prediccions està
relacionada amb la descripció dels MOCACO; enviament inicial i vendes dels MOCACO
semblants que han tingut una situació similar en la tenda, descripció de la situació de la
tenda i venda de la família en la tenda, principalment. Per a acabar, realitzem
l'optimització dels hiperparàmetres i la seua explicabilitat veient la importància de
cadascuna de les set variables a nivell global i setmanal.
La principal limitació que hem tingut al llarg del desenvolupament del projecte és
la memòria dels clústers utilitzats per a executar els models; que hem aconseguit resoldre fent un mostreig per a garantir la representativitat de la mostra.
En obtindre un model que compleix amb l'objectiu, hem aconseguit un gran
impacte ja que l'empresa aconsegueix estalviar costos en fer una assignació correcta
dels MOCACO en tenda durant el procés de distribució. Alhora, permet obtindre la
màxima venda possible en tendes que d'una altra manera haurien rebut menys
mercaderia. En conclusió, s'aconsegueix estalviar costos i augmentar els ingressos de
la companyia en realitzar una millor gestió.
[-]
|