- -

Aprendizaje por refuerzo en logística corporativa: Next Best Action

RiuNet: Repositorio Institucional de la Universidad Politécnica de Valencia

Compartir/Enviar a

Citas

Estadísticas

  • Estadisticas de Uso

Aprendizaje por refuerzo en logística corporativa: Next Best Action

Mostrar el registro sencillo del ítem

Ficheros en el ítem

dc.contributor.advisor Monserrat Aranda, Carlos es_ES
dc.contributor.advisor Rey Masid, Anxo es_ES
dc.contributor.author Obrador Reina, Miquel es_ES
dc.date.accessioned 2023-09-22T08:18:53Z
dc.date.available 2023-09-22T08:18:53Z
dc.date.created 2023-07-13
dc.date.issued 2023-09-22 es_ES
dc.identifier.uri http://hdl.handle.net/10251/196950
dc.description.abstract [ES] En el campo del aprendizaje por refuerzo se busca entrenar agentes inteligentes para que aprendan a tomar decisiones óptimas en situaciones complejas a través de la interacción con un ambiente. En este trabajo realizado juntamente con Inditex, el agente será un robot que se encargue de la logística en un almacén, específicamente la retirada y entrada de cajas de forma automática en estanterías. A medida que se realizan distintas iteraciones del proyecto, se aumenta la complejidad del entorno y del problema a resolver para el agente. Se estudiarán el posible uso de diferentes arquitecturas de redes neuronales (Redes Neuronales Artificiales y Redes Neuronales Recurrentes) y técnicas de entrenamiento (por ejemplo, Deep Q-Learning, Actor-Critic y Policy Gradient) para seleccionar la mejor opción para cada escenario. Además de seleccionar correctamente los hiperparámetros, como el factor de descuento y la tasa de aprendizaje, para el mejor desempeño del modelo. Se espera que el agente logre aprender a realizar la logística del almacén de manera eficiente y efectiva. es_ES
dc.description.abstract [EN] In the field of reinforcement learning, the aim is to train intelligent agents to learn to make optimal decisions in complex situations through interaction with an environment. In this work carried out jointly with Inditex, the agent will be a robot in charge of logistics in a warehouse, specifically the automatic removal and entry of boxes on shelves. As different iterations of the project are carried out, the complexity of the environment and the problem to be solved by the agent increases. The possible use of different neural network architectures (Artificial Neural Networks and Recurrent Neural Networks) and training techniques (e.g. Deep Q-Learning, Actor-Critic and Policy Gradient) will be studied to select the best option for each scenario. In addition to correctly selecting the hyperparameters, such as discount factor and learning rate, for the best model performance. The agent is expected to learn how to perform warehouse logistics efficiently and effectively. es_ES
dc.description.abstract [CA] Al camp de l’aprenentatge per reforç es busca entrenar agents intel·ligents perquè aprenguin a prendre decisions òptimes en situacions complexes a través de la interacció amb un ambient. En aquest treball realitzat juntament amb Inditex, l’agent será un robot que s’encarregui de la logística en un magatzem, específicament la retirada i l’entrada de caixes de forma automàtica en prestatgeries. A mesura que es fan diferents iteracions del projecte, augmenta la complexitat de l’entorn i del problema a resoldre per a l’agent. S’estudiaran el possible ús de diferents arquitectures de xarxa neuronal (Xarxes Neuronals Artificials i Xarxes Neuronals Recurrents) i tècniques d’entrenament (per exemple, Deep Q-Learning, Actor-Critic i Policy Gradient) per seleccionar la millor opció per a cada escenari. A més, heu de seleccionar correctament els hiperparàmetres, com el factor de descompte i la taxa d’aprenentatge, en l’exercici del model. S’espera que l’agent aconsegueixi aprendre a fer la logística del magatzem de forma eficient i efectiva. es_ES
dc.format.extent 59 es_ES
dc.language Español es_ES
dc.publisher Universitat Politècnica de València es_ES
dc.rights Reconocimiento (by) es_ES
dc.subject Aprendizaje por refuerzo es_ES
dc.subject Redes neuronales es_ES
dc.subject Almacenes es_ES
dc.subject Logística es_ES
dc.subject Optimización es_ES
dc.subject Reinforcement learning es_ES
dc.subject Neural networks es_ES
dc.subject Warehouse es_ES
dc.subject Logistics es_ES
dc.subject Optimization es_ES
dc.subject.classification LENGUAJES Y SISTEMAS INFORMATICOS es_ES
dc.subject.other Grado en Ciencia de Datos-Grau en Ciència de Dades es_ES
dc.title Aprendizaje por refuerzo en logística corporativa: Next Best Action es_ES
dc.title.alternative Reinforcement learning in corporate logistics: Next Best Action es_ES
dc.title.alternative Aprenentatge per reforç en logística corporativa: Next Best Action es_ES
dc.type Proyecto/Trabajo fin de carrera/grado es_ES
dc.rights.accessRights Abierto es_ES
dc.contributor.affiliation Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació es_ES
dc.contributor.affiliation Universitat Politècnica de València. Escola Tècnica Superior d'Enginyeria Informàtica es_ES
dc.description.bibliographicCitation Obrador Reina, M. (2023). Aprendizaje por refuerzo en logística corporativa: Next Best Action. Universitat Politècnica de València. http://hdl.handle.net/10251/196950 es_ES
dc.description.accrualMethod TFGM es_ES
dc.relation.pasarela TFGM\156794 es_ES


Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem