Mostrar el registro sencillo del ítem
dc.contributor.advisor | Monserrat Aranda, Carlos | es_ES |
dc.contributor.advisor | Rey Masid, Anxo | es_ES |
dc.contributor.author | Obrador Reina, Miquel | es_ES |
dc.date.accessioned | 2023-09-22T08:18:53Z | |
dc.date.available | 2023-09-22T08:18:53Z | |
dc.date.created | 2023-07-13 | |
dc.date.issued | 2023-09-22 | es_ES |
dc.identifier.uri | http://hdl.handle.net/10251/196950 | |
dc.description.abstract | [ES] En el campo del aprendizaje por refuerzo se busca entrenar agentes inteligentes para que aprendan a tomar decisiones óptimas en situaciones complejas a través de la interacción con un ambiente. En este trabajo realizado juntamente con Inditex, el agente será un robot que se encargue de la logística en un almacén, específicamente la retirada y entrada de cajas de forma automática en estanterías. A medida que se realizan distintas iteraciones del proyecto, se aumenta la complejidad del entorno y del problema a resolver para el agente. Se estudiarán el posible uso de diferentes arquitecturas de redes neuronales (Redes Neuronales Artificiales y Redes Neuronales Recurrentes) y técnicas de entrenamiento (por ejemplo, Deep Q-Learning, Actor-Critic y Policy Gradient) para seleccionar la mejor opción para cada escenario. Además de seleccionar correctamente los hiperparámetros, como el factor de descuento y la tasa de aprendizaje, para el mejor desempeño del modelo. Se espera que el agente logre aprender a realizar la logística del almacén de manera eficiente y efectiva. | es_ES |
dc.description.abstract | [EN] In the field of reinforcement learning, the aim is to train intelligent agents to learn to make optimal decisions in complex situations through interaction with an environment. In this work carried out jointly with Inditex, the agent will be a robot in charge of logistics in a warehouse, specifically the automatic removal and entry of boxes on shelves. As different iterations of the project are carried out, the complexity of the environment and the problem to be solved by the agent increases. The possible use of different neural network architectures (Artificial Neural Networks and Recurrent Neural Networks) and training techniques (e.g. Deep Q-Learning, Actor-Critic and Policy Gradient) will be studied to select the best option for each scenario. In addition to correctly selecting the hyperparameters, such as discount factor and learning rate, for the best model performance. The agent is expected to learn how to perform warehouse logistics efficiently and effectively. | es_ES |
dc.description.abstract | [CA] Al camp de l’aprenentatge per reforç es busca entrenar agents intel·ligents perquè aprenguin a prendre decisions òptimes en situacions complexes a través de la interacció amb un ambient. En aquest treball realitzat juntament amb Inditex, l’agent será un robot que s’encarregui de la logística en un magatzem, específicament la retirada i l’entrada de caixes de forma automàtica en prestatgeries. A mesura que es fan diferents iteracions del projecte, augmenta la complexitat de l’entorn i del problema a resoldre per a l’agent. S’estudiaran el possible ús de diferents arquitectures de xarxa neuronal (Xarxes Neuronals Artificials i Xarxes Neuronals Recurrents) i tècniques d’entrenament (per exemple, Deep Q-Learning, Actor-Critic i Policy Gradient) per seleccionar la millor opció per a cada escenari. A més, heu de seleccionar correctament els hiperparàmetres, com el factor de descompte i la taxa d’aprenentatge, en l’exercici del model. S’espera que l’agent aconsegueixi aprendre a fer la logística del magatzem de forma eficient i efectiva. | es_ES |
dc.format.extent | 59 | es_ES |
dc.language | Español | es_ES |
dc.publisher | Universitat Politècnica de València | es_ES |
dc.rights | Reconocimiento (by) | es_ES |
dc.subject | Aprendizaje por refuerzo | es_ES |
dc.subject | Redes neuronales | es_ES |
dc.subject | Almacenes | es_ES |
dc.subject | Logística | es_ES |
dc.subject | Optimización | es_ES |
dc.subject | Reinforcement learning | es_ES |
dc.subject | Neural networks | es_ES |
dc.subject | Warehouse | es_ES |
dc.subject | Logistics | es_ES |
dc.subject | Optimization | es_ES |
dc.subject.classification | LENGUAJES Y SISTEMAS INFORMATICOS | es_ES |
dc.subject.other | Grado en Ciencia de Datos-Grau en Ciència de Dades | es_ES |
dc.title | Aprendizaje por refuerzo en logística corporativa: Next Best Action | es_ES |
dc.title.alternative | Reinforcement learning in corporate logistics: Next Best Action | es_ES |
dc.title.alternative | Aprenentatge per reforç en logística corporativa: Next Best Action | es_ES |
dc.type | Proyecto/Trabajo fin de carrera/grado | es_ES |
dc.rights.accessRights | Abierto | es_ES |
dc.contributor.affiliation | Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació | es_ES |
dc.contributor.affiliation | Universitat Politècnica de València. Escola Tècnica Superior d'Enginyeria Informàtica | es_ES |
dc.description.bibliographicCitation | Obrador Reina, M. (2023). Aprendizaje por refuerzo en logística corporativa: Next Best Action. Universitat Politècnica de València. http://hdl.handle.net/10251/196950 | es_ES |
dc.description.accrualMethod | TFGM | es_ES |
dc.relation.pasarela | TFGM\156794 | es_ES |