Mostrar el registro sencillo del ítem
dc.contributor.advisor | Palanca Cámara, Javier | es_ES |
dc.contributor.advisor | Julian Inglada, Vicente Javier | es_ES |
dc.contributor.author | Pescador Barreto, Germán Andrés | es_ES |
dc.date.accessioned | 2023-10-21T19:15:08Z | |
dc.date.available | 2023-10-21T19:15:08Z | |
dc.date.created | 2023-09-21 | |
dc.date.issued | 2023-10-21 | es_ES |
dc.identifier.uri | http://hdl.handle.net/10251/198512 | |
dc.description.abstract | [ES] Este trabajo se enfoca en el entrenamiento de un agente robótico de navegación diferencial, utilizando técnicas de aprendizaje por refuerzo. El objetivo principal es capacitar al agente para realizar tareas de navegación en entornos desconocidos y cumplir con éxito una tarea de búsqueda específica, utilizando únicamente la información proporcionada por sus sensores en tiempo real. Dado el alto costo y la complejidad asociados con el entrenamiento en entornos físicos reales, se opta por llevar a cabo este proceso en un entorno de simulación mediante el uso del motor de videojuegos Unity3D y su kit de herramientas de aprendizaje por refuerzo ML-Agents. A lo largo de la memoria se relata el proceso incremental mediante el cual logramos entrenar con éxito un modelo con capacidades de generalización, y al final se proponen una serie de formas en que este modelo podría ser mejorado o extendido en base a los resultados observados durante el proceso de experimentación. | es_ES |
dc.description.abstract | [EN] This work focuses on the training of a differential navigation robotic agent using reinforcement learning techniques. The main objective is to train the agent to perform navigation tasks in unknown environments and successfully accomplish a specific search task, using only the information provided by its real-time sensors. Given the high cost and complexity associated with training in real physical environments, we choose to carry out this process in a simulation environment using the Unity3D video game engine and its reinforcement learning toolkit ML-Agents. Throughout the report, the incremental process by which we successfully trained a model with generalization capabilities is described, and at the end, a series of ways in which this model could be improved or extended based on the results observed during the experimentation process are proposed. | es_ES |
dc.format.extent | 64 | es_ES |
dc.language | Español | es_ES |
dc.publisher | Universitat Politècnica de València | es_ES |
dc.rights | Reserva de todos los derechos | es_ES |
dc.subject | Autonomous systems | es_ES |
dc.subject | Mobile robotics | es_ES |
dc.subject | Reinforcement learning | es_ES |
dc.subject | Artificial Intelligence (AI) | es_ES |
dc.subject | Inteligencia artificial | es_ES |
dc.subject | Aprendizaje por refuerzo | es_ES |
dc.subject | Robótica móvil | es_ES |
dc.subject | Sistemas autónomos | es_ES |
dc.subject.classification | LENGUAJES Y SISTEMAS INFORMATICOS | es_ES |
dc.subject.other | Máster Universitario en Inteligencia Artificial, Reconocimiento de Formas e Imagen Digital-Màster Universitari en Intel·ligència Artificial, Reconeixement de Formes i Imatge Digital | es_ES |
dc.title | Aplicación de técnicas de aprendizaje por refuerzo para la navegación de robots móviles | es_ES |
dc.title.alternative | Application of Reinforcement Learning Techniques for the Navigation of Mobile Robots | es_ES |
dc.title.alternative | Aplicació de tècniques d'aprenentatge per reforç per a la navegació a robots mòbils | es_ES |
dc.type | Tesis de máster | es_ES |
dc.rights.accessRights | Abierto | es_ES |
dc.contributor.affiliation | Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació | es_ES |
dc.description.bibliographicCitation | Pescador Barreto, GA. (2023). Aplicación de técnicas de aprendizaje por refuerzo para la navegación de robots móviles. Universitat Politècnica de València. http://hdl.handle.net/10251/198512 | es_ES |
dc.description.accrualMethod | TFGM | es_ES |
dc.relation.pasarela | TFGM\149420 | es_ES |