- -

Aplicación de técnicas de aprendizaje por refuerzo para la navegación de robots móviles

RiuNet: Repositorio Institucional de la Universidad Politécnica de Valencia

Compartir/Enviar a

Citas

Estadísticas

  • Estadisticas de Uso

Aplicación de técnicas de aprendizaje por refuerzo para la navegación de robots móviles

Mostrar el registro sencillo del ítem

Ficheros en el ítem

dc.contributor.advisor Palanca Cámara, Javier es_ES
dc.contributor.advisor Julian Inglada, Vicente Javier es_ES
dc.contributor.author Pescador Barreto, Germán Andrés es_ES
dc.date.accessioned 2023-10-21T19:15:08Z
dc.date.available 2023-10-21T19:15:08Z
dc.date.created 2023-09-21
dc.date.issued 2023-10-21 es_ES
dc.identifier.uri http://hdl.handle.net/10251/198512
dc.description.abstract [ES] Este trabajo se enfoca en el entrenamiento de un agente robótico de navegación diferencial, utilizando técnicas de aprendizaje por refuerzo. El objetivo principal es capacitar al agente para realizar tareas de navegación en entornos desconocidos y cumplir con éxito una tarea de búsqueda específica, utilizando únicamente la información proporcionada por sus sensores en tiempo real. Dado el alto costo y la complejidad asociados con el entrenamiento en entornos físicos reales, se opta por llevar a cabo este proceso en un entorno de simulación mediante el uso del motor de videojuegos Unity3D y su kit de herramientas de aprendizaje por refuerzo ML-Agents. A lo largo de la memoria se relata el proceso incremental mediante el cual logramos entrenar con éxito un modelo con capacidades de generalización, y al final se proponen una serie de formas en que este modelo podría ser mejorado o extendido en base a los resultados observados durante el proceso de experimentación. es_ES
dc.description.abstract [EN] This work focuses on the training of a differential navigation robotic agent using reinforcement learning techniques. The main objective is to train the agent to perform navigation tasks in unknown environments and successfully accomplish a specific search task, using only the information provided by its real-time sensors. Given the high cost and complexity associated with training in real physical environments, we choose to carry out this process in a simulation environment using the Unity3D video game engine and its reinforcement learning toolkit ML-Agents. Throughout the report, the incremental process by which we successfully trained a model with generalization capabilities is described, and at the end, a series of ways in which this model could be improved or extended based on the results observed during the experimentation process are proposed. es_ES
dc.format.extent 64 es_ES
dc.language Español es_ES
dc.publisher Universitat Politècnica de València es_ES
dc.rights Reserva de todos los derechos es_ES
dc.subject Autonomous systems es_ES
dc.subject Mobile robotics es_ES
dc.subject Reinforcement learning es_ES
dc.subject Artificial Intelligence (AI) es_ES
dc.subject Inteligencia artificial es_ES
dc.subject Aprendizaje por refuerzo es_ES
dc.subject Robótica móvil es_ES
dc.subject Sistemas autónomos es_ES
dc.subject.classification LENGUAJES Y SISTEMAS INFORMATICOS es_ES
dc.subject.other Máster Universitario en Inteligencia Artificial, Reconocimiento de Formas e Imagen Digital-Màster Universitari en Intel·ligència Artificial, Reconeixement de Formes i Imatge Digital es_ES
dc.title Aplicación de técnicas de aprendizaje por refuerzo para la navegación de robots móviles es_ES
dc.title.alternative Application of Reinforcement Learning Techniques for the Navigation of Mobile Robots es_ES
dc.title.alternative Aplicació de tècniques d'aprenentatge per reforç per a la navegació a robots mòbils es_ES
dc.type Tesis de máster es_ES
dc.rights.accessRights Abierto es_ES
dc.contributor.affiliation Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació es_ES
dc.description.bibliographicCitation Pescador Barreto, GA. (2023). Aplicación de técnicas de aprendizaje por refuerzo para la navegación de robots móviles. Universitat Politècnica de València. http://hdl.handle.net/10251/198512 es_ES
dc.description.accrualMethod TFGM es_ES
dc.relation.pasarela TFGM\149420 es_ES


Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem