Mostrar el registro sencillo del ítem
dc.contributor.advisor | Julian Inglada, Vicente Javier | es_ES |
dc.contributor.advisor | Palanca Cámara, Javier | es_ES |
dc.contributor.author | Martínez Sanchis, Genís | es_ES |
dc.date.accessioned | 2021-02-24T09:59:24Z | |
dc.date.available | 2021-02-24T09:59:24Z | |
dc.date.created | 2020-12-18 | |
dc.date.issued | 2021-02-24 | es_ES |
dc.identifier.uri | http://hdl.handle.net/10251/162288 | |
dc.description.abstract | [ES] En este trabajo de fin de grado se realizará un estudio basado en el análisis de la aplicación de algoritmos de aprendizaje por refuerzo para entornos mono-agente sobre entornos multi-agente basados en la plataforma MARLÖ. Todo esto con el objetivo de comparar la eficacia y eficiencia de dichos algoritmos en entornos para los cuales no han sido diseñados. Para esto será necesario tanto el diseño y creación de entornos personalizados como la modificación de las implementaciones de los algoritmos para adaptarlas a dichos entornos. | es_ES |
dc.description.abstract | [EN] In this final degree thesis, we perform a study based on the analysis of the application of reinforcement learning algorithms designed for single-agent environments on multi-agent environments based on the MARLÖ platform. All this in order to compare the effectiveness and efficiency of these algorithms in environments for which they have not been designed. This will require both the design and creation of custom environments and the modification of the algorithm implementations to adapt them to those environments. | es_ES |
dc.description.abstract | [CA] En aquest treball de fi de grau es realitzarà un estudi basat en l’anàlisi de l’aplicació d’algoritmes d’aprenentatge per reforç per a entorns mono-agent sobre entorns multiagent basats en la plataforma MARLÖ. Tot això amb l’objectiu de comparar l’eficàcia i eficiència d’aquests algorismes en entorns per als quals no han estat dissenyats. Per això serà necessari tant el disseny i creació d’entorns personalitzats com la modificació de les implementacions dels algoritmes per adaptar-les a aquests entorns. | es_ES |
dc.description.sponsorship | Gracias al Instituto Valenciano de Investigación en Inteligencia Artificial (VRAIN) por concederme la beca de formación que ha hecho este trabajo posible. We gratefully acknowledge the support of NVIDIA Corporation with the donation of the Titan V GPU used for this research. | |
dc.format.extent | 50 | es_ES |
dc.language | Español | es_ES |
dc.publisher | Universitat Politècnica de València | es_ES |
dc.rights | Reconocimiento (by) | es_ES |
dc.subject | Sistemas multi-agente | es_ES |
dc.subject | Inteligencia artificial | es_ES |
dc.subject | Aprendizaje por refuerzo | es_ES |
dc.subject | Videojuegos | es_ES |
dc.subject | Multi-agent systems | es_ES |
dc.subject | Artificial intelligence | es_ES |
dc.subject | Reinforcement learning | es_ES |
dc.subject | Video games | es_ES |
dc.subject.classification | LENGUAJES Y SISTEMAS INFORMATICOS | es_ES |
dc.subject.other | Grado en Ingeniería Informática-Grau en Enginyeria Informàtica | es_ES |
dc.title | Aprendizaje por refuerzo en sistemas multiagente mediante MARLÖ | es_ES |
dc.type | Proyecto/Trabajo fin de carrera/grado | es_ES |
dc.rights.accessRights | Abierto | es_ES |
dc.contributor.affiliation | Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació | es_ES |
dc.contributor.affiliation | Universitat Politècnica de València. Escola Tècnica Superior d'Enginyeria Informàtica | es_ES |
dc.description.bibliographicCitation | Martínez Sanchis, G. (2020). Aprendizaje por refuerzo en sistemas multiagente mediante MARLÖ. Universitat Politècnica de València. http://hdl.handle.net/10251/162288 | es_ES |
dc.description.accrualMethod | TFGM | es_ES |
dc.relation.pasarela | TFGM\138502 | es_ES |
dc.contributor.funder | Instituto Valenciano de Investigación en Inteligencia Artificial | es_ES |
dc.contributor.funder | Nvidia | es_ES |