- -

Aprendizaje por refuerzo en sistemas multiagente mediante MARLÖ

RiuNet: Repositorio Institucional de la Universidad Politécnica de Valencia

Compartir/Enviar a

Citas

Estadísticas

  • Estadisticas de Uso

Aprendizaje por refuerzo en sistemas multiagente mediante MARLÖ

Mostrar el registro sencillo del ítem

Ficheros en el ítem

dc.contributor.advisor Julian Inglada, Vicente Javier es_ES
dc.contributor.advisor Palanca Cámara, Javier es_ES
dc.contributor.author Martínez Sanchis, Genís es_ES
dc.date.accessioned 2021-02-24T09:59:24Z
dc.date.available 2021-02-24T09:59:24Z
dc.date.created 2020-12-18
dc.date.issued 2021-02-24 es_ES
dc.identifier.uri http://hdl.handle.net/10251/162288
dc.description.abstract [ES] En este trabajo de fin de grado se realizará un estudio basado en el análisis de la aplicación de algoritmos de aprendizaje por refuerzo para entornos mono-agente sobre entornos multi-agente basados en la plataforma MARLÖ. Todo esto con el objetivo de comparar la eficacia y eficiencia de dichos algoritmos en entornos para los cuales no han sido diseñados. Para esto será necesario tanto el diseño y creación de entornos personalizados como la modificación de las implementaciones de los algoritmos para adaptarlas a dichos entornos. es_ES
dc.description.abstract [EN] In this final degree thesis, we perform a study based on the analysis of the application of reinforcement learning algorithms designed for single-agent environments on multi-agent environments based on the MARLÖ platform. All this in order to compare the effectiveness and efficiency of these algorithms in environments for which they have not been designed. This will require both the design and creation of custom environments and the modification of the algorithm implementations to adapt them to those environments. es_ES
dc.description.abstract [CA] En aquest treball de fi de grau es realitzarà un estudi basat en l’anàlisi de l’aplicació d’algoritmes d’aprenentatge per reforç per a entorns mono-agent sobre entorns multiagent basats en la plataforma MARLÖ. Tot això amb l’objectiu de comparar l’eficàcia i eficiència d’aquests algorismes en entorns per als quals no han estat dissenyats. Per això serà necessari tant el disseny i creació d’entorns personalitzats com la modificació de les implementacions dels algoritmes per adaptar-les a aquests entorns. es_ES
dc.description.sponsorship Gracias al Instituto Valenciano de Investigación en Inteligencia Artificial (VRAIN) por concederme la beca de formación que ha hecho este trabajo posible. We gratefully acknowledge the support of NVIDIA Corporation with the donation of the Titan V GPU used for this research.
dc.format.extent 50 es_ES
dc.language Español es_ES
dc.publisher Universitat Politècnica de València es_ES
dc.rights Reconocimiento (by) es_ES
dc.subject Sistemas multi-agente es_ES
dc.subject Inteligencia artificial es_ES
dc.subject Aprendizaje por refuerzo es_ES
dc.subject Videojuegos es_ES
dc.subject Multi-agent systems es_ES
dc.subject Artificial intelligence es_ES
dc.subject Reinforcement learning es_ES
dc.subject Video games es_ES
dc.subject.classification LENGUAJES Y SISTEMAS INFORMATICOS es_ES
dc.subject.other Grado en Ingeniería Informática-Grau en Enginyeria Informàtica es_ES
dc.title Aprendizaje por refuerzo en sistemas multiagente mediante MARLÖ es_ES
dc.type Proyecto/Trabajo fin de carrera/grado es_ES
dc.rights.accessRights Abierto es_ES
dc.contributor.affiliation Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació es_ES
dc.contributor.affiliation Universitat Politècnica de València. Escola Tècnica Superior d'Enginyeria Informàtica es_ES
dc.description.bibliographicCitation Martínez Sanchis, G. (2020). Aprendizaje por refuerzo en sistemas multiagente mediante MARLÖ. Universitat Politècnica de València. http://hdl.handle.net/10251/162288 es_ES
dc.description.accrualMethod TFGM es_ES
dc.relation.pasarela TFGM\138502 es_ES
dc.contributor.funder Instituto Valenciano de Investigación en Inteligencia Artificial es_ES
dc.contributor.funder Nvidia es_ES


Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem