Abstract:
|
[ES] Esta es la memoria escrita que presenta el Trabajo de Fin de Grado de la titulación
Grado en Ingeniería informática.
Este trabajo realiza un estudio sobre la cooperación y aprendizaje entre agentes
inteligentes que ...[+]
[ES] Esta es la memoria escrita que presenta el Trabajo de Fin de Grado de la titulación
Grado en Ingeniería informática.
Este trabajo realiza un estudio sobre la cooperación y aprendizaje entre agentes
inteligentes que utilizan diversas técnicas. En particular, se analiza la utilidad del
algoritmo DQN, un algoritmo de Deep Reinforcement Learning, para problemas de
cooperación entre agentes, así como su coste, utilidad e implementación.
El desarrollo del trabajo consiste en la programación e implementación de un agente
inteligente que aprenda a jugar al minijuego colaborativo 'Catch the Pig' del concurso
The Malmo Colaborative Challenge de Microsoft. El minijuego está implementado en
Project Malmo, una plataforma para la investigación y experimentación de inteligencia
artificial creado a partir del videojuego Minecraft. Para lograr el aprendizaje del agente
se utiliza el algoritmo DQN, el cual será explicado y analizado.
El trabajo también pretende hacer un estudio de la cooperación y aprendizaje entre
agentes inteligentes así como del estado y desarrollo de este campo en la actualidad, a
demás de hacer un análisis y comparativa de los resultados obtenidos tanto por el
agente inteligente desarrollado para este trabajo como por los implementados por los
otros participantes del concurso.
La documentación que se presenta en este trabajo es diversa. En la memoria se expone
información relevante para la comprensión del trabajo y de sus condiciones, así como
de la plataforma utilizada para su desarrollo. También se explica de forma generalizada
la implementación del algoritmo DQN adaptada para este juego. A continuación se
exponen sus resultados así como los de otros agentes presentados para el concurso y se
realiza un análisis de estos para proporcionar un mayor entendimiento de la
cooperación entre agentes inteligentes y proponer futuras mejoras para el trabajo.
[-]
|