- -

RL-GGP : una plataforma de integración de algoritmos de aprendizaje por refuerzo en el sistema de juegos GDL

RiuNet: Repositorio Institucional de la Universidad Politécnica de Valencia

Compartir/Enviar a

Citas

Estadísticas

  • Estadisticas de Uso

RL-GGP : una plataforma de integración de algoritmos de aprendizaje por refuerzo en el sistema de juegos GDL

Mostrar el registro sencillo del ítem

Ficheros en el ítem

dc.contributor.advisor Hernández Orallo, José es_ES
dc.contributor.author Benacloch Ayuso, José Luis es_ES
dc.date.accessioned 2012-04-10T07:55:08Z
dc.date.available 2012-04-10T07:55:08Z
dc.date.created 2012-03-26
dc.date.issued 2012-04-10
dc.identifier.uri http://hdl.handle.net/10251/15162
dc.description.abstract Este proyecto consiste en la creación de una plataforma, denominada RL-GGP (Reinforcement Learning General Game Playing), que permita usar y evaluar algoritmos de aprendizaje por refuerzo en diferentes tipos de juegos por turnos (tres en raya, damas, ajedrez, etc.) de una forma sencilla y genérica para todos los algoritmos. Con genérica se entiende que lo que se pretende es que tanto los algoritmos como los propios juegos sigan un estándar perfectamente definido y por supuesto que la propia aplicación los acepte y los haga jugar. Los juegos por turnos descritos en un estándar de descripción de juegos, denominado GDL (Game Description Language). Los algoritmos utilizados se han adaptado de la librería de van Hasselt y se han integrado en RL-Glue, una plataforma estándar de algoritmos de aprendizaje por refuerzo. Los algoritmos de aprendizaje por refuerzo son algoritmos generalistas que no están diseñados a juegos por turnos, pero pueden "aprender" a jugar con una buena elección de recompensas y muchas partidas. En concreto, los algoritmos de aprendizaje por refuerzo van adquiriendo experiencia en cada partida, lo que les permite ir aprendiendo las reglas del juego, las cuales desconocen en un principio, y por supuesto aprenden como ganar dicho juego. Un intérprete de GDL informa a los jugadores de las acciones de las que disponen y cuando están quebrantando las reglas, y según su acción se determina la recompensa que recibirá cada jugador en cada movimiento. Para ello se ha utilizado una aplicación cliente servidor que permite que varios jugadores se conecten al servidor usando un determinado protocolo, los cuales son informados de los diferentes estados a los que transita el juego, en base a la descripción GDL que se le haya proporcionado a dicha aplicación. Dichos jugadores en el caso de esta implementación son creados mediante la herramienta de jugadores de juego genéricos Jocular. Se han realizado experimentos con dos juegos diferentes y varios algoritmos mostrando así el potencial de la herramienta. Por último, dado que los juegos se representan en el lenguaje estándar GDL y los algoritmos de aprendizaje por refuerzo se han implementado mediante el interfaz RL-Glue. Con este interfaz se puede implementar de forma simple cualquier tipo de algoritmo de aprendizaje por refuerzo. es_ES
dc.format.extent 83 es_ES
dc.language Español es_ES
dc.publisher Universitat Politècnica de València es_ES
dc.rights Reserva de todos los derechos es_ES
dc.subject General game playing es_ES
dc.subject RL-Glue es_ES
dc.subject Aprendizaje por refuerzo es_ES
dc.subject Jocular es_ES
dc.subject Game description language es_ES
dc.subject RL-GGP (Reinforcement Learning General Game Playing) es_ES
dc.subject Algoritmos Hado Van Hasselt es_ES
dc.subject GGP-Server es_ES
dc.subject.other Ingeniería Informática-Enginyeria Informàtica es_ES
dc.title RL-GGP : una plataforma de integración de algoritmos de aprendizaje por refuerzo en el sistema de juegos GDL es_ES
dc.type Proyecto/Trabajo fin de carrera/grado es_ES
dc.rights.accessRights Cerrado es_ES
dc.contributor.affiliation Universitat Politècnica de València. Escola Tècnica Superior d'Enginyeria Informàtica es_ES
dc.description.bibliographicCitation Benacloch Ayuso, JL. (2012). RL-GGP : una plataforma de integración de algoritmos de aprendizaje por refuerzo en el sistema de juegos GDL. http://hdl.handle.net/10251/15162. es_ES
dc.description.accrualMethod Archivo delegado es_ES


Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem