RL-GGP : una plataforma de integración de algoritmos de aprendizaje por refuerzo en el sistema de juegos GDL

Benacloch Ayuso, José Luis

Identificarse

Buscar en RiuNet

Listar

Todo RiuNet
Esta colección

Mi cuenta

Acceder

Estadísticas

Ver Estadísticas de uso

Ayuda RiuNet

Admin. UPV

Compartir/Enviar a

Citas

Estadísticas

RL-GGP : una plataforma de integración de algoritmos de aprendizaje por refuerzo en el sistema de juegos GDL

Mostrar el registro sencillo del ítem

Ficheros en el ítem

Nombre: Memoria.pdf

Tamaño: 1.135Mb

Formato: PDF

Solicitar una copia al autor

dc.contributor.advisor	Hernández Orallo, José	es_ES
dc.contributor.author	Benacloch Ayuso, José Luis	es_ES
dc.date.accessioned	2012-04-10T07:55:08Z
dc.date.available	2012-04-10T07:55:08Z
dc.date.created	2012-03-26
dc.date.issued	2012-04-10
dc.identifier.uri	http://hdl.handle.net/10251/15162
dc.description.abstract	Este proyecto consiste en la creación de una plataforma, denominada RL-GGP (Reinforcement Learning General Game Playing), que permita usar y evaluar algoritmos de aprendizaje por refuerzo en diferentes tipos de juegos por turnos (tres en raya, damas, ajedrez, etc.) de una forma sencilla y genérica para todos los algoritmos. Con genérica se entiende que lo que se pretende es que tanto los algoritmos como los propios juegos sigan un estándar perfectamente definido y por supuesto que la propia aplicación los acepte y los haga jugar. Los juegos por turnos descritos en un estándar de descripción de juegos, denominado GDL (Game Description Language). Los algoritmos utilizados se han adaptado de la librería de van Hasselt y se han integrado en RL-Glue, una plataforma estándar de algoritmos de aprendizaje por refuerzo. Los algoritmos de aprendizaje por refuerzo son algoritmos generalistas que no están diseñados a juegos por turnos, pero pueden "aprender" a jugar con una buena elección de recompensas y muchas partidas. En concreto, los algoritmos de aprendizaje por refuerzo van adquiriendo experiencia en cada partida, lo que les permite ir aprendiendo las reglas del juego, las cuales desconocen en un principio, y por supuesto aprenden como ganar dicho juego. Un intérprete de GDL informa a los jugadores de las acciones de las que disponen y cuando están quebrantando las reglas, y según su acción se determina la recompensa que recibirá cada jugador en cada movimiento. Para ello se ha utilizado una aplicación cliente servidor que permite que varios jugadores se conecten al servidor usando un determinado protocolo, los cuales son informados de los diferentes estados a los que transita el juego, en base a la descripción GDL que se le haya proporcionado a dicha aplicación. Dichos jugadores en el caso de esta implementación son creados mediante la herramienta de jugadores de juego genéricos Jocular. Se han realizado experimentos con dos juegos diferentes y varios algoritmos mostrando así el potencial de la herramienta. Por último, dado que los juegos se representan en el lenguaje estándar GDL y los algoritmos de aprendizaje por refuerzo se han implementado mediante el interfaz RL-Glue. Con este interfaz se puede implementar de forma simple cualquier tipo de algoritmo de aprendizaje por refuerzo.	es_ES
dc.format.extent	83	es_ES
dc.language	Español	es_ES
dc.publisher	Universitat Politècnica de València	es_ES
dc.rights	Reserva de todos los derechos	es_ES
dc.subject	General game playing	es_ES
dc.subject	RL-Glue	es_ES
dc.subject	Aprendizaje por refuerzo	es_ES
dc.subject	Jocular	es_ES
dc.subject	Game description language	es_ES
dc.subject	RL-GGP (Reinforcement Learning General Game Playing)	es_ES
dc.subject	Algoritmos Hado Van Hasselt	es_ES
dc.subject	GGP-Server	es_ES
dc.subject.other	Ingeniería Informática-Enginyeria Informàtica	es_ES
dc.title	RL-GGP : una plataforma de integración de algoritmos de aprendizaje por refuerzo en el sistema de juegos GDL	es_ES
dc.type	Proyecto/Trabajo fin de carrera/grado	es_ES
dc.rights.accessRights	Cerrado	es_ES
dc.contributor.affiliation	Universitat Politècnica de València. Escola Tècnica Superior d'Enginyeria Informàtica	es_ES
dc.description.bibliographicCitation	Benacloch Ayuso, JL. (2012). RL-GGP : una plataforma de integración de algoritmos de aprendizaje por refuerzo en el sistema de juegos GDL. http://hdl.handle.net/10251/15162.	es_ES
dc.description.accrualMethod	Archivo delegado	es_ES

Este ítem aparece en la(s) siguiente(s) colección(ones)

ETSINF - Trabajos académicos [5160]
Escola Tècnica Superior d'Enginyeria Informàtica

Mostrar el registro sencillo del ítem

RL-GGP : una plataforma de integración de algoritmos de aprendizaje por refuerzo en el sistema de juegos GDL

RiuNet: Repositorio Institucional de la Universidad Politécnica de Valencia

Buscar en RiuNet

Listar

Todo RiuNet

Esta colección

Mi cuenta

Estadísticas

Ayuda RiuNet

Admin. UPV

Compartir/Enviar a

Citas

Estadísticas

RL-GGP : una plataforma de integración de algoritmos de aprendizaje por refuerzo en el sistema de juegos GDL

Ficheros en el ítem

Este ítem aparece en la(s) siguiente(s) colección(ones)