Mostrar el registro sencillo del ítem
dc.contributor.advisor | Hernández Orallo, José | es_ES |
dc.contributor.author | Benacloch Ayuso, José Luis | es_ES |
dc.date.accessioned | 2012-04-10T07:55:08Z | |
dc.date.available | 2012-04-10T07:55:08Z | |
dc.date.created | 2012-03-26 | |
dc.date.issued | 2012-04-10 | |
dc.identifier.uri | http://hdl.handle.net/10251/15162 | |
dc.description.abstract | Este proyecto consiste en la creación de una plataforma, denominada RL-GGP (Reinforcement Learning General Game Playing), que permita usar y evaluar algoritmos de aprendizaje por refuerzo en diferentes tipos de juegos por turnos (tres en raya, damas, ajedrez, etc.) de una forma sencilla y genérica para todos los algoritmos. Con genérica se entiende que lo que se pretende es que tanto los algoritmos como los propios juegos sigan un estándar perfectamente definido y por supuesto que la propia aplicación los acepte y los haga jugar. Los juegos por turnos descritos en un estándar de descripción de juegos, denominado GDL (Game Description Language). Los algoritmos utilizados se han adaptado de la librería de van Hasselt y se han integrado en RL-Glue, una plataforma estándar de algoritmos de aprendizaje por refuerzo. Los algoritmos de aprendizaje por refuerzo son algoritmos generalistas que no están diseñados a juegos por turnos, pero pueden "aprender" a jugar con una buena elección de recompensas y muchas partidas. En concreto, los algoritmos de aprendizaje por refuerzo van adquiriendo experiencia en cada partida, lo que les permite ir aprendiendo las reglas del juego, las cuales desconocen en un principio, y por supuesto aprenden como ganar dicho juego. Un intérprete de GDL informa a los jugadores de las acciones de las que disponen y cuando están quebrantando las reglas, y según su acción se determina la recompensa que recibirá cada jugador en cada movimiento. Para ello se ha utilizado una aplicación cliente servidor que permite que varios jugadores se conecten al servidor usando un determinado protocolo, los cuales son informados de los diferentes estados a los que transita el juego, en base a la descripción GDL que se le haya proporcionado a dicha aplicación. Dichos jugadores en el caso de esta implementación son creados mediante la herramienta de jugadores de juego genéricos Jocular. Se han realizado experimentos con dos juegos diferentes y varios algoritmos mostrando así el potencial de la herramienta. Por último, dado que los juegos se representan en el lenguaje estándar GDL y los algoritmos de aprendizaje por refuerzo se han implementado mediante el interfaz RL-Glue. Con este interfaz se puede implementar de forma simple cualquier tipo de algoritmo de aprendizaje por refuerzo. | es_ES |
dc.format.extent | 83 | es_ES |
dc.language | Español | es_ES |
dc.publisher | Universitat Politècnica de València | es_ES |
dc.rights | Reserva de todos los derechos | es_ES |
dc.subject | General game playing | es_ES |
dc.subject | RL-Glue | es_ES |
dc.subject | Aprendizaje por refuerzo | es_ES |
dc.subject | Jocular | es_ES |
dc.subject | Game description language | es_ES |
dc.subject | RL-GGP (Reinforcement Learning General Game Playing) | es_ES |
dc.subject | Algoritmos Hado Van Hasselt | es_ES |
dc.subject | GGP-Server | es_ES |
dc.subject.other | Ingeniería Informática-Enginyeria Informàtica | es_ES |
dc.title | RL-GGP : una plataforma de integración de algoritmos de aprendizaje por refuerzo en el sistema de juegos GDL | es_ES |
dc.type | Proyecto/Trabajo fin de carrera/grado | es_ES |
dc.rights.accessRights | Cerrado | es_ES |
dc.contributor.affiliation | Universitat Politècnica de València. Escola Tècnica Superior d'Enginyeria Informàtica | es_ES |
dc.description.bibliographicCitation | Benacloch Ayuso, JL. (2012). RL-GGP : una plataforma de integración de algoritmos de aprendizaje por refuerzo en el sistema de juegos GDL. http://hdl.handle.net/10251/15162. | es_ES |
dc.description.accrualMethod | Archivo delegado | es_ES |