Utilización de conocimiento específico en aprendizaje por refuerzo para videojuegos

Bonet Cortés, Enric

RiuNet repositorio UPV
:
Docencia
:
Trabajos académicos
:
Servicio de alumnado - Trabajos académicos
:
Ver ítem

Identificarse

Buscar en RiuNet

Listar

Todo RiuNet
Esta colección

Mi cuenta

Acceder

Estadísticas

Ver Estadísticas de uso

Ayuda RiuNet

Admin. UPV

Compartir/Enviar a

Citas

Estadísticas

Utilización de conocimiento específico en aprendizaje por refuerzo para videojuegos

Mostrar el registro sencillo del ítem

Ficheros en el ítem

Nombre: Bonet - Utilización ...

Tamaño: 5.333Mb

Formato: PDF

Solicitar una copia al autor

dc.contributor.advisor	Onaindia de la Rivaherrera, Eva	es_ES
dc.contributor.advisor	Jiménez Celorrio, Sergio	es_ES
dc.contributor.author	Bonet Cortés, Enric	es_ES
dc.date.accessioned	2020-10-13T07:26:39Z
dc.date.available	2020-10-13T07:26:39Z
dc.date.created	2020-09-24
dc.date.issued	2020-10-13	es_ES
dc.identifier.uri	http://hdl.handle.net/10251/151465
dc.description.abstract	[EN] Nowadays, the video-game industry has grown so much that it has transformed this sector into one of the most productive and important in the world. Such is its weight in society, that even the field of Artificial Intelligence has turned with it, giving fruit to various investigations aimed at studying the behavior of AI in video games. The seemingly trivial idea that ¿a computer can defeat a human¿ is not as far away as it seems, but thanks to the highly controlled environments that video-games offer us, computer science has found a safe box of experimentation thus demonstrating that a video-game environment can simulate real situations, beyond entertainment. Reinforcement Learning has proven to be a general and flexible approach to the development of agents who play video-games. However, developing efficient reinforcement agents, especially for end-reward video games, is often very expensive and the simulation requires an enormous number of iterations to obtain an effective policy. The goal of this project is to study the representation and use of domain-specific knowledge from a video-game to guide the exploration of a reinforcement learning agent and reduce in this way the episodes necessary to master the game. The work is based on the reward machine¿s concept, a type of finite state machine that takes an abstract description of the environment as input and returns different reward functions at different instants of time depending on the reward machine¿s transitions. In particular, we apply the concept of the reward machine to the Google Research Football environment using deep reinforcement learning techniques.	es_ES
dc.description.abstract	[ES] Hoy por hoy, la industria de los videojuegos ha crecido tanto que ha trasformado este sector en uno de los más productivos e importantes del mundo. Tal es su peso en la sociedad, que incluso el campo de la Inteligencia Artificial se ha volcado con él, dando fruto a diversas investigaciones orientadas a estudiar el comportamiento de la IA en los videojuegos. La idea, aparentemente trivial, de que ¿un ordenador pueda derrotar a un humano¿ no está realmente tan lejos, si no que gracias a los entornos tan controlados que nos ofrecen los videojuegos la ciencia de la computación ha encontrado un cuadro seguro de experimentación, demostrando así que, mas allá del entretenimiento, un entorno de videojuegos puede simular situaciones absolutamente reales. El Aprendizaje por Refuerzo ha demostrado ser una aproximación general y flexible para el desarrollo de agentes que juegan a videojuegos. Sin embargo, desarrollar agentes de refuerzo eficientes, especialmente para videojuegos de recompensa final, suele ser muy costoso y la simulación requiere un número enorme de iteraciones hasta obtener una política efectiva. El objetivo de este proyecto es estudiar la representación y utilización de conocimiento específico del dominio de un videjuego para guiar la exploración de un agente de aprendizaje por refuerzo y reducir así los episodios necesarios para dominar el juego. El trabajo se sustenta en el concepto de máquina de recompensa, un tipo de máquina de estados finitos que toma una descripción abstracta del entorno como entrada y devuelve diferentes funciones de recompensa en diferentes instantes de tiempo dependiendo de las transiciones de la máquina de recompensa. Particularmente, aplicamos el concepto de máquina de recompensa al Google Research Football environment utilizando para ello técnicas de aprendizaje por refuerzo profundo.	es_ES
dc.description.abstract	[CA] Ara com ara, la indústria dels videojocs ha crescut tant que ha transformat aquest sector en uno dels més productius e importants del món. Tal és el seu pes en la societat, que fins i tot el camp de la Inteligencia Artificial s’ha volcat amb ell, donant frut a diverses investigacions orientades a estudiar el comportament de la IA en els videojocs. La idea, aparenment trivial, de que “un ordinador puga derrotar a un humà” no està realment tan lluny, si no que gràcies als entorns tan controlats que ens ofereixen els videojocs, la ciència de la computació ha trobat un cuadre segur d’experimentació, demostrant aixina que, més enllà de l’entreteniment, un entorn de videojocs pot simular situacions absolutament reals. L’Aprenentatge per Reforç ha demostrat ser una aproximació general i flexible per al desenvolupament d’agents que juguen a videojocs. No obstant això, desenvolupar agents per reforç eficients, especialment per videojocs de recompensa final, sol ser molt costós i la simulació requereix un número enorme de iteracions fins a obtindre una política efectiva. L’objectiu d’aquest projecte és estudiar la representació i utilització de coneixement específic del domini d’un videojoc per guiar l’exploració d’un agent d’aprenentatge per reforç i reduir així els episodis necesaris per a dominar el joc. El treball es sustenta en el concepte de màquines de recompensa, un tipus de màquina d’estats finits que pren una descripció abstracta de l’entorn com entrada i torna diferents funcions de recompensa en diferents instants de temps depenent de les transaccions de la màquina de recompensa. Particularment, apliquem el concepte de màquina de recompensa al Google Research Football environment utilitzant per a ell tècniques d’aprenentatge per reforç profund.	es_ES
dc.format.extent	62	es_ES
dc.language	Español	es_ES
dc.publisher	Universitat Politècnica de València	es_ES
dc.rights	Reserva de todos los derechos	es_ES
dc.subject	Inteligencia artificial	es_ES
dc.subject	Video Juegos	es_ES
dc.subject	Deep Reinforcement Learning	es_ES
dc.subject	OpenAI Gym	es_ES
dc.subject	Google Research Football	es_ES
dc.subject	Reward machines	es_ES
dc.subject	Artificial intelligence	es_ES
dc.subject	Video Games	es_ES
dc.subject	OpenAI Gym	es_ES
dc.subject	Intel·ligència artificial	es_ES
dc.subject	Videojocs	es_ES
dc.subject.classification	CIENCIAS DE LA COMPUTACION E INTELIGENCIA ARTIFICIAL	es_ES
dc.subject.classification	LENGUAJES Y SISTEMAS INFORMATICOS	es_ES
dc.subject.other	Máster Universitario en Inteligencia Artificial, Reconocimiento de Formas e Imagen Digital-Màster Universitari en Intel·Ligència Artificial: Reconeixement de Formes i Imatge Digital	es_ES
dc.title	Utilización de conocimiento específico en aprendizaje por refuerzo para videojuegos	es_ES
dc.type	Tesis de máster	es_ES
dc.rights.accessRights	Cerrado	es_ES
dc.contributor.affiliation	Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació	es_ES
dc.description.bibliographicCitation	Bonet Cortés, E. (2020). Utilización de conocimiento específico en aprendizaje por refuerzo para videojuegos. http://hdl.handle.net/10251/151465	es_ES
dc.description.accrualMethod	TFGM	es_ES
dc.relation.pasarela	TFGM\125772	es_ES

Este ítem aparece en la(s) siguiente(s) colección(ones)

Servicio de alumnado - Trabajos académicos [7391]

Mostrar el registro sencillo del ítem

Utilización de conocimiento específico en aprendizaje por refuerzo para videojuegos

RiuNet: Repositorio Institucional de la Universidad Politécnica de Valencia

Buscar en RiuNet

Listar

Todo RiuNet

Esta colección

Mi cuenta

Estadísticas

Ayuda RiuNet

Admin. UPV

Compartir/Enviar a

Citas

Estadísticas

Utilización de conocimiento específico en aprendizaje por refuerzo para videojuegos

Ficheros en el ítem

Este ítem aparece en la(s) siguiente(s) colección(ones)