- -

Utilización de conocimiento específico en aprendizaje por refuerzo para videojuegos

RiuNet: Repositorio Institucional de la Universidad Politécnica de Valencia

Compartir/Enviar a

Citas

Estadísticas

  • Estadisticas de Uso

Utilización de conocimiento específico en aprendizaje por refuerzo para videojuegos

Mostrar el registro sencillo del ítem

Ficheros en el ítem

dc.contributor.advisor Onaindia de la Rivaherrera, Eva es_ES
dc.contributor.advisor Jiménez Celorrio, Sergio es_ES
dc.contributor.author Bonet Cortés, Enric es_ES
dc.date.accessioned 2020-10-13T07:26:39Z
dc.date.available 2020-10-13T07:26:39Z
dc.date.created 2020-09-24
dc.date.issued 2020-10-13 es_ES
dc.identifier.uri http://hdl.handle.net/10251/151465
dc.description.abstract [EN] Nowadays, the video-game industry has grown so much that it has transformed this sector into one of the most productive and important in the world. Such is its weight in society, that even the field of Artificial Intelligence has turned with it, giving fruit to various investigations aimed at studying the behavior of AI in video games. The seemingly trivial idea that ¿a computer can defeat a human¿ is not as far away as it seems, but thanks to the highly controlled environments that video-games offer us, computer science has found a safe box of experimentation thus demonstrating that a video-game environment can simulate real situations, beyond entertainment. Reinforcement Learning has proven to be a general and flexible approach to the development of agents who play video-games. However, developing efficient reinforcement agents, especially for end-reward video games, is often very expensive and the simulation requires an enormous number of iterations to obtain an effective policy. The goal of this project is to study the representation and use of domain-specific knowledge from a video-game to guide the exploration of a reinforcement learning agent and reduce in this way the episodes necessary to master the game. The work is based on the reward machine¿s concept, a type of finite state machine that takes an abstract description of the environment as input and returns different reward functions at different instants of time depending on the reward machine¿s transitions. In particular, we apply the concept of the reward machine to the Google Research Football environment using deep reinforcement learning techniques. es_ES
dc.description.abstract [ES] Hoy por hoy, la industria de los videojuegos ha crecido tanto que ha trasformado este sector en uno de los más productivos e importantes del mundo. Tal es su peso en la sociedad, que incluso el campo de la Inteligencia Artificial se ha volcado con él, dando fruto a diversas investigaciones orientadas a estudiar el comportamiento de la IA en los videojuegos. La idea, aparentemente trivial, de que ¿un ordenador pueda derrotar a un humano¿ no está realmente tan lejos, si no que gracias a los entornos tan controlados que nos ofrecen los videojuegos la ciencia de la computación ha encontrado un cuadro seguro de experimentación, demostrando así que, mas allá del entretenimiento, un entorno de videojuegos puede simular situaciones absolutamente reales. El Aprendizaje por Refuerzo ha demostrado ser una aproximación general y flexible para el desarrollo de agentes que juegan a videojuegos. Sin embargo, desarrollar agentes de refuerzo eficientes, especialmente para videojuegos de recompensa final, suele ser muy costoso y la simulación requiere un número enorme de iteraciones hasta obtener una política efectiva. El objetivo de este proyecto es estudiar la representación y utilización de conocimiento específico del dominio de un videjuego para guiar la exploración de un agente de aprendizaje por refuerzo y reducir así los episodios necesarios para dominar el juego. El trabajo se sustenta en el concepto de máquina de recompensa, un tipo de máquina de estados finitos que toma una descripción abstracta del entorno como entrada y devuelve diferentes funciones de recompensa en diferentes instantes de tiempo dependiendo de las transiciones de la máquina de recompensa. Particularmente, aplicamos el concepto de máquina de recompensa al Google Research Football environment utilizando para ello técnicas de aprendizaje por refuerzo profundo. es_ES
dc.description.abstract [CA] Ara com ara, la indústria dels videojocs ha crescut tant que ha transformat aquest sector en uno dels més productius e importants del món. Tal és el seu pes en la societat, que fins i tot el camp de la Inteligencia Artificial s’ha volcat amb ell, donant frut a diverses investigacions orientades a estudiar el comportament de la IA en els videojocs. La idea, aparenment trivial, de que “un ordinador puga derrotar a un humà” no està realment tan lluny, si no que gràcies als entorns tan controlats que ens ofereixen els videojocs, la ciència de la computació ha trobat un cuadre segur d’experimentació, demostrant aixina que, més enllà de l’entreteniment, un entorn de videojocs pot simular situacions absolutament reals. L’Aprenentatge per Reforç ha demostrat ser una aproximació general i flexible per al desenvolupament d’agents que juguen a videojocs. No obstant això, desenvolupar agents per reforç eficients, especialment per videojocs de recompensa final, sol ser molt costós i la simulació requereix un número enorme de iteracions fins a obtindre una política efectiva. L’objectiu d’aquest projecte és estudiar la representació i utilització de coneixement específic del domini d’un videojoc per guiar l’exploració d’un agent d’aprenentatge per reforç i reduir així els episodis necesaris per a dominar el joc. El treball es sustenta en el concepte de màquines de recompensa, un tipus de màquina d’estats finits que pren una descripció abstracta de l’entorn com entrada i torna diferents funcions de recompensa en diferents instants de temps depenent de les transaccions de la màquina de recompensa. Particularment, apliquem el concepte de màquina de recompensa al Google Research Football environment utilitzant per a ell tècniques d’aprenentatge per reforç profund. es_ES
dc.format.extent 62 es_ES
dc.language Español es_ES
dc.publisher Universitat Politècnica de València es_ES
dc.rights Reserva de todos los derechos es_ES
dc.subject Inteligencia artificial es_ES
dc.subject Video Juegos es_ES
dc.subject Deep Reinforcement Learning es_ES
dc.subject OpenAI Gym es_ES
dc.subject Google Research Football es_ES
dc.subject Reward machines es_ES
dc.subject Artificial intelligence es_ES
dc.subject Video Games es_ES
dc.subject OpenAI Gym es_ES
dc.subject Intel·ligència artificial es_ES
dc.subject Videojocs es_ES
dc.subject.classification CIENCIAS DE LA COMPUTACION E INTELIGENCIA ARTIFICIAL es_ES
dc.subject.classification LENGUAJES Y SISTEMAS INFORMATICOS es_ES
dc.subject.other Máster Universitario en Inteligencia Artificial, Reconocimiento de Formas e Imagen Digital-Màster Universitari en Intel·Ligència Artificial: Reconeixement de Formes i Imatge Digital es_ES
dc.title Utilización de conocimiento específico en aprendizaje por refuerzo para videojuegos es_ES
dc.type Tesis de máster es_ES
dc.rights.accessRights Cerrado es_ES
dc.contributor.affiliation Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació es_ES
dc.description.bibliographicCitation Bonet Cortés, E. (2020). Utilización de conocimiento específico en aprendizaje por refuerzo para videojuegos. http://hdl.handle.net/10251/151465 es_ES
dc.description.accrualMethod TFGM es_ES
dc.relation.pasarela TFGM\125772 es_ES


Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem