Mostrar el registro sencillo del ítem
dc.contributor.advisor | Onaindia de la Rivaherrera, Eva | es_ES |
dc.contributor.advisor | Jiménez Celorrio, Sergio | es_ES |
dc.contributor.author | Bonet Cortés, Enric | es_ES |
dc.date.accessioned | 2020-10-13T07:26:39Z | |
dc.date.available | 2020-10-13T07:26:39Z | |
dc.date.created | 2020-09-24 | |
dc.date.issued | 2020-10-13 | es_ES |
dc.identifier.uri | http://hdl.handle.net/10251/151465 | |
dc.description.abstract | [EN] Nowadays, the video-game industry has grown so much that it has transformed this sector into one of the most productive and important in the world. Such is its weight in society, that even the field of Artificial Intelligence has turned with it, giving fruit to various investigations aimed at studying the behavior of AI in video games. The seemingly trivial idea that ¿a computer can defeat a human¿ is not as far away as it seems, but thanks to the highly controlled environments that video-games offer us, computer science has found a safe box of experimentation thus demonstrating that a video-game environment can simulate real situations, beyond entertainment. Reinforcement Learning has proven to be a general and flexible approach to the development of agents who play video-games. However, developing efficient reinforcement agents, especially for end-reward video games, is often very expensive and the simulation requires an enormous number of iterations to obtain an effective policy. The goal of this project is to study the representation and use of domain-specific knowledge from a video-game to guide the exploration of a reinforcement learning agent and reduce in this way the episodes necessary to master the game. The work is based on the reward machine¿s concept, a type of finite state machine that takes an abstract description of the environment as input and returns different reward functions at different instants of time depending on the reward machine¿s transitions. In particular, we apply the concept of the reward machine to the Google Research Football environment using deep reinforcement learning techniques. | es_ES |
dc.description.abstract | [ES] Hoy por hoy, la industria de los videojuegos ha crecido tanto que ha trasformado este sector en uno de los más productivos e importantes del mundo. Tal es su peso en la sociedad, que incluso el campo de la Inteligencia Artificial se ha volcado con él, dando fruto a diversas investigaciones orientadas a estudiar el comportamiento de la IA en los videojuegos. La idea, aparentemente trivial, de que ¿un ordenador pueda derrotar a un humano¿ no está realmente tan lejos, si no que gracias a los entornos tan controlados que nos ofrecen los videojuegos la ciencia de la computación ha encontrado un cuadro seguro de experimentación, demostrando así que, mas allá del entretenimiento, un entorno de videojuegos puede simular situaciones absolutamente reales. El Aprendizaje por Refuerzo ha demostrado ser una aproximación general y flexible para el desarrollo de agentes que juegan a videojuegos. Sin embargo, desarrollar agentes de refuerzo eficientes, especialmente para videojuegos de recompensa final, suele ser muy costoso y la simulación requiere un número enorme de iteraciones hasta obtener una política efectiva. El objetivo de este proyecto es estudiar la representación y utilización de conocimiento específico del dominio de un videjuego para guiar la exploración de un agente de aprendizaje por refuerzo y reducir así los episodios necesarios para dominar el juego. El trabajo se sustenta en el concepto de máquina de recompensa, un tipo de máquina de estados finitos que toma una descripción abstracta del entorno como entrada y devuelve diferentes funciones de recompensa en diferentes instantes de tiempo dependiendo de las transiciones de la máquina de recompensa. Particularmente, aplicamos el concepto de máquina de recompensa al Google Research Football environment utilizando para ello técnicas de aprendizaje por refuerzo profundo. | es_ES |
dc.description.abstract | [CA] Ara com ara, la indústria dels videojocs ha crescut tant que ha transformat aquest sector en uno dels més productius e importants del món. Tal és el seu pes en la societat, que fins i tot el camp de la Inteligencia Artificial s’ha volcat amb ell, donant frut a diverses investigacions orientades a estudiar el comportament de la IA en els videojocs. La idea, aparenment trivial, de que “un ordinador puga derrotar a un humà” no està realment tan lluny, si no que gràcies als entorns tan controlats que ens ofereixen els videojocs, la ciència de la computació ha trobat un cuadre segur d’experimentació, demostrant aixina que, més enllà de l’entreteniment, un entorn de videojocs pot simular situacions absolutament reals. L’Aprenentatge per Reforç ha demostrat ser una aproximació general i flexible per al desenvolupament d’agents que juguen a videojocs. No obstant això, desenvolupar agents per reforç eficients, especialment per videojocs de recompensa final, sol ser molt costós i la simulació requereix un número enorme de iteracions fins a obtindre una política efectiva. L’objectiu d’aquest projecte és estudiar la representació i utilització de coneixement específic del domini d’un videojoc per guiar l’exploració d’un agent d’aprenentatge per reforç i reduir així els episodis necesaris per a dominar el joc. El treball es sustenta en el concepte de màquines de recompensa, un tipus de màquina d’estats finits que pren una descripció abstracta de l’entorn com entrada i torna diferents funcions de recompensa en diferents instants de temps depenent de les transaccions de la màquina de recompensa. Particularment, apliquem el concepte de màquina de recompensa al Google Research Football environment utilitzant per a ell tècniques d’aprenentatge per reforç profund. | es_ES |
dc.format.extent | 62 | es_ES |
dc.language | Español | es_ES |
dc.publisher | Universitat Politècnica de València | es_ES |
dc.rights | Reserva de todos los derechos | es_ES |
dc.subject | Inteligencia artificial | es_ES |
dc.subject | Video Juegos | es_ES |
dc.subject | Deep Reinforcement Learning | es_ES |
dc.subject | OpenAI Gym | es_ES |
dc.subject | Google Research Football | es_ES |
dc.subject | Reward machines | es_ES |
dc.subject | Artificial intelligence | es_ES |
dc.subject | Video Games | es_ES |
dc.subject | OpenAI Gym | es_ES |
dc.subject | Intel·ligència artificial | es_ES |
dc.subject | Videojocs | es_ES |
dc.subject.classification | CIENCIAS DE LA COMPUTACION E INTELIGENCIA ARTIFICIAL | es_ES |
dc.subject.classification | LENGUAJES Y SISTEMAS INFORMATICOS | es_ES |
dc.subject.other | Máster Universitario en Inteligencia Artificial, Reconocimiento de Formas e Imagen Digital-Màster Universitari en Intel·Ligència Artificial: Reconeixement de Formes i Imatge Digital | es_ES |
dc.title | Utilización de conocimiento específico en aprendizaje por refuerzo para videojuegos | es_ES |
dc.type | Tesis de máster | es_ES |
dc.rights.accessRights | Cerrado | es_ES |
dc.contributor.affiliation | Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació | es_ES |
dc.description.bibliographicCitation | Bonet Cortés, E. (2020). Utilización de conocimiento específico en aprendizaje por refuerzo para videojuegos. http://hdl.handle.net/10251/151465 | es_ES |
dc.description.accrualMethod | TFGM | es_ES |
dc.relation.pasarela | TFGM\125772 | es_ES |