[ES] El objetivo del TFG propuesto es desarrollar e implementar dos algoritmos distintos basados en 'machine learning' en el videojuego Super Mario World de la consola Super Nintendo Entertaiment System (SNES), utilizando ...[+]
[ES] El objetivo del TFG propuesto es desarrollar e implementar dos algoritmos distintos basados en 'machine learning' en el videojuego Super Mario World de la consola Super Nintendo Entertaiment System (SNES), utilizando para ello la librería `gym-retro` que nos ofrece OpenAI en el lenguaje de programación Python. El primer algoritmo que será utilizado será un algoritmo evolutivo en el que se irá aprendiendo mediante una `fitness function¿ y la selección de las mejores muestras para crear el mejor jugador posible; este algoritmo será llevado acabo mediante NEAT-Python. El segundo algoritmo utilizado será un algoritmo de aprendizaje por refuerzo, en concreto Deep Q-Learning, que al ser aplicado a juegos de poca complejidad ha permitido obtener resultados prometedores. Finalmente se pasará a la comparación de los resultados obtenidos tras usar sendos algoritmos, pudiendo así demostrar cuál de los dos algoritmos resulta más interesante para la resolución de un juego de plataformas.
[-]
[EN] The objective of this end-of-degree project is to develop and implement two different algorithms based on Machine Learning for solving the Super Mario World video-game
on the Super Nintendo Entertainment System (SNES) ...[+]
[EN] The objective of this end-of-degree project is to develop and implement two different algorithms based on Machine Learning for solving the Super Mario World video-game
on the Super Nintendo Entertainment System (SNES) console, using the gym-retro library offered by OpenAI in the Python programming language. The first algorithm to be used
Evolutionary Algorithm that will learn through a fitness function and the selection of the best samples to create the best possible player; this algorithm will be carried out using
NEAT-Python. The second algorithm to be used will be a Reinforcement Learning algorithm, specifically Deep Q-Learning, which when it is applied to low-complexity games
it has obtained promising results. Finally, we will proceed to the comparison of the re-sults obtained after using both algorithms, thus being able to show which of the two
algorithms is more interesting for the resolution of a platform game.
[-]
[CA] L’objectiu del TFG proposat és desenvolupar i implementar dos algorismes diferents
basats en machine learning en el videojoc Super Mario World de la consola Super Nintendo Entertaiment System (SNES), utilitzant per ...[+]
[CA] L’objectiu del TFG proposat és desenvolupar i implementar dos algorismes diferents
basats en machine learning en el videojoc Super Mario World de la consola Super Nintendo Entertaiment System (SNES), utilitzant per a això la llibreria gym-retro que ens ofereix
OpenAI en el llenguatge de programació Python. El primer algorisme que serà utilitzat
serà un algorisme evolutiu en què s’anirà aprenent mitjançant una fitness function i la selecció de les millors mostres per crear el millor jugador possible; aquest algorisme serà
implementat mitjançant NEAT-Python. El segon algorisme utilitzat serà un algorisme d’aprenentatge per reforç, en concret Deep Q-Learning, que quan s’ha aplicat a jocs de poca
complexitat ha obtingut resultats prometedors. Finalment, es passarà a la comparació
dels resultats obtinguts després d’usar sengles algorismes, podent així demostrar quin
dels dos algorismes resulta més interessant per a la resolució d’un joc de plataformes.
[-]
|