Medina Vazquez, Daniel(Universitat Politècnica de València, 2019-10-16)
[ES] El objetivo de este TFG es desarrollar un algoritmo mediante aprendizaje por
refuerzo, utilizando la biblioteca para Python gym-retro de OpenAI. En este caso el
algoritmo utilizado es el de Deep Q-Learning, que es ...