Insa Cabrera, Javier(Universitat Politècnica de València, 2012-05-25)
La Inteligencia Arti cial (IA) siempre ha intentado emular la mayor virtud
del ser humano: su inteligencia. Sin embargo, y aunque han habido multitud
de esfuerzos por conseguirlo, a simple vista nos percatamos de que ...
Aguado Sarrió, Guillem(Universitat Politècnica de València, 2015-09-30)
[ES] Este trabajo consiste en la aplicación de técnicas de aprendizaje automático sobre juegos para la elaboración de estrategias o aprendizaje de reglas.
Seni Molina, Mario Jose(Universitat Politècnica de València, 2022-11-03)
[ES] En este trabajo fin de máster se desarrolla un agente inteligente basado en el aprendizaje por refuerzo profundo (Deep Reinforcement Learning) para modelar el proceso de abastecimiento colaborativo entre cadenas de ...
Calabuig Rodriguez, Jose Manuel; García Raffi, Luis Miguel; Sánchez Pérez, Enrique Alfonso(Universitat Politècnica de València, 2021-01-27)
[EN] Artificial intelligence is present in the usual environment of all high school students. However, the general population—and students in particular—do not know how these algorithmic techniques work, which often have ...
Obiol Delgado, Iván(Universitat Politècnica de València, 2015-10-26)
En este documento se introduce un ejemplo de aplicación del aprendizaje por
refuerzo, enfrentándose al reto propuesto por el videojuego Space Invaders.
Empleando el Arcade Learning Environment (ALE) se realizan varias ...
Obrador Reina, Miquel(Universitat Politècnica de València, 2023-09-22)
[ES] En el campo del aprendizaje por refuerzo se busca entrenar agentes inteligentes para que aprendan a tomar decisiones óptimas en situaciones complejas a través de la interacción con un ambiente. En este trabajo realizado ...
Martínez Sanchis, Genís(Universitat Politècnica de València, 2021-02-24)
[ES] En este trabajo de fin de grado se realizará un estudio basado en el análisis de la aplicación de algoritmos de aprendizaje por refuerzo para entornos mono-agente sobre entornos multi-agente basados en la plataforma ...
Pastor Alcaraz, José Manuel(Universitat Politècnica de València, 2017-02-07)
[EN] The aim of this master thesis is to study the state of art of reinforment learning, particularly those based on policy search methods and to apply such techniques to a 3DOFs inverted pendulum mechanism. The controller ...
Ferrándiz Alarcón, Jesús(Universitat Politècnica de València, 2021-10-19)
[ES] Con el presente trabajo se pretende llevar a cabo el desarrollo de controladores usando una arquitectura modular basada en software libre de código abierto. Para ello en la controladora se ejecutará el sistema operativo ...
Valero Gimeno, Adrián(Universitat Politècnica de València, 2020-05-05)
[ES] En este trabajo de fin de grado se realiza un estudio basado en la aplicación de diferentes técnicas de aprendizaje por refuerzo sobre videojuegos clásicos con el fin de comprobar si es posible conseguir un rendimiento ...
Miguez Quintela, Imanol(Universitat Politècnica de València, 2022-06-09)
[ES] Se comparará la eficiencia, ventajas y desventajas, de diferentes algoritmos de aprendizaje por refuerzo ("reinforcement learning", RL), tales como el refuerzo basado en modelo (model-based RL), el refuerzo sin modelo ...
Medina Vazquez, Daniel(Universitat Politècnica de València, 2019-10-16)
[ES] El objetivo de este TFG es desarrollar un algoritmo mediante aprendizaje por
refuerzo, utilizando la biblioteca para Python gym-retro de OpenAI. En este caso el
algoritmo utilizado es el de Deep Q-Learning, que es ...
Rodríguez Sánchez, Álvaro(Universitat Politècnica de València, 2021-09-16)
[ES] El objetivo del TFG propuesto es desarrollar e implementar dos algoritmos distintos basados en 'machine learning' en el videojuego Super Mario World de la consola Super Nintendo Entertaiment System (SNES), utilizando ...
Diosdado López, Daniel(Universitat Politècnica de València, 2019-10-28)
[ES] Este trabajo describe un novedoso enfoque de crear agentes capaces de jugar a múltiples videojuegos que se basa en un mecanismo que intercala planificación y aprendizaje. La planificación se utiliza para explorar el ...
Davó Gelardo, Borja(Universitat Politècnica de València, 2021-05-10)
[ES] El grupo de Software Testing and Quality (STaQ) del centro de investigación PROS de la Universidad Politécnica de Valencia (UPV) ha desarrollado una herramienta, denominada TESTAR (www.testar.org) para el testing ...
Agrag, Ecem Nur(Universitat Politècnica de València, 2023-07-26)
[ES] En los últimos años, la aparición de las comunicaciones masivas de tipo máquina (mMTC) ha provocado un aumento significativo del número de dispositivos conectados en las redes 5G. Este rápido crecimiento de los ...
Benacloch Ayuso, José Luis(Universitat Politècnica de València, 2012-04-10)
Este proyecto consiste en la creación de una plataforma, denominada RL-GGP (Reinforcement Learning General Game Playing), que permita usar y evaluar algoritmos de aprendizaje por refuerzo en diferentes tipos de juegos por ...
Carbonell Granados, Alberto(Universitat Politècnica de València, 2022-09-12)
[ES] En años recientes el desarrollo de vehículos de conducción autónoma para el transporte de
personas a nivel personal o de servicio como taxis ha avanzado considerablemente. Esto crea la
necesidad de implementar un ...