Butt, Jemil; Wieser, Andreas(Editorial Universitat Politècnica de València, 2023-01-27)
[EN] A well-known challenge for deformation monitoring is the spatial discretization, i.e. the choice of monitoring points at which measurements are to be taken. Well-chosen monitoring points employ prior knowledge to yield ...
Pescador Barreto, Germán Andrés(Universitat Politècnica de València, 2023-10-21)
[ES] Este trabajo se enfoca en el entrenamiento de un agente robótico de navegación diferencial, utilizando técnicas de aprendizaje por refuerzo. El objetivo principal es capacitar al agente para realizar tareas de navegación ...
Seni Molina, Mario Jose(Universitat Politècnica de València, 2022-11-03)
[ES] En este trabajo fin de máster se desarrolla un agente inteligente basado en el aprendizaje por refuerzo profundo (Deep Reinforcement Learning) para modelar el proceso de abastecimiento colaborativo entre cadenas de ...
Obrador Reina, Miquel(Universitat Politècnica de València, 2023-09-22)
[ES] En el campo del aprendizaje por refuerzo se busca entrenar agentes inteligentes para que aprendan a tomar decisiones óptimas en situaciones complejas a través de la interacción con un ambiente. En este trabajo realizado ...
Martínez Sanchis, Genís(Universitat Politècnica de València, 2021-02-24)
[ES] En este trabajo de fin de grado se realizará un estudio basado en el análisis de la aplicación de algoritmos de aprendizaje por refuerzo para entornos mono-agente sobre entornos multi-agente basados en la plataforma ...
Pastor Alcaraz, José Manuel(Universitat Politècnica de València, 2017-02-07)
[EN] The aim of this master thesis is to study the state of art of reinforment learning, particularly those based on policy search methods and to apply such techniques to a 3DOFs inverted pendulum mechanism. The controller ...
REGO MAÑEZ, ALBERT; Gonzalez Ramirez, Pedro Luis; Jimenez, Jose M.; Lloret, Jaime(Springer-Verlag, 2022-06)
[EN] Internet of Things (IoT) has introduced new applications and environments. Smart Home provides new ways of communication and service consumption. In addition, Artificial Intelligence (AI) and deep learning have improved ...
Insa Cabrera, Javier; Dowe, David L.; España Cubillo, Sergio; Henánez-Lloreda, M. Victoria; Hernández Orallo, José(Springer Verlag (Germany), 2011)
Comparing humans and machines is one important source of
information about both machine and human strengths and limitations.
Most of these comparisons and competitions are performed in rather
specific tasks such as ...
Ferrándiz Alarcón, Jesús(Universitat Politècnica de València, 2021-10-19)
[ES] Con el presente trabajo se pretende llevar a cabo el desarrollo de controladores usando una arquitectura modular basada en software libre de código abierto. Para ello en la controladora se ejecutará el sistema operativo ...
Tello Oquendo, Luis Patricio(Universitat Politècnica de València, 2018-09-10)
En la actualidad, la Internet de las Cosas (Internet of Things, IoT) es una tecnología esencial para la próxima generación de sistemas inalámbricos. La conectividad es la base de IoT, y el tipo de acceso requerido dependerá ...
[EN] In this paper, we describe a new trend analysis and forecasting method (Deflexor), which is
intended to help inform decisions in almost any field of human social activity, including, for example,
business, art and ...
Serrano, Julio C.; Mula, Josefa; Poler, R.(Springer, 2021-06-30)
[EN] Recently, many novel paradigms, concepts and technologies, which lay the foundation for the new revolution in manufacturing environments, have emerged and make it faster to address critical decisions today in supply ...
Calabuig, J. M.; Falciani, H.; Sánchez Pérez, Enrique Alfonso(Elsevier, 2020-07-20)
[EN] We consider a quasi-metric topological structure for the construction of a new reinforcement learning model in the framework of financial markets. It is based on a Lipschitz type extension of reward functions defined ...
Arnau Notari, Andres Roger; García Raffi, Luis Miguel; Calabuig Rodriguez, Jose Manuel; Sánchez Pérez, Enrique Alfonso(Editorial Universitat Politècnica de València, 2023-10-06)
[ES] En este trabajo se presenta una sesión a modo de taller orientada al estudiantado universitarios para que entiendan los fundamentos del aprendizaje por refuerzo (RL). Esta técnica de inteligencia artificial no es ...
Valero Gimeno, Adrián(Universitat Politècnica de València, 2020-05-05)
[ES] En este trabajo de fin de grado se realiza un estudio basado en la aplicación de diferentes técnicas de aprendizaje por refuerzo sobre videojuegos clásicos con el fin de comprobar si es posible conseguir un rendimiento ...
Miguez Quintela, Imanol(Universitat Politècnica de València, 2022-06-09)
[ES] Se comparará la eficiencia, ventajas y desventajas, de diferentes algoritmos de aprendizaje por refuerzo ("reinforcement learning", RL), tales como el refuerzo basado en modelo (model-based RL), el refuerzo sin modelo ...
In this paper we apply the recent notion of anytime universal intelligence tests to the evaluation of a popular reinforcement learning algorithm, Q-learning. We show that a general approach to intelligence evaluation of ...
[EN] Cloud computing leads to efficient resource allocation for network users. In order to achieve efficient allocation, many research activities have been conducted so far. Some researchers focus on classical optimisation ...
Medina Vazquez, Daniel(Universitat Politècnica de València, 2019-10-16)
[ES] El objetivo de este TFG es desarrollar un algoritmo mediante aprendizaje por
refuerzo, utilizando la biblioteca para Python gym-retro de OpenAI. En este caso el
algoritmo utilizado es el de Deep Q-Learning, que es ...
Perelló Pinazo, Raül(Universitat Politècnica de València, 2021-09-14)
[ES] En este TFG, vamos a estudiar una de las tres partes principales del aprendizaje automático: el paradigma del aprendizaje reforzado y su aplicación en el ámbito de los
videojuegos mediante los algoritmos Q-Learning ...