- -

Estudio del meta-aprendizaje como alternativa a la disyuntiva entre el aprendizaje por refuerzo basado en modelo y el aprendizaje por refuerzo sin modelo

RiuNet: Repositorio Institucional de la Universidad Politécnica de Valencia

Compartir/Enviar a

Citas

Estadísticas

  • Estadisticas de Uso

Estudio del meta-aprendizaje como alternativa a la disyuntiva entre el aprendizaje por refuerzo basado en modelo y el aprendizaje por refuerzo sin modelo

Mostrar el registro completo del ítem

Miguez Quintela, I. (2022). Estudio del meta-aprendizaje como alternativa a la disyuntiva entre el aprendizaje por refuerzo basado en modelo y el aprendizaje por refuerzo sin modelo. Universitat Politècnica de València. http://hdl.handle.net/10251/183145

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10251/183145

Ficheros en el ítem

Metadatos del ítem

Título: Estudio del meta-aprendizaje como alternativa a la disyuntiva entre el aprendizaje por refuerzo basado en modelo y el aprendizaje por refuerzo sin modelo
Otro titulo: Study of meta-learning as a way out to the alternative between model-based reinforcement learning and model-free reinforcement learning
Estudi del meta-aprenentatge com alternativa a la disjuntiva entre l'aprenentatge per reforç basat en model i l'aprenentatge per reforç sense model
Autor: Miguez Quintela, Imanol
Director(es): Herrero Debón, Alicia Ardid Ramírez, Joan Salvador
Entidad UPV: Universitat Politècnica de València. Departamento de Matemática Aplicada - Departament de Matemàtica Aplicada
Universitat Politècnica de València. Escuela Técnica Superior de Ingeniería del Diseño - Escola Tècnica Superior d'Enginyeria del Disseny
Fecha acto/lectura:
2022-05-25
Fecha difusión:
Resumen:
[ES] Se comparará la eficiencia, ventajas y desventajas, de diferentes algoritmos de aprendizaje por refuerzo ("reinforcement learning", RL), tales como el refuerzo basado en modelo (model-based RL), el refuerzo sin modelo ...[+]


[EN] In this TFG, I will analyze and compare the performance, advantages and limitations, of the following reinforcement learning (RL) algorithms: model-based RL, model-free RL, a hybrid RL algorithm that arises from ...[+]
Palabras clave: Algoritmo SARSA , Análisis de datos , Aprendizaje automático , Aprendizaje reforzado , Aprendizaje por refuerzo , Diferencia temporal , Data analysis , Machine learning , Model-based , Model-free , Reinforcement learning , Temporal difference
Derechos de uso: Reserva de todos los derechos
Editorial:
Universitat Politècnica de València
Titulación: Grado en Ingeniería Electrónica Industrial y Automática-Grau en Enginyeria Electrònica Industrial i Automàtica
Tipo: Proyecto/Trabajo fin de carrera/grado

recommendations

 

Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro completo del ítem