How well does inverse reinforcement learning perform in simple markov decision processes (MDP) in comparison to reinforcement learning?

Izquierdo Ayala, Pablo

Identificarse

Buscar en RiuNet

Listar

Todo RiuNet
Esta colección

Mi cuenta

Acceder

Estadísticas

Ver Estadísticas de uso

Ayuda RiuNet

Admin. UPV

Compartir/Enviar a

Citas

Estadísticas

How well does inverse reinforcement learning perform in simple markov decision processes (MDP) in comparison to reinforcement learning?

Mostrar el registro sencillo del ítem

Ficheros en el ítem

Nombre: Izquierdo - Compa ...

Tamaño: 1.418Mb

Formato: PDF

Solicitar una copia al autor

dc.contributor.advisor	Hernández Orallo, José	es_ES
dc.contributor.advisor	Ekeberg, Örjan	es_ES
dc.contributor.advisor	Conradt, Jörg	es_ES
dc.contributor.author	Izquierdo Ayala, Pablo	es_ES
dc.date.accessioned	2019-09-26T06:51:04Z
dc.date.available	2019-09-26T06:51:04Z
dc.date.created	2019-09-11
dc.date.issued	2019-09-26	es_ES
dc.identifier.uri	http://hdl.handle.net/10251/126395
dc.description.abstract	[EN] This research project elaborates a qualitative comparison between two different learning approaches, Reinforcement Learning (RL) and Inverse Reinforcement Learning (IRL) over the Gridworld Markov Decision Process. The interest focus will be set on the second learning paradigm, IRL, as it is considered to be relatively new and little work has been developed in this field of study. As observed, RL outperforms IRL, obtaining a correct solution in all the different scenarios studied. However, the behaviour of the IRL algorithms can be improved and this will be shown and analyzed as part of the scope.	es_ES
dc.description.abstract	[SV] Denna studie är en kvalitativ jämförelse mellan två olika inlärningsangreppssätt, “Reinforcement Learning” (RL) och “Inverse Reinforcement Learning” (IRL), om använder "Gridworld", en "Markov Decision-Process". Fokus ligger på den senare algoritmen, IRL, eftersom den anses relativt ny och få studier har i nuläget gjorts kring den. I studien är RL mer fördelaktig än IRL, som skapar en korrekt lösning i alla olika scenarier som presenteras i studien. Beteendet hos IRL-algoritmen kan dock förbättras vilket också visas och analyseras i denna studie.	es_ES
dc.description.abstract	[ES] Este proyecto de investigación elabora una comparación cualitativa entre dos enfoques de aprendizaje diferentes, Aprendizaje de refuerzo (RL) y Aprendizaje de refuerzo inverso (IRL) sobre el Proceso de decisión de Gridworld Markov. El interés se centrará en el segundo paradigma de aprendizaje, IRL, ya que se considera relativamente nuevo y se ha desarrollado poco trabajo en este campo de estudio. Como se observó, RL supera a IRL, obteniendo una solución correcta en todos los diferentes escenarios estudiados. Sin embargo, el comportamiento de los algoritmos IRL puede ser mejorado y esto se mostrará y analizará como parte del estudio.	es_ES
dc.format.extent	33	es_ES
dc.language	Inglés	es_ES
dc.publisher	Universitat Politècnica de València	es_ES
dc.rights	Reserva de todos los derechos	es_ES
dc.subject	Reinforcement Learning	es_ES
dc.subject	Inverse Reinforcement Learning	es_ES
dc.subject	Markov decision process	es_ES
dc.subject	Gridworld	es_ES
dc.subject	Computer Science	es_ES
dc.subject	Aprendizaje de refuerzo	es_ES
dc.subject	Aprendizaje de refuerzo inverso	es_ES
dc.subject	Procesos de decisión de Markow	es_ES
dc.subject	Computación	es_ES
dc.subject.classification	LENGUAJES Y SISTEMAS INFORMATICOS	es_ES
dc.subject.other	Grado en Ingeniería Informática-Grau en Enginyeria Informàtica	es_ES
dc.title	How well does inverse reinforcement learning perform in simple markov decision processes (MDP) in comparison to reinforcement learning?	es_ES
dc.title.alternative	Comparativa entre el aprendizaje de refuerzo inverso en los procesos de decisión de markov (MDP) y el aprendizaje de refuerzo	es_ES
dc.type	Proyecto/Trabajo fin de carrera/grado	es_ES
dc.rights.accessRights	Cerrado	es_ES
dc.contributor.affiliation	Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació	es_ES
dc.contributor.affiliation	Universitat Politècnica de València. Escola Tècnica Superior d'Enginyeria Informàtica	es_ES
dc.description.bibliographicCitation	Izquierdo Ayala, P. (2019). How well does inverse reinforcement learning perform in simple markov decision processes (MDP) in comparison to reinforcement learning?. http://hdl.handle.net/10251/126395	es_ES
dc.description.accrualMethod	TFGM	es_ES
dc.relation.pasarela	TFGM\108522	es_ES

Este ítem aparece en la(s) siguiente(s) colección(ones)

ETSINF - Trabajos académicos [4769]
Escola Tècnica Superior d'Enginyeria Informàtica

Mostrar el registro sencillo del ítem

How well does inverse reinforcement learning perform in simple markov decision processes (MDP) in comparison to reinforcement learning?

RiuNet: Repositorio Institucional de la Universidad Politécnica de Valencia

Buscar en RiuNet

Listar

Todo RiuNet

Esta colección

Mi cuenta

Estadísticas

Ayuda RiuNet

Admin. UPV

Compartir/Enviar a

Citas

Estadísticas

How well does inverse reinforcement learning perform in simple markov decision processes (MDP) in comparison to reinforcement learning?

Ficheros en el ítem

Este ítem aparece en la(s) siguiente(s) colección(ones)