Aprendizaje por refuerzo mediante métodos de búsqueda de política en sistemas electromecánicos

Pastor Alcaraz, José Manuel

RiuNet repositorio UPV
:
Docencia
:
Trabajos académicos
:
Servicio de alumnado - Trabajos académicos
:
Ver ítem

Identificarse

Buscar en RiuNet

Listar

Todo RiuNet
Esta colección

Mi cuenta

Acceder

Estadísticas

Ver Estadísticas de uso

Ayuda RiuNet

Admin. UPV

Compartir/Enviar a

Citas

Estadísticas

Aprendizaje por refuerzo mediante métodos de búsqueda de política en sistemas electromecánicos

Mostrar el registro sencillo del ítem

Ficheros en el ítem

Nombre: Pastor - Aprendizaje ...

Tamaño: 6.017Mb

Formato: PDF

Solicitar una copia al autor

dc.contributor.advisor	Sala Piqueras, Antonio	es_ES
dc.contributor.advisor	Armesto Ángel, Leopoldo	es_ES
dc.contributor.author	Pastor Alcaraz, José Manuel	es_ES
dc.date.accessioned	2017-02-07T12:42:23Z
dc.date.available	2017-02-07T12:42:23Z
dc.date.created	2016-09-28
dc.date.issued	2017-02-07	es_ES
dc.identifier.uri	http://hdl.handle.net/10251/77698
dc.description.abstract	[EN] The aim of this master thesis is to study the state of art of reinforment learning, particularly those based on policy search methods and to apply such techniques to a 3DOFs inverted pendulum mechanism. The controller must learn an "optimal control" policy that maximizes the reward (as a cost function) without using any model. The controller will learn on-policy or off-policy a closed loop feedback control law to set the pendulum on its marginally stable vertical position. This work is oriented to students who want to extend further work on his/her PhD. thesis in complex robot systems.	es_ES
dc.description.abstract	[ES] El objetivo de la tesina es estudiar las técnicas de aprendizaje por refuerzo con métodos basados en búsqueda de políticas para sistemas electromecánicos, pudiendo se estas aplicarse a una plataforma de 3 DOFs de péndulo invertido. En las técnicas de aprendizaje por refuerzo el controlador debe aprender cual es la política de "control óptima" que maximiza su recompensa (definida mediante una función de coste) sin la utilización de ningún modelo. El controlador aprenderá en línea o fuera de línea una ley de control en bucle cerrado mediante experimentación hasta que consiga colocar el péndulo en su posición vertical de equilibrio inestable. La tesina está enfocada a futuros doctorandos que quieran realizar la tesis en este ámbito, con extensión a sistemas robóticos más complejos.	es_ES
dc.language	Español	es_ES
dc.publisher	Universitat Politècnica de València	es_ES
dc.rights	Reserva de todos los derechos	es_ES
dc.subject	Reinforcement learning	es_ES
dc.subject	Policy search	es_ES
dc.subject	Optimal control	es_ES
dc.subject	Robotics	es_ES
dc.subject	Control	es_ES
dc.subject	Aprendizaje por refuerzo	es_ES
dc.subject	Búsqueda de política	es_ES
dc.subject	Control óptimo	es_ES
dc.subject	Robótica	es_ES
dc.subject.classification	INGENIERIA DE SISTEMAS Y AUTOMATICA	es_ES
dc.subject.other	Máster Universitario en Automática e Informática Industrial-Màster Universitari en Automàtica i Informàtica Industrial	es_ES
dc.title	Aprendizaje por refuerzo mediante métodos de búsqueda de política en sistemas electromecánicos	es_ES
dc.type	Tesis de máster	es_ES
dc.rights.accessRights	Cerrado	es_ES
dc.contributor.affiliation	Universitat Politècnica de València. Departamento de Ingeniería de Sistemas y Automática - Departament d'Enginyeria de Sistemes i Automàtica	es_ES
dc.description.bibliographicCitation	Pastor Alcaraz, JM. (2016). Aprendizaje por refuerzo mediante métodos de búsqueda de política en sistemas electromecánicos. http://hdl.handle.net/10251/77698	es_ES
dc.description.accrualMethod	TFGM	es_ES
dc.relation.pasarela	TFGM\39612	es_ES

Este ítem aparece en la(s) siguiente(s) colección(ones)

Servicio de alumnado - Trabajos académicos [7043]

Mostrar el registro sencillo del ítem

Aprendizaje por refuerzo mediante métodos de búsqueda de política en sistemas electromecánicos

RiuNet: Repositorio Institucional de la Universidad Politécnica de Valencia

Buscar en RiuNet

Listar

Todo RiuNet

Esta colección

Mi cuenta

Estadísticas

Ayuda RiuNet

Admin. UPV

Compartir/Enviar a

Citas

Estadísticas

Aprendizaje por refuerzo mediante métodos de búsqueda de política en sistemas electromecánicos

Ficheros en el ítem

Este ítem aparece en la(s) siguiente(s) colección(ones)