Learning Control for Robot-to-Robot Tool Handover

Pérez Mahiques, Ignacio

Identificarse

Buscar en RiuNet

Listar

Todo RiuNet
Esta colección

Mi cuenta

Acceder

Estadísticas

Ver Estadísticas de uso

Ayuda RiuNet

Admin. UPV

Compartir/Enviar a

Citas

Estadísticas

Learning Control for Robot-to-Robot Tool Handover

Mostrar el registro sencillo del ítem

Ficheros en el ítem

Nombre: Perez - Learning ...

Tamaño: 30.36Mb

Formato: PDF

Descripción: TFM

Solicitar una copia al autor

dc.contributor.advisor	Valera Fernández, Ángel	es_ES
dc.contributor.advisor	Wu, Fan	es_ES
dc.contributor.advisor	Haddadin, Sami	es_ES
dc.contributor.author	Pérez Mahiques, Ignacio	es_ES
dc.date.accessioned	2022-11-08T08:19:22Z
dc.date.available	2022-11-08T08:19:22Z
dc.date.created	2022-10-10
dc.date.issued	2022-11-08	es_ES
dc.identifier.uri	http://hdl.handle.net/10251/189419
dc.description.abstract	[ES] En los últimos años se ha podido observar un rápido crecimiento en la utilización de robots en los procesos industriales. Algunos ejemplos de las aplicaciones robóticas actuales son los procesos de montaje en la industria del automóvil, la selección de productos en la industria alimentaria y el transporte autónomo en logística. La utilización de robots se justifica por una reducción de costes y por su mayor rendimiento en ciertas tareas repetitivas o de alta precisión. Sin embargo, muchas de las tareas ejecutadas por los robots son individuales. Uno de los ámbitos de estudio abiertos es la colaboración entre humanos y robots y entre los robots entre sí. Esta colaboración permitiría expandir aún más las aplicaciones en las que los robots pueden participar. La motivación del trabajo es la creación de una fábrica robotizada donde los robots colaboren entre sí para realizar las tareas necesarias. A partir de esa idea, se piensa en un escenario industrial donde el rendimiento de los robots es inferior al de los humanos y se utiliza un algoritmo de optimización para mejorar el rendimiento de la tarea. Debido a que los robots tienen que interaccionar con otros robots es importante que los robots se adapten a su entorno para minimizar su desgaste. Una posible solución es la utilización de robots colaborativos con sensores de fuerzas en las articulaciones y un controlador que pueda adaptar la reacción del robot para reducir estas fuerzas. La tarea elegida para la tesis es el traspaso de una herramienta. El traspaso es una acción esencial entre humanos y útil para la colaboración entre robots. Para optimizar la ejecución de la tarea nos centramos en dos componentes, el generador de la trayectoria y el controlador. Para optimizar la trayectoria utilizamos ¿Dynamical Movement Primitives¿ (DMPs). DMPs es una representación de movimientos basado en sistemas dinámicos. El controlador utilizado es un controlador de impedancia variable en las articulaciones ya que permite variar la rigidez del robot con el entorno durante la ejecución. El algoritmo de optimización seleccionado es ¿Policy Improvement with Black-Box Optimization¿ (PIBB) ya que se puede extender para optimizar DMPs y las constantes de impedancia de cada articulación del brazo. Este algoritmo minimiza una función de coste personalizada para aprender la tarea. La función de coste se basa en el éxito de la tarea, el tiempo necesario y las fuerzas medidas por el robot durante la tarea. Para acelerar la optimización, el aprendizaje comienza con una demostración exitosa de la tarea. Este enfoque se conoce como ¿Learning from Demonstration¿. El primer experimento es la optimización de la recogida de la herramienta con un brazo robótico para comprobar el funcionamiento del algoritmo. El segundo experimento es el objetivo real del trabajo, el cual es la entrega de la herramienta de un brazo al otro. Ambos experimentos serán en un entorno real y no en simulación. Los recursos necesarios para los experimentos son dos brazos robóticos colaborativos de la marca Franka Emika que tienen una mano robótica qb SoftHand Research. Como herramienta industrial se utilizará un martillo. Para programar y ejecutar el algoritmo se cuenta con un ordenador con conexión directa a los brazos robóticos. Los experimentos tendrán lugar en las instalaciones de la universidad Technische Universität Munich bajo la supervisión del tutor. De esta forma, el trabajo de fin de máster trata de resolver la tarea de un traspaso de una herramienta entre dos brazos robóticos. Para ello se utiliza un algoritmo para optimizar la trayectoria y un controlador de impedancia variable. La aportación principal del trabajo de fin de máster será programar el algoritmo, y aplicarlo a la transferencia de la herramienta. Para ello, es necesario analizar antes los algoritmos utilizados en la literatura del ámbito y justificar el algoritmo a utilizar. Cabe destacar que el algoritmo aplicado tiene la novedad de optimizar DMPs	es_ES
dc.description.abstract	[EN] The interest in making robots learn to interact with the environment and perform joint tasks drives the use of robotics in environments with the interaction of other agents. Learning these skills improves the adaptiveness and flexibility of robots. This work aims to optimize a robot-to-human and a robot-to-robot handover of a working tool. For the optimization of these tasks, we use a novel policy improvement algorithm PIBB-CMA that is derived from the Black-Box Optimization (BBO) algorithm PIBB. The advantage of PIBB-CMA with respect to PIBB is that it determines the magnitude of the exploration autonomously. PIBB-CMA optimizes the trajectory with Dynamic Movement Primitives (DMPs) and the impedance gains of the variable impedance controller used in the robots. The experiments are executed in a real scenario, and the demonstrated trajectory is initialized with Learning by Demonstration (LfD). The optimized policy of the robot-to-human handover experiment achieves significant improvements in terms of the cost function compared to the initial policy. The algorithm optimizes the robot-to-robot handover moderately from the demonstrated task. However, the optimized trajectories have only a minor variation from the initial trajectory. Moreover, the learned impedance gains in both tasks can not be meaningfully interpreted since there is no clear pattern. Therefore, we state that the optimizations are limited due to a restricted exploration for safety reasons and a fixed number of updates due to time expenses.	es_ES
dc.format.extent	53	es_ES
dc.language	Inglés	es_ES
dc.publisher	Universitat Politècnica de València	es_ES
dc.rights	Reserva de todos los derechos	es_ES
dc.subject	Algoritmo	es_ES
dc.subject	Control	es_ES
dc.subject	Colaboración	es_ES
dc.subject	Robot	es_ES
dc.subject	Transferencia	es_ES
dc.subject	Herramienta	es_ES
dc.subject	Industrial	es_ES
dc.subject	Controlador	es_ES
dc.subject	Impedancia variable	es_ES
dc.subject	DMP	es_ES
dc.subject	PI	es_ES
dc.subject	Optimización	es_ES
dc.subject	Black-box	es_ES
dc.subject	Brazo róbotico	es_ES
dc.subject	Colaborativo	es_ES
dc.subject	Franka Emika	es_ES
dc.subject	Qb SoftHand	es_ES
dc.subject	LfD	es_ES
dc.subject	Algoritm	es_ES
dc.subject	Collaboration	es_ES
dc.subject	Robot-to-robot	es_ES
dc.subject	Handover	es_ES
dc.subject	Tool	es_ES
dc.subject	Joint controller	es_ES
dc.subject	Variable impedance	es_ES
dc.subject	Optimization	es_ES
dc.subject	Robot arm	es_ES
dc.subject	Collaborative	es_ES
dc.subject.classification	INGENIERIA DE SISTEMAS Y AUTOMATICA	es_ES
dc.subject.other	Máster Universitario en Ingeniería Industrial-Màster Universitari en Enginyeria Industrial	es_ES
dc.title	Learning Control for Robot-to-Robot Tool Handover	es_ES
dc.title.alternative	Diseño e implementación de algoritmos de control para la colaboración entre robots basado en técnicas de optimización Black-Box	es_ES
dc.title.alternative	Disseny i implementació d'algoritmes de control per a la col·laboració entre robots basat en tècniques d'optimització "Black-Box"	es_ES
dc.type	Tesis de máster	es_ES
dc.rights.accessRights	Cerrado	es_ES
dc.contributor.affiliation	Universitat Politècnica de València. Departamento de Ingeniería de Sistemas y Automática - Departament d'Enginyeria de Sistemes i Automàtica	es_ES
dc.contributor.affiliation	Universitat Politècnica de València. Escuela Técnica Superior de Ingenieros Industriales - Escola Tècnica Superior d'Enginyers Industrials	es_ES
dc.description.bibliographicCitation	Pérez Mahiques, I. (2022). Learning Control for Robot-to-Robot Tool Handover. Universitat Politècnica de València. http://hdl.handle.net/10251/189419	es_ES
dc.description.accrualMethod	TFGM	es_ES
dc.relation.pasarela	TFGM\148592	es_ES

Este ítem aparece en la(s) siguiente(s) colección(ones)

ETSII - Trabajos académicos [10404]
Escuela Técnica Superior de Ingenieros Industriales

Mostrar el registro sencillo del ítem

Learning Control for Robot-to-Robot Tool Handover

RiuNet: Repositorio Institucional de la Universidad Politécnica de Valencia

Buscar en RiuNet

Listar

Todo RiuNet

Esta colección

Mi cuenta

Estadísticas

Ayuda RiuNet

Admin. UPV

Compartir/Enviar a

Citas

Estadísticas

Learning Control for Robot-to-Robot Tool Handover

Ficheros en el ítem

Este ítem aparece en la(s) siguiente(s) colección(ones)

Ítems relacionados