- -

Learning Control for Robot-to-Robot Tool Handover

RiuNet: Repositorio Institucional de la Universidad Politécnica de Valencia

Compartir/Enviar a

Citas

Estadísticas

  • Estadisticas de Uso

Learning Control for Robot-to-Robot Tool Handover

Mostrar el registro sencillo del ítem

Ficheros en el ítem

dc.contributor.advisor Valera Fernández, Ángel es_ES
dc.contributor.advisor Wu, Fan es_ES
dc.contributor.advisor Haddadin, Sami es_ES
dc.contributor.author Pérez Mahiques, Ignacio es_ES
dc.date.accessioned 2022-11-08T08:19:22Z
dc.date.available 2022-11-08T08:19:22Z
dc.date.created 2022-10-10
dc.date.issued 2022-11-08 es_ES
dc.identifier.uri http://hdl.handle.net/10251/189419
dc.description.abstract [ES] En los últimos años se ha podido observar un rápido crecimiento en la utilización de robots en los procesos industriales. Algunos ejemplos de las aplicaciones robóticas actuales son los procesos de montaje en la industria del automóvil, la selección de productos en la industria alimentaria y el transporte autónomo en logística. La utilización de robots se justifica por una reducción de costes y por su mayor rendimiento en ciertas tareas repetitivas o de alta precisión. Sin embargo, muchas de las tareas ejecutadas por los robots son individuales. Uno de los ámbitos de estudio abiertos es la colaboración entre humanos y robots y entre los robots entre sí. Esta colaboración permitiría expandir aún más las aplicaciones en las que los robots pueden participar. La motivación del trabajo es la creación de una fábrica robotizada donde los robots colaboren entre sí para realizar las tareas necesarias. A partir de esa idea, se piensa en un escenario industrial donde el rendimiento de los robots es inferior al de los humanos y se utiliza un algoritmo de optimización para mejorar el rendimiento de la tarea. Debido a que los robots tienen que interaccionar con otros robots es importante que los robots se adapten a su entorno para minimizar su desgaste. Una posible solución es la utilización de robots colaborativos con sensores de fuerzas en las articulaciones y un controlador que pueda adaptar la reacción del robot para reducir estas fuerzas. La tarea elegida para la tesis es el traspaso de una herramienta. El traspaso es una acción esencial entre humanos y útil para la colaboración entre robots. Para optimizar la ejecución de la tarea nos centramos en dos componentes, el generador de la trayectoria y el controlador. Para optimizar la trayectoria utilizamos ¿Dynamical Movement Primitives¿ (DMPs). DMPs es una representación de movimientos basado en sistemas dinámicos. El controlador utilizado es un controlador de impedancia variable en las articulaciones ya que permite variar la rigidez del robot con el entorno durante la ejecución. El algoritmo de optimización seleccionado es ¿Policy Improvement with Black-Box Optimization¿ (PIBB) ya que se puede extender para optimizar DMPs y las constantes de impedancia de cada articulación del brazo. Este algoritmo minimiza una función de coste personalizada para aprender la tarea. La función de coste se basa en el éxito de la tarea, el tiempo necesario y las fuerzas medidas por el robot durante la tarea. Para acelerar la optimización, el aprendizaje comienza con una demostración exitosa de la tarea. Este enfoque se conoce como ¿Learning from Demonstration¿. El primer experimento es la optimización de la recogida de la herramienta con un brazo robótico para comprobar el funcionamiento del algoritmo. El segundo experimento es el objetivo real del trabajo, el cual es la entrega de la herramienta de un brazo al otro. Ambos experimentos serán en un entorno real y no en simulación. Los recursos necesarios para los experimentos son dos brazos robóticos colaborativos de la marca Franka Emika que tienen una mano robótica qb SoftHand Research. Como herramienta industrial se utilizará un martillo. Para programar y ejecutar el algoritmo se cuenta con un ordenador con conexión directa a los brazos robóticos. Los experimentos tendrán lugar en las instalaciones de la universidad Technische Universität Munich bajo la supervisión del tutor. De esta forma, el trabajo de fin de máster trata de resolver la tarea de un traspaso de una herramienta entre dos brazos robóticos. Para ello se utiliza un algoritmo para optimizar la trayectoria y un controlador de impedancia variable. La aportación principal del trabajo de fin de máster será programar el algoritmo, y aplicarlo a la transferencia de la herramienta. Para ello, es necesario analizar antes los algoritmos utilizados en la literatura del ámbito y justificar el algoritmo a utilizar. Cabe destacar que el algoritmo aplicado tiene la novedad de optimizar DMPs es_ES
dc.description.abstract [EN] The interest in making robots learn to interact with the environment and perform joint tasks drives the use of robotics in environments with the interaction of other agents. Learning these skills improves the adaptiveness and flexibility of robots. This work aims to optimize a robot-to-human and a robot-to-robot handover of a working tool. For the optimization of these tasks, we use a novel policy improvement algorithm PIBB-CMA that is derived from the Black-Box Optimization (BBO) algorithm PIBB. The advantage of PIBB-CMA with respect to PIBB is that it determines the magnitude of the exploration autonomously. PIBB-CMA optimizes the trajectory with Dynamic Movement Primitives (DMPs) and the impedance gains of the variable impedance controller used in the robots. The experiments are executed in a real scenario, and the demonstrated trajectory is initialized with Learning by Demonstration (LfD). The optimized policy of the robot-to-human handover experiment achieves significant improvements in terms of the cost function compared to the initial policy. The algorithm optimizes the robot-to-robot handover moderately from the demonstrated task. However, the optimized trajectories have only a minor variation from the initial trajectory. Moreover, the learned impedance gains in both tasks can not be meaningfully interpreted since there is no clear pattern. Therefore, we state that the optimizations are limited due to a restricted exploration for safety reasons and a fixed number of updates due to time expenses. es_ES
dc.format.extent 53 es_ES
dc.language Inglés es_ES
dc.publisher Universitat Politècnica de València es_ES
dc.rights Reserva de todos los derechos es_ES
dc.subject Algoritmo es_ES
dc.subject Control es_ES
dc.subject Colaboración es_ES
dc.subject Robot es_ES
dc.subject Transferencia es_ES
dc.subject Herramienta es_ES
dc.subject Industrial es_ES
dc.subject Controlador es_ES
dc.subject Impedancia variable es_ES
dc.subject DMP es_ES
dc.subject PI es_ES
dc.subject Optimización es_ES
dc.subject Black-box es_ES
dc.subject Brazo róbotico es_ES
dc.subject Colaborativo es_ES
dc.subject Franka Emika es_ES
dc.subject Qb SoftHand es_ES
dc.subject LfD es_ES
dc.subject Algoritm es_ES
dc.subject Collaboration es_ES
dc.subject Robot-to-robot es_ES
dc.subject Handover es_ES
dc.subject Tool es_ES
dc.subject Joint controller es_ES
dc.subject Variable impedance es_ES
dc.subject Optimization es_ES
dc.subject Robot arm es_ES
dc.subject Collaborative es_ES
dc.subject.classification INGENIERIA DE SISTEMAS Y AUTOMATICA es_ES
dc.subject.other Máster Universitario en Ingeniería Industrial-Màster Universitari en Enginyeria Industrial es_ES
dc.title Learning Control for Robot-to-Robot Tool Handover es_ES
dc.title.alternative Diseño e implementación de algoritmos de control para la colaboración entre robots basado en técnicas de optimización Black-Box es_ES
dc.title.alternative Disseny i implementació d'algoritmes de control per a la col·laboració entre robots basat en tècniques d'optimització "Black-Box" es_ES
dc.type Tesis de máster es_ES
dc.rights.accessRights Cerrado es_ES
dc.contributor.affiliation Universitat Politècnica de València. Departamento de Ingeniería de Sistemas y Automática - Departament d'Enginyeria de Sistemes i Automàtica es_ES
dc.contributor.affiliation Universitat Politècnica de València. Escuela Técnica Superior de Ingenieros Industriales - Escola Tècnica Superior d'Enginyers Industrials es_ES
dc.description.bibliographicCitation Pérez Mahiques, I. (2022). Learning Control for Robot-to-Robot Tool Handover. Universitat Politècnica de València. http://hdl.handle.net/10251/189419 es_ES
dc.description.accrualMethod TFGM es_ES
dc.relation.pasarela TFGM\148592 es_ES


Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem