Resumen:
|
[ES] Los sistemas distribuidos en la nube se están volviendo más eficientes, pueden procesar mayor cantidad de datos, realizar tareas complejas de alto coste computacional y permiten la creación de sistemas críticos, debido ...[+]
[ES] Los sistemas distribuidos en la nube se están volviendo más eficientes, pueden procesar mayor cantidad de datos, realizar tareas complejas de alto coste computacional y permiten la creación de sistemas críticos, debido a que sus componentes trabajan de forma independiente.
Se espera que la infraestructura de los sistemas distribuidos en la nube sea resiliente para que sea capaz de recuperarse, seguir funcionando en caso de cualquier incidente inesperado y ser capaz de garantizar la operación. Los elementos clave para la resiliencia en la nube se relacionan con alta disponibilidad, tolerancia a fallos y recuperación ante desastres.
Este Trabajo Final de Máster propone un estudio sobre las herramientas empleadas en la disciplina de Ingeniería del Caos, que pone a prueba los sistemas distribuidos para identificar debilidades en una aplicación. La investigación abarcará herramientas de distintos proveedores de nube como AWS y Azure, así como soluciones de código abierto y otras relevantes, permitiendo detectar cuellos de botella, limitaciones de escalabilidad y otros problemas potenciales en un entorno controlado antes de que se manifiesten en el entorno real. Esto permitirá conocer las herramientas más usadas en esta disciplina y utilizarlas para generar fallos de manera controlada, con el fin de fortalecer continuamente la arquitectura de un sistema.
[-]
[EN] Distributed systems in the cloud are becoming more efficient, can process larger amounts of data, perform complex tasks with high computational cost and allow the creation of critical systems, because their components ...[+]
[EN] Distributed systems in the cloud are becoming more efficient, can process larger amounts of data, perform complex tasks with high computational cost and allow the creation of critical systems, because their components work independently. The infrastructure of distributed cloud systems is expected to be resilient so that it is able to recover, continue to function in case of any unexpected incident and be able to guarantee operation. The key elements for resilience in the cloud are related to high availability, fault tolerance and disaster recovery. This Master Thesis proposes a study on the tools used in the discipline of Chaos Engineering, which tests distributed systems to identify weaknesses in an application. The research will cover tools from different cloud providers such as AWS and Azure, as well as open source and other relevant solutions, allowing to detect bottlenecks, scalability limitations and other potential problems in a controlled environment before they manifest themselves in the real environment. This will allow to know the most used tools in this discipline and use them to generate failures in a controlled way, in order to continuously strengthen the architecture of a system.
[-]
|