El producto matricial distribuido en entornos computacionales de alto rendimiento

Huerta Gañán, Rodrigo

Identificarse

Buscar en RiuNet

Listar

Todo RiuNet
Esta colección

Mi cuenta

Acceder

Estadísticas

Ver Estadísticas de uso

Ayuda RiuNet

Admin. UPV

Compartir/Enviar a

Citas

Estadísticas

El producto matricial distribuido en entornos computacionales de alto rendimiento

Mostrar el registro sencillo del ítem

Ficheros en el ítem

Nombre: Huerta - El producto ...

Tamaño: 891.5Kb

Formato: PDF

Abrir

dc.contributor.advisor	Alonso Jordá, Pedro	es_ES
dc.contributor.author	Huerta Gañán, Rodrigo	es_ES
dc.date.accessioned	2020-09-08T10:44:50Z
dc.date.available	2020-09-08T10:44:50Z
dc.date.created	2020-07-14
dc.date.issued	2020-09-08	es_ES
dc.identifier.uri	http://hdl.handle.net/10251/149579
dc.description.abstract	[ES] La multiplicación de matrices es una operación fundamental para la resolución de innumerables problemas matemáticos que tienen a esta operación en su base. El coste de esta operación, incluso el algoritmo utilizado, es diferente según la forma particular que tengan las matrices (densas, diagonales, dispersas, ...). En el caso de matrices densas sin estructura conocida a priori, es decir, de matrices generales, esta operación tiene un coste computacional elevado O(n^3). Es por este motivo por el que existen desde hace tiempo algoritmos paralelos diversos según el entorno de computación particular en el que se ejecutan. Entre estos algoritmos tiene especial relevancia el algoritmo SUMMA, diseñado para entornos de memoria distribuida. En este documento, en primer lugar, se lleva a cabo una implementación del algoritmo SUMMA para clusters de ordenadores utilizando la conocida librería MPI, teniendo en cuenta y aprovechando la capacidad multicore de los nodos. En segundo lugar, y aprovechando la experiencia anterior, se implementa el mismo algoritmo para un entorno de computación de alto rendimiento, objetivo real de este trabajo, formado por 4 GPUs interconectadas mediante una red de alta capacidad (NVLink) y utilizando, para ello, la librería NCCL de NVIDIA. Finalmente, el trabajo construye una envoltura C++ que permite una utilización accesible de la librería desarrollada. Además, se ofrece una interfaz Matlab que proporciona la habilidad de utilizar el software desarrollado eficientemente a usuarios no programadores. Se demuestra la eficacia de la solución propuesta mediante un ejemplo real: el cálculo de funciones de matrices basado en la evaluación de polinomios matriciales.	es_ES
dc.description.abstract	[EN] Matrix multiplication is a fundamental operation for solving uncountable mathematical problems that have this operation at their base. The cost of this operation, including the algorithm used, is different depending on the particular structure of the matrices (dense, diagonal, sparse, ...). In the case of dense matrices, with no known structure, that is, of general matrices, this operation has a high computational cost (O(n3)). It is for this reason that parallel algorithms have existed for a long time, being different according to the particular computing environment in which they are executed. Among these algorithms it is specially relevant the SUMMA algorithm, designed for distributed memory environments. In this document, firstly, we build an implementation of the SUMMA algorithm for computer clusters using the MPI library, taking into account and exploiting the multicore capacity of the nodes. Secondly, using the previous experience, we implement a version of the same algorithm for another high-performance computing environment, which is the real objective of this work, featuring 4 GPUs interconnected by a high-speednetwork (NVLink) and using, for this, the NVIDIA NCCL library. Finally, the work builds a C++ wrapper that allows a handy use of the developed library. In addition, it offers a Matlab interface that provides the ability to use the developed software ef¿ciently for non-programmer users. We demonstrate the effectiveness of the proposed solution on a real example: the computation of matrix functions based on the evaluation of matrix polynomials.	es_ES
dc.description.abstract	[CA] La multiplicació de matrius és una operació fonamental per a la resolució d’innombrables problemes matemàtics que tenen a aquesta operació en la seua base. El cost d’aquesta operació, fins i tot l’algorisme utilitzat, és diferent segons la forma particular que tinguen les matrius (denses, diagonals, disperses, . . . ). En el cas de matrius denses sense estructura coneguda a priori, és a dir, de matrius generals, aquesta operació té un cost computacional elevat (O(n 3 )). És per aquest motiu pel qual existeixen des de fa temps algorismes paral·lels diversos segons l’entorn de computació particular en el qual s’executen. Entre aquests algorismes té especial rellevància l’algorisme SUMMA, dissenyat per a entorns de memòria distribuïda. En aquest document, en primer lloc, es porta a terme una implementació de l’algorisme SUMMA per a clústers d’ordinadors utilitzant la coneguda llibreria MPI, tenint en compte i aprofitant la capacitat multicore dels nodes. En segon lloc, i aprofitant l’experiència anterior, s’implementa el mateix algorisme per a un entorn de computació d’alt rendiment, objectiu real del treball, format per 4 GPUs interconnectades mitjançant una xarxa d’alta capacitat (NVLink) i utilitzant, per a això, la llibreria NCCL de NVIDIA. Finalment, el treball construeix un embolcall C++ que permet una utilització accessible de la llibreria desenvolupada. A més, s’ofereix una interfície Matlab que proporciona l’habilitat d’utilitzar el programari desenvolupat eficientment a usuaris no programadors. Es demostra l’eficàcia de la solució proposada mitjançant un exemple real: el càlcul de funcions de matrius basat en l’avaluació de polinomis matricials.	es_ES
dc.format.extent	63	es_ES
dc.language	Español	es_ES
dc.publisher	Universitat Politècnica de València	es_ES
dc.rights	Reconocimiento (by)	es_ES
dc.subject	Algoritmo SUMMA	es_ES
dc.subject	MPI	es_ES
dc.subject	NCCL	es_ES
dc.subject	C++	es_ES
dc.subject	BLAS	es_ES
dc.subject	GEMM	es_ES
dc.subject	CUDA	es_ES
dc.subject	CUBLAS	es_ES
dc.subject	Matlab	es_ES
dc.subject	Multiplicación de Matrices	es_ES
dc.subject	Computación Paralela	es_ES
dc.subject	Computación de Altas Prestaciones	es_ES
dc.subject	SUMMA algorithm	es_ES
dc.subject	Matrix Multiplication	es_ES
dc.subject	Parallel Computing	es_ES
dc.subject	High Performance Computing	es_ES
dc.subject.classification	CIENCIAS DE LA COMPUTACION E INTELIGENCIA ARTIFICIAL	es_ES
dc.subject.other	Grado en Ingeniería Informática-Grau en Enginyeria Informàtica	es_ES
dc.title	El producto matricial distribuido en entornos computacionales de alto rendimiento	es_ES
dc.type	Proyecto/Trabajo fin de carrera/grado	es_ES
dc.rights.accessRights	Abierto	es_ES
dc.contributor.affiliation	Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació	es_ES
dc.contributor.affiliation	Universitat Politècnica de València. Escola Tècnica Superior d'Enginyeria Informàtica	es_ES
dc.description.bibliographicCitation	Huerta Gañán, R. (2020). El producto matricial distribuido en entornos computacionales de alto rendimiento. http://hdl.handle.net/10251/149579	es_ES
dc.description.accrualMethod	TFGM	es_ES
dc.relation.pasarela	TFGM\126903	es_ES

Este ítem aparece en la(s) siguiente(s) colección(ones)

ETSINF - Trabajos académicos [5174]
Escola Tècnica Superior d'Enginyeria Informàtica

Mostrar el registro sencillo del ítem

El producto matricial distribuido en entornos computacionales de alto rendimiento

RiuNet: Repositorio Institucional de la Universidad Politécnica de Valencia

Buscar en RiuNet

Listar

Todo RiuNet

Esta colección

Mi cuenta

Estadísticas

Ayuda RiuNet

Admin. UPV

Compartir/Enviar a

Citas

Estadísticas

El producto matricial distribuido en entornos computacionales de alto rendimiento

Ficheros en el ítem

Este ítem aparece en la(s) siguiente(s) colección(ones)