%PDF-1.5
%
1 0 obj
<>
endobj
2 0 obj
<>stream
CUDA
CuBLAS
MPI
Redes Neuronales
NVIDIA
Neural Networks
[ES] El objetivo de este trabajo es la optimización de dos aplicaciones que tienen un elevado coste computacional. La primera de ellas se trata de un sistema enfocado al estudio de las estructuras de los puentes ferroviarios donde existen dos niveles de optimización. La primera optimización se centra en la implementación de un sistema distribuido mediante MPI y segunda de la utilización de las GPUs de NVIDIA mediante CUDA para los cálculos. La segunda se trata de HELENNA, una aplicación para el entrenamiento e inferencia de redes neuronales. En este trabajo se desarrolla el soporte para GPUs de NVIDIA a través de CUDA y su combinación con cuBLAS.
[EN] The goal of this project is the optimization of two applications with a high computational cost. The first application is focused on the analysis of the structure of train
bridges and its maintenance. The first optimization is focused on the implementation
of a distributed system with MPI communication whereas the second optimization is
focused on the use of GPUs from NVIDIA progframmed with CUDA. The second application is HELENNA, a neural network application used for training and inferencing. In
this project we have developed the whole support for NVIDIA GPUs using CUDA and
combined with cuBLAS.
[CA] L’objectiu d’aquest treball és l’optimització de dues aplicacions que contenen un elevat cost computacional. La primera d’elles tracta d’un sistema enfocat a l’estudi de les
estructures dels ponts ferroviaris on hi ha dos nivells d’optimització. La primera optimització se centra en la implementació d’un sistema distribuït mitjançant MPI i segona
de la utilització de les GPUs de NVIDIA mitjançant CUDA per als càlculs. La segona es
tracta d’HELENNA, una aplicació per a l’entrenament i inferència de xarxes neuronals.
En aquest treball es desenvolupa el suport per GPUs de NVIDIA a través de CUDA i la
seua combinació amb cuBLAS.
Reconocimiento (by)
Abierto
José Flich Cardo
Pedro Museros Romero
http://hdl.handle.net/10251/150241
Español
endstream
endobj
3 0 obj
<>
endobj
4 0 obj
<>stream
x3PHW0Pp2A c(
endstream
endobj
7 0 obj
<>
endobj
8 0 obj
<>stream
xX_s6ϧ[Z(ɒi-um]٢mvZh˙k@ ADg/ΞJJ,"n%*\yY p*VwCs Rjܛ(Pq7Y⟷OzٛbЯσz(k`>NeyMcʥ2mmڎ,YV[
2Z0o̓"`4)} Qlv(.fi7%;MrO5z~W.{Ѫq:}mWm)9$h,ԬV_P]N&+XV[Ȃ0WzGJޔ;#ֲpcx)B+
!(g`6҄c6`n!]Oùaa/i=W4Z70ZԢCj
YPSYrSi$+mZ5Trǡ7iu&G.=QAtK߿V(k1Ͱ^uIsEIG8MtRTOW7Wx>X$ }(4qҴriml#tvi^/h*ZFA0_mvcwzؖ"nض;Yͱ !gBx< n*4x2<ԓǤl"^\&ḣ
̣4[6g>^2I@
\;ms0PE%YDQ6hS<y
;WxI#fF(&bS<嶧63"qZ;QoyAg_T-~*E'`6cO2ƞD:@]uXg8Jp9? H/ ʴȧMCQ CJZ^zi_
'/J`8PБɸ xE\)4ՃvD(u@(C #ѳ4GClU2ZQxx2xkkxwnHm#MJK`!XVi9e`Rz*HrDGB.cIΐ?r0eol?YW]l}Wal;ꎚB呻RNLR*euZ*Y-N ],<+% #0Q
UQ{=
R >z˧WTAA
W
Gqkq&A
Hżn'.+
8rb}'@侱o-(nMϯ$=؈eؘ0t&pJ'3v$70T;z>xkfP0x\ect) Ϟ'jԩ1ZTi+&Rx#2.55tpXs&,94"f{gnJL~HB9K2<