Auto-generación de núcleos computacionales para redes neuronales sobre GPUs

Del Campo Calvo, Francisco Javier

RiuNet repositorio UPV
:
Docencia
:
Trabajos académicos
:
Servicio de alumnado - Trabajos académicos
:
Ver ítem

Identificarse

Buscar en RiuNet

Listar

Todo RiuNet
Esta colección

Mi cuenta

Acceder

Estadísticas

Ver Estadísticas de uso

Ayuda RiuNet

Admin. UPV

Compartir/Enviar a

Citas

Estadísticas

Auto-generación de núcleos computacionales para redes neuronales sobre GPUs

Mostrar el registro completo del ítem

Del Campo Calvo, FJ. (2023). Auto-generación de núcleos computacionales para redes neuronales sobre GPUs. Universitat Politècnica de València. http://hdl.handle.net/10251/197040

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10251/197040

Ficheros en el ítem

Nombre: Del - Auto-generacion ...

Tamaño: 38.14Mb

Formato: PDF

Abrir/Preview

Metadatos del ítem

Título:

Auto-generación de núcleos computacionales para redes neuronales sobre GPUs

Otro titulo:

Auto-generation of computational kernels for neural networks on GPUs
Acte-generació de nuclis computacionals per a xarxes neuronals sobre GPUs

Autor:

Del Campo Calvo, Francisco Javier

Director(es):

Alonso Jordá, Pedro

Castelló Gimeno, Adrián

Entidad UPV:

Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació

Fecha acto/lectura:

2023-07-25

Fecha difusión:

2023-09-25

Resumen:

[ES] La adopción de las redes neuronales en prácticamente todos los ámbitos científicos está propiciando su uso en una amplia variedad de dispositivos. Estos dispositivos pueden ser de muy diversa naturaleza: desde grandes y complejos servidores de cómputo, hasta procesadores de bajo consumo como los integrados en los teléfonos móviles. Sin embargo, ya sean de un tipo u otro, casi todos incluyen un acelerador gráfico o GPU que puede ser utilizado para cómputo de propósito general. Generar núcleos computacionales optimizados para cada acelerador de forma manual requiere de un enorme esfuerzo por parte de los desarrolladores, de hecho, en la práctica, esto se lleva a cabo solamente para algunos modelos. El objetivo del presente trabajo es automatizar la generación de código optimizado para cualquier tipo de GPU mediante una herramienta conocida como Apache TVM. Esta herramienta permite especificar la operación a optimizar a un alto nivel y, a través de una serie de modificaciones intermedias por parte del framework, generar el código optimizado. En este trabajo se desarrolla código para optimizar la operación de multiplicación de matrices, la cual es ampliamente utilizada en la mayoría de los campos científicos, incluyendo las redes neuronales. Una vez generado el código con TVM, se lleva a cabo un estudio de prestaciones, comparando su rendimiento con el de la librería de altas prestaciones NVIDIA cuBLAS y el de otra utilidad de TVM llamada Auto-Tuning (AutoScheduler), que permite automatizar el proceso de desarrollo a partir de una descripción del cómputo. Los resultados muestran que el código desarrollado obtiene un rendimiento similar al obtenido por cuBLAS, y supera el generado por AutoScheduler en multiplicaciones de matrices de dimensiones grandes. Al aplicar esta comparativa a un caso de estudio real, la red neuronal ResNet50-v1.5, donde el escenario de aplicación cambia a matrices muy rectangulares, ha sido posible vencer a cuBLAS en algunas de las capas que corresponden a los productos de matrices más rectangulares y al AutoScheduler en la mayoría de las capas. [-]

[EN] The adoption of neural networks in virtually all scientific fields is leading to their use in a wide variety of devices. These devices can range from large, complex computational servers to low-power processors such ...[+]

Palabras clave:

Multiplicación de matrices , Apache TVM , GPU , Generación automática , Redes neuronales , Convolución , Matrix multiplication , Automatic generation , Neural networks , Convolution

Derechos de uso:

Reserva de todos los derechos

Editorial:

Universitat Politècnica de València

Titulación:

Máster Universitario en Computación en la Nube y de Altas Prestaciones / Cloud and High-Performance Computing-Màster Universitari en Computació en el Núvol i d'Altes Prestacions / Cloud and High-Performance Computing

Tipo:

Tesis de máster

recommendations

Este ítem aparece en la(s) siguiente(s) colección(ones)

Servicio de alumnado - Trabajos académicos [7391]

Mostrar el registro completo del ítem

Auto-generación de núcleos computacionales para redes neuronales sobre GPUs

RiuNet: Repositorio Institucional de la Universidad Politécnica de Valencia

Buscar en RiuNet

Listar

Todo RiuNet

Esta colección

Mi cuenta

Estadísticas

Ayuda RiuNet

Admin. UPV

Compartir/Enviar a

Citas

Estadísticas

Auto-generación de núcleos computacionales para redes neuronales sobre GPUs

Ficheros en el ítem

Metadatos del ítem

recommendations

Este ítem aparece en la(s) siguiente(s) colección(ones)