High performance and energy efficient inference for deep learning on multicore ARM processors using general optimization techniques and BLIS

Castelló, Adrián; SERGIO BARRACHINA; DOLZ ZARAGOZÁ, MANUEL FRANCISCO; Enrique S. Quintana-Ortí; San Juan-Sebastian, Pablo; Tomás Domínguez, Andrés Enrique

doi:10.1016/j.sysarc.2022.102459

Identificarse

Buscar en RiuNet

Listar

Todo RiuNet
Esta colección

Mi cuenta

Acceder

Estadísticas

Ver Estadísticas de uso

Ayuda RiuNet

Admin. UPV

Compartir/Enviar a

Citas

Estadísticas

High performance and energy efficient inference for deep learning on multicore ARM processors using general optimization techniques and BLIS

Mostrar el registro completo del ítem

Castelló, A.; SERGIO BARRACHINA; Dolz Zaragozá, MF.; Enrique S. Quintana-Ortí; San Juan-Sebastian, P.; Tomás Domínguez, AE. (2022). High performance and energy efficient inference for deep learning on multicore ARM processors using general optimization techniques and BLIS. Journal of Systems Architecture. 125:1-9. https://doi.org/10.1016/j.sysarc.2022.102459

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10251/197569

Ficheros en el ítem

Nombre: CastelloSERGIO ...

Tamaño: 732.2Kb

Formato: PDF

Descripción: Versión editorial

Abrir/Preview

Metadatos del ítem

Título:

High performance and energy efficient inference for deep learning on multicore ARM processors using general optimization techniques and BLIS

Autor:

Castelló, Adrián SERGIO BARRACHINA DOLZ ZARAGOZÁ, MANUEL FRANCISCO

Enrique S. Quintana-Ortí

San Juan-Sebastian, Pablo

Tomás Domínguez, Andrés Enrique

Entidad UPV:

Universitat Politècnica de València. Departamento de Informática de Sistemas y Computadores - Departament d'Informàtica de Sistemes i Computadors
Universitat Politècnica de València. Escola Tècnica Superior d'Enginyeria Informàtica

Fecha difusión:

2022-04

Resumen:

[EN] We evolve PyDTNN, a framework for distributed parallel training of Deep Neural Networks (DNNs), into an efficient inference tool for convolutional neural networks. Our optimization process on multicore ARM processors ...[+]

Palabras clave:

Convolutional neural network , Inference , Multicore low-power processors

Derechos de uso:

Reconocimiento - No comercial - Sin obra derivada (by-nc-nd)

Fuente:

Journal of Systems Architecture. (issn: 1383-7621 )

DOI:

10.1016/j.sysarc.2022.102459

Editorial:

Elsevier

Versión del editor:

https://doi.org/10.1016/j.sysarc.2022.102459

Código del Proyecto:

info:eu-repo/grantAgreement/AEI/Plan Estatal de Investigación Científica y Técnica y de Innovación 2013-2016/TIN2017-82972-R/ES/TECNICAS ALGORITMICAS PARA COMPUTACION DE ALTO RENDIMIENTO CONSCIENTE DEL CONSUMO ENERGETICO Y RESISTENTE A ERRORES/
info:eu-repo/grantAgreement/GVA//PROMETEO%2F2019%2F109//COMUNICACION Y COMPUTACION INTELIGENTES Y SOCIALES/
info:eu-repo/grantAgreement/GVA//CDEIGENT%2F2018%2F014//Plan GenT/

Agradecimientos:

This research was partially sponsored by projects TIN2017-82972-R of Ministerio de Ciencia, Innovacion y Universidades, Spain and Prometeo/2019/109 of the Generalitat Valenciana, Spain. Adrian Castello was supported by the ...[+]

Tipo:

Artículo

recommendations

Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro completo del ítem

High performance and energy efficient inference for deep learning on multicore ARM processors using general optimization techniques and BLIS

RiuNet: Repositorio Institucional de la Universidad Politécnica de Valencia

Buscar en RiuNet

Listar

Todo RiuNet

Esta colección

Mi cuenta

Estadísticas

Ayuda RiuNet

Admin. UPV

Compartir/Enviar a

Citas

Estadísticas

High performance and energy efficient inference for deep learning on multicore ARM processors using general optimization techniques and BLIS

Ficheros en el ítem

Metadatos del ítem

recommendations

Este ítem aparece en la(s) siguiente(s) colección(ones)