Resumen:
|
[ES] Los procesadores de altas prestaciones más modernos integran prefetchers hardware muy complejos, en los que seleccionar la configuración para que éste obtenga las mejores prestaciones se convierte en una tarea compleja. ...[+]
[ES] Los procesadores de altas prestaciones más modernos integran prefetchers hardware muy complejos, en los que seleccionar la configuración para que éste obtenga las mejores prestaciones se convierte en una tarea compleja. Adicionalmente, en cargas de trabajo que consisten en múltiples aplicaciones que se ejecutan concurrentemente estas tareas se complican aún más. Esto se debe principalmente a la compartición de los recursos compartidos dentro del procesador (especialmente el ancho de banda de la memoria principal). Recientemente ha habido un aumento notable en las aplicaciones de redes neuronales gracias a las nuevas técnicas de aprendizaje profundo, un nuevo tipo de aprendizaje automático que ha sido posible gracias al aumento de la capacidad de cómputo y el uso de redes neuronales multicapa, que actúan como aproximadores universales que permiten modelar relaciones no lineales entre datos de entrada y salida. En este estudio se pretende emplear las técnicas mencionadas de redes neuronales para predecir dinámicamente (en tiempo de ejecución) la mejor configuración del prefecher para obtener las máximas prestaciones en cargas multiprograma, empleando un procesador IBM POWER8 que tiene un prefetcher con un elevado (2 elevado a 25) configuraciones posibles.
[-]
[EN] The most modern high-performance processors integrate very complex hardware prefetchers, in which selecting the configuration to obtain the best performance becomes a complex task. Additionally, in workloads consisting ...[+]
[EN] The most modern high-performance processors integrate very complex hardware prefetchers, in which selecting the configuration to obtain the best performance becomes a complex task. Additionally, in workloads consisting of multiple applications running concurrently these tasks are further complicated. This is mainly due to the sharing of shared resources within the processor (especially the bandwidth of main memory). Recently there has been a notable increase in neural network applications thanks to new deep learning techniques, a new type of machine learning that has been made possible by increased computing power and the use of multilayer neural networks, which act as universal approximators that allow you to model nonlinear relationships between input and output data. This study aims to use the aforementioned neural network techniques to dynamically predict (at runtime) the best configuration of the prefecher to obtain maximum performance in multiprogram loads, using an IBM POWER8 processor that has a prefetcher with a high (2 high to 25) possible configurations.
[-]
[CA] Els processadors d’altes prestacions més moderns integren prefetchers hardware molt
complexos, en els quals seleccionar la configuració que obtinga les millors prestacions es
converteix en una tasca complexa. ...[+]
[CA] Els processadors d’altes prestacions més moderns integren prefetchers hardware molt
complexos, en els quals seleccionar la configuració que obtinga les millors prestacions es
converteix en una tasca complexa. Adicionalment, en càrregues de treball que consisteixen de múltiples aplicacions que s’executen concurrentment, la configuració del prefetch
és encara més complicada (la millor configuració de prebúsqueda per a cada aplicació
és diferent). Això es deu principalment a la compartició dels recursos compartits dins el
processador (especialment l’ample de banda de la memòria principal).
D’altra banda, recentment, hi ha hagut un augment notable en les aplicacions de xarxes neuronals gràcies a les tècniques d’aprenentatge profund, un nou tipus d’aprenentatge automàtic que ha estat possible gràcies a l’augment de la capacitat de còmput i l’ús
de xarxes neuronals multicapa, que actuen com aproximadors universals que permeten
modelar relacions no lineals entre dades d’entrada i sortida.
En aquestquest estudi es pretén emprar les tècniques esmentades de xarxes neuronals
abans esmentades per predir dinàmicament (en temps d’execució) la millor configuració
del prefetch per a cada aplicació en càrregues multiprograma per obtenir el màxim rendiment, utilitzant un processador IBM POWER8 que, a dia d’avui, té un dels prefetchers
més sofisticats disponibles al mercat de processadors.
[-]
|