Resumen:
|
[ES] Hoy en día, los procesadores implementan una serie de prefetchers a lo largo de la
jerarquía de caché del procesador con el objetivo de reducir u ocultar la latencia de los
accesos a memoria y, con ello, mejorar las ...[+]
[ES] Hoy en día, los procesadores implementan una serie de prefetchers a lo largo de la
jerarquía de caché del procesador con el objetivo de reducir u ocultar la latencia de los
accesos a memoria y, con ello, mejorar las prestaciones del sistema. Puesto que estos prefetchers
poseen una alta complejidad y su configuración afecta notablemente las prestaciones
del sistema, es importante realizar una óptima gestión de estos recursos.
En este trabajo se realiza un estudio del impacto de las diferentes configuraciones del
prefetcher del IBM POWER8 en las prestaciones de las aplicaciones (benchmarks). El estudio
presenta una caracterización de las prestaciones alcanzadas por las aplicaciones en
función del ancho de banda de memoria principal consumido. La caracterización cubre
tanto la ejecución en solitario de cada una de las aplicaciones como la ejecución concurrente
con otras aplicaciones, donde se generan escenarios de alta contención de ancho de
banda de memoria principal. Basándonos en los resultados del estudio, se ha propuesto
Bandwidth-Aware Prefetcher Configuration (BAPC). Se trata de una estrategia de prebúsqueda
que elige la configuración óptima del prefetcher para cada aplicación en ejecución
multinúcleo. El objetivo perseguido es realizar una mejor gestión del ancho de banda del
sistema, y repartirlo de la manera más adecuada, para mejorar sus prestaciones globales.
Los resultados son realmente esperanzadores y se consiguen mejorar las prestaciones en
alrededor de un 70 % en algunas aplicaciones y en un 30 % de media en las aplicaciones
estudiadas
[-]
[CA] Hui en dia, els processadors actuals implementen una sèrie de prefetchers al llarg de
la seua jerarquia de caché del processador amb l’objectiu de reduir o ocultar la latència
dels accessos a memòria i, amb això, ...[+]
[CA] Hui en dia, els processadors actuals implementen una sèrie de prefetchers al llarg de
la seua jerarquia de caché del processador amb l’objectiu de reduir o ocultar la latència
dels accessos a memòria i, amb això, millorar les prestacions del sistema. Pel fet que
aquests prefetchers tenen una alta complexitat i la seua configuració altera les prestacions
del sistema, és important fer una òptima gestió d’aquests.
En aquest treball s’ha realitzat un estudi de l’impacte de les diferents configuracions
del prefetcher del IBM POWER8 en l’execució de certes aplicacions (benchmarks). L’estudi
presenta una caracterització de les prestacions en funció de l’ample de banda de memòria
principal consumit. La caracterització s’ha realitzat tant en una execució en solitari com
en execució concurrent amb altres aplicacions, on es genera situacions d’alta contenció
d’amplada de banda de memòria principal. Basant-nos en els resultats de l’estudi, s’ha
proposat Bandwidth-Aware Prefetcher Configuration (BAPC). Es tracta d’una estratègia de
prebúsqueda que tria una configuració òptima del prefetcher per a cada aplicació en execució
multinucli. L’objectiu perseguit és fer un millor ús de l’ample de banda del sistema,
i repartir-ho d’una forma més adequada, per a millorar les seues prestacions globals. Els
resultats són realment esperançadors i mostren beneficis en les prestacions de fins a un
70 % en algunes aplicacions i d’un 30 % de mitja en les aplicacions estudiades
[-]
[EN] Nowadays current processors implements a range of prefetchers along its processor
memory cache hierarchy with the aim of decreasing or hiding the memory accesses lantency
and consecuently increasing the system’s ...[+]
[EN] Nowadays current processors implements a range of prefetchers along its processor
memory cache hierarchy with the aim of decreasing or hiding the memory accesses lantency
and consecuently increasing the system’s performance. Due to the complexity of
those prefetchers and because their configuration alters the system’s performance, it is
crucial to make an optimal management of them.
Therefore, in this work a study of the impact of the diferent prefetch configurations in
the IBM POWER8 on several aplications (benchmarks) has been carried out. This study
shows a characterization of the reached performance of the aplications depending on
main memory bandwidth consumption. The characterization covers not only isolated
execution but also concurrent execution with other aplications, where a high memory
bandwidth contention is present. Based on the results of this study, we proposed BandwidthAware
Prefetcher Configuration (BAPC). It is a prefetch strategy that determines the optimal
prefetcher configuration for each aplication in multicore execution. The aim of this strategy
is to make a better use of the system bandwith and also its appropriate ditribution. The
encouraging results show that the performance of some aplications is increased up to
70 % and 30 % in average with the studied aplications
[-]
|