Las actuales arquitecturas de múltiples núcleos como los chip multiprocesadores
(CMP) y soluciones multiprocesador para sistemas dentro del chip
(MPSoCs) han adoptado a las redes dentro del chip (NoC) como elemento
óptimo para la interconexión de los diversos elementos de dichos sistemas.
En este sentido, fabricantes de CMPs y MPSoCs han adoptado NoCs sencillas,
generalmente con una topología en malla o anillo, ya que son suficientes
para satisfacer las necesidades de los sistemas actuales. Sin embargo a medida
que los requerimientos del sistema - baja latencia y alto rendimiento - se hacen
más exigentes, estas redes tan simples dejan de ser una solución real. Así, la
comunidad investigadora ha propuesto y analizado NoCs más complejas. No
obstante, estas soluciones son más difíciles de implementar - especialmente los
enlaces largos - haciendo que este tipo de topologías complejas sean demasiado
costosas o incluso inviables.

En esta tesis, presentamos una metodología de diseño que minimiza la
pérdida de prestaciones de la red debido a su implementación real. Los principales
problemas que se encuentran al implementar una NoC son los conmutadores
y los enlaces largos. En esta tesis, el conmutador se ha hecho modular,
es decir, formado como unión de módulos más pequeños. En nuestro caso, los
módulos son idénticos, donde cada módulo es capaz de arbitrar, conmutar, y
almacenar los mensajes que le llegan. Posteriormente, flexibilizamos la colocación
 de estos módulos en el chip, permitiendo que módulos de un mismo
conmutador estén distribuidos por el chip.

Esta metodología de diseño la hemos aplicado a diferentes escenarios.
Primeramente, hemos introducido nuestro conmutador modular en NoCs con
topologias conocidas como la malla 2D. Los resultados muestran como la modularidad y la distribución del conmutador reducen la latencia y el consumo de
potencia de la red.


En segundo lugar, hemos utilizado nuestra metodología de diseño para implementar
un crossbar distribuido. Nuestro crossbar distribuido tiene unas
prestaciones claramente mejores que el resto de configuraciones, tanto en latencia
como en rendimiento. No obstante, para redes con un gran número de
nodos, nuestro crossbar distribuido necesita demasiados recursos. Para solucionar
este problema de escalabilidad, se ha estudiado un crossbar distribuido
jerárquico viable que, además mantiene prácticamente las prestaciones del
crossbar distribuido.