Resum Actualment, els clusters de PCs estan considerats com una alternativa eficient a l’hora de construir ordinadors amb un alt grau de paralelització. En aquests sistemes, milers de nodes de computació es connecten per mitjà d’una xarxa d’interconnexió. La xarxa d’interconnexió ha de ser dissenyada cuidadosament, ja que té una gran influència sobre les prestacions globals del sistema. Dos dels principals paràmetres de disseny de les xarxes d’interconnexió són la topologia i l’encaminament. La topologia defineix la interconnexió dels elements de la xarxa entre si, i entre aquestos i els nodes de computació. Per la seua banda, l’encaminament defineix els camins que segueixen els paquets a través de la xarxa. Les prestacions han sigut tradicionalment la principal mètrica a l’hora d’avaluar les xarxes d’interconnexió. No obstant això, hui en dia cal considerar dos mètriques addicionals: el cost i la tolerància a fallades. Les xarxes d’interconnexió a més d’escalar en prestacions també han de fer-ho en cost. s a dir, no sols han de mantindre la seua productivitat conforme augmenta la grandària de la xarxa, sinó que han de fer-ho sense incrementar en una gran medida el seu cost. D’altra banda, conforme s’incrementa el nombre de nodes en les màquines de tipus cluster, la xarxa d’interconnexió ha de créixer en concordança. Aquest increment en el nombre d’elements de la xarxa d’interconnexió augmenta la probabilitat d’aparició de fallades, i per tant, la tolerància a fallades és pràcticament obligatòria per a les xarxes d’interconnexió actuals. Esta tesis es centra en la topologia fat-tree, ja que és una de les topologies més comunament usades en els clusters. El nostre propòsit consisteix a aprofitar-nos de les seues característiques particulars per a proporcionar tolerància a fallades i un algoritme d’encaminament capa¸c d’equilibrar la càrrega de la xarxa que proporcione una bona solució de compromís entre les prestacions i el cost. En primer lloc, ens centrem en la tolerància a fallades en la topologia fat-tree. Molts dels treballs dedicats a aquest tema proporcionen tolerància a fallades a canvi d’afegir recursos a la xarxa; ja siguen encaminadors, enllaços o canals virtuals. Al contrari que aquests treballs, nosaltres proporcionem el mateix nivell de tolerància a fallades sense incrementar els recursos de la xarxa, aprofitant-nos de l’abundància de camins equivalents disponibles en el fat-tree. En concret, definim un mecanisme que evita que s’usen aquells camins que porten als elements fallits, de manera que els paquets que anessen a prendre un d’eixos camins són desviats cap al seu destí per camins que no continguen elements fallits. Atés que tots els camins que no han patit una fallada poden ser usats sense cap restricció, el mecanisme presenta una degradació de prestacions mínima davant de la presència de fallades, mentres que proveïx el màxim nivell de tolerància a fallades que es pot aconseguir sense afegir nous recursos a la xarxa. Posteriorment, ens centrem en el disseny d’un algoritme d’encaminament determinista que pot competir en prestacions amb els algoritmes d’encaminament adaptatius usats en la topologia fat-tree. A pesar que els algoritmes adaptatius requereixen més recursos que els deterministes a l’hora de ser implementats, els algoritmes adaptatius solen tindre unes prestacions majors que els deterministes. En el nostre treball presentem un algoritme d’encaminament determinista que pot obtindre prestacions semblants, o majors, que el millor algoritme d’encaminament adaptatiu, per`o a un cost menor, ja que no requereix l’ús de mecanismes complementaris, ja que els algoritmes d’encaminament determinista proporcionen entrega en orde dels paquets per definició. Els resultats mostraran que l’algoritme d’encaminament determinista proposat pot sobrepassar clarament les prestacions dels algoritmes adaptatius quan l’entrega en orde dels paquets és obligatòria. Finalment, ens aprofitem de certes característiques d’aquest algoritme d’encaminament determinista per a simplificar la topologia fat-tree. La nova topologia pràcticament reduïx a la mitat els recursos necessaris per a construir un fat-tree, al mateix temps que proporciona en molts casos les mateixes prestacions. En general, la relació entre costos i prestacions de la nova topologia es quasi la mitat que la del fat-tree.