Macroordenadores i grups d'ordinadors

Roa Zubia, Guillermo

Elhuyar Zientzia

En Santa Bàrbara, Califòrnia, hi havia un ordinador de 30.000 tubs de buit. El sistema de refrigeració de canonades (aire condicionat) ocupava tota la planta d'un edifici. Tenia 64 K de memòria RAM i 12 kHz de velocitat. Per descomptat, l'entrada i la sortida eren targetes perforades i una cinta de paper, respectivament. No tenia pantalla. Quan estava en funcionament, "absorbia" el 10% de l'electricitat de la ciutat i, a més, per por de crear pics de tensió, mai ho apagaven. Els macroordenadores van aparèixer en els inicis de la informàtica. Macroordenadores vectorials Clústers: la col·laboració dels més petits Top500 Macroordenadores a Euskal Herria

Què és un macroordenador? Una definició és: "Ordinador d'alta capacitat que es connecta a altres ordinadors. La seva grandària depèn de la memòria; els majors tenen una memòria principal de diversos gigaoctets i diversos terabytes de memòria de disc". Des del punt de vista actual, és possible que aquestes màquines grans es defineixin amb una altra idea: un ordinador que fa coses que no es poden fer amb l'ordinador de casa. No obstant això, totes dues definicions no són molt concretes.

El primer macroordenador (si és possible) va ser construït en 1975 per l'informàtic estatunidenc Seymour Cray, que li va donar el seu nom: Cray 1. Aporta idees arquitectòniques innovadores; va ser el primer ordinador vectorial, és a dir, tenia registres que treballaven amb vectors (matrius unidimensionals). Aquesta idea és molt útil per a programar-la en llenguatge FORTRAN, que era el llenguatge més adequat per al programari de la ciència, ja que amb les matrius els càlculs eren fàcils. A més, disposava de processadors en paral·lel.

Empreses com Alliant, Ardent o Convex van fabricar ordinadors més petits de la mateixa filosofia i s'han fabricat molts nous models de Cray. En l'actualitat, els 'successors' de l'ordenador Cray 1 ocupen aproximadament el 10% del mercat de supercomputación. No obstant això, cadascuna d'aquestes macroodenadoras té una capacitat d'operació limitada, si es necessita una major capacitat s'han de formar equips d'ordinador.

Grups d'ordinadors

Un ordinador vectorial Cray.

Èxit dels ordinadors interconnectats. I és que els macroordenadores són màquines molt cares i per al manteniment també es necessita molts diners. No obstant això, qualsevol empresa pot instal·lar, gestionar i utilitzar la xarxa d'ordinadors 'petits' per a fer aquests gegantescos treballs. Per això, en lloc d'utilitzar un ordinador amb més d'un processador, es va treballar la manera de treballar en paral·lel per a molts ordinadors d'un mateix processador.

Cada ordinador d'un grup rep el nom de node i pot tenir centenars connectats a aquesta xarxa. També es poden connectar equips. L'estructura que agrupa 16 grups es diu constel·lació. A la vista de tot això, s'entén fàcilment que un macroordenador no tingui la mateixa capacitat de càlcul que diversos grups. D'altra banda, un equip d'ordinadors és accessible per a una empresa, tant des del punt de vista de la màquina com del manteniment, si es connecta a xarxes d'altres empreses el cost es distribueix.

Política de càlcul

En els anys 80, els governs van posar en marxa molts centres de supercomputación amb macroordenadores. A les empreses que no podien pagar aquest tipus de màquines se'ls donava la possibilitat de connectar-se a aquests centres. Per tant, els governs gestionaven les majors necessitats informàtiques de les empreses.

Els equips d'ordinador són una bona alternativa als macroordenadores.

Però en aquests anys es van desenvolupar els ordinadors més petits (ordinadors personals, entre altres) i la idea de grups d'ordinadors. A poc a poc es van abaratir els recursos necessaris per a formar les xarxes. A la fi de la dècada de 1990 les empreses havien perdut la tendència als centres de supercomputación. Els grups tenien importants avantatges: els gestionava un mateix, desapareixia la dependència del govern i, a més, l'ordinador no havia de compartir-se. En conseqüència, la capacitat de càlcul era major.

Els governs van recórrer a reduir el nombre de centres. En l'actualitat, en molts Estats hi ha pocs d'ells perquè encara són necessaris per a certes tasques (l'exemple és el projecte Blue Gene). Alguns centres s'han convertit en bases de dades públiques, però la tendència de la majoria dels grups d'investigadors és la de comptar amb equips d'ordinador privats. Quina serà la principal oportunitat de futur? En un parell de dècades la situació pot canviar.

Blue Gene : aplicació per a cremar xips

Estructura tridimensional d'una proteïna.

Més enllà de la informàtica teòrica, val la pena analitzar com s'aplica l'enorme capacitat dels macroordenadores. La posada en marxa d'aquestes màquines és costosa, per la qual cosa cal aprofitar-les, per exemple, tenint en compte que aquests ordinadors requereixen sistemes especials d'aire condicionat.

Què cal calcular en aquestes màquines grans? El projecte Blue Gene que va posar en marxa IBM en 1999 és un bon exemple. Aquest projecte es va posar en marxa per a investigar un dels problemes més importants de la bioquímica: el plegat de proteïnes. Per a abordar aquest treball es va idear un ordinador amb una nova arquitectura, que el seu segon objectiu és analitzar l'eficàcia de la nova arquitectura.

Per què cal investigar com es dobleguen les proteïnes? És fàcil, perquè les proteïnes són responsables de les reaccions químiques del cos. Si les proteïnes es deterioren "" es produeixen malalties greus que sovint es deterioren per un mal plegat. Sabem que malalties com l'Alzheimer, l'hemofília i unes altres tenen a veure amb proteïnes mal plegades.

Problema de conformat

En general, les proteïnes són cadenes d'aminoàcids. Existeixen 20 tipus d'aminoàcids dels quals la proteïna presenta característiques químiques segons la seva seqüència. Però la química no sols la determina la seqüència, sinó que és molt important la localització espacial dels aminoàcids. Els aminoàcids molt allunyats de la cadena han d'estar físicament a prop per a poder complir la seva funció, és a dir, la cadena ha de plegar-se en tres dimensions adequadament. Si es pren una conformació equivocada, la proteïna no podrà treballar.

Grup d'ordinadors en baldes.

Però a mesura que la proteïna se sintetitza, com sap quina és la seva conformació? Quin patró segueix per a plegar proteïnes? Si ho sabéssim, inventaríem proteïnes per a produir la reacció química desitjada amb la simple definició de la seqüència. Blue Gene tracta de trobar aquests patrons.

Números grans

Les proteïnes contenen centenars d'aminoàcids. Per exemple, l'hemoglobina, una proteïna que transporta oxigen en la sang, conté 612 aminoàcids. L'angle diedre entre tres aminoàcids consecutius pot tenir molts valors, per la qual cosa la proteïna pot contenir milions d'estructures espacials. Només una d'elles és adequada

sorprenentment, la proteïna es plega normalment amb aquesta estructura

Els científics proposen patrons del procés de plegat de proteïnes, però la capacitat de càlcul i la memòria necessàries per a demostrar que estan o no són correctes. El treball d'un macroordenador és imprescindible. L'empresa IBM va dissenyar un gran ordinador amb una arquitectura singular: Blue Gene. En aquest projecte es treballarà el model d'una proteïna de grandària mitjana que conté 300 aminoàcids.

Blue Gene: arquitectura especial per a aconseguir velocitats de càlcul molt altes.
IBM

Lectors ràpids

Blue Gene es va dissenyar per a ser 500 vegades més ràpid que l'ordinador més ràpid del món. Com s'ha aconseguit? En molts ordinadors, el major temps necessari per a accedir a les dades de les xips de memòria. El projecte Blue Gene ha dissenyat xips per a fer front a aquest problema.

Cada xip consta de dos processadors: un de càlcul i un altre de comunicació. Cada grup de xips s'encarrega de part del càlcul complet. Aquesta estratègia accelera enormement la capacitat de càlcul. En el cas de les proteïnes, per exemple, els fitxers de treball han de ser molt grans (fitxers que romanen durant els càlculs), i la durada del treball depèn en última instància del temps que busquem les dades que necessitem.

En aplicacions complexes, els ordinadors han de realitzar milions d'operacions aritmètiques en el menor temps possible. Per a això, fa uns quaranta anys, els informàtics van inventar ordinadors vectorials. Aquests ordinadors, en lloc d'utilitzar números senzills, utilitzen vectors, és a dir, llistes de números (per a informàtics, matrius unidimensionals).

(Foto: G. Puente Rosegui). Per a veure bé la foto anar al pdf.

Els ordinadors vectorials utilitzen línies de pipes per a un càlcul ràpid. La idea d'aquestes pipe-line és molt senzilla, és el mateix principi que la fabricació de sèries. Amb un exemple s'entén fàcilment. Suposem que hem de calcular la diferència entre les dades de dues llistes de números, per a això cal seguir quatre passos: a) prendre un número de cada llista, b) restar c) si el resultat de la resta és negatiu, canviar el signe i d) emmagatzemar el resultat en memòria. Si cada pas es realitza en un microsegon, per a tractar un parell de números es necessiten quatre microsegons.

Els llistats que utilitzarem són: 10, 3, 2, 6, 7, 1, 5, 10, … i 7, 8, 14, 5, 3, 4, 5, 6, …

En canvi, en una pipe-line, quan el primer parell de números ha acabat el primer pas, es va al segon, però un segon parell de números entren en el primer pas. Així, en cada microsegon, les parets interiors avançaran un pas i s'incorporarà un parell en el primer pas lliure. D'aquesta manera, l'operació del primer parell requerirà tres microsegons, però el del segon parell finalitzarà en el quart microsegon (i no en el sisè, com si es realitzessin un a un).

(Foto: G. Puente Rosegui). Per a veure bé la foto anar al pdf.

Ha estat un exemple senzill, però cal tenir en compte que els ordinadors realitzen operacions aritmètiques amb números de coma mòbil. (L'escriptura de coma mòbil per a representar un número utilitza un pregadéu i una característica, és a dir, és una escriptura de tipus 0,233 x 10 3).

L'aritmètica d'aquests números requereix més passos que els nombres enters. Els macroordenadores vectorials incorporen sistemes pipe-line de càlcul amb coma mòbil. A més, en combinar vectors complets amb registres per al tractament de números simples, poden realitzar operacions aritmètiques extremadament ràpides. El més famós dels primers macroordenadores d'aquest tipus, Cray 1, data de l'any 1976.


Moltes vegades, un grup de petits ordinadors pot treballar en un ordinador vectorial. Aquesta és la filosofia principal dels grups d'ordinadors. No obstant això, tots els ordinadors que componen el grup han d'estar connectats d'alguna manera a una xarxa. A cada ordenador participant se'l denomina node. Però, on està el programari que necessiten tots els nodes? Utilitzaran la memòria conjunta o cada node utilitzarà la seva? Des del punt de vista arquitectònic de tot el sistema existeixen tres formes d'organització.

Discos compartits

Aquest tipus d'ordenació és molt utilitzada. La xarxa disposa de dispositius generals d'entrada i sortida, accessibles des de cada node. Aquests dispositius inclouen arxius i bases de dades. Així, el sistema no necessita compartir memòries de nodes.

El principal problema d'aquest sistema és la disponibilitat de tots els nodes. En un moment donat, tots els nodes poden escriure o llegir simultàniament en els discos generals. Per a poder controlar tot això és necessari un mecanisme de sincronització: el gestor del bloqueig.

La deterioració d'un node en aquests sistemes no afecta a uns altres. Això proporciona una gran disponibilitat al sistema, encara que a vegades aquesta característica alenteix el treball degut als estrenyiments que genera l'activitat del gestor del bloqueig.

Sistemes sense compartició

En aquests sistemes no hi ha discos disponibles per als nodes. Per això, en aquests sistemes el nombre de nodes no està tan limitat com en ocasions anteriors. Aquests sistemes tenen centenars de nodes.

Sistemes miralls

Encara que en aquests sistemes les dades estan emmagatzemades en un disc general, es copien a un segon per a augmentar la disponibilitat. Normalment no es treballa en aquesta còpia, tret que s'espatlli el disc original. Si s'espatlla, aquesta organització recupera les dades molt ràpidament. Aquests sistemes normalment només tenen dos nodes. Molts dels servidors que suporten la xarxa Internet són sistemes d'aquest tipus.


Dues vegades a l'any, durant els mesos de juny i novembre, s'organitzen congressos de supercomputación per a donar a conèixer el succeït en aquest àmbit. L'últim congrés, de novembre de l'any passat, va tenir lloc als Estats Units, Denver, i l'anterior, de juny, en Heilderberg, Alemanya. En aquests congressos es recullen les dades dels centres de supercomputación i s'actualitza el llistat Top500. En aquest llistat s'analitzen els 500 centres de major capacitat i les seves característiques. Els canvis entre les diferents versions del llistat es poden consultar en la següent pàgina web: http://www.top500.org/


Quant als grans centres de càlcul, al País Basc la tendència és la mateixa que en la resta del món. En el passat, quan s'impulsaven centres de funcionament de macroordenadores, la Viceconsejería d'Indústria del Govern Basc i el centre tecnològic Labein van signar un conveni per a la instal·lació d'un centre de computació. Es va decidir situar est centro en el Parc Tecnològic de Zamudio.

LABEIN

Es va posar en marxa un macroordenador Convex que podia ser utilitzat en diverses empreses d'Euskal Herria. Les empreses a les quals s'anava a connectar pertanyien principalment a l'àmbit de l'enginyeria, amb l'objectiu de realitzar en aquest gegantesc ordinador els grans càlculs necessaris per al disseny.

La millor configuració d'aquesta màquina convex va ser l'ordinador paral·lel de 8 processadors vectorials. Al principi, algunes empreses van tenir un gran interès. No obstant això, en lloc de ser un centre de supercomputación, la tendència general va anar a buscar altres solucions (per exemple, grups d'ordinadors gestionats per un mateix). Durant alguns anys va ser utilitzat per diversos grups d'investigadors de la Universitat del País Basc, però finalment es va suspendre el centre de supercomputación.

Babesleak
Eusko Jaurlaritzako Industria, Merkataritza eta Turismo Saila