di Roberto Freato
Nel tentativo di ripercorrere sinteticamente il fenomeno della condivisione delle risorse di calcolo, si possono distinguere quattro ere.
Nella prima era (anni ’70) erano ancora in pochi ad avere la possibilità di utilizzare le risorse di calcolo a causa dei costi ancora troppo alti, infatti erano solamente le grandi aziende a potersi permettere un investimento simile. Per tale motivo, questa fase fu rinominata l’era del “computer per molti utenti”.
Negli anni ’80, la riduzione dei costi hardware ha cambiato radicalmente lo scenario, consentendo a moltissimi di poter avere un computer personale per ragioni non strettamente tecniche. È da questa era che i primi centri di ricerca si focalizzarono sull’importanza di tale potenza di calcolo a supporto delle loro attività: siamo nell’era in cui il computer era principalmente uno strumento di calcolo scientifico e teorico.
Negli anni ’90 la situazione si sviluppa a tal punto da parlare di “molti computer per un singolo utente”. L’utente, incuriosito dalla possibilità di poter possedere a un prezzo basso uno strumento tecnologico tanto potente, ha cominciato ad utilizzare il computer per svariate funzioni: come archivio dei propri dati, come strumento di svago fino a divenire, con l’avvento di Internet, uno strumento di interazione e comunicazione sociale. La crescita della memoria di massa e della larghezza di banda disponibile, ha permesso infatti la condivisione delle risorse computazionali non adiacenti che ha portato alla nascita del modello distribuito di computing che è quanto abbiamo oggi. Si è assistito in pochi anni alla nascita delle architetture cluster, cioè di un aggregato di nodi computazionali interconnessi tra di loro attraverso la rete e con protocolli standard. La diffusione di protocolli TCP/IP di Internet ha reso possibile poi lo sviluppo di architetture completamente distribuite che hanno dato il via al Grid Computing, il cui processo di maturazione converge nella creazione di una struttura affidabile e completamente scalabile (Migliardi, 2004). Il web ha abbattuto in tal senso le barriere legate alle distanze territoriali tra le persone e le cose, consentendo a tutti gli utenti di rimanere ancora più affascinati dall’utilizzo del computer, al punto che oggi non è possibile escludere nessuno quando si parla di evoluzione informatica.
Il CERN: la più grande Grid europea
La più grande Grid europea è quella del CERN[1] di Ginevra. Infatti, la necessità di condividere enormi risorse di calcolo distribuite territorialmente è conseguenza del processo di trasformazione del grande acceleratore di particelle europeo del CERN che ha dato il via ad un progetto conosciuto per l’appunto sotto il nome di Data Grid.
La Grid, che è stata realizzata per supportare tale attività, è basata su fibra ottica e collega il CERN a undici centri situati in Europa, Canada e Asia con l’obiettivo di registrare i dati del Large Hadron Collider (LHC): l’acceleratore di particelle progettato per analizzare come è nato l’universo. La nuova tecnologia collegava più di 50.000 server[2], che sarebbero diventati 300.000 dopo poco tempo. Già allora ci si era resi conto delle potenzialità di un sistema di tale portata: esso avrebbe consentito a chiunque di poter accedere ai propri dati da qualsiasi posto del mondo e in tempi stupefacenti. Ed è da tale progetto che la comunità europea decise di investire altro denaro in tale architettura informatica, al fine di stabilizzarne l’infrastruttura, convergendo nel progetto Enabling Grid for E-science in Europe[3].
[1] Il CERN (Organizzazione Europea di Ricerche Nucleari) è il più grande laboratorio al mondo di fisica delle particelle. Si trova al confine tra la Svizzera e la Francia, alla periferia ovest della città di Ginevra. Esso fornisce ai ricercatori gli strumenti necessari per la ricerca in fisica delle alte energie attraverso complessi esperimenti. Questi strumenti sono principalmente gli acceleratori di particelle.
[2] L’avvio dell’attività operativa dell’Large Computing Grid applicata all’Lhc è stata celebrata con un evento, il Grid Fest, nel corso del quale sono stati premiati i partner tecnologici strategici del progetto: Hp, Intel e Oracle. Quest’ultima ha collaborato al progetto 3D (Distributed Deployment of Databases) per la distribuzione ai massimi livelli di scalabilità e affidabilità delle informazioni necessarie all’elaborazione e analisi dei dati generati dagli eventi dell’Lhc, mentre ad Intel e Hp si deve la “griglia” vera e propria. Questa è formata da circa 100 mila Cpu Intel. Il risultato di una riduzione di circa 2,5MW, impossibile con normali architetture, è stato raggiunto grazie a una collaborazione per l’ottimizzazione del software utilizzato dal Cern in funzione dell’introduzione progressiva delle ultime tecnologie multicore. Le Cpu del Grid sono interconnesse grazie alle soluzioni e alla tecnologia ‘adaptive networking’ di Hp Procurve. La rete ha una topologia gerarchica, con un nucleo presso il Cern e centri di primo e di secondo livello dislocati in vari Paesi. Oltre 2000 switch Hp Procurve serie 3400 e 3500 controllano la griglia del campus Cern e sono a loro volta controllati da 10 ‘core switch’ serie 8212 che centralizzano gestione e sicurezza dell’intera infrastruttura. La griglia abilita un’attività che nel 2008 ha superato i 100 mila ‘job’ al giorno.
Bibliografia
Migliardi, M. (2004, Giugno). Grid Computing: Da dove viene e che cosa manca perchè diventi una realtà?




