La memorizzazione dei dati del CERN

Il Large Hadron Collider (LHC) del CERN è all’avanguardia della ricerca fisica. I dati generati dalle sue fasi “Run 1” e “Run 2” sono già stati utilizzati per dimostrare l’esistenza di particelle atomiche finora mai identificate, e dunque ampliare la nostra conoscenza dell’universo e come questo si è formato. In particolare, nel 2012 i dati hanno permesso di confermare l’esistenza del bosone di Higgs.
I numeri del CERN sono sbalorditivi. A partire dalla dimensione del large hadron collider, un acceleratore di particelle circolare con un raggio di 4,3 km, alla velocità di collisione delle particelle: all’interno dei rilevatori dell’esperimento con il LHC si possono verificare fino a 1 miliardo di collisioni di particelle ogni secondo.
Ma è la quantità di dati che desta maggiore impressione, infatti le collisioni generano 1 petabyte (PB) di dati al secondo. Anche dopo aver filtrato i soli eventi interessanti, il CERN ha la necessità di immagazzinare ogni mese circa 10 PB di nuovi dati da analizzare.
Questi dati vengono immagazzinati nel centro elaborazione dati del CERN e sono condivisi con una rete di circa 170 centri elaborazione dati per la loro analisi, grazie alla Worldwide LHC Computing Grid (WLCG), la rete mondiale di calcolo per LHC. L’attuale centro archiviazione dati del CERN comprende buffer hard disk con 3200 JBOD che contengono 100.000 hard disk drive (HDD), per un totale di 350 PB.
Le fasi Run con il LHC sono destinate e continuare e ad ogni nuovo “Run” l’archivio dati cresce in modo significativo. Dopo i necessari upgrade, la fase Run 3 del CERN è prevista per il 2021.
Gli hard disk di Toshiba Electronics Europe GmbH vengono utilizzati dal CERN dal 2014 per gestire gli enormi volumi di dati, e tre generazioni di tecnologia hard drive Toshiba hanno finora soddisfatto le crescenti esigenze di capacità di storage del centro. Ma ciò può continuare se, come dichiara Eric Bonfillou, responsabile della divisione Facility Planning and Procurement presso il dipartimento IT del CERN: “Gli interventi di upgrade programmati per le macchine del LHC richiederanno un dimensionamento delle risorse di calcolo e archiviazione che va oltre quanto oggi la tecnologia è in grado di offrire”.