banner

Blog

Sep 02, 2023

ALICE migliora la sua strategia per l'informatica sostenibile

La progettazione e l’implementazione di un modello informatico completamente nuovo – il progetto O2 – consente alla collaborazione ALICE di unire l’elaborazione dei dati online e offline in un unico framework software per far fronte alle esigenze di Run 3 e oltre. Volker Lindenstruth va dietro le quinte.

Il Large Hadron Collider (LHC) è tornato in vita il 5 luglio 2022, quando le collisioni protone-protone con un'energia record del centro di massa di 13,6 TeV sono riprese per la fase 3. Per consentire alla collaborazione ALICE di beneficiare della maggiore luminosità istantanea Di questa e delle future operazioni dell'LHC, l'esperimento ALICE ha subito un importante aggiornamento durante il Long Shutdown 2 (2019-2022) che migliorerà sostanzialmente la ricostruzione della traccia in termini di precisione spaziale ed efficienza di tracciamento, in particolare per le particelle a basso momento. L'aggiornamento consentirà inoltre una maggiore velocità di interazione fino a 50 kHz per le collisioni piombo-piombo (PbPb) in modalità di lettura continua, che consentirà ad ALICE di raccogliere un campione di dati più di 10 volte più grande dei campioni combinati delle Analisi 1 e Analisi 2 .

ALICE è un esperimento unico presso l'LHC dedicato allo studio della materia nucleare estrema. Comprende un barile centrale (il più grande produttore di dati) e un “braccio” muonico anteriore. Il barile centrale si basa principalmente su quattro sottorivelatori per il tracciamento delle particelle: il nuovo sistema di tracciamento interno (ITS), che è un tracciatore di silicio monolitico da 12,5 gigapixel a sette strati (CERN Courier luglio/agosto 2021 p29); una camera di proiezione temporale (TPC) aggiornata con lettura basata su GEM per il funzionamento continuo; un rivelatore di radiazione di transizione; e un rilevatore del tempo di volo. Il braccio di muoni è composto da tre dispositivi di tracciamento: un inseguitore avanzato di muoni appena installato (un tracciatore di silicio basato su sensori monolitici a pixel attivi), camere di muoni rinnovate e un identificatore di muoni.

A causa del maggiore volume di dati nel rilevatore ALICE aggiornato, è impossibile archiviare tutti i dati grezzi prodotti durante l'esecuzione 3. Uno dei principali aggiornamenti di ALICE in preparazione all’ultima corsa è stata quindi la progettazione e l’implementazione di un modello di calcolo completamente nuovo: il progetto O2, che unisce l’elaborazione dei dati online (sincrona) e offline (asincrona) in un unico framework software. Oltre a un aggiornamento delle fattorie di calcolo dell'esperimento per la lettura e l'elaborazione dei dati, ciò richiede un'efficiente compressione online e l'uso di unità di elaborazione grafica (GPU) per accelerare l'elaborazione.

Come suggerisce il nome, le GPU sono state originariamente progettate per accelerare il rendering della grafica computerizzata, in particolare nei giochi 3D. Sebbene continuino a essere utilizzate per tali carichi di lavoro, le GPU sono diventate processori vettoriali generici da utilizzare in una varietà di impostazioni. La loro capacità intrinseca di eseguire più attività contemporaneamente conferisce loro un throughput di calcolo molto più elevato rispetto alle CPU tradizionali e consente loro di essere ottimizzate per l'elaborazione dei dati piuttosto che, ad esempio, per la memorizzazione nella cache dei dati. Le GPU riducono quindi i costi e il consumo energetico delle fattorie di calcolo associate: senza di esse, sarebbero necessari circa otto volte più server dello stesso tipo e altre risorse per gestire l’elaborazione online di ALICE TPC dei dati di collisione PbPb a una velocità di interazione di 50 kHz.

Dal 2010, quando è entrata in funzione la fattoria informatica online con trigger di alto livello (HLT), il rilevatore ALICE ha aperto la strada all’uso delle GPU per la compressione e l’elaborazione dei dati nella fisica delle alte energie. L'HLT aveva accesso diretto all'hardware di lettura del rivelatore ed era fondamentale per comprimere i dati ottenuti dalle collisioni di ioni pesanti. Inoltre, la struttura del software HLT era sufficientemente avanzata da eseguire la ricostruzione dei dati online. L'esperienza acquisita durante il funzionamento nelle fasi 1 e 2 di LHC è stata essenziale per la progettazione e lo sviluppo degli attuali sistemi software e hardware di O2.

Per la lettura e l'elaborazione dei dati durante la prova 3, i componenti elettronici front-end del rilevatore ALICE sono collegati tramite collegamenti transceiver gigabit resistenti alle radiazioni ad array di gate programmabili sul campo personalizzati (vedere la figura "Flusso di dati"). Questi ultimi, ospitati nei nodi farm del processore di primo livello (FLP), eseguono la lettura continua e la soppressione dello zero (la rimozione dei dati senza segnale fisico). Nel caso di ALICE TPC, la soppressione dello zero riduce la velocità dei dati da un proibitivo 3,3 TB/s nel front-end a 900 GB/s per operazioni PbPb con bias minimo a 50 kHz. Questo flusso di dati viene quindi inviato dalla farm di lettura FLP ai nodi di elaborazione degli eventi (EPN) utilizzando il software di distribuzione dei dati in esecuzione su entrambe le farm.

 0.1 GeV/c. Here the fake-track rate is rather negligible, however the clone rate increases significantly for low-pT primary tracks due to incomplete track merging of very low-momentum particles that curl in the ALICE solenoidal field and leave and enter the TPC multiple times./p>
CONDIVIDERE