Il Contributo di INAF in ICSC
Il Centro Nazionale HPC, Big Data and Quantum Computing (ICSC), offre un’opportunità fondamentale per il sistema scientifico, industriale ed economico italiano per affrontare le sfide scientifiche e sociali attuali e future, rafforzando ed espandendo le competenze esistenti e le risorse infrastrutturali. ICSC è strutturato secondo il modello hub and spoke: l’hub è responsabile della validazione e della gestione del programma di ricerca, le cui attività sono elaborate e realizzate dagli spoke e dalle loro istituzioni affiliate. L’hub attuerà inoltre tutte le attività in materia di istruzione e formazione, imprenditorialità, trasferimento di conoscenze, politiche e sensibilizzazione. Hub e spoke sono costituiti da Università, Enti di Ricerca e operatori privati e pubblici. Il centro nazionale proposto comprende uno spoke trasversale, Spoke 0 “Supercomputing Cloud Infrastructure”, e 10 spoke tematici. ICSC ha due obiettivi principali:
- creare un’infrastruttura informatica nazionale, di tipo datalake, raggruppando le esistenti infrastrutture di High Performance Computing (HPC), High Throughput Computing (HTC), Big Data e di rete e nuove risorse mirate acquisite tramite il finanziamento ICSC, e fornendo alla comunità scientifica e industriale un’interfaccia cloud flessibile e uniforme;
- creare attorno all’infrastruttura un ecosistema che supporti il mondo accademico e il sistema industriale, e favorisca lo sfruttamento delle risorse informatiche e lo sviluppo di nuove tecnologie.
INAF contribuisce a quattro diversi Spoke:
- Spoke 1: Future HPC
- Spoke 2: Fundamental Research & Space Economy (INAF co-leadership)
- Spoke 3: Astrophysics & Cosmos Observations (INAF leadership)
- Spoke 10: Quantum Computing
Spoke 3 – Astrophysics & Cosmos Observations
Le tecnologie basate su High Performance Computing (HPC) e Big Data sono strumenti eccezionali per modellare i complessi sistemi dinamici studiati oggi in astrofisica e cosmologia. Il loro uso è necessario per la maggior parte delle attività odierne legate all’astrofisica: dalla riduzione e analisi dei dati astronomici fino alla loro interpretazione e confronto con previsioni teoriche, incluse simulazioni e modellazione teorica. Inoltre, i metodi numerici avanzati sonofondamentali durante le fasi preparatorie e operative di nuovi esperimenti scientifici, guidando e modellando in modo efficiente la progettazione e la costruzione di strumenti e osservatori. Sono anche importanti per analizzare l’enorme quantita’ di complessi dati osservativi che la nuova generazione di osservatori produrrà [ad es. lo Square Kilometer Array Observatory (SKAO), i nuovi osservatori MeerKAT+ e LOFAR2.0, il Cherenkov Telescope Array (CTA), l’European Extremely Large Telescope (E-ELT), il Vera Rubin Observatory, il Laser a bassa frequenza nato nello spazio Interferometer Space Antenna (LISA), le missioni satellitari Euclid e WFIRST, l’esperimento LSPE in mongolfiera, il satellite LiteBIRD, DAMPE e HERD], che permetteranno u enorme balzo nella nostra comprensione dei fenomeni astronomici, la formazione e l’evoluzione dell’universo , e le leggi fondamentali della fisica. La nuova generazione di telescopi e strumenti produrra’ esponenzialmente piu’ dati rispetto ai predecessori e richiederà risorse eccezionali per la post-elaborazione, l’analisi e l’archiviazione dei dati.
Spoke 3 indirizza queste sfide, con l’obiettivo di consentire l’indagine dei processi fisici che originano i fenomeni astrofisici osservati con qualità, risoluzione e affidabilità senza precedenti, consentendone l’interpretazione e aprendo la strada a nuove scoperte scientifiche. A tal fine lo sfruttamento efficiente delle capacità di calcolo a exascale (e oltre) sarà di fondamentale importanza: la combinazione di elaborazione dei dati ad alte prestazioni con analisi interattiva in tempo reale e visualizzazione dei dati sarà necessaria per lo sfruttamento dei grandi volumi di dati previsti . Il confronto delle osservazioni con le simulazioni su larga scala raggiungerà un nuovo livello di sviluppo grazie alle capacità di archiviazione e accesso ai dati ad alte prestazioni necessarie per rendere la prossima generazione di data store astrofisici facilmente accessibile all’intera comunità astronomica.
Questo sforzo richiede la progettazione, l’implementazione e la promozione di un ecosistema completo in grado di sfruttare efficacemente le infrastrutture HPC exascale e post exascale implementate dal Centro ICSC (i) fornendo simulazioni complesse capaci di un’elevata accuratezza predittiva per affrontare la complessità dell’Universo, riprogettando, e reimplementando codici numerici esistenti e sviluppandone di nuovi per sfruttare efficaciemente soluzioni HPC innovative; (ii) contribuire al co-design delle future architetture informatiche; (iii) gestire, annotare, pubblicare la ricchezza di dati prodotti da calcoli e osservazioni implementando soluzioni innovative di storage e archiviazione dei dati; (iv) sviluppare strumenti software in grado di elaborare, analizzare e visualizzare in modo efficiente i big data (v) sfruttare la comunità di astronomia, astrofisica e fisica delle astroparticelle e formare una nuova generazione di scienziati del dominio in grado di sfruttare appieno l’infrastruttura computazionale all’avanguardia resa disponibile da ICSC.
Spoke 3, inoltre, instaurerà un’efficace azione sinergica con alcuni dei principali enti e aziende industriali nazionali al fine di implementare un’attività virtuosa di trasferimento tecnologico e di conoscenza, massimizzando l’impatto dell’investimento del Centro ICSC sull’economia nazionale e sull’intera società.
INAF e’ lo Spoke 3 leader. Allo Spoke 3, oltre ad INAF, partecipano i seguenti soggetti pubblici:
- INFN (Spoke co-leader)
- Universita’ di Roma Tor Vergata
- Scuola Normale Superiore di Pisa
- Universita’ di Torino
- SISSA ISAS Trieste
- Universita’ di Trieste
- Universita’ di Catania
Inoltre, partecipano i seguenti soggetti privati:
- Leitha S.r.l. (Gruppo Unipol)
- Banca Intesa San Paolo
- SOGEI
- Leonardo
Spoke 1 – Future HPC
Lo Spoke 1 “Future HPC & Big Data” è il pilastro tecnologico del Centro Nazionale e si occupa dello sviluppo di tecnologie hardware e software altamente innovative per i supercalcolatori del futuro. L’obiettivo principale dello Spoke 1 è di creare nuovi laboratori come parte integrante di un centro federato nazionale di livello mondiale con competenze per la co-progettazione hardware e software, e di rafforzare la leadership italiana nell’Impresa Comune Europea (Joint Undertaking) EuroHPC e nell’ecosistema dell’infrastruttura dei dati per la scienza e per l’industria.
Il personale INAF coinvolto nello Spoke 1 partecipa alle seguenti flagship, ognuna della quali corrisponde ad un Work Package collaborativo partecipato da più soggetti:
- FL2: Flagship on heterogeneous acceleration, architecture, tools, and software (leader POLIMI)
- FL3: Flagship on workflows, I/O, and HPC-cloud convergence (leader UNIPI)
- FL5: HW-SW co-design, benchmarking, patterns, and microkernels (leader UNICT)
Le attività di ricerca e sviluppo pianificate nelle flagship dello Spoke 1 porteranno alla realizzazione di prototipi e dimostratori delle tecnologie più promettenti, facilitandone l’adozione e lo sviluppo industriale.
In particolare INAF fornirà prototipi e dimostratori di applicazioni astrofisiche (come ad esempio fluidodinamica e simulazione N-body cosmologica, dinamiche dei gas, analisi dati etc.) sulle piattaforme sviluppate dal FL2, impiegando tecnologie innovative per workflow management e strumenti per l’AI e Big Data fornite da FL3, e parteciperà alle attività per il co-design e benchmarking in FL5.
Spoke 2 – Fundamental Research & Space Economy
Nella struttura hub-spoke dell’ICSC, l’INAF co-dirige, con l’INFN come capofila, lo Spoke~2 “Fundamental Research and Space Economy”. Le attività nello spoke sono sviluppate in sei pacchetti di lavoro, tre dedicati alla definizione di casi d’uso e gli altri tre all’implementazione di soluzioni tecniche. Il team INAF in Spoke 2 è deputato alla definizione di casi d’uso prevalentemente basati su tematiche di Fisica Astroparticellare, quali:
- la classificazione delle immagini dai telescopi Cherenkov attraverso tecniche di machine learning;
- l’ottimizzazione dell’analisi di serie temporali per dati interferometrici ottici;
- analisi federata di dati multifrequenza e multimessaggero;
- calcolo parallelo e upscaling di dati ad alto volume da satelliti geodetici e per simulazioni di strumenti ad alta energia su satelliti.
I servizi tecnologici per la ricerca seguono tre gruppi di attività diverse:
- ottimizzazione del codice e porting su architetture ibride;
- containerizzazione per la portabilità e distribuzione del software come servizio;
- adozione e avanzamento tecnologico di framework e tecniche di machine learning.
Queste attività troveranno il loro test e applicazione nei suddetti casi d’uso scientifici che saranno anche adattati e sviluppati congiuntamente con i partner industriali dello spoke 2.
Spoke 10 – Quantum Computing
Il quantum computing è una tecnologia dalle potenzialità enormi in termini di velocità e gestione dei dati. I calcolatori quantistici hanno, infatti, la capacità di risolvere problemi complessi che nessun computer classico potrebbe risolvere in un tempo ragionevole, una potenzialità nota come “supremazia quantistica”.
Tuttavia, nonostante le aspettative siano molto alte, in considerazione dei potenziali campi di applicazione e dei nuovi modelli di business che ne conseguiranno, siamo ancora lontani da una piena maturità tecnologica. Centrale è il superamento di alcune sfide legate all’affidabilità dei componenti e alla complessità di programmazione, sfide che risulta fondamentale risolvere per permettere un utilizzo pratico dei calcolatori quantistici.
Questo è il principale obiettivo dello Spoke 10, che opererà secondo tre linee di ricerca: sviluppo applicativo, interoperabilita’ con calcolatori tradizionali, progettazione di computer quantistici di grandi dimensioni e scalabili. La prima azione, in particolar, consiste nella realizzazione di applicazioni che sfruttino i calcolatori quantistici come acceleratori per risolvere problemi altrimenti insolubili. INAF vi partecipafocalizzandosi sullo sviluppo e applicazione di software quantistico di alto livello per algoritmi che indirizzano sia l’aspetto della modellazione teorica che quello dell’analisi dati.
Last update: 25 September 2023, 11:43