Data governance in emergenza: l’esempio di Cineca e del super-computer
Cineca ospita Marconi100, al 9° posto nella lista dei supercomputer più potenti al mondo, in grado di svolgere 32 milioni di miliardi di calcoli al secondo. Dal 2021 Marconi100 sarà affiancato dal supercomputer europeo Leonardo, raggiungendo i 200 milioni di miliardi di calcoli al secondo
30 Luglio 2020
David Vannozzi
Direttore generale, Cineca
Governare i dati oggi significa dare risposte rapide a eventi imprevisti, e operare in contesti in rapida evoluzione potendo sempre mettere in campo competenze e risorse di eccellenza. Raccogliere, analizzare i dati e i Big Data, creare modelli, scoprire associazioni, fare previsioni sono elementi essenziali della governance dei dati. Siamo di fronte a un nuovo paradigma figlio delle nuove tecnologie: vale per la ricerca scientifica, e per i processi industriali, per le vendite, per la sanità, per le imprese, per la pubblica amministrazione.
In particolar modo durante la pandemia la capacità di gestire grandi moli di dati è stata cruciale per Cineca. In particolare sono due i fronti su cui abbiamo operato: da un lato la ricerca scientifica, con il supercalcolo e l’intelligenza artificiale; dall’altro il supporto alle attività degli uffici amministrativi del sistema accademico nazionale, e della didattica, grazie ai servizi erogati in modalità Cloud.
Cineca è un consorzio interuniversitario partecipato da tutte le università pubbliche italiane (69) e 21 istituzioni pubbliche nazionali, oltre ai 2 Ministeri a cui fanno capo il Sistema dell’Istruzione e il Sistema Accademico Nazionale: il Ministero dell’Istruzione e il Ministero dell’Università e Ricerca. Fondato nel 1969, già nel Cineca 1970 si occupava di supercomputing, e Bologna era la sede del primo supercomputer italiano. Negli anni ‘80 inizia l’erogazione dei servizi per il Ministero dell’Università e Ricerca e negli anni ‘90, con l’autonomia delle università, prendono il via le attività di supporto agli atenei, alla sanità, alla PA e all’industria. Oggi Cineca è proiettato nel futuro con tecnologie di frontiera: sede dei maggiori sistemi di calcolo della comunità scientifica italiana e della Comunità Europea.
Dall’inizio anno Cineca ospita Marconi100, al 9° posto nella lista dei supercomputer più potenti al mondo, in grado di svolgere 32 milioni di miliardi di calcoli al secondo. Dal 2021 Marconi100 sarà affiancato dal supercomputer europeo che si chiamerà LEONARDO, che consentirà di raggiungere una potenza di 200 milioni di miliardi di calcoli al secondo. Sarà ospitato nel Tecnopolo di Bologna e comporterà un investimento (della Comunità Europea e del Ministero dell’Istruzione) pari a 240 milioni di euro. LEONARDO si posizionerà probabilmente tra i primi 5 sistemi più potenti al mondo, dopo gli Stati Uniti e la Cina.
Cineca è anche un datacenter a supporto del sistema universitario nazionale: con più di 2000 macchine virtuali a disposizione della comunità accademica, 318.000 processori, 2 data center (Bologna e Roma), siamo Cloud Service Provider ed abbiamo servizi qualificati per l’erogazione di servizi alla Pubblica Amministrazione.
Supercalcolo vs coronavirus
L’esperienza di Cineca nella gestione di grandi moli di dati, abbinata alla disponibilità di risorse di calcolo all’avanguardia e alla capacità di creare sinergie con l’industria e con altri enti di ricerca, a livello nazionale e internazionale, si è dimostrata fondamentale durante la pandemia. Fin dalle prime fasi dell’emergenza, infatti, il Consorzio è stato in grado di rispondere alla richiesta della Commissione Europea di utilizzare il supercalcolo per accelerare la ricerca di farmaci e vaccini in grado di contrastare il virus. La sfida era abbinare la potenza di calcolo alle competenze in ambito bioinformatico per replicare virtualmente la struttura del virus e simularne il comportamento in abbinamento alle molecole farmaceutiche, nell’ambito del progetto Exscalate4CoV, guidato da Dompè farmaceutici, con 18 partner europei, pubblici e privati.
Senza i supercomputer sarebbero stati necessari diversi mesi per procedere allo screening di una biblioteca chimica di oltre 500 miliardi di molecole, invece, grazie alla capacità di elaborare 3 milioni di molecole al secondo, in poche settimane è stato possibile restringere la ricerca a una cinquantina di molecole. Successivamente, grazie alla sperimentazione in vitro, è stato possibile individuare un farmaco, potenzialmente in grado di rallentare il virus. In attesa dell’autorizzazione per la sperimentazione clinica, attualmente altre molecole sono in fase di test.
Governare i dati, in questo caso, è stato possibile grazie alla capacità di reagire rapidamente, alla disponibilità di risorse molto potenti per l’elaborazione dei dati, e alla capacità di creare sinergie a livello multidisciplinare e internazionale. Disporre di una biblioteca chimica di 500 miliardi di molecole, o della struttura virtuale del virus sarebbe stato poco utile se non ci fosse stata la capacità di utilizzare le nuove tecnologie per studiarne l’interazione, e la capacità di farlo “in tempo reale”, rispondendo immediatamente alla richiesta.
Servizi in cloud per il Sistema Accademico Nazionale
Il secondo fronte che ha visto Cineca impegnato durante l’emergenza è quello del supporto agli atenei.
Cineca ha dimostrato la sua vera natura di ente in house per i propri consorziati e non un semplice “fornitore”, accompagnando, con i propri servizi, il passaggio del personale degli atenei a un regime di lavoro in modalità smart. Di fondamentale importanza sono state alcune caratteristiche peculiari di Cineca: la profonda conoscenza del contesto accademico; il rapporto di stretta collaborazione tra i tecnici e gli utenti dei servizi, da sempre fiore all’occhiello del Consorzio; la scelta di progettare un data center in cloud, scalabile; la competenza dei tecnici, abbinata alla flessibilità e alla rapidità nella ricerca e nell’implementazione di nuove soluzioni.
Questi elementi hanno consentito a oltre 100.000 utenti degli uffici amministrativi degli atenei di accedere ai servizi erogati in cloud da Cineca, tra i quali i sistemi per la gestione delle carriere e degli stipendi, la contabilità, la gestione della ricerca… Inoltre, più di 1.200.000 studenti e 34.000 docenti hanno avuto accesso ai sistemi per la gestione della didattica e delle segreterie studenti, continuando quindi a organizzare e seguire le lezioni, iscriversi agli esami, gestire le verbalizzazioni degli esami stessi anche da casa.
Per ottenere questi risultati, anche in questo caso, il lavoro ha preso il via fin dalle prime fasi dell’emergenza: Cineca ha potenziato i propri sistemi IT, ha rafforzato lo staff di supporto agli utenti, dopo aver messo in campo tutte le precauzioni necessarie per consentire agli operatori di lavorare in sicurezza (sia in telelavoro, sia, nei casi in cui si è reso necessario, nelle rispettive sedi). In alcuni casi Cineca ha sostenuto direttamente gli atenei nel passaggio allo smart working, sia supportando la preparazione delle postazioni di lavoro, sia automatizzando le procedure di accesso ai servizi per accedere in sicurezza agli applicativi in cloud.
L’emergenza ha avuto un impatto diretto anche sui servizi, per esempio sul sistema di gestione delle risorse umane, in cui si sono dovute adeguare le procedure alle nuove disposizioni del Decreto “Cura Italia”, o ancora rispetto alle modalità di erogazione della didattica. Per garantire il passaggio da una didattica in presenza a una didattica completamente online, infatti, oltre a provvedere all’integrazione dei sistemi degli atenei con i diversi strumenti di videoconferenza, Cineca ha mantenuto l’operatività di tutte le piattaforme gestite, pur sottoposte a picchi di carico mai pianificati. Si è passati da una situazione che vedeva qualche studente collegato giornalmente a varie centinaia, costantemente. Per portare un paio di esempi, in merito alle lezioni video erogate giornalmente nei primi giorni di marzo siamo passati da 304 a 10.229, da 1.882 a 29.782. Il tasso di produzione video docente durante le fasi cruciali della pandemia in quattro giorni avrebbe esaurito lo spazio disco pianificato per la crescita per l’intero 2020. La scelta del Consorzio di adottare soluzioni distribuite e virtualizzate ha consentito, nella difficoltà di tempi ristrettissimi, di potenziare rapidamente i server dedicati e di quadruplicarne le capacità .
Che cosa ci ha insegnato questa emergenza
L’emergenza Covid-19 ci ha detto che dobbiamo rivedere e riformulare il concetto stesso di “emergenza”. Perché l’emergenza è una condizione quasi connaturata al lavoro stesso di ricerca. Di che cosa si nutre la scienza, che cosa anima i ricercatori se non il desiderio di affrontare e superare i problemi e le sfide inattese che vengono dalla realtà quotidiana? Cineca ha costruito nel tempo una potenza di calcolo ragguardevole che ci colloca oggi tra i primi dieci al mondo. Disponiamo quindi di una tale capacità di gestione dei Big Data da poter pensare di correre insieme alla realtà e non doverla solo rincorrere.
Pensiamo alle risposte trovate alla pandemia e ai mutamenti introdotti in pochi giorni nella nostra vita: la ricerca scientifica ha potuto mettere a fuoco in pochi giorni le molecole in grado di contrastare il coronavirus; le attività degli atenei, e di didattica sono proseguite dopo pochi giorni di interruzione grazie anche al contributo di Cineca. Possiamo dire che l’Italia ha mostrato di avere le risorse, i saperi e i mezzi per fronteggiare le sfide più temibili.