Linee Guida Open Data: ecco cosa prevedono e i risultati della consultazione
Sono arrivati circa 180 commenti alla consultazione pubblica relativa alle Linee Guida sull’apertura dei dati e il riutilizzo dell’informazione del settore pubblico. L’obiettivo delle Linee Guida è fornire a tutte le amministrazioni chiare e necessarie indicazioni per gestire in modo adeguato, dalla loro entrata in vigore in avanti, la pubblicazione di Open Data. Quelle pubblicate costituiscono una prima versione, che sarà aggiornata innanzitutto con le indicazioni emerse dalla consultazione pubblica appena conclusa e poi periodicamente. Ecco i punti principali e i nodi ancora da sciogliere
26 Luglio 2022
Morena Ragone
Giurista, studiosa di diritto di Internet e PA Digitale
Vincenzo Patruno
Istat - Dipartimento per lo sviluppo di metodi e tecnologie per la produzione e diffusione dell'informazione statistica
Si è conclusa il 17 luglio scorso la consultazione pubblica relativa alle “Linee Guida recanti regole tecniche per l’attuazione del decreto legislativo 24 gennaio 2006, n. 36 e s.m.i. relativo all’apertura dei dati e al riutilizzo dell’informazione del settore pubblico”. Dopo un mese esatto dall’avvio della consultazione sono arrivati circa 180 commenti, come illustrato dall’Agenzia per l’Italia Digitale nel webinar di presentazione dei risultati che si è svolto oggi, 26 luglio. Un risultato numericamente importante, riconducibile a commenti di 22 stakeholders di riferimento (soggetti singoli/associazioni/rappresentanti di enti e strutture). Vediamo cosa prevedono le “Linee Guida Open Data” e cosa è emerso dalla consultazione.
Linee Guida Open Data: cosa sono e obiettivi
Le suddette Linee Guida costituiscono il documento di riferimento per tutte quelle amministrazioni e quegli enti che intendono pubblicare dati aperti, nello specifico ambito di applicazione rappresentato dall’attuazione del D. Lgs. n. 200/2021, che costituisce, a sua volta, il recepimento della Direttiva (UE) 2019/1024, comunemente chiamata “Direttiva Open Data” e relativa all’apertura e al riutilizzo dell’informazione del settore pubblico. Quelle pubblicate costituiscono una prima versione, che sarà aggiornata innanzitutto con le indicazioni emerse dalla consultazione pubblica da poco ultimata, e poi periodicamente, in modo da renderle coerenti con le evoluzioni tecniche/normative che, inevitabilmente, ci saranno su alcune tematiche ancora “in progress” (per esempio, l’attesa individuazione degli “high value dataset”, sui quali si scontrano contrapposti interessi).
L’obiettivo delle Linee Guida, come noto, è quello di fornire a tutte le amministrazioni chiare e necessarie indicazioni per gestire in modo adeguato, dalla loro entrata in vigore in avanti, la pubblicazione di Open Data.
Prima di analizzare qualche dato, due precisazioni che riteniamo opportuno fare fin da subito:
- la prima, sul “valore”, all’interno della gerarchia delle fonti, di questa tipologia di Linee Guida adottate da AgID: come ricordato dal Consiglio di Stato nell’ambito del parere reso sullo schema di decreto legislativo del correttivo al CAD, il n. 2122/2017 del 10.10.2017, le Linee Guida adottate da AgID ai sensi dell’art. 71 del CAD hanno carattere vincolante e assumono valenza erga omnes; sono, quindi, inquadrate come un atto di regolamentazione, seppur di natura tecnica, e sono pienamente azionabili davanti al giudice amministrativo in caso di violazione delle prescrizioni ivi contenute (e la loro violazione è segnalabile al Difensore civico e, quindi, passibile di applicazione della procedura prevista dal nuovo articolo 18-bis del CAD);
- la seconda, sullo specifico ambito di applicazione delle presenti Linee Guida, direttamente connesso al suo valore di normazione regolamentare: il documento può chiarire alcuni aspetti presenti nella normativa di rango primario cui si riferisce, ma non può andarvi in contrasto. Questo, anche per evidenziare la diversa direzione di alcuni dei commenti proposti nell’ambito della consultazione pubblica, che si pongono in (legittima) posizione critica rispetto alla norma primaria “a monte”, ma che le Linee Guida non hanno la possibilità di modificare. Su questo specifico punto, torneremo nella riflessione finale.
Va, inoltre, specificato che tutte le indicazioni delle Linee Guida si muovono, come è giusto che sia, in un contesto fortemente europeo: sì è più volte sottolineato come una delle criticità più evidenti degli Open Data sia stata l’assenza di un’unica governance efficace a livello nazionale: questo ha prodotto difformità di applicazione tra le amministrazioni, che sono spesso andate in ordine sparso, pubblicando quello che hanno potuto nei modi in cui hanno potuto, generando una frammentazione dell’offerta di dati, una pressoché assenza di standardizzazione, e compromettendone ‒ o, quantomeno, riducendone ‒ le possibilità di riutilizzo, viste le difficoltà che questa “procedura senza procedura” produce.
Come abbiamo visto, negli ultimi anni si sta alacremente lavorando alla costituzione di un mercato unico dei dati a livello europeo e di una economia basata sui dati, che costituiscono obiettivi primari e assolutamente strategici; va da sé che i dati pubblici costituiscono un pezzo importante di questa economia.
La consultazione pubblica
Come accennavamo nell’incipit, il riscontro alla consultazione pubblica promossa da AgID è stato considerevole, come i grafici che seguono ‒ elaborazioni della stessa AgID presentate il 26 luglio in occasione del webinar di chiusura della consultazione pubblica ‒ evidenziano:
- il primo grafico mostra la suddivisione per tipologia dei commenti arrivati, in maggioranza di carattere generale, ma per circa un terzo di carattere tecnico;
- il secondo grafico, invece, mostra la suddivisione dei commenti per canale di trasmissione, con predominanza della categoria “altro” (nonostante i molteplici canali ufficiali resi disponibili dall’Agenzia).
All’interno delle Linee Guida, in coerenza con lo schema adottato da AgID per tutte queste tipologie di atti, sono previste una serie di indicazioni tassative (“DEVONO, NON DEVONO”) e non, necessarie a pubblicare i dati in modo da potenziarne le opportunità di riutilizzo.
Alcuni miglioramenti al testo, come già anticipato, saranno introdotti direttamente, quindi recepiti, come esito della consultazione: in merito, il terzo grafico, sempre elaborato da AgID, evidenzia anche l’opportunità di ulteriori, futuri approfondimenti, che potrebbero essere effettuati tramite guide operative:
Le tipologie di dati e le questioni aperte
Indubbio il valore di tale documento: fermo restando che, ovviamente, ciascuna amministrazione può pubblicare i dati che ritiene opportuni, le Linee Guida si soffermano su alcune tipologie precise di dati. I dati dinamici, ossia quelli che cambiano continuamente nel tempo, i dati della ricerca, i dati ad alto valore. Per quanto riguarda questi ultimi in particolare, al momento, come sappiamo, sono state definite le categorie tematiche (dati geospaziali, dati relativi all’osservazione della terra e all’ambiente, dati meteorologici, dati statistici, dati relativi alle imprese e alla proprietà delle imprese, dati relativi alla mobilità), ma si è ancora in attesa di conoscere quali dovranno essere, nel dettaglio, le specifiche tipologie di dataset, quando verranno portate a termine le attività, tutt’ora in corso, delle specifiche task force che stanno lavorando su ogni verticale tematico. Sono previste, inoltre, indicazioni anche su come i dati dovranno essere resi fruibili. Di certo, i dati dinamici e i dati ad alto valore dovranno essere fruibili attraverso API: modalità, questa, molto gradita dagli sviluppatori e da chi costruisce servizi a valore aggiunto sui dati, e che ben si collega a tutto il lavoro che, in ambito nazionale, si sta facendo sull’interoperabilità (vedi PDND).
Semantica dei dati: un tema centrale e delicato
Una menzione necessaria sui formati, sui quali è il caso di fare qualche riflessione aggiuntiva: non c’è dubbio che le Linee Guida puntino a far sì che le amministrazioni possano pubblicare dati anche in RDF, con l’obiettivo di standardizzare la metadatazione, da sempre uno degli aspetti più delicati e critici della produzione di dati aperti.
Un aiuto in questo senso viene anche dal recente catalogo nazionale della semantica dei dati, rilasciato lo scorso 30 giugno, progetto realizzato dal Dipartimento della Trasformazione Digitale e Istat. Si tratta di ontologie e vocabolari controllati organizzati per categoria tematica, da utilizzare per modellare i dati. La regola generale dovrà essere, quindi, quella di esaminare ontologie e vocabolari controllati esistenti presenti nel catalogo nazionale (o anche non presenti nel catalogo, ma utilizzati in ambito europeo) prima di andare a definire il modello dati.
Tale scelta è in grado di aumentare non soltanto il grado di interoperabilità dei dati, ma, anche, di poter incrementare la possibilità di automatizzare la loro gestione: non è più pensabile, infatti, vista la complessità e ricchezza dei dati che ogni giorno processiamo, gestire i dati in modo prevalentemente manuale; serve, al contrario, puntare su elevati gradi di automazione, standardizzando e industrializzando i processi di pubblicazione e di riutilizzo dei dati.
Molto interessante e corposo il blocco sulle licenze, con tavole di raffronto che tengono conto sia dell’ipotesi di mashup di dataset, sia dell’ipotesi di “opera” derivata, che, si immagina, potrà essere di concreta e pratica utilità in fase di scelta della licenza da adottare.
Nodi da sciogliere e prossimi passi
Come scrivevamo all’inizio, restano alcuni punti “sospesi”, a causa di alcuni aspetti da affinare, e, soprattutto, di qualche “difficoltà di relazione” tra norme di ambiti affini. Come già precisato nel cappello introduttivo, la funzione delle presenti Linee Guida non ha reso possibile dirimere tali aspetti: pensiamo, soprattutto, alla compatibilità di tutto il macro-tema dei dati aperti con la previsione dell’art. 108, comma 3 del D. Lgs. n. 42/2004 (il Codice del Beni Culturali), e dell’applicazione pratica, nello specifico contesto di riferimento, dei concetti di riproduzione, di divulgazione, di opera libera.
Sono aspetti sui quali, più prima che poi, sarà necessario tornare, per consentire all’intera Strategia sui dati (europea, ma anche italiana) di dispiegare appieno la sua forza dirompente. È una direzione che abbiamo intrapreso con convinzione e che dobbiamo accelerare in modo da renderla pienamente operativa.