Open data, impatto e qualità: cosa ci aspettiamo dal Regolamento UE sui dati di elevato valore

Home Open Government Open Data Open data, impatto e qualità: cosa ci aspettiamo dal Regolamento UE sui dati di elevato valore

Il 20 gennaio 2023, con la pubblicazione nella GUUE del Regolamento di esecuzione (UE) 2023/138 sono state individuate nel dettaglio le serie di dati di elevato valore, rientranti nelle sei categorie tematiche, che tutte le PA di tutti i Paesi membri dovranno aprire al più tardi entro il 9 giugno 2024. Si completa, così, il quadro normativo europeo sugli open data. Lato Italia, si attendono solo le Linee Guida sui dati aperti di AgID – in corso di adozione – e poi si parte

16 Marzo 2023

Morena Ragone

Giurista, esperta in Diritto delle Tecnologie e PA Digitale

Vincenzo Patruno

Istat - Dipartimento per lo sviluppo di metodi e tecnologie per la produzione e diffusione dell'informazione statistica

Foto di Kristina Tripkovic su Unsplash - https://unsplash.com/it/foto/nwWUBsW6ud4

Indice degli argomenti

1 Open data: cosa intendiamo con “qualità del dato”
- 1.1 La frammentazione del dato
- 1.2 L'assenza di standard di riferimento
2 La Direttiva Open Data e le categorie di dati ad alto valore
3 Il Regolamento UE sui dati di elevato valore
4 Prossimi passi: le Linee Guida sui dati aperti di AgID

Partiamo da una considerazione: gli open data esistono essenzialmente per dare la possibilità a chiunque di riutilizzare i dati pubblici – o resi tali – per generare valore sociale o economico. Non è un caso se continuiamo, in altri articoli e altri contesti, ad utilizzare anche l’espressione “valore pubblico”: le politiche pubbliche hanno il ruolo, delicato e insieme fondamentale, di fungere da fattori abilitanti della creazione di valore, capace di incidere sul territorio di riferimento. Va da sé che quella appena descritta non è una caratteristica esclusiva degli open data, ma, più in generale, di tutto ciò che ricade nel perimetro della “conoscenza aperta”.

Di conseguenza, possiamo estendere la considerazione precedente e affermare che la conoscenza aperta e il riutilizzo di questa conoscenza consente di generare valore sociale ed economico. Come vedremo a breve, non parliamo di assiomi: parliamo di monitoraggio, di prove, e, ancora una volta, di dati. La stessa storia della tecnologia ci dice quale enorme impatto abbia avuto, per esempio, il software open source sulla nascita di nuovi modelli di business e nel modo stesso di scrivere applicazioni e riusare codice.

Non è un caso, quindi, se, venendo da quel mondo e da quella storia, ci siano aspettative elevate sui dati aperti: aspettative che riguardano non soltanto un loro riutilizzo per generare impatto sociale, ma anche e soprattutto, aspettative per un loro riutilizzo in ambito business, con annessi sviluppi di nuove idee, generazione di servizi a valore aggiunto, ottimizzazione e miglioramento dell’efficienza dei processi. In passato abbiamo citato più volte uno studio della Commissione Europea sull’impatto economico degli Open Data (“The economic impact of Open Data”), risalente al 2020, che stima attorno a 200-300 miliardi di euro il valore del mercato europeo dei dati aperti. Nella logica di un’Europa che continua a crescere per migliorare le condizioni di vita di tutti i propri cittadini, quindi, non sorprende che l’Unione Europea punti molto su questo specifico aspetto.

Open data: cosa intendiamo con “qualità del dato”

C’è, però, un problema. I dati aperti, come li abbiamo conosciuti fino ad oggi, hanno evidenziato quanto sia necessario avere dati di qualità affinché questi possano essere veramente riutilizzati generando l’impatto di cui parliamo.

La qualità del dato è un concetto articolato e composito – e, per l’utente, spesso fumoso – di cui vanno valutati numerosi aspetti. Tra tutti questi aspetti, ne prendiamo in considerazione due in particolare, che possono essere visti come le facce di un medesimo problema, che ne ha da sempre limitato le potenzialità e le occasioni di riutilizzo: la frammentazione del dato e l’assenza di standard di riferimento.

La frammentazione del dato

I dati sono frammentati quando, ad esempio, la stessa tipologia di dato viene rilasciata da più amministrazioni diverse: pensiamo al caso in cui una Regione rilascia un determinato dataset e lo fa in modo autonomo e indipendente, in assenza, per esempio, di una politica nazionale/sovranazionale che renda obbligatoria e detti le regole per l’apertura di quello specifico dataset.

Innanzitutto, non è detto che tutte le Regioni facciano altrettanto, per cui non è detto che quel dato/dataset sia disponibile per tutto il territorio nazionale. In secondo luogo, va considerato che la stessa formazione/raccolta del dato e, quindi, la strutturazione di uno specifico dataset, potrebbe essere suddivisa tra le competenze di diversi livelli di governo (nazionale, regionale, locale), amplificando il problema che stiamo evidenziando.

L’assenza di standard di riferimento

Aggiungiamo l’altro aspetto problematico, ossia l’assenza di standard di riferimento per il rilascio dei dati. Se si provasse infatti a integrare i dataset rilasciati da amministrazioni differenti per ricostruire ad esempio un intero dataset nazionale contenente i dati rilasciati da tutte le Regioni, ci si troverebbe di fronte a dati difficilmente integrabili tra loro in quanto non “omogenei”. Tale criticità ha minato alla base (e di molto) le potenzialità di riutilizzo degli open data in questi anni, in particolar modo in ambito business. Dati con queste caratteristiche, infatti, si prestano ad un utilizzo che potremmo definire “locale”. Chi riutilizza il dato, quindi, lo fa utilizzando dati delle amministrazioni di uno specifico territorio di riferimento, con limitate (se non nulle) possibilità di “scalare” a livello nazionale o meglio ancora a livello europeo.

La Direttiva Open Data e le categorie di dati ad alto valore

Un grande supporto ci viene fornito dalla direttiva (UE) 2019/1024, nota come “direttiva Open Data” che ha, tra le altre cose, definito sei categorie di “dati ad alto valore”, individuando e predeterminando, quindi, alcune categorie tematiche di dati che, una volta aperti, massimizzano quell’impatto derivante dal riutilizzo e che, per ciò solo, sono già predefinite ad alto impatto {cfr. artt. 13 e 14, e allegato I della direttiva).

Ed è intuitivo verificarlo: nell’allegato I troviamo dati geospaziali, dati relativi all’osservazione della terra e all’ambiente, dati meteorologici, dati statistici, dati relativi alle imprese e alla proprietà delle imprese, dati relativi alla mobilità.

Alla Commissione, poi, è stato affidato il potere di adottare atti delegati per “modificare l’allegato I aggiungendovi nuove categorie tematiche di serie di dati di elevato valore” (art. 13, comma 2) e “atti di esecuzione che stabiliscono un elenco di specifiche serie di dati di elevato valore appartenenti alle categorie di cui all’allegato I e detenute da enti pubblici e imprese pubbliche”, individuate tra i documenti cui si applica la direttiva (art. 14, comma 1).

Ma la chiave di volta di tutto l’impianto normativo è al successivo comma 2 dell’art. 14: le serie di dati individuate all’interno delle specifiche categorie tematiche, come dati di tipo aperto – in quanto comprese nel perimetro dei “documenti” individuati dalla direttiva – sono disponibili gratuitamente (fatti salvi i paragrafi 3, 4 e 5, alla cui lettura si rimanda), leggibili meccanicamente, fornite mediante API e fornite come bulk download, se del caso.

Il Regolamento UE sui dati di elevato valore

Il Regolamento di esecuzione è puntualmente arrivato: il 20 gennaio 2023, con la pubblicazione nella GUUE del Regolamento di esecuzione (UE) 2023/138 sono state individuate nel dettaglio le serie di dati, rientranti nelle sei categorie tematiche, che tutte le PA di tutti i Paesi membri dovranno aprire al più tardi entro il 9 giugno 2024:

La categoria tematica “dati geospaziali” comprende serie di dati rientranti nell’ambito di applicazione delle categorie tematiche di dati Inspire “Unità amministrative”, “Nomi geografici”, “Indirizzi”, “Edifici” e “Particelle catastali”.
La categoria “dati relativi all’osservazione della terra e all’ambiente” comprende, tra gli altri, l’osservazione della terra, i dati spaziali o di telerilevamento, i dati rilevati a terra o in situ, le serie di dati ambientali e climatici rientranti nell’ambito di applicazione delle categorie tematiche di dati Inspire, le serie di dati più aggiornate e le versioni storiche delle serie di dati disponibili in formato leggibile meccanicamente, ogni tipo di “informazione ambientale”.
La categoria tematica “dati meteorologici” comprende serie di dati riguardanti i dati di osservazione misurati dalle stazioni meteorologiche, osservazioni convalidate (dati climatici), allerte meteorologiche, dati radar e dati dei modelli numerici di previsione meteorologica.
La categoria tematica “dati statistici» comprende serie di dati statistici, ad eccezione dei microdati relativi agli obblighi di comunicazione [tra le principali: flussi turistici, popolazione, fertilità, mortalità, spese ed entrate delle PA, povertà, disuguaglianze, occupazione, disoccupazione, forza lavoro, potenziale].
La categoria tematica “dati relativi alle imprese e alla proprietà delle imprese” comprende serie di dati contenenti le informazioni di base sull’impresa e i documenti e i conti aziendali a livello di singola impresa.
La categoria tematica “dati relativi alla mobilità” comprende serie di dati rientranti nell’ambito di applicazione della categoria tematica di dati Inspire “Reti di trasporto”. Le serie di dati comprendono come attributi chiave il codice di identificazione nazionale, la posizione geografica e i collegamenti con le reti transfrontaliere, se disponibili.

Un “nota bene” per tutti noi: per questi specifici set di dati, è previsto il riutilizzo “alle condizioni della licenza Creative Commons BY 4.0 o di una licenza aperta equivalente o meno restrittiva” e che sia sempre possibile anche il download in blocco, oltre all’accesso via API.

Granularità ed aggiornamento sono differenti a seconda dei set (si rimanda al dettaglio nell’allegato al regolamento); grande attenzione, ancora, è riservata a vocabolari e tassonomie controllati, pubblicamente documentati e riconosciuti dall’Unione o a livello internazionale, il cui utilizzo è sempre previsto se disponibili.

Prossimi passi: le Linee Guida sui dati aperti di AgID

Il primo “tagliando” è previsto già a due anni dall’entrata in vigore, quindi ad appena 8 mesi dall’effettiva applicazione della disciplina, con una dettagliata relazione contenente, tra l’altro, le specifiche dei set di dati rientranti in ciascuna categoria, il collegamento permanente alle condizioni di licenza e alle API (per ciascun set di dati), i documenti di orientamento su pubblicazione e riutilizzo di ciascuno stato membro, il numero degli enti pubblici eventualmente esentati.

Direttiva e regolamento, quindi, hanno immaginato, prima, e individuato con precisione, poi, quali dati aprire, costruendo un solido framework normativo di riferimento per il loro rilascio a livello di ogni singolo Paese membro, spingendo proprio l’idea di passare dal “locale” al “globale”, con dataset accessibili via API o bulk download rilasciati allo stesso modo [quindi standardizzati] da tutti i Paesi dell’Unione.

In tal modo, si consente al mercato di consolidare modelli di business su scala nazionale ed europea basati sul riutilizzo dei dati pubblici aperti, aumentando esponenzialmente le potenzialità e il conseguente impatto di tali dati.

In una parola: il loro valore.

Ancora: producendo ricchezza, per tutti.

Si completa, quindi, il quadro normativo europeo sugli open data. Lato Italia, si attendono solo le Linee Guida sui dati aperti di AgID – in corso di adozione – e poi si parte.

Per davvero.

ICity Club

Completato il catalogo sui Saperi di base FP-CGIL

Un punto di osservazione sui partner di FPA

FORUM PA Città 2025