Disponibile il catalogo nazionale per la semantica dei dati: oltre 100 risorse per migliorare i servizi digitali
Il Dipartimento per la Trasformazione Digitale e lstat hanno messo a disposizione di PA e imprese il Catalogo nazionale per la semantica dei dati. Questo catalogo supporta la creazione di servizi digitali mediati dalla modellazione dei dati aperti e la realizzazione di schemi di API utili a condividere informazioni tramite la Piattaforma Digitale Nazionale Dati (PDND). Il Catalogo raccoglie ontologie, vocabolari controllati e schemi di API, consentendo il riutilizzo delle risorse semantiche e facilitando lo sviluppo di nuovi sistemi informativi. Il Catalogo favorisce la riduzione dei costi, lo scambio di informazioni e l’integrazione di dati provenienti da fonti diverse, promuovendo l’interoperabilità del dato tra sistemi
11 Gennaio 2024
Istituto Nazionale di Statistica *
Dipartimento per la Trasformazione Digitale **
Offrire servizi sempre più efficienti, facili da usare e utili a soddisfare le necessità dei cittadini: è la missiondi una pubblica amministrazione che guarda al futuro e che, grazie al digitale e alla piena interoperabilità dei sistemi informativi, ridisegna i processi amministrativi per rendere protagoniste le persone e le imprese, oltre che le stesse istituzioni.
L’interoperabilità, ovvero la capacità di sistemi software di interagire in maniera automatica con altri sistemi per scambiare dati e erogare servizi, rende possibile l’attuazione del principio europeo once only: non chiedere al cittadino informazioni di cui le amministrazioni sono già in possesso.
Uno degli aspetti chiave per favorire l’interoperabilità dei sistemi informativi è l’approccio semantico. Questo garantisce che durante lo scambio di dati, il formato e il significato delle informazioni condivise siano preservati e compresi. In altre parole, l’interoperabilità semantica assicura che “ciò che viene inviato è ciò che viene compreso” nel passaggio di dati da macchina a macchina.
Per supportare l’adozione di sistemi interoperabili, il Dipartimento per la trasformazione digitale e l’Istituto Nazionale di Statistica (Istat), avvalendosi anche della collaborazione di esperti di varie discipline come quelli del Consiglio Nazionale delle Ricerche (CNR), dell’Università la Sapienza di Roma e di AgID, hanno messo a disposizione di soggetti pubblici e privati il Catalogo nazionale per la semantica dei dati (di seguito “Catalogo”). Realizzato nell’ambito del Piano Nazionale di Ripresa e Resilienza (PNRR), il Catalogo supporta, grazie alla semantica, la creazione di servizi digitali mediati dalla modellazione dei dati aperti e la realizzazione di schemi di API (interfacce di programmazione delle applicazioni) utili a condividere informazioni tramite la Piattaforma Digitale Nazionale Dati (PDND).
L’importanza della semantica dei dati
L’interoperabilità semantica emerge come uno degli elementi cruciali per affrontare le sfide nel settore pubblico. In un ecosistema in cui le pubbliche amministrazioni si scambiano dati per erogare servizi digitali, è necessario infatti che il significato dei concetti espressi nei diversi procedimenti amministrativi sia condiviso e compreso. Oltre a semplificare gli scambi di informazioni, l’interoperabilità semantica promuove una visione condivisa del capitale informativo delle PPAA e una comprensione su larga scala delle potenzialità dei dati, in un’ottica di collaborazione tra le amministrazioni e di miglioramento complessivo dell’efficienza e dell’efficacia dei servizi pubblici digitali.
Ed è proprio per raggiungere questi obiettivi, facilitando il lavoro degli sviluppatori, che le risorse del Catalogo nazionale per la semantica dei dati vengono messe liberamente a disposizione secondo formati standard, per permetterne il riutilizzo.
Il portale per l’interoperabilità: schema.gov.it
Per supportare la modellazione di dati aperti e favorire lo sviluppo di servizi digitali, il Catalogo raccoglie e promuove il riuso, attraverso il portale schema.gov.it, delle seguenti risorse semantiche, pubblicate degli enti nei propri repository, di cui gli stessi enti sono gli unici titolari:
- ontologie, ovvero la rappresentazione formale, condivisa ed esplicita, di un dominio della conoscenza;
- vocabolari controllati, liste, tassonomie, glossari e tesauri di termini e codici utilizzati per valorizzare concetti, indicizzare e recuperare informazioni;
- schemi di API (elemento di prossima pubblicazione) creati dagli enti per descrivere, riferendosi alle ontologie e ai vocabolari controllati, le interfacce di programmazione delle applicazioni, il cui elenco è fornito dalla PDND.
In particolare, le ontologie sono uno strumento per descrivere i dati sotto forma di concetti e di caratteristiche, oltre che di relazioni reciproche. Ad esempio, possono essere utilizzate per definire il concetto di “persona”, associandole i concetti di “Nome proprio”, “Cognome”, “Data di nascita” e “Luogo di nascita”. L’utilizzo di un’ontologia può migliorare la coerenza dei dati, facilitare la comprensione e l’interpretazione delle informazioni da parte degli attori coinvolti e favorire l’automazione di processi che coinvolgono dati e decisioni complesse.
Un procedimento amministrativo che descriva i suoi dati utilizzando le ontologie potrà quindi essere gestito nel pieno rispetto dell’interoperabilità fra diverse amministrazioni senza necessitare di spiegazioni aggiuntive, generando banche dati condivise e riutilizzabili.
I vocabolari controllati sono un insieme di concetti, dati da termini e definizioni, con un significato specifico e univoco, e consentono di promuovere la chiarezza, la coerenza e l’efficienza nella gestione delle informazioni e dei servizi all’interno della pubblica amministrazione. Da questo punto di vista, il Catalogo può semplificare e uniformare la creazione e la gestione della modulistica online e dei servizi digitali. Ad esempio, un Comune, invece di ridefinire i possibili titoli di studio e la loro sintassi, potrà riusare tramite API i valori del vocabolario controllato dei titoli di studio pubblicato dal Catalogo.
Uno schema dati di API fornisce una descrizione strutturata e standardizzata dei dati che l’API accetta e restituisce. Lo schema svolge un ruolo chiave nella definizione di come i dati devono essere inviati e ricevuti tra un client e un server attraverso l’API. Un’API ben definita con uno schema dati standard facilita l’interoperabilità tra diversi sistemi. Gli sviluppatori di diverse applicazioni possono facilmente comprendere come interagire con l’API e integrarla nei loro progetti.
Tramite un proprio motore interno (harvester), il Catalogo si collega ai repository di risorse semantiche realizzate dagli enti, le indicizza e le pubblica nel proprio database. Inoltre, mette a disposizione degli utenti gli strumenti per navigare, visualizzare e fruire di tutte le risorse individuate, in maniera semplice e intuitiva.
Il riutilizzo di risorse semantiche condivise, siano esse ontologie, vocabolari controllati e schemi di API, ha numerosi vantaggi, soprattutto in termini di riduzione dei costi. Il Catalogo, infatti, facilita lo sviluppo e la definizione degli schemi dati di nuovi sistemi informativi, agevola lo scambio di informazioni, abilita l’integrazione di dati provenienti da fonti diverse, standardizza il dato aperto e consente di supportare più facilmente il principio di portabilità del dato tra diversi sistemi.
Come contribuire al Catalogo
Attualmente all’interno del Catalogo sono presenti oltre 100 risorse semantiche messe a disposizione da diverse amministrazioni, in particolare da quelle che stanno investendo nell’utilizzo di dati aperti e nei servizi digitali da esporre sulla PDND.
Per contribuire alla crescita del Catalogo, è possibile richiedere supporto a Istat per la creazione delle proprie risorse semantiche da pubblicare sul portale schema.gov.it (si veda il caso delle ontologie e dei vocabolari relativi all’Anagrafe nazionale della popolazione residente). In alternativa, l’ente interessato può creare le proprie risorse semantiche in autonomia, rispettando le regole presenti nella documentazione di progetto del Catalogo. La pubblicazione su schema.gov.it attualmente avviene, come accennato, tramite l’harvesting dai repository indicati dallo stesso ente. In particolare, l’ente può:
- individuare autonomamente il proprio repository (a titolo di esempio, è possibile consultare le risorse messe a disposizione da INAIL);
- integrare le proprie risorse semantiche nel repository gestito dal Dipartimento per la trasformazione digitale e AgID (un esempio è l’ontologia dell’istruzione del Ministero dell’Università e della Ricerca).
Maggiori informazioni sono disponibili sul sito del progetto, gli enti interessati possono fare riferimento alle informazioni contenute nella sezione “Esplora il Catalogo” per scoprire come contribuire e come utilizzare l’interoperabilità semantica per realizzare servizi digitali sempre più a misura di cittadino.
Hanno collaborato alla stesura di questo articolo:
*Sara Letardi, Roberta Radini, Roberto Puglisi, Marco Polizzi, Fabrizio Davide
** Claudia Pollina, Matteo Vabanesi, Matteo Fortini