Ispra, il monitoraggio ambientale è in linked open data
Per rendere fruibili le consultazioni e le possibilità di download è stato creato il portale dati.isprambiente.it, che sarà nei prossimi mesi integrato con altri dataset anche cartografici
8 Aprile 2016
Marco Pennacchi e Elio Giulianelli, DIR-INF, ISPRA
Nel corso del 2015 l’Istituto Superiore per la Protezione e la Ricerca Ambientale (Ispra) ha avviato e realizzato in collaborazione con Regesta il progetto pilota “Linked ISPRA” che prevede la trasformazione di 4 dataset ambientali in Linked Open Data.
I dataset scelti per la pubblicazione in formato LOD riguardano i dati in “tempo reale” raccolti dalle reti di monitoraggio ISPRA relativi alle altezze di marea, di onda con associati dati meteorologici, quelli del consumo del suolo e infine i dati inerenti gli interventi pubblici per la difesa del suolo.
Per rendere fruibili le consultazioni e le possibilità di download è stato creato il portale dati.isprambiente.it (con SPARQL endpoint disponibile), che sarà nei prossimi mesi integrato con altri dataset anche cartografici.
Particolare rilievo assumono le informazioni contenute nella voce “Ontologie e Thesauri” fondamentali per la definizione della infrastruttura dei Linked Open Data ISPRA secondo gli standard indicati dal World Wide Web Consortium (W3C).
In particolare, per la descrizione del patrimonio informativo dell’Ispra, oltre ad ontologie internazionali standard ampiamente riusate, è stata creata una ontologia di dominio che ha l’obiettivo di fornire tutti gli strumenti per comprendere al meglio i dati grezzi e le loro interconnessioni e che sarà integrata e aggiornata con i concetti espressi dai nuovi dataset pubblicati nel corso del tempo.
Nel portale ogni dataset reso disponibile ha una pagina dedicata che ne spiega i dettagli e fornisce delle query sparql di esempio per interrogarlo.
Gli spunti per eventuali approfondimenti sulla tipologia e la pubblicazione dei dataset sopra descritti, sono numerosi e crediamo davvero interessanti. Riteniamo opportuno documentare con qualche esempio il contenuto dei dataset pubblicati:
1. Dataset dei luoghi: comuni / province / regioni d’Italia + shape dei comuni + link ai lod di istat + link a geoname/dbpedia/etc E’ nato come un dataset di corredo alla pubblicazione, potrebbe però risultare molto utile se si parte dal principio di implementare una porzione di LOD cloud italiana. Qui un esempio. E’ stato inoltre effettuato un mutuo collegamento con i dati LOD di ISTAT nell’ottica di poter creare dei percorsi di analisi incrociando dati di natura ambientale ISPRA con dati del censimento ISTAT (es. indicatori di consumo del suolo vs popolazione residente).
2. Dataset delle Reti Ondametrica/Mareografica Nazionali (RON/RMN) : sulle relative stazioni ISPRA (boe/mareografi) sono posizionate varie tipologie di sensori che producono in tempo reale dati il cui flusso finale è scaricabile nel formato csv mentre le metadatazione, la descrizione dei contenuti e un’estrazione degli indicatori più interessanti è in RDF. Qui due esempi: Catania e Crotone.
3. Dataset del Consumo del suolo: per ogni area geografica (su base comunale/provinciale/regionale) sono mostrati i relativi indicatori storicizzati (descritti nel relativo vocabolario in formato SKOS). Qui un esempio.
4. Dataset degli Interventi per la difesa del suolo: il monitoraggio degli interventi del Repertorio Nazionale degli interventi per la Difesa del Suolo (ReNDiS) con aggiornamento giornaliero (con relativo vocabolario per la classificazione dei dissesti e delle opere in formato SKOS), qui un esempio.
Particolare rilievo hanno le informazioni di tutti i dataset descritti in DCAT (vocabolario per facilitare l’interoperabilità tra i cataloghi dei dati pubblicati nel Web).
Infine, per lo sviluppo del portale dati.isprambiente.it sono state utilizzate tutte componenti open source (tra cui Virtuoso come triplestore, Lodview e LodLive) mentre per quanto riguarda le modalità di navigazione dati è stato utilizzato byg.portal, una personalizzazione di Lodview.