Cos’è e a cosa serve il web semantico
Ai suoi esordi Internet era costituito unicamente di testi e indici ipertestuali di testi. Col tempo le cose si sono evolute (database, script, fogli di stile…) e la mole di informazione condivisa è cresciuta senza controllo. Sapersi orientare nel fantastico mondo del web diventa sempre più determinante e l’esperienza, da un lato, e le modalità di compilazione ed archiviazione delle informazioni, dall’altro, sono i due parametri fondamentali per il buon esito o meno di una ricerca.
3 Giugno 2008
Tommaso Del Lungo
Ai suoi esordi Internet era costituito unicamente di testi e indici ipertestuali di testi. Col tempo le cose si sono evolute (database, script, fogli di stile…) e la mole di informazione condivisa è cresciuta senza controllo. Sapersi orientare nel fantastico mondo del web diventa sempre più determinante e l’esperienza, da un lato, e le modalità di compilazione ed archiviazione delle informazioni, dall’altro, sono i due parametri fondamentali per il buon esito o meno di una ricerca.
È in questo contesto che si inserisce un nuovo approccio di concepire la rete come archivio di dati ed informazioni, un nuovo approccio che mira ad analizzare i contenuti di internet in maniera semantica. Ciò vuol dire che ogni informazione pubblicata sul web non viene vista come singolo dato, o come “documento”, bensì come espressione “linguistica” in relazione diretta con la realtà.
In poche parole costruire un sito web seguendo logiche semantiche vuol dire consentire ad alcuni software di interpretare il contenuto di un testo imitando il meccanismo di lettura e comprensione degli esseri umani. Intendiamoci, non si tratta di intelligenza artificiale, ma vuol dire semplicemente programmare le macchine per risolvere un problema ben definito realizzando operazioni ben definite sui dati.
Abbastanza complicato a descriversi, ma piuttosto intuitivo: l’obiettivo del web semantico è rendere il web che conosciamo più funzionale, non solo nelle relazioni tra uomini e macchine, ma anche e soprattutto macchina e macchina.
Questo risultato è possibile solo se, preventivamente, all’atto della creazione del contenuto, ogni informazione viene definita ed etichettata secondo specifiche regole, semantiche appunto.
Ma è possibile scrivere del codice in grado di compiere operazioni semantiche? Un codice è una serie di regole sintattiche, il codice non ha altra capacità che seguire i passi di una regola descritta dal programmatore, tutto dipende dallo schema, dall’insieme di regole che si è deciso di utilizzare per archiviare quelle informazioni. Il modo di organizzare e classificare queste informazioni è definito ontologia.
Affinché funzioni il web semantico deve potersi poggiare su ontologie condivise. Se un sito web utilizza una classificazione semantica non condivisa da nessun altro, le informazione in esso contenuto hanno la stessa possibilità di essere individuate di quelle contenute in un sito web non semantico, quindi non aumenta la propria fruibilità. Al contrario le ontologie devono essere definite dalle comunità di pratica che le utilizzi e le diffonda. Lo scenario ipotizzabile è che ogni comunità possa descrivere una propria ontologia, mettendola in relazione con quelle già esistenti, procedendo in questo modo ad un accrescimento progressivo ed esponenziale che abbracci tutti gli ambiti del sapere e renda veramente la rete una enciclopedia “destrutturata” utilissima e facile da usare.
Ci sono molte tecnologie che devono lavorare insieme per rendere operativo il web semantico e per attuare pienamente le potenzialità del web. Tanto per cominciare il web semantico è parte del web come tale, quindi, si basa sull’HTTP e sugli standard ad esso collegati. Per scendere un minimo nel dettaglio tecnico potremmo aggiungere:
- Lo standard Uri – Uniform Resource Identifiers – papà degli Url o Uniform Resource Locator per la definizione univoca di indirizzi Internet.
- Lo standard Xml – Extensible Markup Language – il linguaggio che porta con sé alcune informazioni sulla semantica degli oggetti
- Lo standard Rdf – Resource Description Framework – adatto a descrivere la struttura di una parte della realtà, definendo agevolmente il tipo e le proprietà degli oggetti (si tratta sempre di un insieme definito di risorse, proprietà e valori). Ogni dichiarazione RDF è composta di tre parti: un soggetto, un predicato ed un oggetto.