Ricerca semantica e IA, da oggi accedere a dati di qualità e certificati è più semplice: è nato il nuovo sito Istat.it

Home PA Digitale Ricerca semantica e IA, da oggi accedere a dati di qualità e certificati è più semplice: è nato il nuovo sito Istat.it

Nasce il nuovo sito istituzionale dell’Istat che rilancia sull’informazione statistica di qualità, con notizie, servizi e ricerche aggiornate in tempo reale. Rilasciato in occasione della XV Conferenza Nazionale di Statistica, ha una navigazione più intuitiva e user friendly, permette di consultare dati, analisi e documenti certificati con la massima trasparenza. Cuore del sito istat.it l’ultima versione del motore di ricerca Elasticsearch, che fornisce all’utente non solo opportunità di effettuare ricerche libere, ma anche quelle guidate, evolute e semantiche. Esso si basa su una architettura open source che consente di gestire grandi quantità di dati, rendendo la ricerca veloce e scalabile, grazie a modelli AI e di machine learning. In una società contemporanea sempre più data driven, Istat si proietta verso il centenario dalla sua nascita nel 2026, accrescendo il proprio ruolo di produttore dell’informazione statistica ufficiale

3 Ottobre 2024

S

Manlio Serreti

Giornalista

Foto di Raphael Schaller su Unsplash - https://unsplash.com/it/foto/foto-ravvicinata-di-decori-ritagliati-GkinCd2enIY

È nato da un virtuoso lavoro di squadra il nuovo sito dell’Istat, presentato nel luglio scorso in occasione della XV Conferenza Nazionale di Statistica. Migliore comunicazione e sviluppo tecnologico sono stati i principi guida del rinnovamento del portale web. In vista del centenario nel 2026, Istat ha voluto aprire ancora di più all’utenza le proprie ricerche, offrendo una vetrina di accesso ai dati più facile, precisa e flessibile. “L’obiettivo principale sotto il profilo della comunicazione e della diffusione è stato quello di mettere sempre più al centro gli utenti dell’informazione statistica – ha dichiarato Serenella Ravioli, Direttore Centrale per la Comunicazione Informazione e Servizi ai cittadini e agli utenti dell’Istat –. In tale ottica, il nuovo sito presenta una homepage più pulita, menù più semplici, dati strutturati e maggiormente accessibili, in linea con gli standard AgID, pronto ad evolversi con moduli di intelligenza artificiale”.

Come nasce il progetto del nuovo sito Istat

Se il sito istituzionale rappresenta il biglietto da visita di un ente, nel caso di Istat esprime la missione di rilancio tecnologico e comunicativo. “Ci siamo resi conto che era necessario fare qualcosa in più per far raggiungere i nostri dati e le nostre informazioni. Nel 2026 celebreremo il nostro centenario dalla nascita L’Istat fornisce dati di qualità da sempre; oggi – tuttavia è importante fornirli in maniera semplice e di immediata fruibilità– ha sottolineato Massimo Fedeli, Capo Dipartimento Sviluppo di Metodi e Tecnologie per la Produzione e Diffusione dell’Informazione Statistica dell’Istat”. La realizzazione del nuovo sito è stata il coronamento di un complesso lavoro di squadra fra management, comunicatori, redattori web, informatici ed esperti tematici. Si sono svolti molti incontri in cui i colleghi tecnici, i colleghi tematici, hanno dato un grande contributo – ha aggiunto Massimo Fedeli –. Questo è servito a far sì che tutte le istanze intercettate nei vari ambiti (sociale, economico, territorio) venissero accolte e venissero sintetizzate all’interno della soluzione realizzata, sempre mettendo al centro i nostri interlocutori. Il percorso di rinnovamento nella diffusione è partito lo scorso anno, quando sempre con l’attenzione rivolta agli utenti, abbiamo pubblicato IstatData la piattaforma di diffusione. Ora con il nuovo sito facciamo un secondo step”.

Un risultato ottenuto grazie anche alla sinergia di tante competenze e professionalità eterogenee: “Il mio lavoro, con gli altri direttori, è stato sostanzialmente quello di tradurre in linguaggio informatico le istanze che venivano dalla produzione statistica e dalla Direzione Generale – ha sottolineato Cecilia Colasanti, Direttore Centrale per le Tecnologie Informatiche dell’Istat –. Un lavoro per certi aspetti faticoso, come spesso lo è quello di integrazione tra diversi punti di vista. Dapprima abbiamo trovato un comune denominatore a esigenze apparentemente diverse, quindi abbiamo realizzato soluzioni tecniche adeguate. Le aspettative di tutti erano tarate nel modo corretto – ha aggiunto Colasanti –, e questo è stato un fattore chiave di successo”.

Caratteristiche e novità del nuovo sito istat.it

Il sito conserva la ricchezza informativa del precedente, ma con contenuti e funzionalità fortemente evolute. Atterrati sulla home page www.istat.it, con un solo click si accede alle sezioni principali, alle notizie, all’agenda degli eventi in programma, alle aree focus e a tante altre informazioni. Da ogni pagina, poi, si possono raggiungere contenuti multimediali e condividerli sulle principali piattaforme social. Diverse le novità introdotte: “Il sito è responsive, per un’accessibilità pienamente supportata; è sviluppato su piattaforma open source. Massimizza l’esperienza di navigazione, garantendo la piena usabilità, grazie all’introduzione e allo sviluppo di alcuni elementi di forte innovazione – ha evidenziato Serenella Ravioli. A livello operativo, spiccano le funzioni di ricerca evoluta e di ricerca semantica. La prima sfrutta l’utilizzo di query complesse e algoritmi di classificazione avanzati per recuperare e presentare informazioni in modo più rilevante ed accurato. Il concetto di ricerca semantica utilizza invece tecniche di elaborazione del linguaggio naturale (NLP), che mettono in relazione i termini di ricerca, il contesto e il significato dei termini stessi, restituendo risultati semanticamente rilevanti.

La ricerca guidata permette inoltre all’utente una navigazione sia per tipologie di risultati (audizioni, classificazioni, comunicati stampa), sia per temi (agricoltura, ambiente, commercio, estero e tutti i temi della statistica ufficiale) o per territorio. Il motore di ricerca è stato ulteriormente raffinato per categorie di utenti, con sezioni dedicate a giornalisti, corrispondenti, ricercatori, studenti, docenti e per enti Sistan. Il sito è stato anche migliorato graficamente: “Il Dipartimento, insieme alla Presidenza, hanno pensato ad un restyling con una parte grafica moderna, che fa riferimento un po’ alle impostazioni editoriali dei giornali” – ha sottolineato Fedeli.

Il nuovo istat.it opera in sinergia con i social media per raggiungere un pubblico più ampio e diversificato: “Il sito funge da hub centrale da cui approfondire i dati e le analisi presentati su altre piattaforme: in tal senso – ha aggiunto Serenella Ravioli – gioca un ruolo cruciale nel consolidare l’identità della produzione statistica ufficiale dell’Istituto, fondamentale per garantire la riconoscibilità dei dati prodotti dall’Istat”. Sempre con l’attenzione rivolta agli utenti, nel nuovo sito è anche possibile inviare feedback e suggerimenti, utilizzando il form presente in fondo ad ogni pagina.

La tecnologia alla base del nuovo motore di ricerca

Vero e proprio cuore pulsante del nuovo portale Istat è il motore di ricerca: “La scelta si è rivelata efficiente per diverse ragioni. La prima è di tipo organizzativo, dal punto di vista della capitalizzazione del know-how interno, essendo il motore già presente nel precedente sito, sebbene in una versione meno raffinata. Si è evitato così di dover acquisire ex novo tutte le conoscenze sulla configurazione – ha proseguito Colasanti, che ha evidenziato anche i diversi vantaggi strettamente tecnici. Ha il crawling integrato e l’indicizzazione automatizzata, ovvero fornisce strumenti predefiniti per lo scanning dei siti web, facilitando recupero e indicizzazione dei dati. È inoltre rinomato per la sua ricerca full text con performance molto elevate in termini di velocità, potendo cercare tra miliardi di documenti con rapidità e fornendo risultati accurati più o meno su qualsiasi domanda venga fatta. Inoltre, è flessibile nelle trasformazioni e nei filtri”. La piattaforma open source è Elasticsearch, nella sua ultima versione 8.12.2.

Semplice anche personalizzare il ranking dei risultati: il motore consente di regolare facilmente il modo in cui i risultati vengono classificati, dando una priorità a contenuti specifici. Inoltre, si tratta di un motore scalabile, ovvero progettato per gestire un numero di dataset in crescita mantenendo le prestazioni ottimizzate; consente anche analisi avanzate, con suggerimenti e query migliorate, a tutto vantaggio della “user experience”. Il machine learning è una componente fondamentale ed è basata su un motore di open source su cui si basa la piattaforma. In definitiva, tanti i vantaggi dalla “ricerca ibrida” (semantica e full text), a cominciare da una precisione migliorata, con risultati più mirati e pertinenti, per un’esperienza davvero user-friendly dei propri fruitori, dai ricercatori professionisti ai semplici cittadini che cercano informazioni ufficiali aggiornate.

Prospettive di sviluppo con l’intelligenza artificiale

“Per quanto riguarda i prossimi passi, potenzieremo la capacità di ricerca delle informazioni e lavoreremo sulle soluzioni di intelligenza artificiale per la navigazione dei dati – ha sottolineato Massimo Fedeli –. Precisiamo che l’uso dell’IA sarà comunque vincolato ai nostri dati e che non saranno integrati da fonti provenienti da siti esterni a quello istituzionale. Poiché l’obiettivo è quello fornire un’informazione certificata dall’Istituto, di qualità, il “prompting” riguarderà quindi solo i nostri dati. Poi, all’esterno – ha proseguito Fedeli – i nostri interlocutori avranno accesso anche a dati aggregati in forma tabellare e potranno fare delle aggregazioni esterne. L’importante è che la fonte da cui partono queste integrazioni sia ufficiale e certificata”.

L’utilizzo del motore è una soluzione best in class nella ricerca semantica che consente di traguardare nuovi progetti di ricerca su larga scala: “ha funzionalità che possono essere estese per includere ancor di più la ricerca semantica e la generative AI. La personalizzazione del motore è un processo di continuo miglioramento, processo che, anche in linea con le indicazioni fornite dal Capo Dipartimento e dal top management, abbiamo seguito durante lo sviluppo del sito. Ma questo miglioramento continuo – ha concluso Cecilia Colasanti –, è qualcosa con cui fare i conti: tutto è sempre perfettibile e ciò è davvero bello e sfidante”. 

Valuta la qualità di questo articolo

La tua opinione è importante per noi!

Su questo argomento

La salute è data-driven: il ruolo dell’IA per percorsi di cura personalizzati