Giuseppe Jurman (Fondazione Bruno Kessler): “Intelligenza umana e artificiale vero motore della nuova medicina”
Siamo solo agli albori nell’utilizzo dei dati sintetici, che sono prodotti da specifici algoritmi di intelligenza artificiale generativa. Nonostante ciò, essi rivestono un’importanza fondamentale nel settore sanitario, in quanto non sono soggetti a limitazioni sulla privacy e, soprattutto, consentono di ovviare al problema della scarsità dei dati clinici. Inoltre, favoriscono una sinergia tra ricerca e pratica clinica al fine di massimizzare gli effetti positivi nell’adozione di strumenti innovativi e migliorare la cura dei pazienti. Ne abbiamo parlato con Giuseppe Jurman, Responsabile in Fondazione Bruno Kessler dell’unita Data Science for Health, da noi intervistato in vista del prossimo FORUM Sanità
21 Settembre 2023
Patrizia Fortunato
Consultant Content Editor, FPA
I dati creati da particolari algoritmi di intelligenza artificiale generativa (un esempio è ChatGPT, ossia tutte quelle procedure che riescono a generare immagini, suoni, a partire anche da descrizioni letterarie) sono definiti dati sintetici. Non appartengono a nessun paziente e possono riguardare qualsiasi aspetto della diagnostica o prognostica: esami di laboratorio, immagini fornite da TAC o PET, dati di genetica, dati di sequenziamento del genoma.
Quanto può essere fondamentale il loro uso in medicina? Lo abbiamo chiesto a Giuseppe Jurman, Responsabile in Fondazione Bruno Kessler dell’unita Data Science for Health, intervistato in vista del prossimo FORUM Sanità 2023 e della sua partecipazione come relatore allo scenario “Health Data & FSE”.
L’importanza dei dati sintetici nel settore sanitario
“Ci sono due aspetti di cui tener conto: il primo è quello della scarsità dei dati; il secondo è legato alla privacy”, afferma Giuseppe Jurman.
La frammentazione dei dati disponibili per molte patologie dovuta alle dimensioni ridotte di un determinato ospedale, alla rarità della malattia o al costo elevato nel produrre tali dati, determinano quella che viene definita la data poverty in healthcare.
“L’utilizzo di dati sintetici – dichiara Giuseppe Jurman – può aiutare ad aumentare la quantità di dati disponibili per consentire a un dispositivo di apprendere e migliorare le sue capacità predittive, prognostiche o diagnostiche rispetto a uno specifico task clinico in studio”.
Nell’accezione statistica, trarre conclusioni solide dalla valutazione di campioni troppo piccoli comporta dei rischi (alla base della teoria della probabilità c’è proprio il principio della “variabilità di campionamento”). Allo stesso modo la scarsità di dati condiziona le performance dei modelli di Machine Learning.
I dati sintetici preservano la privacy. “Non essendo legati a nessun paziente reale, non sono soggetti a limitazioni d’uso derivanti dal GDPR, né hanno bisogno di comitati etici, permessi o autorizzazioni da parte del paziente”, come afferma Jurman. Sono dati utilizzati dalla pura ricerca. Non comportano dunque implicazioni etiche, piuttosto espongono dei caveat clinici, degli avvertimenti del pericolo per indurre chi non ne è consapevole a tener conto del relativo rischio e a riconoscerne l’affidabilità.
I problemi e le sfide legate all’utilizzo dei dati sintetici in sanità
Siamo all’alba del loro utilizzo, si stanno ancora comprendendo le loro potenzialità. Ci sono numerosi aspetti delicati legati ai dati sintetici, nel senso che il dato sintetico è valido se è realistico. “Il principale problema nell’usare i dati sintetici in sanità – dichiara Jurman – è garantire che l’algoritmo utilizzato abbia prodotto un dato che sia realisticamente appartenente alla distribuzione del dato reale che stiamo studiando. La funzionalità del dato viene a cadere se questo non può appartenere a un vero paziente, semplicemente perché le motivazioni biologiche impediscono che quel dato sia generato in quella maniera”.
Questo è l’ostacolo più grosso con cui si confronta la ricerca, e questo vale per ogni tipo di dato. Giuseppe Jurman fa notare che ci sono tipi di dati che sono più facili da creare: “i primi dati che siano mai stati riprodotti, dal punto di vista sintetico, sono i dati di bioimmagini, come i dati di risonanze magnetiche, biopsie in anatomia patologica, e questo perché le immagini sono in qualche modo più controllabili durante la generazione; è molto più difficile, invece, generare dati clinici, soprattutto longitudinali, che descrivono la traiettoria di salute di un paziente nel corso degli anni. Se si prende un paziente e lo si monitora nel corso del tempo, continuando a sottoporlo a esami clinici, replicare in modo affidabile e realistico questo tipo di dati diventa molto più difficile”. Questa è una delle sfide aperte che la ricerca affronta.
Favorire l’adozione di soluzioni innovative nel campo sanitario: il ruolo chiave della Fondazione Bruno Kessler
La consapevolezza che dalla ricerca si deve passare alla fase di impatto, di ricaduta nella pratica clinica, deve sempre guidare qualunque tipo di attività in questo settore. Questo è uno dei principi a cui si ispira la Fondazione Bruno Kessler, che ha al proprio interno il Digital Health and Wellbeing Centre, un centro basato su due pilastri fondamentali che sostengono le diverse attività: la ricerca di eccellenza da un lato e l’impatto sul sistema sanitario dall’altro.
Nel momento in cui si avvia un progetto di ricerca con il clinico, è importante considerare che “il clinico desidera poterne vedere gli effetti a livello di pratica clinica in un tempo ragionevole e con un livello di affidabilità adeguato”, sostiene Jurman.
Quindi quando la Fondazione Bruno Kessler avvia progetti con le unità sanitarie, sia locali sia nazionali, si pone sempre il problema di ottenere un ottimo risultato dal punto di vista della ricerca, ma anche di muoversi rapidamente in direzione della certificazione, della validazione, dell’implementazione della medicina traslazionale, ovvero di portare questo prodotto dal laboratorio alla pratica clinica. In questo, la Fondazione ha bisogno della guida del clinico e dell’aiuto di specifiche linee guida per la certificazione dell’algoritmo di ricerca verso il prodotto clinico.
“È noto in letteratura – dichiara Jurman – che i risultati di performance che si raggiungono in ricerca difficilmente vengono replicati allo stesso livello nella pratica clinica a causa di numerosi problemi legati ai dati, all’implementazione e al fatto che il dato su cui hai addestrato la tua macchina non corrisponde esattamente a quello con cui ci si confronta nella pratica quotidiana. I dati nella pratica sono più impuri, meno puliti”.
“Se si sta studiando una malattia di cui si sa pochissimo, qualsiasi strumento si possa utilizzare nella ricerca è ben accetto; solo in seguito – continua Jurman – ci occuperemo dell’implementazione. Cerchiamo di capire, prima di tutto, i meccanismi biologici con cui abbiamo a che fare, mentre in tante attività, più propriamente di routine, l’intelligenza artificiale deve servire da supporto al lavoro quotidiano. In questi casi, l’impatto diventa forse più importante e quindi è necessario avere uno strumento certificato e validato in tempi ragionevoli, che abbia delle buone performance”.
Clinico e ricerca: un connubio essenziale
La ricerca è sempre stata collaborativa e lo è ancor di più quando si inizia a introdurre strumenti innovativi anche per il clinico e “non è detto che il clinico sia sempre incline ad accettarli”, fa notare Jurman.
“Veniamo da due mondi diversi e con linguaggi diversi. La nuova rivoluzione imposta dall’intelligenza artificiale e dalla Data Science impone un riavvicinamento – afferma Jurman. La professione del medico sta cambiando e devono essere introdotti elementi che aiutino il medico a capire nel miglior modo possibile cosa si stia utilizzando e come questo possa essere integrato nel suo lavoro. Dal nostro punto di vista, come data scientist, è fondamentale dotarsi delle competenze necessarie per capire il più possibile il punto di vista delle problematiche del clinico. Quindi si sta tentando di convergere i due ambiti e questo è uno dei principi a cui si sta ispirando anche la letteratura scientifica”.
Eric Topol, uno dei massimi esperti di questo settore, ha infatti pubblicato nel 2019 su Nature Medicine un articolo dal titolo “High-performance medicine: the convergence of human and artificial intelligence”, evidenziando come il risultato della convergenza delle due diverse intelligenze, umana e artificiale, sarà il vero motore della nuova medicina. La medicina personalizzata, di precisione, sarà necessariamente il risultato della convergenza dei due filoni della competenza umana e della competenza artificiale.
Prenota il tuo posto all’appuntamento “Health Data & FSE” (THE HUB LVenture GROUP – Via Marsala 29 H, Roma, il 26 ottobre).