Avvenire, 9 gennaio 2020
L’algoritmo di Google più attendibile dei medici
L’anno è cominciato con una di quelle notizie che hanno un tono rivoluzionario: Google ha sviluppato un sistema di intelligenza artificiale in grado di eguagliare o addirittura superare i medici nel rilevare il cancro al seno. Una notizia come questa sembrerebbe sancire l’inizio della fine: la macchina supera il medico nella più antica e preziosa arte umana: il curare. O quanto meno sembrerebbe che alcune discipline mediche, come la diagnostica per immagini, saranno presto dominio di macchine e tecnici e non più di esseri umani. Ma è davvero così? Forse conviene analizzare in dettaglio la questione per comprendere che tipi di cambiamenti sono in atto e che sfide si pongono per chi vuole e desidera una medicina sempre più umanizzata. A scanso di equivoci, ci sia permesso di chiarire subito un punto: non è l’utilizzo della macchina il problema in sé, né la causa dell’eventuale disumanizzazione della medicina. Non ci troviamo in una prospettiva luddista. Chi scrive è convinto che grazie alla tecnica la medicina oggi può compiere prodigi impensabili fino a pochi decenni fa. Tuttavia, la complessa relazione tra un essere umano che si percepisce come vulnerabile, il paziente, e un altro – il medico – che con questo si compromette in una promessa di cura è questione assai delicata e complessa in cui la tecnologia gioca un ruolo cruciale. Torniamo alla notizia. Secondo uno studio condotto da ricercatori britannici e americani e pubblicato sulla rivista Nature, l’analisi di alcune mammografie può essere condotta con notevole successo da un software basato sull’intelligenza artificiale. La mammografia di screening non è una diagnosi di fronte a un problema manifesto ma mira a identificare il carcinoma mammario nelle prime fasi della malattia, quando il trattamento può avere più successo. Nonostante l’esistenza di programmi di screening in tutto il mondo, l’interpretazione delle mammografie è influenzata da alti tassi di falsi positivi e falsi negativi legati, come tutte le analisi compiute dall’uomo, dalla qualità dell’immagine e dalla perizia dell’esaminatore.
Nature, la celebre rivista scientifica, ha presentato un sistema di intelligenza artificiale (AI) in grado di superare gli esperti umani nella previsione del cancro al seno. Qual è la precisione del sistema? Per valutare le prestazioni del software in ambito clinico, gli sviluppatori hanno fatto ricorso a un ampio set di dati rappresentativo dal Regno Unito e un ampio set di dati arric- chito dagli Stati Uniti. Lo studio mostra una riduzione assoluta rispettivamente del 5,7% e dell’1,2% (rispetto ai campioni Usa e del Regno Unito) nei falsi positivi e, analogamente, del 9,4% e 2,7% nei falsi negativi. Inoltre, nella ricerca – e forse questa è la pretesa più importante dell’articolo – si forniscono prove della capacità del sistema di avere prestazioni analoghe generalizzabili dal Regno Unito agli Stati Uniti. Il sistema di intelligenza artificiale è stato testato su mammografie di oltre 25mila donne nel Regno Unito e 3mila negli Stati Uniti (e in questi numeri forse risiede il motivo di tali percentuali). La competizione con l’umano è stata calcolata con un confronto secondo il sistema Auc-Roc. Nella teoria delle decisioni, le curve Roc (
Receiver Operating Characteristic) sono schemi grafici per studiare i rapporti fra allarmi veri ( hit rate) e falsi allarmi. In uno studio indipendente con sei radiologi il sistema di intelligenza artificiale ha sovraperformato tutti i lettori umani: l’area sotto la curva Auc-Roc per il sistema AI era maggiore dell’Auc-Roc per il radiologo medio di un margine assoluto dell’11,5%.
A questo punto, leggendo lo studio emerge un dato interessante: i ricercatori hanno eseguito una simulazione in cui il sistema di intelligenza artificiale ha partecipato al processo di doppia lettura dei referti utilizzato nel Regno Unito e hanno scoperto che il sistema di intelligenza artificiale ha mantenuto prestazioni non inferiori a quelle del test e ha potenzialmente ridotto il carico di lavoro del secondo lettore dell’88%. Lo studio conclude che questa valutazione del sistema di intelligenza artificiale apre la strada a studi clinici per migliorare l’accuratezza e l’efficienza dello screening del cancro al seno.
A questo punto possiamo fare alcune considerazioni generali e alcune domande di senso. Innanzitutto, lo scopo dello studio non è ingenerare una competizione di tipo darwiniano tra il medico e la macchina ma cercare di dire che la macchina può essere utilizzata non sbagliando più dell’uomo. Questa argomentazione è abbastanza singolare: usereste voi un coltello elettrico che vi può ferire sapendo che, in media, tagliando a mano può essere meno preciso? Se fino a ieri abbiamo richiesto degli standard di sicurezza assoluti nelle macchine destinate all’uso professionale, perché ora cerchiamo altri parametri? Possibile che per i device medici tradizionali, come un bisturi, chiediamo uno standard e per questi software basti invece una media statistica? Questo cambio di paradigma richiede una riflessione approfondita.
La seconda questione invece è di natura politica. Il Regno Unito ha un sistema di assistenza pubblico i cui costi si fanno via via più proibitivi. La ricerca mostra come quello per cui si vuole sviluppare questi software non è un miglioramento delle capacità del medico, un enhancement della diagnosi, ma ottenere un risparmio sui costi, eliminare la doppia lettura o abbatterne la spesa. In medicina il valore è la persona e la sua salute o il budget?
Le domande sarebbero molte altre, ma già questo primo livello di riflessione ci mostra come l’innovazione abbia bisogno di un’etica per essere trasformata in sviluppo, cioè in reale opportunità di maggior bene per più persone. In particolare, nel caso dell’algoritmizzazione della medicina abbiamo bisogno di una ’algor-etica’, cioè di un nuovo capitolo nell’etica per guidare lo sviluppo delle intelligenze artificiali ponendo una sorta di guard rail a tutela della dignità di tutte le persone coinvolte: medici e pazienti.