Come mai solo oggi scienziati e statistici si capiscono quando discutono di dati

Il Sole 24 Ore, 6 gennaio 2019

Come mai solo oggi scienziati e statistici si capiscono quando discutono di dati

I dati, in quanto tali, sono stupidi. Non parlano. Non portano attaccate etichette che ci dicono cosa significano. Oggi, però, di dati si parla come se contenessero chissà quali verità. «Viviamo in un’era – dice l’informatico e filosofo Judea Pearl, vincitore del premio Turing nel 2011 per avere rivoluzionato l’approccio probabilistico all’intelligenza artificiale – nella quale i Big Data si pensa siano la soluzione a tutti i problemi. I corsi di “scienza dei dati” proliferano nelle università, e gli impieghi come “scienziati dei dati” sono redditizi nelle nostre società, dove l’economia è “basata su dati”». Gli strumenti statistici tradizionali, che guardano solo alle correlazioni, e gli algoritmi di Intelligenza Artificiale (IA) che usiamo per interrogare le banche di dati sono, per Pearl, come gli uomini «nella famosa caverna di Platone, (…) che esplorano le ombre sulla parete della grotta e imparano a prevedere con precisione i loro movimenti. Ma non capiscono che le ombre osservate sono proiezioni di oggetti che si muovono in uno spazio tridimensionale». Ne deriva, per il teorico dell’IA basata su network bayesiani, che sono sciocchezze la «singolarità» (la super-intelligenza che prenderebbe il comando delle tecnologie), l’avvento di legioni di robot che ci schiavizzeranno o un Armageddon causato dall’IA.
L’IA, oggi, è solo in grado, con molta ma molta più efficienza dell’uomo, di rilevare strutture significative all’interno di basi di dati anche molto ampie. Il fatto che vinca a scacchi o a GO, che sappia progettare farmaci a livello molecolare, o guidare auto o fingere di essere un servizio clienti umano, dimostra solo che la gamma di domini dove questa capacità di uso superficiale dei dati si può applicare in modi adattativi, è più ampia di quanto inizialmente si pensava. «Il giorno in cui – continua Pearl – l’IA saprà approssimarsi all’intelligenza umana è vicino, ma le sue capacità vanno giudicate su tre livelli di abilità cognitivi: vedere (associazione), fare (intervento) e immaginare (controfattuali). L’IA oggi lavora solo al livello più basso, cioè vedere».
Vedere, fare e immaginare: sono i tre pioli di una scala metaforica che è l’asse narrativo del bellissimo e inesauribilmente stimolante libro che Judea Pearl ha scritto insieme a Dana Mackenzie, per spiegare come mai solo oggi scienziati e statistici si capiscono quando discutono di dati e di come metterli tra loro in relazione al fine di trovare spiegazioni causali dei fatti. Per oltre mezzo secolo nel mondo della ricerca il lessico causale era praticamente vietato. E questo ha avuto anche delle conseguenze tragiche. Il libro di Peal è l’opportuna, articolata risposta a una discussione in corso da dieci anni sulla crisi del metodo scientifico di fronte a uno tsunami di dati che porta i ricercatori a credere, scioccamente, di potere fare a meno delle teorie per interrogare e controllare la realtà.
Il gradino più basso della scala, dove si trovano gli statistici, si occupa dell’osservazione, e consiste nella ricerca di regolarità nel mondo. In che modo delle variabili sono collegate? Come cambia quello che so di Y, se osservo X? In altre parole, cosa mi dice un sintono su una data malattia o un sondaggio sui prossimi risultati elettorali? Pearl colloca gli algoritmi di machine learning e deep learning a questo primo stadio. L’esplosione della potenza di calcolo e i set di dati molto dettagliati accessibili hanno dato risultati sorprendenti e importanti, ma i meccanismi funzionano ancora “nello stesso modo in cui un lo statistico cerca di adattare una linea a un insieme di punti”.
Nonostante gli sforzi del genetista Sewall Wright (1889-1988) di applicare a diversi domini conoscitivi complessi la tecnica statistica della path analysis, da lui inventata nel 1918, per descrivere quantitativamente le dirette dipendenze tra insiemi di variabili – tecnica oggi di uso comune –, la supremazia intellettuale dei biometristi inglesi, allievi di Karl Pearson, detrminò un’autocensura per l’uso di strumenti matematici utili a gestire le domande causali. Parlare di “causalità” per decenni era come parlare di flogisto dopo la teoria cinetica del calore, per cui le statistiche si dovevano concentrare solo su come raccogliere e collegare tra loro i dati, non su come interpretarli e spiegarli.
La «rivoluzione causale» ha consentito di salire al secondo piolo, di passare dall’osservare al fare. Cosa accadrebbe a Y se faccio X? Come posso fare in modo che accada Y? In altre parole: se prendo un’aspirina se ne andrà il mal di testa?; cosa accadrà rispetto a diverse variabili se vieto la vendita di sigarette? Secondo Pearl «molti scienziati sono rimasti traumatizzati apprendendo che nessuno dei metodi che hanno imparato con la statistica serve per rispondere a una semplice domanda come: Cosa succede se raddoppiamo il prezzo?». Nel libro si spiega come e quando un modello da solo può rispondere alla domanda in assenza di esperimenti in vivo.
Al gradino più alto entra in gioco l’argomentazione «controfattuale», cioè l’immaginazione, la retrospezione e la comprensione. X è stato causato da Y? Se X non fosse accaduto come sarebbero oggi le cose? Cosa sarebbe successo se avessi agito diversamente? In altre parole: è stata l’aspirina a farmi passare il mal di testa?;se i terroristi non avessero abbattuto le Torri Gemelle gli Stati Uniti avrebbero scatenato le guerre? come sarebbe la mia salute non avessi fumato negli ultimi dieci anni? Siamo al livello della scienza, ma anche dell’etica. Si tratta di usare la capacità di guardare indietro e astrarre, immaginando cosa avrebbe potuto cambiare fare qualcosa di diverso sul piano del successo o fallimento, o di giudizi di giusto e sbagliato, etc. Un tempo questo tratto era considerato distintivo dell’intelligenza umana, e negli ultimi decenni sono entrati in gioco strumenti di modellizzazione sempre più complessi. Tali strumenti sono stati applicati a vari problemi sociali e scientifici, tra cui l’efficacia delle procedure mediche, l’impatto dei cambiamenti climatici e l’utilità delle politiche sociali.
Parte del libro discute di perché e come statistici e scienziati rifiutavano la causalità come argomento scientifico. Si studiavano le correlazioni, ci si ripeteva il mantra «la correlazione non implica causalità» e si riteneva che fosse illusorio cercare di andare oltre le correlazioni. Gli scienziati sperimentali avrebbero voluto discutere e pianificare le implicazioni causali della loro ricerca, ma gli statistici rifiutarono la maggior parte dei tentativi di prendere in considerazione le cause. Con l’invenzione degli studi controllati e randomizzati (RCT) gli statistici hanno creduto di poter dimostrare che la correlazione implica la causalità. Quindi gli RCT sono diventati sempre più importanti. L’uso degli RCT sdoganava il concetto di causalità, ma fino a un certo punto. Quando per esempio gli scienziati hanno notato che il fumo potrebbe causare il cancro del polmone, hanno dovuto aspettare che gli RCT osservassero che il fumo è associato al cancro. Questo alla fine ha spinto gli esperti a immaginare criteri utili per stabilire la causalità. Ma anche nelle circostanze ideali, quei criteri non erano abbastanza convincenti da produrre un consenso fra gli statistici. Alcuni di loro, influentissimi come Ronald Fisher e Jacob Yerushalmy, hanno usato il loro prestigio e la loro intelligenza per eludere l’argomento della causalità e mettere in discussione la relazione tra fumo e cancro. Per cui le prese di posizione degli organi sanitari sono state ritardate per anni sotto l’attacco delle multinazionali del tabacco con un numero cospicuo di morti, a causa del disagio degli scienziati nel parlare di causalità.
Pearl appare, attraverso le pagine ma anche da interviste, molto simpatico, pieno di curiosità e di gioia per il suo lavoro; anche molto amato da studenti e colleghi viene da pensare. Il suo entusiasmo per la ricerca filosofica deve averlo aiutato non poco a fronteggiare la tragedia del figlio giornalista sequestrato e assassinato dai talebani in Pakistan. La sua reazione è stata creare una fondazione a nome di Daniel, fondata su principi di tolleranza e rispetto per tutte le culture, cioè su valori che in ultima istanza gemmano da una cultura scientifica o che coltiva l’oggettività e rifugge il conformismo. «Mio figlio è stato ucciso dall’odio per cui sono deciso a combattere l’odio» ha detto, senza lesinare critiche durissime a chi sbagliando accusa Israele di essere causa del terrorismo islamico, e così razionalizza l’odio fondamentalista.

GILBERTO CORBELLINI