Franco Debenedetti, Il Sole 24 Ore 7/4/2013, 7 aprile 2013
IL VALORE DI LASCIARE TRACCIA
L’uomo lascia tracce. 40.000 anni fa erano incisioni su zanne di mammouth, come quelle attualmente in mostra al British Museum. Oggi sono le stringhe di 0 e 1 conservate nelle memorie in un data center in qualche parte del mondo. Qualunque cosa facciamo, se vendiamo o comperiamo, se siamo sani o malati, se viaggiamo o camminiamo, se parliamo al telefono o interroghiamo Internet, lasciamo tracce. Sono digitali, archiviarle costa sempre meno, ritrovarle è sempre più rapido: benvenuti nel mondo del Big Data. Non è solo una differenza quantitativa: la «datificazione» delle tracce rende possibili cose impensate, estrae valore da segni dimenticati, fa emergere nuove professionalità e nascere nuove imprese. Mayer-Schoenberger ci conduce ad esplorarla con entusiasmo, ma senza trionfalismi, costeggiando intriganti problemi epistemici, e mettendo in guardia da possibili inquietanti prospettive.
Quando nel 2009 scoppiò l’aviaria, Google riuscì a «prevedere» la diffusione geografica della pandemia con due settimane di anticipo rispetto al Center for Disease Control. Dove appaiono i primi segni di influenza, fu l’intuizione, aumenterà la frequenza con cui certe parole sono ricercate su Internet. Google riceve ogni giorno 3 miliardi di interrogazioni; prese i 50 milioni di termini più frequentemente richiesti e li paragonò ai dati del Cdc per le pandemie del 2003 e del 2008. Provando con 450 milioni di diversi modelli matematici, individuò 45 termini che usati insieme avevano una forte correlazione con i dati delle precedenti epidemie. Quando il numero dei dati è piccolo, ci vuole esattezza nel misurarli, attenzione a raccoglierli in modo casuale, e un teoria per generalizzarli. Invece quando i dati sono tanti, quando «N = tutto», non ha più importanza se sono meno precisi, perfino se alcuni sono sbagliati. A indirizzare la ricerca non sono più le ipotesi, ma i dati stessi; ciò che interessa non è sapere perché, ma constatare che una cosa accade. Al cuore di Big Data sono predizioni basate su correlazioni.
I dati hanno un valore di per sé: ma assai più conta quello che Mayer-Schoenberger chiama «option value», quello che si «scopre» – nel senso hayekiano del termine – incrociando tra di loro diversi set di dati. Dati «nuovi», in formato digitale, ma perfino quelli «vecchi» in formato analogico si può trovar modo di impiegarli. Anche i «dati esausti» hanno un valore potenziale: può sempre saltar fuori un’occasione per estrarne ancora valore.
Nel mondo di Big Data ci sono rischi: di violare la privacy, di ledere la libertà, di credersi onniscienti. Contro l’incrocio dei dati non basta neppure cancellarne una parte per renderli anonimi. Informare e chiedere il consenso è uno schermo di carta: e anche negare il consenso è un dato. Con i dati si possono fare previsioni: si arriverà a limitare la libertà di persone perché è prevedibile che delinquano? La correlazione sostituirà il rapporto di causa?
Concetto complicato, quello di causalità, ci si sono misurati filosofi e teologi: Mayer-Schoenberger lo tratta con rispettosa prudenza. Non ha i «lampi» folgoranti di Albert-Làzlò-Barabàsi («un giorno ci renderemo conto che il nostro futuro non è più il mistero che era un tempo»). Ma, scritto secondo il collaudato modello nordamericano di divulgazione colta – un aneddoto ad introdurre il tema, analisi, generalizzazione, breve sintesi, collegamento al capitolo successivo – il libro è una chiara e persuasiva introduzione al nuovo paradigma di Big Data. Sarà un passo avanti se sostituiremo alle indecidibili questioni della causalità le affidabili previsioni delle correlazioni? Se la tolleranza delle imprecisioni prenderà il posto della meticolosa verifica dell’esattezza del dato?
La datificazione, ricorda Mayer-Schoenberger, inizia con la partita doppia, a diffonderla sono mercanti e mecenati, come i Medici: famiglia Veneta, secondo lui. «I dati son, ma chi pon mano ad essi?» (dal Purgatorio, XVI, 95. Grazie, Wikiquote!)