Corriere della Sera, 1 settembre 2019
Cosa Google sa di noi
Proviamo a chiedere a lui, Google: «Tu sai tutto?». Risposta: «Ci sono tantissime cose da sapere. Posso cercare per te». «Ok, ma tu sai cosa è vero e giusto?». Risposta: «Penso di sì, ti sembra sbagliato?». Eccoci subito al punto con solo un paio di battute con l’Assistente, il maggiordomo intelligente di Mountain View capace sia di dare informazioni sia di compiere azioni molto più avanzate (è lì lì per riuscire a prendere un appuntamento dal parrucchiere): è giusto che Google pensi di sapere cosa sia vero e giusto e in alcuni casi arrivi a presentarcelo come una verità assoluta, sostituendosi a enciclopedie o giornali online? E fin dove si spinge per costruire quella che ci propone come la sua verità?
L’ultimo caso Queste domande si sono imposte lo scorso 20 agosto. Quel giorno il motore di ricerca, come scritto dal Corriere, ha risposto a chiunque domandasse quale fosse stata la causa della morte del Garante europeo per la privacy Giovanni Buttarelli con il nome della sua malattia in un riquadro in evidenza. Una verità, presentata come tale e senza alternative, priva di fonte. Non si capiva da dove fosse stata desunta, perché non era pubblica. Dopo la nostra segnalazione il riquadro è stato rimosso nel giro di una notte, con tanto di scuse. «Questi casi saranno sempre più frequenti perché sta cambiando l’interfaccia di presentazione dei risultati», spiega Andrea Volpini, esperto di Web semantico e Ceo di WordLift.
Come raccoglie i dati Google opera in un mercato di concorrenza e custodisce gelosamente i segreti con cui ha conquistato il 90% del mercato. Ricostruire nel dettaglio come agisce rasenta dunque l’impossibile, ma provare a capire ci aiuta a farne un uso più consapevole. Di certo sappiamo che per completare il riquadro in questione – chiamato snippet di primo piano, Google card o Knowledge panel e i cui limiti sono emersi da anni negli Usa, dove è diventato così frequente da rendere inutile per metà delle ricerche un clic su un altro sito – Google può usare direttamente le pagine indicizzate, evidenziandone il link, o pescare dalla conoscenza accumulata nella sua attività di indicizzazione ed estrazione di dati. Questa conoscenza è organizzata in un grafo «composto da un miliardo di entità e circa 70 miliardi di fatti. Le entità sono dei nodi, che si collegano fra loro attraverso degli archi. L’informazione è data dalla relazioni fra i nodi», prosegue Volpini. Quindi: Google mette dati su persone, fatti, oggetti, concetti, dataset e qualsiasi altra cosa che abbia inghiottito in una mappa a cui attinge per dare una risposta univoca. Se si sente abbastanza sicuro, non cita le fonti. Per il filosofo Luciano Floridi «poco cambia se Google ci restituisce la realtà in un solo riquadro o raccontata da cinque link che sono sempre gli stessi». E afferma: «Il vero tema è quello degli assistenti vocali: pagheremo l’enorme costo della semplificazione dell’interazione. Parlare con un oggetto è più semplice che scrivere, più facile sarà l’interazione meno ci sarà pressione perché gli analfabeti e gli analfabeti di ritorno si mettano a scrivere una frase».
Wikipedia e le nostre ricercheTornando alle fonti del grafo «è ormai sdoganato che Wikipedia sia quella principale, ma è anche inverosimile che Google offra agli utenti una risposta come oggettiva nel caso in cui abbia una sola fonte, magari controversa», dichiara Nereo Sciutto, Ceo di Webranking. A quanto risulta un riferimento alla malattia di Buttarelli comparso poi sull’enciclopedia online – senza alcun articolo a sostegno e infatti eliminato anche da quel contesto – ha rafforzato la convinzione di Google, ma non era sufficiente. Su cos’altro allora Google costruisce le sue verità? Pagine o post sui social rimossi? Di sicuro non è successo quel giorno. Pagine che Google vede ma non ci propone perché accessibili solo con un account? Volpini sottolinea come, secondo un brevetto depositato nel 2013, il grafo si nutre anche delle ricerche degli utenti. Screenshot inviati al Corriere mostrano come già un anno fa BigG avesse iniziato a suggerire il completamento delle ricerche in automatico con il nome del personaggio deceduto e la sua malattia basandosi sulle numerose interrogazioni fatte dagli utenti che digitavano proprio quell’accoppiata. Molti dubbi hanno contribuito a generare una certezza da restituire alle persone che li avevano posti?
Le nostre informazioni Dopo la gestione impropria dei dati da parte della società di consulenza britannica Cambridge Analytica siamo più consapevoli di quanto Google e gli altri colossi sappiano di noi: cronologia delle posizioni, YouTube, posta elettronica, uso delle app, attività compiuta su Chrome. Non c’è alcuna evidenza dell’uso di queste informazioni per dare risposte. Ma è importante sottolineare come Mountain View abbia annunciato che comincerà ad allenare la sua intelligenza sul dispositivo di ogni singolo utente, spedendo meno dati possibile sulla nuvola. Volpini spiega: «Dal punto di vista tecnico è ovvio che queste aziende analizzino le mail o ascoltino le conversazioni con gli assistenti, meno ovvio e giusto è usare questi dati per vendere pubblicità o per il training».