La Lettura, 13 dicembre 2015
Ci sorvegliano attraverso lo smartphone
Per catturare le informazioni riservate di privati cittadini non servono tecnologie sofisticate o misteriosi programmi di sorveglianza. Può essere sufficiente il microfono installato sul telefono, collegato a un browser di navigazione del web o ad applicazioni. Se vi è mai capitato di ricevere pubblicità online su argomenti di cui avete discusso a cena con amici o sul divano con il partner a fine giornata, controllate la funzione microfono sul vostro cellulare. Probabilmente sarà attiva. In secondo luogo, provate a verificare a quante applicazioni avete permesso – senza pensarci troppo – l’utilizzo del microfono. Ci sono ottime probabilità che siano diverse.
I microfoni installati su iPhone, computer e iPad – gli stessi che servono per parlare al telefono, eseguire ricerche o dare istruzioni agli assistenti vocali – catturano le nostre parole, le conservano sui server delle aziende e le trasformano in testi. Quei documenti preziosi vengono archiviati e usati dai fornitori dei servizi per conoscere meglio i propri clienti e, giurano, migliorare il servizio; ma può succedere che vengano intercettati da siti terzi. Questi – nel migliore dei casi – li analizzeranno per trovare parole-chiave che identificano gusti, preferenze e desideri immediati delle persone, profilando così, con estrema precisione, la loro offerta commerciale.
Il whistleblower Thomas Drake, cripto-linguista della National Security Agency fino al 2008 (quando ha denunciato, prima di Snowden, attività illecite di spionaggio dell’agenzia), contattato da «la Lettura» ha dichiarato che le app collegate ai microfoni dei cellulari «in alcune circostanze sono ad alto rischio di spionaggio. Spegnete i microfoni e cancellate periodicamente le vostre ricerche dalla cronologia», ha esortato via mail.
Israele chiama Mountain View
Nel settembre 2013, sei mesi dopo il debutto del microfono per la ricerca vocale su Google, un programmatore israeliano, Tal Ater, ha scoperto un difetto in grado di trasformare il proprio pc letteralmente in un «microfono aperto» 24 ore su 24 e intercettabile da chiunque. Va detto che la funzione di ricerca vocale deve essere attivata dall’utente, ma quello che spesso sfugge (anche perché non è esplicitato) è che – una volta terminato il servizio – l’utente deve disattivare la funzione per evitare che Google continui a registrare e a trasformare in testi tutte le conversazioni che ascolta. La presenza del bug individuato da Ater renderebbe facile per i siti «male intenzionati» catturare quelle trascrizioni. A distanza di due anni dalla scoperta, Ater conferma via mail a «la Lettura» che il problema, poiché non viola formalmente alcuna norma, non è stato risolto del tutto da Mountain View.
Se è noto che gli assistenti vocali come Siri di Apple o Cortana di Microsoft conservano tutti gli audio per un periodo di circa due anni, quando permettiamo ad applicazioni di accedere ai nostri profili social (succede spesso poiché sono sempre di più quelle che offrono l’opzione per velocizzare i passaggi), bisogna verificare – ancora una volta – se tali applicazioni abbiano accesso al microfono. Si nasconde anche lì il rischio concreto di aziende e persone che possono controllarlo. «I server conservano la tua voce – spiega Bhiksha Raj, docente del Language Technology Institute della Carnegie Mellon University —, che può essere utilizzata per cercarne tracce in altri luoghi del web, per esempio su YouTube; oppure venduta ad aziende che la utilizzano per tracciarti o per scopi criminali: possono “editare” le registrazioni ed effettuarne di false».
Il valore (economico) della voce
Le tecnologie biometriche sono quelle che identificano una persona in base a caratteristiche biologiche: il Dna, la retina, l’iride, le impronte digitali, la voce. Mentre in Italia il governo discute del «riconoscimento facciale» come strumento efficace per la prevenzione del terrorismo, gli studiosi della biometria assicurano che il segmento su cui aziende e governi stanno investendo di più sia quello vocale. «La Lettura» ha avuto accesso a un documento riservato che rivela di un programma di sicurezza al vaglio del governo americano sulla «profilazione e individuazione dei cittadini» attraverso la loro voce. Come mai tutto questo interesse?
«La voce umana è un pattern unico», spiega Slobodan Ribaric, a capo del programma europeo Cost (Coopération européenne dans le domaine de la recherche Scientifique et Technique) sulla de-identificazione per la protezione di dati. «Non ci sono due persone con la stessa voce – continua —, ognuno ha una propria identità vocale che porta con sé informazioni come il sesso, l’età, il livello di educazione, lo stato di salute, quello emotivo e l’origine». Rita Singh del James K. Baker Center for Voice Forensic si spinge oltre. Spiega che la voce umana è un biomarcatore: può rivelare se una persona sta mentendo, se parla sotto costrizione, e livello di stress, rendendola uno strumento cruciale per la medicina e per la lotta al terrorismo e alla criminalità.
Il ruolo della Nsa
Singh è stata la impiegata numero uno del Center of Excellence creato dalla National Security Agency alla Johns Hopkins University per studiare le tecnologie di riconoscimento vocale, primo esempio «ufficiale» dell’interesse dell’agenzia verso il settore. Tra le rivelazioni di Edward Snowden, l’ex dipendente della Nsa che ha fatto luce sulle tecniche di sorveglianza di massa, una riguarda l’entusiasmo con cui l’agenzia ha festeggiato l’iniziativa «Google for Voice», il programma con cui Mountain View traduce in tempo reale in testo quello che ascolta. Se le trascrizioni delle telefonate, benché molto usate dalle intelligence, sono complicate e facilmente soggette a disturbi, il nuovo sistema lanciato da Google avrebbe permesso all’agenzia, quanto meno nelle sue intenzioni, di avere accesso a milioni di testi «puliti» con parole chiave già in evidenza. D’altronde, le tecnologie di conversione testi sono usate dalla Nsa da almeno dieci anni. L’agenzia utilizza metodi di «Natural Language Processing» per selezionare persone potenzialmente «interessanti» in giro per il mondo. E – secondo un documento del 2011 citato da «The Intercept» – avrebbero fondato in Afghanistan un laboratorio di «Tecnologia di linguaggio umano» per contrastare forze militari e terroristi sul campo.
«Da studioso di legge – afferma Oleksandr Pastukhov, uno dei massimi esperti europei di privacy – devo constatare che l’avvento delle tecnologie biometriche non ha ricevuto il livello di attenzione che merita». Il ricercatore spiega che la direttiva europea sulla protezione dei dati «non riconosce quei dati come sensibili – ovvero la categoria che ha diritto al più alto grado di protezione – ma impone semplicemente “una valutazione di impatto sulla protezione dei dati” prima di processarli».
Elsa Kindt, autore di Privacy and Data Protection Issues of Biometric Applications, spiega che per identificare i cittadini attraverso la voce non c’è bisogno di un’autorizzazione scritta: «Il riconoscimento vocale non richiede al momento che venga definito chi è intitolato a farlo, in quale circostanze e seguendo quali procedure».
In cerca di soluzioni
Al momento i tentativi portati avanti da accademici e gruppi di ricerca per arginare il rischio sorveglianza insito nei dispositivi audio si muovono nella direzione della de-identificazione: una tecnica per nascondere o rimuovere identificatori personali e sostituirli con «surrogati» per evitare che quelle informazioni vengano attribuite a una persona in particolare e quindi utilizzati per uno scopo diverso da quello iniziale. «Ci sono due approcci principali per la protezione della privacy – illustra Slobodan Ribaric —. Il primo è basato sul principio della trasformazione della voce: andiamo a modificare le caratteristiche non linguistiche di un discorso, senza cambiare il contesto. Il secondo è basato sul criptaggio delle caratteristiche biometriche della voce».
Le ricerche del team di Bhiksha Raj al Carnegie Mellon provano invece a far sì che i sistemi che utilizzano la voce degli utenti possano catturare l’informazione (e portare a termine il servizio) senza però identificare la persona. Ma il problema è anche culturale. «I cittadini non si rendono conto che le informazioni che rilasciano ai device attraverso la loro voce – continua Raj – sono preziose quanto i numeri delle carte di credito, gli indirizzi, le mail riservate e tutte le informazioni che hanno imparato a proteggere da occhi online indiscreti». Il ricercatore fa un paragone con internet degli anni Novanta, quando tutti scrivevano e cercavano qualsiasi argomento online senza preoccuparsi delle conseguenze sulla privacy. Succede oggi con le comunicazioni vocali: le direzioni al navigatore, le istruzioni per le ricerche, i messaggi vocali così popolari su WhatsApp. Stiamo costruendo un enorme database di informazioni preziosissime sul nostro conto. «Vi siete mai chiesti – conclude – dove finiscono quelle informazioni?».