L’algoritmo è una questione di copyright ora il New York Times vuol farsi pagare

La Stampa, 24 agosto 2023

L’algoritmo è una questione di copyright ora il New York Times vuol farsi pagare

Tramontato in meno di un mese il combattimento stile gladiatori fra Elon Musk e Mark Zuckerberg, se ne intravede uno molto più interessante e con effetti più penetranti sulle nostre vite: quello fra il New York Times e OpenAi, la startup che produce e gestisce ChatGpt. Diciamolo meglio: il duello sarebbe tra il più importante giornale del mondo e l’intelligenza artificiale generativa di cui si dibatte da nove mesi con toni a volte apocalittici. La cosa – la prospettiva di una sfida in tribunale – entusiasma i molti che temono un futuro dominato dagli algoritmi più di quanto avvenga già oggi; e ingolosisce tutti gli editori del mondo, che sperano di aver trovato nell’intelligenza artificiale un nuovo filone per incassare un po’ di soldi, dopo aver provato, con grande fatica e alterne fortune, di farsi riconoscere un compenso da Google e Facebook per la condivisione delle notizie. Qui il punto non è la condivisione delle notizie, ma l’addestramento dell’intelligenza artificiale con le notizie di un giornale.
Infatti per OpenAi – ma anche per Google e Meta e per tutti quelli che stanno sviluppando strumenti di intelligenza artificiale generativa – si tratta di un passaggio essenziale. Esattamente come accade con gli esseri umani che – passatemi la definizione – sono quello che sanno; anche il valore, la qualità di una intelligenza artificiale dipende direttamente da quello che ha imparato, ovvero da quali base dati ha “ingerito” per allenarsi. Datele in pasto i post dei tanti siti di fake news che prosperano sul web, e questa sfornerà notizie false a raffica; al contrario, allevatela con post di qualità – ben scritti, verificati, affidabili – e avrete ottimi risultati.
Questa cosa vale per il giornalismo, ma vale più in generale per tutte le cosiddette industrie creative: se date in pasto ad una intelligenza artificiale tutte le canzoni dei Queen o dei Beatles, questa sarà in grado di creare canzoni nel loro stile (mediocri, però, finora); oppure si può far cantare una canzone dei Radiohead a Frank Sinatra, cosa che ovviamente non hai mai fatto, ottenendo un risultato bizzarro ma non spregevole. Di fatto le intelligenze artificiali generative stanno realizzando la profezia di un libro che nel 2008 venne accolto con qualche scetticismo ed invece adesso andrebbe riletto: si chiama Remix, lo ha scritto un giurista di chiara fama, Lawrence Lessig, e ragiona sul fatto che con il digitale quasi tutto quello che creiamo è un “remix” di cose altrui e che per questa ragione le leggi sul copyright sarebbero obsolete. Insomma, il tema di cui si dibatte adesso precede l’avvento delle intelligenze artificiali generative come dimostra una storica sentenza delle Corte Suprema americana che a maggio ha dato torto alla fondazione di Andy Warhol per un famoso ritratto di Prince realizzato a partire da una fotografia per la quale non erano stati pagati i diritti alla fotografa. Il remix si può fare, ha detto la Corte, ma devi riconoscere un compenso a chi ti ha dato la base da cui sei partito.
Un esempio potente della capacità dell’intelligenza artificiale di remixare il meglio del passato viene dall’esperimento fatto da una multinazionale svedese che ha provato a creare una scultura «nello stile di Michelangelo e Rodin»; ci è voluto un po’, ma alla fine è stata realizzata una figura umana in acciaio inossidabile che tiene il mondo in una mano, interessante ma nessun critico la considera un capolavoro. Michelangelo e Rodin ovviamente non hanno potuto rivendicare dei diritti, cosa che invece sta accadendo fra gli attori, gli scrittori e i fotografi.
I primi lamentano il fatto che l’intelligenza artificiale, allenandosi con le immagini delle comparse, sarebbe in grado di crearne all’infinito e senza costi (da qui lo sciopero in corso ad Hollywood); i secondi hanno scoperto che i loro libri sono stati utilizzati, senza consenso, per addestrare degli algoritmi che ora sarebbero in grado di scrivere testi nel loro stile (ma Stephen King è tra quelli che non vede il pericolo per la modestia degli scritti artificiali); e i terzi hanno fatto causa a quegli strumenti con cui nei mesi scorsi sono state create immagini famose, come l’arresto di Trump e il Papa con il piumino, a partire da foto vere e rielaborate dall’intelligenza artificiale.
Qui il punto non è tanto la liceità di queste pratiche ma stabilire un compenso: vuoi usare i miei dati per far progredire la tua intelligenza artificiale? Pagami. Questo vogliono le comparse di Hollywood, gli scrittori, i fotografi. E naturalmente i giornalisti. O meglio, gli editori. Stiamo parlando di soldi. Come dimostra l’accordo sottoscritto qualche mese fa da OpenAi con la più importante agenzia di stampa del mondo, l’Associated Press. Accordo che prevede che ChatGpt possa addestrarsi con tutte le notizie pubblicate dal 1985 ad oggi in cambio di una somma che non è stata resa nota. Insomma, OpenAi ha già a disposizione 38 anni di notizie di ottima qualità. Anche il New York Times aveva in corso una trattative con OpenAi, ma non si sono accordati sul prezzo e quindi ha fatto due cose: all’inizio di agosto ha aggiornato i termini di uso del sito web vietando espressamente l’addestramento di algoritmi; e due settimane dopo ha bloccato l’accesso su ChatGpt al suo archivio. Che si arrivi alla causa in tribunale non è detto insomma: potrebbero non esserci gli estremi. Ma resta il tema di fondo: una intelligenza artificiale è davvero utile solo se è di qualità, e la qualità dipende dai dati con cui si addestra; e quei dati in qualche modo vanno pagati. Come e quanto è la cosa di cui si parlerà nei prossimi anni. —

RICCARDO LUNA