Estratto dell'articolo di Filippo Santelli per “la Repubblica”, 29 maggio 2023
I "BOT" PARLANO LA LINGUA DEI PADRONI - L'INTELLIGENZA ARTIFICIALE RISCHIA DI AUMENTARE IL DIVARIO COMPETITIVO TRA CHI PARLA INGLESE E CHI NO - "CHATGPT" E LE ALTRE IA "PENSANO" IN INGLESE, AUMENTANDO GLI ERRORI NELLE ALTRE LINGUE - UTILIZZARE I "CHATBOT" IN UNA VERSIONE NON INGLESE COSTA ANCHE DI PIÙ, VISTO CHE SERVE UN MAGGIORE POTERE DI CALCOLO PER DECIFRARE I LINGUAGGI - PER QUALCHE STRANO MOTIVO, LA LINGUA CHE CHATGPT PARLA MEGLIO DOPO L’INGLESE È L'ITALIANO, NONOSTANTE IL NOSTRO PAESE SIA… -
ChatGPT parla un centinaio di lingue, […] Ma sia lui che i rivali, come Bard di Google, “pensano” […] in inglese. Non è un dettaglio, visto che […] i divari tra l’inglese e le altre lingue rischiano di aprire un nuovo abisso di competitività tra gli Stati Uniti – con l’anglosfera al traino – e il resto del mondo.
Divari di costo: se in inglese ogni milione di parole prodotto da GPT costa 35 dollari, in italiano sale a 58, in greco si impenna a 182 e in malese esplode a 345. Divario di precisione, visto che gli algoritmi padroneggiano la lingua di Melville ed Eminem meglio delle altre. E pure divario di sensibilità, perché nel linguaggio si incarnano aspetti etici e culturali. […]
Ed è per questo che tanti, anche in Europa, stanno sperimentando alternative che rendano l’AI davvero poliglotta. Ma perché questa differenza? Tutto nasce dalla matematica dei “grandi modelli linguistici” come quello alla base di ChatGPT. Le frasi vengono divise in tasselli più o meno lunghi, parole o sillabe, i cosiddetti token. Quando “parlano”, le AI stanno in realtà calcolando quale è il tassello successivo più probabile, uno alla volta, sulla base dei testi che hanno studiato.
[…] Una frase che in inglese viene divisa in un numero ideale di tasselli, in francese o italiano ne richiede di più, e più ancora in mandarino. Più pezzi significano più calcoli e consumo di energia - la materia prima dell’AI - , con costi fino a 15 volte superiori. E minore velocità, al punto che applicazioni come le chat in tempo reale potrebbero non essere possibili. Il fatto che gli algoritmi abbiano frequentato meno altre lingue spiega pure la minor accuratezza: GPT prende 85 su 100 in un test di inglese, un meno brillante 66 in coreano e appena 56 in panjiabi […]
OpenAI, la società che ha creato ChatGPT, è consapevole del problema: sta per esempio lavorando con una squadra di linguisti islandesi per migliorare la performance e preservare l’idioma dell’isola. Bard di Google, a lungo solo in inglese, ha iniziato a masticare giapponese e coreano. Ma il tema degli squilibri, di costo ed efficienza, resta. […]
Dopo il “digital divide”, il divario digitale, c’è già chi parla di “AI divide”. Così in giro per il mondo sono spuntati una serie di concorrenti che vogliono costruire modelli pensati per lingue diverse […] In questa glottologia dell’innovazione, per una volta l’Italia ha un vantaggio competitivo. La lingua di Dante, nonostante costi quasi il doppio, è quella che ChatGPT parla meglio dopo l’inglese, sopra a tutte le altre. Il motivo non è chiaro, dipende forse dal fatto che noi italiani traduciamo molto e quei testi sono finiti negli allenamenti degli algoritmi.
Un paradosso, visto che siamo uno dei Paesi dove OpenAI ha avuto l’accoglienza più difficile, con il bando poi rientrato del Garante. […]