Riccardo Staglianò, la Repubblica 21/10/2012, 21 ottobre 2012
ARCHIVIO BABELE
[Salviamo ogni file nel formato in cui arriva. Usiamo pile di dischi rigidi, non roba all’ultimo grido, anzi i modelli più standard. Così se qualcosa va storto è facile rimpiazzarli. E ogni documento è replicato almeno tre volte.] –
La morte di William Donald Hamilton ha costituito un’immensa perdita per il mondo della biologia evolutiva e un grattacapo incalcolabile per la British Library. Il lascito accademico dello scienziato consisteva di taccuini, software di epoche disparate, documenti salvati su schede perforate, floppy disk, nastri magnetici e dischi fissi. Il sogno di un ricercatore, l’incubo di un archivista. Nonché l’esempio paradigmatico di una sfida cruciale nella partita per la preservazione della cultura nell’era digitale: in che formato e su quali supporti salvare i file in modo che siano ancora consultabili tra dieci, cinquanta, cento anni? La riposta sbagliata porta dritti al seguente titolo: la fine della storia. Ovvero la versione elettronica dell’incendio della biblioteca di Alessandria, deposito delle conoscenze dell’epoca, nel 48 avanti Cristo.
Inserisci il cd dopo un certo numero di anni e non si legge. Clicchi sul file creato da un vecchio programma e non si apre. Colleghi un hard disk d’antane non si“vede”.Ordinariecatastrofi che, su scala collettiva, potrebbero avere conseguenze pesanti. La storia del fondo Hamilton la racconta Adam Farquhar, barba da chierico medievale e capo della Digital Library Technology alla British Library. E aggiunge: «La prima cosa è stata estrarre i bit da quel guazzabuglio. Poi censirli, distinguendo tra immagini, fogli di calcolo, audio e garantirsi di avere i software in grado di riprodurli.
Quindi capire il contesto di quelle informazioni e salvaguardarle senza modificare niente». Se vi sembra facile, pensate allo sforzo erculeo di organizzare anche solo il proprio archivio fotografico digitale, quando traducete sigle tipo img.7945 in titoli più evocativi tipo “Stromboli 2012”. E moltiplicate per svariati milioni.
«Il nostro patrimonio documentale», confessa Agostino Attanasio, sovrintendente dell’Archivio centrale dello Stato, «si estende per 120 chilometri. Si tratta dei documenti prodotti da ministeri e varie amministrazioni dall’Ottocento in poi. Che crescono senza sosta».
Digitalizzarli tutti è, oggi, impensabile. Così si sono concentrati sui cataloghi che dicono dove si trova cosa: «Abbiamo iniziato da poco ma siamo vicini alla digitalizzazione di 150-200 inventari su un totale di duemila». Neanche il dieci per cento: poco o tanto? Mariella Guercio, ordinaria di archivistica alla Sapienza di Roma, solo due settimane fa era alla conferenza Unesco di Vancouver per discutere di queste cose. «L’Italia è tante realtà diverse. Ci sono aree come Toscana, Emilia Romagna, Marche e Trento, che hanno fatto grossi investimenti e sono più avanti della Library of Congress di Washington (che dal 2000 ha stanziato cento milioni di dollari per digitalizzazione e preservazione,
ndr).
Anche la documentazione prodotta dai comuni più sperduti viene messa in un cloudsicuro da dipendenti addestrati a farlo. Va peggio nelle amministrazioni centrali. E il ministero dei Beni culturali, senza risorse, può fare poco o niente». Per questo, già due anni fa, ha stretto un accordo con Google per la digitalizzazione e pubblicazione online di un milione di libri fuori diritti.
L’alleanza col motore di ricerca è uno dei rari punti in comune con la situazione britannica. Torniamo a Farquhar: «Nel 2003 la legge sul “deposito legale”, ovvero l’obbligo di depositare presso la biblioteca centrale ogni copia di nuovi libri stampati, ha allargato il suo perimetro su cd, dvd, riviste scientifiche elettroniche e siti web britannici. Mancano ancora i regolamenti per rendere operativa quell’estensione, ma dovrebbero essere pronti entro il 2013». Intanto si sono portati avanti col lavoro. «Google ha digitalizzato 250mila volumi che datavano dal 1700 al 1860. Un’altra azienda privata ha scansionato 40 milioni di pagine di
quotidiani, mettendoli a disposizione del pubblico a tariffe molto basse. Lo UK Web Archive immagazzina, ma solo dopo aver chiesto il permesso, copie di siti. E c’è anche un progetto in collaborazione con i cittadini per sovrapporre mappe storiche con quelle attuali, per rendersi conto del cambiamento».
Anche da noi c’è lo stesso requisito di deposito dei nuovi libri. Allargato in linea di principio a ricomprendere i contenuti elettronici. «L’obbligo è per i libri di carta, la consegna del file è facoltativa» ammette Rossella Caffo, direttrice dell’Istituto centrale per il Catalogo unico, «però date un’occhiata ai nostri siti internetculturale. it, con i suoi otto milioni e mezzo di file, da giornali d’epoca a fondi librari e mostre, oppure culturaitalia.it, e vi renderete conto che ci diamo da fare». Sì, ma quando sarà possibile, sull’esempio di Amazon, prendere in prestito un ebook come si fa con i libri di carta? «Non dipende da noi, ma dagli accordi con gli editori». Deperibilità dei supporti (un cddvd masterizzato dovrebbe durare 10-20 anni, ma raccomandano di rimpiazzarlo ogni 3-7) e obsolescenza dei formati sono problemi teoricamente noti, ma non ancora messi in pratica perché è tutto in fase iniziale. «Salviamo ogni file nel formato in cui arriva» spiega Maurizio Messina, direttore della Biblioteca Marciana di Venezia. «Quanto all’immagazzinamento, dopo aver perduto dati su cd e dvd, usiamo pile di dischi rigidi. Non roba all’ultimo grido, anzi i modelli più standard, così se qualcosa va storto è facile rimpiazzarli. E infine i data center, gestiti da aziende private, sono stati scelti ad almeno 200 chilometri uno dall’altro, in caso di calamità. E ogni documento è replicato almeno tre volte».
Gli esperti la chiamano redundancy and disaster recovery.
Moltiplicare gli esemplari per dividere i rischi. L’accortezza dei formati standard avrebbero dovuta tenerla a mente quelli che, nel 1986, hanno inciso il Domesday Book, censimento commissionato nel 1086 da Guglielmo il Conquistatore, su uno speciale disco laser a 12 pollici. L’originale, ingiallito ma gagliardo, fa bella mostra di sé ai National Archives di Londra. La copia digitale è buona solo per un improvvisato frisbee da ufficio. Dovevano fare la «migrazione» a formati nuovi. Non ci hanno pensato. Fine della storia.