L’Accademia delle Scienze di Torino ha avviato nel 2006 un progetto di digitalizzazione delle opere custodite, mettendo a disposizione alcuni pregiati documenti e numerosi volumi a stampa di argomento scientifico, prodotti da scienziati italiani ed europei, per consentirne la consultazione online in favore della libera conoscenza.
Oggi, tutto questo è possibile!
Su richiesta dell’Accademia, abbiamo lavorato alla realizzazione della Teca digitale, inserendo i file dei libri digitalizzati on line sul sito dell’Accademia.
Quali sono i retroscena di questo lavoro?
Per soddisfare questa curiosità Davide Allavena risponde ad alcune domande, raccontando i dettagli del lavoro effettuato.
Qual era il materiale a disposizione?
Il materiale da cui è partito il nostro lavoro consiste in una cartella di immagini in formato TIFF di ottima qualità corredata dei metadati che descrivono la relativa opera (titolo, autore, editore, data e indice dei contenuti) in formato XML/OAIS.
Perché la scelta di Internet Archive?
Obiettivo di questo progetto era minimizzare l’infrastruttura tecnologica necessaria per fornire una teca digitale e contemporaneamente garantirne la durata nel tempo, fattore per cui Internet Archive (IA) costituisce una garanzia di alto livello.
Infatti, le immagini e il reader dei libri provengono da IA, invece relativamente alla struttura tecnologica si è ricorso a un agile sito scritto in Node.js che incorpora un motore di ricerca e si integra perfettamente nel sito dell’Accademia delle Scienze di Torino rendendo le esigenze tecniche ridottissime.
Come abbiamo caricato i libri su Internet Archive?
Innanzitutto abbiamo registrato un account su Internet Archive. Successivamente abbiamo scaricato ed installato le librerie Python 2.7 per fare l’upload automatizzato su IA.
L’installazione è facile e qui potete trovare una guida.
Le scansioni dei libri che ci ha fornito l’Accademia delle Scienze sono TIFF di ottima qualità. Quindi per velocizzare il processo di caricamento abbiamo compresso le scansioni di ciascun libro in formato ZIP che abbiamo chiamato identificativoLibro_images.zip
.
Tramite il bot abbiamo creato le istanze dei libri corredati dei metadati principali estratti dai file XML/OAIS e abbiamo aggiunto l’archivio di immagini.
Come abbiamo aggiunto le informazioni all’indice? 
OpenLibrary è una iniziativa di Internet Archive che ha come obbiettivo quello di costruire una biblioteca digitale. Creando un istanza di libro su OpenLibrary e collegandolo alla relativa opera su IA l’indice dei contenuti viene visualizzato nel “bookreader” di IA migliorandone la fruizione.
Purtroppo al momento la creazione delle opere su OpenLibrary non può essere completamente automatizzata, ma siamo in contatto con gli sviluppatori per rendere disponibile a tutti il caricamento automatizzato di informazioni.
Come daremo visibilità alle opere dell’Accademia delle Scienze di Torino su Internet Archive?
Le opere verranno inserite sulla piattaforma all’interno di una collezione creata ad hoc in modo da trovare facilmente i libri dell’Accademia e leggere la descrizione del progetto che ne ha permesso il caricamento.
Come valore aggiunto, avendo già a disposizione sul sito del CoBiS i dati forniti delle opere conservate dall’Accademia, sarà possibile integrare e collegare questi dati con i libri pubblicati sulla Teca aggiungendo l’URI di riferimento corrispondente su Archive. Questo consente, secondo i principi dei linked data, l’arricchimento automatico e progressivo dei dati rilasciati che confluiranno nella crescente rete della libera conoscenza, consentendone il dialogo con i dati forniti da altre fonti esterne.

Qual è il pregio di aver lavorato a questo progetto?
Contribuire attivamente ad ampliare la rete della conoscenza libera e il piacere di entrare in contatto direttamente con testi di grande valore storico-scientifico come una delle prime litografie (dispense di formule scritte a mano per ovviare la complessità e i costi dell’uso dei caratteri mobili) del matematico Augustin-Louis Cauchy concessa dall’Accademia, disponibile e liberamente fruibile sul sito.