Grazie al lavoro delle community online e al contributo di numerosi enti culturali che hanno deciso di aprire e rendere accessibili i propri cataloghi, oggi il Web rappresenta una fonte inesauribile di open data relativi al patrimonio culturale.
Si tratta di un’immensa mole di informazioni che fa del Web una rete di conoscenza distribuita, in cui però le informazioni sono disperse in una miriade di fonti diverse, che non sono collegate tra di loro e devono essere consultate una per una.
Immaginate di poter collegare i vostri cataloghi a queste fonti esterne e di poter arricchire il vostro sistema informativo o sito Web con le informazioni provenienti da queste fonti: dati biografici degli autori, elenchi di opere accessibili online, immagini e altre risorse multimediali, coordinate geografiche dei luoghi.
Sembra complicato? Collegare i dati non è mai stato così facile: OLAF è la nostra soluzione.
Che cos’è OLAF?
Si tratta di una piattaforma di crowdsourcing per allineare in modo semiautomatico basi di dati diverse.
OLAF consente di individuare con procedimenti automatici probabili relazioni di identità tra le informazioni contenute in un catalogo e le risorse pubblicate sul Web, secondo la tecnologia Linked Data.
Tramite un’interfaccia grafica, queste ipotetiche relazioni di identità vengono sottoposte alla validazione manuale degli operatori culturali. Dopo la validazione, i collegamenti vengono salvati nel catalogo, e diventa possibile arricchire il patrimonio informativo originario con informazioni provenienti da altre fonti, fornendo la possibilità di ampliare e contestualizzare le informazioni della ricerca.
Come funziona OLAF?
L’interfaccia che abbiamo realizzato mostra una lista delle entità potenzialmente equivalenti: la lista viene generata in modo automatico attraverso una query alle fonti esterne con cui si preferisce collegare il proprio catalogo. Tra le fonti di maggiore interesse ci sono naturalmente Wikidata e VIAF, ma il software può essere configurato per interrogare qualsiasi altra fonte collegata alla Linked Open Data Cloud.
Le entità proposte sono corredate di informazioni di contesto che agevolano l’operatore nell’analisi e nell’eventuale validazione dell’equivalenza in modo semplice, direttamente dall’interfaccia. L’operatore potrà quindi confrontare le entità del proprio catalogo con quelle presenti sul Web, supportato dalla presenza di immagini, metadati biografici, elenchi di opere e link alle pagine di siti Web esterni che riportano ulteriori informazioni (ad esempio, tra i casi più utili, voci di enciclopedie e dizionari biografici o elenchi di opere di un autore).
OLAF si rivela particolarmente utile per risolvere casi di ambiguità, in quanto consente di selezionare manualmente le entità che le operazioni di allineamento automatico non sono in grado di gestire in sicurezza.
Ad esempio, nel caso di omonimia, OLAF restituirà tra i risultati diverse entità che riportano lo stesso nome, ma fornendo quelle informazioni aggiuntive che consentono all’operatore di individuare il contesto e decidere se validare la relazione di uguaglianza tra le entità proposte.
Come si collegano le risorse?
Attraverso un processo di interlinking che consente di definire/determinare relazioni di identità tra le proprie risorse e le risorse affini appartenenti a fonti esterne pubblicate secondo i principi Linked Data.
Tutti questi dati strutturati e collegati confluiscono nella Linked Open Data Cloud, una rete di basi di conoscenza aperte, collegate tra loro e in costante crescita.
In questo caso ruolo fondamentale è ricoperto dai codici identificativi, chiamati Uniform Resource Identifier (URI), una sequenza di caratteri, simile nella forma a un URL, che identifica universalmente ed in modo univoco una risorsa nel Web; l’entità risulta così inequivocamente identificata non solo nel dominio di appartenenza, ma anche in rete.
I codici identificativi delle risorse (ad es. di un libro o un autore) sono importanti perché costituiscono la chiave per stabilire relazioni di uguaglianza tra i dati appartenenti a fonti diverse e allineare i dati di un ente alle basi di conoscenza della Linked Open Data Cloud.
Se il catalogo da allineare è un database Linked Data, l’equivalenza tra le risorse stabilita tramite l’interfaccia di OLAF viene salvata collegando con una specifica proprietà il codice identificativo dell’entità soggetta a validazione al codice identificativo della risorsa esterna.
Il software è comunque configurabile per collegare database o formati di diverso tipo, non necessariamente esposti secondo le tecnologie Linked Data.
Qual è il valore aggiunto/perché usare OLAF?
Configurando OLAF per i propri dati sarà possibile cercare legami e collegamenti con le risorse aperte di altre fonti collegate alla Linked Open Data Cloud.
Stabilire l’uguaglianza tra entità appartenenti a fonti diverse porta alla convergenza delle informazioni e quindi a incrementare il potenziale informativo iniziale di ciascuno.
Le informazioni provenienti da fonti esterne (come Wikidata e VIAF) possono essere recuperate in tempo reale tramite interrogazioni eseguite in rete: grazie al miglioramento progressivo e l’incremento degli open data disponibili sul Web sarà quindi possibile ampliare e migliorare in modo automatico i propri dati nel tempo.
In sintesi l’uso di OLAF porta a:
- allineare gli authority file;
- arricchire le informazioni grazie ai collegamenti esterni con Wikidata, SBN e VIAF;
- agevolare i propri utenti a reperire le informazioni supportate da un contesto informativo che si aggiorna ogni qual volta Wikidata viene arricchita (periodicamente gli utenti della community modificano o aggiungono informazioni alle varie entità, quindi ad esempio l’aggiunta di un’immagine in automatico sarà integrata alle informazioni delle basi di dati collegate);
- migliorare la qualità dei propri dati.
Per saperne di più sull’applicazione di OLAF contattaci e/o visita le pagine del progetto CoBiS e LCA e i nostri prodotti.