A partire dalla situazione che in questo momento stiamo vivendo, la quale ha contribuito a rendere tutti più consapevoli del valore che il digitale assume nei vari ambiti, è possibile affermare che nel 2020 non è più sufficiente solamente pubblicare le informazioni del patrimonio culturale online, certamente utile per la consultazione di una risorsa senza doversi recare in loco, ma diviene fondamentale potenziarli adottando dei modi per rendere questi dati interoperabili (ad esempio manualmente collegando i dati con OLAF) e riutilizzabili, al fine di ampliare la rete di conoscenza aperta distribuita sul web.

Per approfondire l’argomento abbiamo chiesto al nostro collega Davide Allavena, Data Scientist, di parlarne per individuare metodologie e conseguenti vantaggi.

Infatti, nell’ambito dei progetti a cui abbiamo preso parte, abbiamo lavorato molto per collegare cataloghi esterni a Wikidata e creare interfacce per il collegamento manuale (OLAF); questo contribuisce positivamente a creare un database distribuito della conoscenza culturale mondiale, con Wikidata come hub centrale e i vari dataset della Linked Open Data Cloud, e rilasciando i dati collegati con OLAF, contribuisce a supportare lo studio dei ricercatori per costruire algoritmi che in un futuro breve permetteranno la riconciliazione automatica delle informazioni della Linked Open Data Cloud.

Cos’è OLAF

 

Interfaccia OLAF

Open Linked Authority Files è uno strumento per l’allineamento di dati appartenenti a fonti diverse di conoscenza in modo semiautomatico.

Consente di identificare relazioni di uguaglianza tra i dati di un determinato catalogo e le fonti già pubblicate sul Web, seguendo le tecniche Linked Data.

Attraverso un’interfaccia all’operatore vengono sottoposte delle entità che potrebbero essere uguali da verificare e validare in maniera manuale. Una volta effettuata la validazione, le entità collegate vengono salvate nel catalogo e possono essere arricchite da informazioni di contesto provenienti da altre fonti esterne collegate alla Linked Open Data Cloud.

Per chi è indicato OLAF? Per tutte le istituzioni culturali che da un lato, internamente al loro catalogo, vogliono migliorare i loro dati interlinkandoli ad altre fonti esterne.

Perché è fondamentale

OLAF si inserisce nel contesto che coinvolge tutti gli enti culturali che vogliono espandere la conoscenza presente sui loro cataloghi ed abilitarsi all’intervento dell’AI (se oggi insegni alla macchina a riconoscere che Galileo registrato sul tuo catalogo è lo stesso Galileo presente nelle altre basi di conoscenza aperta pubblicate sul web, dopo sarà possibile perfezionare, rendere più efficiente e intuitivo il metodo per l’interlinking).

Costituisce un passo verso l’addestramento delle macchine e lo studio di algoritmi che riconcilieranno in automatico le risorse, c’è quindi un doppio vantaggio: collegando direttamente un catalogo alla Linked Data Cloud, e quindi creando una base di conoscenza aperta, questa servirà anche per testare gli algoritmi che in futuro potranno riconoscere in automatico relazioni di uguaglianza tra i dati.

L’AI nel Cultural Heritage è un argomento molto conosciuto e ci sono grandi aziende che si stanno muovendo in questa direzione.

Quali vantaggi comporta l’utilizzo di OLAF

Linked Open Data Cloud

Il lavoro di interlinking con OLAF comporta due vantaggi: uno immediato e uno a lungo termine.

Vantaggio immediato

Da un lato consente di creare subito un dataset collegato, permettendo quindi analisi numeriche quantitative che prima non erano possibili (es. numeriche del progetto CoBiS), permette di aumentare le informazioni che si possono estrarre dal catalogo, come ad esempio l’influenza culturale degli autori del catalogo? i luoghi della formazione degli scrittori nel tempo? chi erano gli advisor di dottorato degli autori presenti sul catalogo?

Vantaggio a lungo termine

Dall’altro lato, consente di costruire una Knowledge base, un training set open, che abilita i ricercatori a costruire, grazie a questi dati, algoritmi che automaticamente riconoscono se due entità sono la stessa entità e quindi a individuare relazioni di uguaglianza.

I risultati

OLAF “guarda avanti”, gli operatori culturali degli enti con cui collaboriamo lo hanno iniziato ad usare e l’effetto del lavoro svolto inizia a manifestarsi; infatti, già due grandi enti (CoBiS e Fonoteca Nazionale Svizzera) con cui abbiamo collaborato hanno caricato i loro dati anche su Wikidata, essendo già dotati dei loro identificativi, e questo comporta uno scambio di informazioni che allarga ancora di più la dimensione del database distribuito.

Come abbiamo detto, questo strumento è fondamentale per costruire conoscenza sulla base dei cataloghi già esistenti e tutto il lavoro di collegamento manuale che è stato fatto non rimarrà fine a se stesso perché sta contribuendo a costruire un training set open per permettere in un futuro breve la costruzione di algoritmi che permettano l’allineamento automatico tra basi di conoscenza diverse (nel caso specifico Wikidata, Arco, CoBiS).

Stiamo generando, quindi, dei dataset aperti che saranno utili per i ricercatori al fine di creare conoscenza non solo a livello di dati, ma anche di algoritmi

Il tema dell’AI per la preservazione, condivisione, per ampliare le connessioni e favorire l’accesso alla cultura direttamente dal web è molto sentito e tanti sono i progetti nel mondo.

Noi, ad esempio, collaboriamo da anni con enti culturali per accrescere e valorizzare i dati dei loro cataloghi, collegandoli ai dati affini, corredandoli di dati che contribuiscano a collocarli in un contesto storico, artistico e letterario, operato che siamo lieti di raccontare per condividere la nostra esperienza, per confrontarci su nuove soluzioni innovative, sempre pronti ad intraprendere sempre nuove sfide.

Per saperne di più o scambiare idee continuate a leggere il nostro blog o contattateci.