Le tecnologie linked data si stanno affermando sempre di più nel mondo dei beni culturali: la crescente necessità di adottare strategie comuni di condivisione e valorizzazione del patrimonio, e la volontà di sfruttare il Web per costituire una rete di conoscenza distribuita hanno portato diverse istituzioni ad aprire i propri cataloghi, a renderli accessibili tramite standard di interoperabilità, collegando e arricchendo il contenuto informativo di diverse fonti distribuite nel Web.

Nel mondo linked, ciò avviene per mezzo dello standard RDF, un formalismo secondo il quale tutte le informazioni sono pubblicate nel Web ed espresse nella forma di triple soggetto-predicato-oggetto. Esistono diversi modelli per organizzare le informazioni in RDF: le ontologie di dominio descrivono a questo scopo le entità che popolano un dominio della conoscenza e le relazioni che definiscono i rapporti tra le diverse entità.

In questo contesto, i dati dei cataloghi bibliografici costituiscono una fonte di informazione preziosa sia per la quantità sia per il loro livello di descrizione semantica. Ma il formato MARC alla base del modello catalografico tradizionale non risulta idoneo agli standard di interoperabilità dei linked data: è quindi necessaria l’adozione di nuove ontologie di dominio che consentano di trasformare i dati dei cataloghi nel formato RDF, per favorirne il riuso e la condivisione.

Per soddisfare quest’esigenza nel 2012 la Library of Congress propone BIBFRAME, ontologia per la descrizione bibliografica in ottica linked data, studiato proprio per favorire la transizione dal modello catalografico tradizionale a quello del Web dei dati: BIBFRAME trasforma i cataloghi delle biblioteche in una rete di entità individuate in maniera univoca e collegate tra loro da relazioni qualificate.

Lo spostamento dall’ambiente catalografico tradizionale a un nuovo sistema informativo costituito dai linked data, che vede impegnata la comunità bibliotecaria (dalla Library of Congress, alle biblioteche nazionali di numerosi paesi, agli enti promotori di progetti catalografici internazionali) impone una riflessione approfondita per tutti coloro che creano e diffondono le informazioni bibliografiche per partecipare in modo consapevole a quella che è, se non una rivoluzione, un’evoluzione storica del mondo informativo.M. Guerrini

BIBFRAME modelAl fine di approfondire meglio l’argomento, proponiamo una descrizione del modello BIBFRAME e un’analisi delle differenze che intercorrono tra le due versioni rilasciate dalla Library of Congress (BIBFRAME 1.0 e BIBFRAME 2.0).

BIBFRAME 1.0 è un modello dati che in parte rispecchia quello di FRBR (i Functional Requirements for Bibliographic Records redatti nel 1998 dall’IFLA); pone al centro della descrizione le singole entità e non il record nel suo complesso; permette la distinzione tra i diversi livelli concettuali che caratterizzano l’ambito bibliografico, dal contenuto concettuale di più alto livello alle sue manifestazioni, cioè tra l’opera e le istanze dell’opera; consente di identificare un’entità in maniera non ambigua e di mostrare le relazioni tra le entità specificando la natura della correlazione, ed è basato su:

bibframe e FRBR

  • Opera: l’essenza concettuale della risorsa catalogata (riferibile all’opera e all’espressione di FRBR);
  • Istanza: manifestazione individuale dell’opera;
  • Authority: identificazione delle entità in relazione con l’opera o con l’istanza (come ad es. enti, famiglie, persone);
  • Annotazioni: tutti gli elementi che arricchiscono le risorse descritte con ulteriori informazioni (es. immagini di copertina o recensioni).

La struttura generale del modello pone l’opera al centro del grafo in relazione al creatore, al tema trattato e collegata all’istanza in cui si manifesta, che è a sua volta associata a un editore, luogo e formato di riferimento (o meglio alla modalità di fruizione come ad es. edizione cartacea, edizione online, e-book, etc.).

Bibframe2

Nel 2016 viene lanciato BIBFRAME 2.0.

La nuova versione del modello prevede l’organizzazione delle informazioni relative a una determinata risorsa in tre livelli:

  • Opera: il livello che riflette l’essenza concettuale della risorsa, come ad es. titolo, autore, lingua, argomento.
  • Istanza: permette di identificare una specifica manifestazione dell’opera, riportando ad es. informazioni sull’editore, il luogo e la data di pubblicazione.
  • Item: questo nuovo livello rispetto alla versione precedente del modello identifica una specifica copia fisica o digitale di un’istanza, consentendo di registrare anche le informazioni relative alla collocazione della copia e al codice associato, estendendo così la ricerca più in profondità.

Inoltre, l’ontologia definisce le relazioni tra le 3 classi principali e le seguenti classi:

  •  Agenti: persone, enti e organizzazioni collegate a un’opera o un’istanza da un ruolo specifico (come ad es. autore, compositore, editore).
  • Soggetti: i vari temi che un’opera può affrontare e contenere al suo interno.
  • Eventi: può riferirsi ad es. alla fase di registrazione di un lavoro multimediale.

Come si evince dalle immagini, il modello consente di collegare le varie classi (Opera, Istanza, Item) attraverso l’uso di specifiche proprietà.

Queste specificano le caratteristiche della risorsa che si sta descrivendo e la natura delle relazioni che le riguardano, ad es. un’opera può essere una traduzione di una specifica opera, oppure possono descrivere gli attributi delle classi, ad es. la proprietà soggetto rappresenta un attributo importante di un’opera.

Il progetto Linked Open Data del CoBiS è una delle prime iniziative in Italia che ha adottato il modello BIBFRAME 2.0, la prima a pubblicare un endpoint SPARQL (http://dati.cobis.to.it/sparql) organizzato secondo questa ontologia.

Si tratta di un progetto di data integration, in cui i dati bibliografici di 12 biblioteche sono stati convertiti dai formati eterogenei dei cataloghi locali (MARC, UNIMARC, Dublin Core, CSV custom) in triple RDF secondo le ontologie BIBFRAME 2.0 e schema.org. Il grafo RDF del CoBiS rappresenta ora in un unico formato tutti i dati bibliografici forniti dalle biblioteche aderenti al progetto.

Grazie a un processo di interlinking, le entità degli autori sono state collegate con fonti esterne disponibili sul Web esposte in linked open data, come Wikidata e VIAF. In questo modo, è possibile attingere a informazioni provenienti dalla Linked Open Data Cloud, estendendo il contenuto informativo del patrimonio iniziale. Ad esempio le pagine Web degli autori del portale del CoBiS sono generate in automatico attraverso query SPARQL, in cui le informazioni biografiche e un elenco di risorse interconnesse sono recuperate in tempo reale da Wikidata e da altri repository bibliografici (VIAF, Wikidata, LoC, Deutsche National Bibliothek GND, Bibliotheque Nationale de France BNF, Servizio Bibliotecario Nazionale – SBN, Dizionario Biografico degli Italiani DBI).

Il resto del portale, interamente realizzato grazie a tecnologie linked, consente di esplorare i cataloghi, visualizzare i dettagli provenienti dall’OPAC e tutte le triple della risorsa (attraverso il pulsante RDF disponibile sulle pagine) constatando come è avvenuta la traduzione dei dati bibliografici in linked data.

Eccetto qualche integrazione, le proprietà utilizzate seguono il vocabolario di BIBFRAME 2.0, ad esempio nel caso di un’istanza:

rdf
Esempio di file RDF disponibile sulla piattaforma
  • istanceOf;
  • classification;
  • dimension;
  • hasItem;
  • language;
  • subject;
  • title.

In questo contesto BIBFRAME 2.0 costituisce un importante strumento per integrare dati bibliografici provenienti da fonti eterogenee, connetterli con altre risorse disponibili nel Web, consentendo alle biblioteche di rendere i propri cataloghi disponibili in rete secondo standard interoperabili, e quindi riutilizzabili per fornire nuovi servizi agli utenti del Web.

Esplora il portale CoBiS e per saperne di più visita la nostra pagina dedicata al progetto.