Spieghiamo i dati come non li avete mai visti.

Immaginiamo un mondo in cui le informazioni siano organizzate come dati in relazione tra loro, identificati univocamente, interpretabili e trattabili dalle macchine, arricchiti e facilmente accessibili.

Quel che abbiamo immaginato è il sogno di Tim Berners-Lee e può essere realizzato attraverso le tecniche Linked Data.

Cosa sono i Linked Data? a cosa servono e come si producono?

Protagonisti di un ampio dibattito, i Linked Data costituiscono la tecnologia alla base del Semantic Web e nello specifico si tratta di un modo diverso di gestire e pubblicare i dati che, strutturati e collegati tra loro, costruiscono un reticolo informativo sempre più ampio consentendo una maggiore divulgazione e fruizione dei dati, interconnessi e reperibili attraverso query semantiche.

Facciamo un passo indietro…

Per spiegare cosa sono i Linked Data, dobbiamo prima introdurre ed esaminare il concetto di Semantic Web: 

“Una rete di cose nel mondo, descritta dai dati sul Web“.

Da questa definizione di Tim Berners-Lee possiamo estrapolare riferimenti importanti come:

  • la rete;
  • gli oggetti in relazione tra loro;
  • i dati non più intesi come record ma come singoli elementi.

Web tradizionaleIn particolare, quest’ultimo riferimento è fondamentale perché determina la differenza principale tra il Web, costituito da documenti HTML, e il Semantic Web, costituito invece da oggetti descritti attraverso i dati e quindi dotati di significato.

Quest’evoluzione da un Web basato su documenti a una rete di dati interconnessi consente di connettere non solo pagine HTML, ma nello specifico concetti tra loro, leggibili dall’uomo e disponibili anche in formati leggibili dalla macchina.

Infatti, ormai conosciamo tutti i collegamenti ipertestuali che consentono di spostarsi da un sito a un altro, da un documento all’altro, in cui però il significato della relazione che intercorre tra i link delle pagine collegate risulta interpretabile per gli umani, ma non per le macchine.Web dei dati

Da qui l’idea di potenziare questo sistema di collegamenti attribuendo un’etichetta che permetta di specificare la natura delle relazioni, per consentire una maggiore profondità di ricerca sia per le persone sia per le macchine, facilitati nel reperimento di dati appartenenti a fonti diverse attraverso interrogazioni semantiche automatizzate.

Questo è possibile solo se ai dati viene conferita una struttura attraverso il formalismo standard chiamato Resource Description Framework (RDF), che consente la descrizione dei dati, identificati univocamente, attribuendogli un valore e definendo la specifica relazione che intercorre tra loro seguendo la struttura della tripla Risorsa-Proprietà-Valore.

Si comprende, quindi, che la tecnologia Linked Data nasce con lo scopo di favorire l’interoperabilità, tra fonti di dati eterogenee pubblicate sul Web, grazie all’uso di una struttura semplice, di identificatori univoci (URI – Uniform Resource Identifier) e vocabolari condivisi.

LOD Cloud

Il formalismo RDF consente l’interpretazione da parte delle macchine, gli URI consentono di identificare una risorsa unica a livello globale a cui è possibile agganciare tutti i relativi collegamenti evitando una dispersione di informazioni, mentre ontologie e vocabolari controllati di stabilire le modalità di relazione in base ai domini di riferimento

Per comprendere meglio questo concetto introduciamo il progetto Linked Open Data Cloud, dal quale emerge anche l’importanza della libera condivisione dei dati, spesso ostacolata da vincoli culturali, legali e/oeconomici.

Tutti i collegamenti tra i dataset pubblicati secondo le specifiche Linked Data vengono rappresentati sotto la forma di una nuvola denominata LOD cloud diagram, in continua espansione.

Esplorando la nuvola si possono indagare le relazioni tra i diversi dataset, ad esempio riguardo la loro dimensione geografica GeoNames è il dataset di riferimento.

 

La grande nuvola consente di capire l’ampio raggio di applicabilità dei Linked Data ai vari contesti della vita quotidiana, in altri post abbiamo iniziato già a svelare perchè sono importanti, qual è il loro valore aggiunto, ma cosa altro si può fare? …continueremo a parlarne nei prossimi post.

 

Per saperne di più esplora i nostri progetti.