ENTE
Dipartimento di Filosofia e Scienze dell'Educazione di UniTO

PROGETTO
LCA. Intellectual networks, themes, individuals

PERIODO
2017 - in corso

I dati della corrispondenza per ricostruire la rete intellettuale di Leibniz

La corrispondenza di Leibniz rappresenta una parte importante della sua opera: tra i 50mila manoscritti conservati presso la Gottfried Wilhelm Leibniz Bibliothek di Hannover, si contano 15mila lettere che il filosofo tedesco ha indirizzato ad alcune delle più importanti personalità dell’epoca.
Il progetto Leibniz’s Correspondents and Acquaintances ha lo scopo di ricostruire la rete intellettuale di Leibniz a partire dalle informazioni deducibili dal suo epistolario.
I ricercatori di UniTO e i partner internazionali del progetto LCA hanno compilato una lista di circa 1630 corrispondenti, i cui profili sono stati individuati consultando fonti bibliografiche e database online. Il progetto prevede, a partire dalle voci della lista, la realizzazione di un dizionario biografico dei Corrispondenti e Conoscenti di Leibniz. A questa fase parteciperanno circa 200 autori di voci biografiche, molti dei quali membri delle società leibniziane affiliate al progetto.

Il nostro lavoro consiste nell’integrare i metadati biografici con gli open data provenienti da fonti online, mettere a disposizione degli autori delle biografie gli strumenti per consultare e modificare i dati strutturati e per scrivere i testi, e infine pubblicare i risultati del progetto.

Il popolamento della knowledge base

Abbiamo installato un’istanza di Wikibase, il software sviluppato dalla Wikimedia Foundation per gestire la knowledge base di Wikidata, e la abbiamo configurata sulla base di un’ontologia in grado di ospitare i dati già raccolti.

Il primo popolamento della piattaforma ha riguardato due basi di dati eterogenee, la prima sviluppata dai ricercatori di UniTO e dai partner di LCA, la seconda risultante dall’attività di estrazione di dati da fonti web. Abbiamo configurato software custom (BOT) per l’automatizzazione del data entry su Wikibase, basandoci sul progetto open source wikidata-edit.

Architettura del progetto Leibnitiana

Perchè Wikibase

Sono diverse le motivazioni che hanno condizionato la scelta del CMS. Avevamo bisogno di uno strumento in grado di rappresentare una knowledge base complessa ed estendibile, che si potesse facilmente convertire in Linked Data; avevamo bisogno di aggiungere i contenuti sia con operazioni automatiche sia manualmente, tramite un’interfaccia grafica.

Interfaccia di Wikibase

Wikibase soddisfa tutti questi requisiti. Rappresenta le informazioni sotto forma di dichiarazioni (statement) di tipo soggetto-predicato-oggetto facilitando in questo modo la mappatura dei dati in triple RDF. Ciascuna dichiarazione può essere reificata e annotata di conseguenza: essa diventa soggetto di una nuova tripla mediante la quale è possibile, per esempio, indicare la fonte o specificare una qualità della dichiarazione stessa. Abbiamo valutato che la possibilità di descrivere le informazioni in maniera così granulare fosse un requisito importante per un progetto che integra informazioni diverse (talvolta discordanti) e ha a che fare con dati complessi e potenzialmente imprecisi (pensiamo in questo caso alle date).

Essendo un’estensione di MediaWiki, Wikibase è caratterizzata da un sistema di gestione degli utenti, dei permessi e dei log; inoltre espone un’interfaccia direttamente editabile dagli utenti. Utenti e amministratori possono non solo valorizzare i campi, ma anche estendere l’ontologia creando nuove entità e proprietà per mezzo di un semplice edit.

L’insieme di queste caratteristiche fa di Wikibase uno strumento che avvicina la tradizionale attività di data entry manuale alla produzione e modifica diretta di Linked Data. Grazie a un sistema completamente automatizzato infatti, basato su un progetto open source, i dati della knowledge base sono triplificati e sincronizzati con un triplestore RDF, interrogabile tramite un endpoint SPARQL.

Data enrichment

Una volta convertito in RDF il database di LCA può essere sottoposto a operazioni di interlinking con i Linked Open Data di altre basi di dati.

Abbiamo a questo scopo sviluppato OLAF, una piattaforma di crowdsourcing che supporta l’interlinking semiautomatico. Analizzando i dati di diverse knowledge base esposte secondo il formalismo RDF, OLAF individua automaticamente potenziali relazioni di identità tra i corrispondenti di Leibniz e soggetti presenti in fonti esterne (in questo caso Wikidata e VIAF). Tali relazioni sono state sottoposte a verifica manuale e, se validate, sono state annotate in Wikibase (e di conseguenza nel triplestore RDF di LCA) sotto forma di relazioni di identità di tipo owl:sameAs.

OLAF piattaforma di crowdsourcing

Il workflow e le schede dei corrispondenti

Abbiamo predisposto due strumenti a disposizione degli autori delle biografie: la Wikibase e le schede dei corrispondenti.

Ogni autore avrà accesso, tramite login, alla Wikibase dove potrà consultare ed eventualmente modificare i dati biografici già caricati, aggiungere nuove informazioni, e scrivere i testi delle biografie grazie a un link a una pagina di MediaWiki, opportunamente configurata in base a un tempate.

Ad ogni voce biografica corrisponderà una scheda di corrispondente: una pagina web alimentata da query SPARQL live verso il triplestore di LCA e verso i Linked Open Data di altre basi di dati (in base alle indicazioni degli interlink già individuati). In questo modo le schede dei corrispondenti si configurano sia come ulteriori strumenti di consultazione (oltre alle proprie modifiche, l’autore potrà visualizzare direttamente i dati biografici provenienti da nuove fonti o essere rimandato alle voci dei corrispondenti in enciclopedie biografiche online) che come strumento di pubblicazione finale del progetto.

Le schede dei corrispondenti sono attualmente in fase di sviluppo.