Linked Data e ontologie

lod-cloud 1000pxLinked Data (dati connessi) rappresenta un paradigma di accesso ai dati che si è diffuso negli ultimi anni e che ha lo scopo di facilitare l'accesso all'informazione da parte di agenti automatizzati (software). Linked Data (spesso abbreviato in LD) ha un potenziale di diffusione del tutto analogo a quello del World Wide Web in quanto sfrutta il medesimo principio, l'interconnessione attraverso indirizzi accessibili attraverso il protocollo HTTP (HyperText Transfer Protocol, protocollo di trasferimento di ipertesti).

Il principio è molto semplice: così come i contenuti web possono essere connessi tra loro attraverso l'identificatore che troviamo nella barra degli indirizzi di un browser (e che troviamo visualizzato come "link" all'interno della pagina), allo stesso modo blocchi di dati possono riferire l'un l'altro associando ad essi indirizzi univoci. Prerequisito per l'accesso ad un dato in modalità LD è quindi l'associare ad esso un identificatore, un URI (Uniform Resource Identifier, identificatore uniforme di risorsa) e consentire il suo scaricamento attraverso il protocollo HTTP. Il termine Linked Open Data (LOD) aggiunge ai LD la connotazione di dati aperti, liberamente accessibili.

Al fine di rendere il dato non solo accessibile, ma anche comprensibile ad un agente automatizzato (associare, cioè, una "semantica" al dato) è tuttavia necessario disporre di un modello generale per la rappresentazione dei dati, costituito dal Resource Description Framework (RDF). Ulteriori linguaggi, sempre espressi secondo il modello definito da RDF, consentono poi di definire schemi di dati con elevata espressività: RDF Schema (RDFS) e Web Ontology Language (OWL).

Gli schemi definiti secondo questi ultimi formalismi, tipicamente identificati col termine "ontologie", consentono di modellare strutture dati con un livello di dettaglio più fine rispetto al modello relazionale (comunemente applicato nei comuni RDBMS) e al modello XML. Inoltre, le ontologie consentono di superare l'interpretazione "a mondo chiuso" dei modelli precedenti e di realizzare strutture dati che possano essere interpretati secondo la logica "a mondo aperto" che contraddistingue il Web Semantico.

Linked Data e ontologie rappresentano quindi gli strumenti per accedere e strutturare, rispettivamente, dati connessi tra loro e caratterizzati da una semantica specifica. Ad esempio, accedendo via HTTP all'indirizzo http://sp7.irea.cnr.it/rdfdata/project/IREA, si ottiene il blocco di dati RDF funzionali a descrivere IREA all'interno del progetto RITMARE, che è trascritto nella seguente figura:

codicerdf irea
 

Nella figura precedente, le righe 1-6 definiscono alcune abbreviazioni per i "namespaces" (prefissi di URI) utilizzati in seguito, in modo da semplificare la notazione. La riga 8 descrive quale tipo di entità è rappresentata nei dati, ovvero un "agente" (in questo caso una istituzione) scondo il vocabolario Friend Of A Friend (FOAF). La linea 9 definisce una etichetta intelligibile per le persone. Infine, la riga 10 identifica il dato che rappresenta la chiave pubblica che è stata associata ad IREA in RITMARE. Le righe 12-23 specificano i dati associati alla chiave pubblica, mentre la riga 25 e seguenti riportano gli identificatori (gli URI) associati alle persone di IREA che fanno parte del progetto RITMARE.

Queste informazioni vengono utilizzate per l'autenticazione di IREA presso l'infrastruttura che si sta creando. Ulteriori informazioni nel formato RDF vengono utilizzate per altri scopi, quali la metadatazione assistita di risorse, per la ricerca delle risorse fornite dai diversi partner e, piu' in generale, per la gestione dell'infrastruttura nel suo complesso, come mostrato nella seguente figura:

ritmare bubble

IREA utilizza le tecnologie del Web Semantico nell'ambito del progetto RITMARE, nello specifico nel Sottoprogetto 7, per la realizzazione della infrastrutture di dati spaziali.