Linked Open Data

Visualizza articoli per tag: Linked Open Data

Mercoledì, 22 Febbraio 2012 10:16

Infrastrutture interoperabili per i geodati

L'ambito di studio delle Infrastrutture interoperabili per i geodati è di grande attualità tanto che alcuni testi di letteratura contemporanea - citiamo ad esempio Il Sentiero Luminoso, Wu Ming 2, Ediciclo Editore (2016) - ne prendono in prestito acronimi e glossario per arricchire le proprie pagine, renderle attuali e curiose.

L'attività di IREA in questo settore nasce dall'esigenza di usare Internet per diffondere ed elaborare i prodotti geospaziali delle proprie ricerche, si tratti di mappe digitali che derivano dall'osservazione satellitare della terra o di osservazioni raccolte da sensori sul campo.

 

ale-lauraAnche il mondo dei Sistemi per l'Informazione Geografica (GIS) non ha potuto sottrarsi al processo di 'webbizzazione' che ormai investe molti ambiti. Internet si è imposta come nuova piattaforma di sviluppo anche per i dati geospaziali dettando le regole del loro utilizzo.
Il web non si presta, infatti, ad applicazioni monolitiche controllate da un unico venditore: il suo approccio è quello di un sistema senza padroni, basato su insiemi precisi di standard di riferimento. Internet richiede inoltre un'operatività non vincolata ai sistemi posseduti da ciascun utente; questa caratteristica prende il nome di interoperabilità ed è alla base dei sistemi complessi che prendono il nome di infrastrutture interoperabili per i geodati (SDI, Spatial Data Infrastructure).

I ricercatori IREA di questo gruppo, lavorano in stretto contatto con i loro colleghi esperti di dominio, quali geologi, ecologie e limnologi, nel tentativo di coniugare il più possibile tecnologie e strumenti IT di avanguardia con requisiti e pratiche di chi crea e usa dati e informazioni in settori specifici della ricerca, quali il telerilevamento satellitare, l'ecologia, la biologia, la geologia, ecc.
IREA, in questo momento, si occupa dello sviluppo di infrastrutture di dati spaziali soprattutto nei settori dell'ecologia e della biologia, nell'ambito di ricerche marine, lacustri e terrestri.

Tale attività di ricerca si svolge nell'ambito di diverse iniziative internazionali. Tra le varie ricordiamo: la direttiva europea INSPIRE, il Programma Copernicus/GMES della Commissione Europea, GEO-GEOSS e l'Open Geospatial Consortium (OGC).
Giovedì, 06 Marzo 2014 09:24

Linked Data e ontologie

lod-cloud 1000pxLinked Data (dati connessi) rappresenta un paradigma di accesso ai dati che si è diffuso negli ultimi anni e che ha lo scopo di facilitare l'accesso all'informazione da parte di agenti automatizzati (software). Linked Data (spesso abbreviato in LD) ha un potenziale di diffusione del tutto analogo a quello del World Wide Web in quanto sfrutta il medesimo principio, l'interconnessione attraverso indirizzi accessibili attraverso il protocollo HTTP (HyperText Transfer Protocol, protocollo di trasferimento di ipertesti).

Il principio è molto semplice: così come i contenuti web possono essere connessi tra loro attraverso l'identificatore che troviamo nella barra degli indirizzi di un browser (e che troviamo visualizzato come "link" all'interno della pagina), allo stesso modo blocchi di dati possono riferire l'un l'altro associando ad essi indirizzi univoci. Prerequisito per l'accesso ad un dato in modalità LD è quindi l'associare ad esso un identificatore, un URI (Uniform Resource Identifier, identificatore uniforme di risorsa) e consentire il suo scaricamento attraverso il protocollo HTTP. Il termine Linked Open Data (LOD) aggiunge ai LD la connotazione di dati aperti, liberamente accessibili.

Al fine di rendere il dato non solo accessibile, ma anche comprensibile ad un agente automatizzato (associare, cioè, una "semantica" al dato) è tuttavia necessario disporre di un modello generale per la rappresentazione dei dati, costituito dal Resource Description Framework (RDF). Ulteriori linguaggi, sempre espressi secondo il modello definito da RDF, consentono poi di definire schemi di dati con elevata espressività: RDF Schema (RDFS) e Web Ontology Language (OWL).

Gli schemi definiti secondo questi ultimi formalismi, tipicamente identificati col termine "ontologie", consentono di modellare strutture dati con un livello di dettaglio più fine rispetto al modello relazionale (comunemente applicato nei comuni RDBMS) e al modello XML. Inoltre, le ontologie consentono di superare l'interpretazione "a mondo chiuso" dei modelli precedenti e di realizzare strutture dati che possano essere interpretati secondo la logica "a mondo aperto" che contraddistingue il Web Semantico.

Linked Data e ontologie rappresentano quindi gli strumenti per accedere e strutturare, rispettivamente, dati connessi tra loro e caratterizzati da una semantica specifica. Ad esempio, accedendo via HTTP all'indirizzo http://sp7.irea.cnr.it/rdfdata/project/IREA, si ottiene il blocco di dati RDF funzionali a descrivere IREA all'interno del progetto RITMARE, che è trascritto nella seguente figura:

codicerdf irea
 

Nella figura precedente, le righe 1-6 definiscono alcune abbreviazioni per i "namespaces" (prefissi di URI) utilizzati in seguito, in modo da semplificare la notazione. La riga 8 descrive quale tipo di entità è rappresentata nei dati, ovvero un "agente" (in questo caso una istituzione) scondo il vocabolario Friend Of A Friend (FOAF). La linea 9 definisce una etichetta intelligibile per le persone. Infine, la riga 10 identifica il dato che rappresenta la chiave pubblica che è stata associata ad IREA in RITMARE. Le righe 12-23 specificano i dati associati alla chiave pubblica, mentre la riga 25 e seguenti riportano gli identificatori (gli URI) associati alle persone di IREA che fanno parte del progetto RITMARE.

Queste informazioni vengono utilizzate per l'autenticazione di IREA presso l'infrastruttura che si sta creando. Ulteriori informazioni nel formato RDF vengono utilizzate per altri scopi, quali la metadatazione assistita di risorse, per la ricerca delle risorse fornite dai diversi partner e, piu' in generale, per la gestione dell'infrastruttura nel suo complesso, come mostrato nella seguente figura:

ritmare bubble

IREA utilizza le tecnologie del Web Semantico nell'ambito del progetto RITMARE, nello specifico nel Sottoprogetto 7, per la realizzazione della infrastrutture di dati spaziali.

Pubblicato in Elenco metodologie

inspireIREA ha una pluriennale esperienza nell'implementazione e utilizzo di geo-servizi sul Web per le infrastrutture di dati spaziali (SDI) nell'ambito della Direttiva Europea INSPIRE (2007), esperienza maturata in passato nel corso di progetti internazionali come AWARE e IDE-Univers.

L'architettura e i geo-servizi sono ormai ben noti, diffusi, codificati e implementati in quanto rispondono ad esigenze di base nel trattamento dell'informazione geografica, principalmente di cartografia e tematismi. La specifica dell'interfaccia dei geoservizi è definita dal Consorzio OpenGeospatial (OGC). Un esempio è Web Map Service (WMS), che abilita la visualizzazione e la sovrapposizione simultanea su Internet di geodati o campi fisici rappresentati da mappe raster* provenienti da più server diversi e distribuiti. WMS è un servizio per geodati; i servizi per geo-operazioni invece non sono associati a dati specifici: essi implementano un certo algoritmo per derivare nuovi dati dagli input forniti e realizzano operazioni di tipo geografico o spaziale, per es. calcolano il centroide di un poligono, l'estensione spaziale di un'immagine digitale, eseguono trasformazioni di coordinate, applicano un modello, ecc.

In questo contesto IREA ha sviluppato geoservizi autonomi che permettono di ospitare e distribuire i geodati prodotti dalla ricerca di Istituto. L'articolo "OGC Web Services in the workflow of a research Institute dealing with Remote Sensing data", presentato alla Int. Conf. on Data flow: from Space to Earth, Venezia (Italy), 21-23 March 2011, descrive la metodologia adottata per creare l'infrastruttura di Istituto.

I servizi sviluppati in IREA seguono gli standard OGC e sono: servizi di catalogo o CSW (Catalogue Service on the Web) che permettono di cercare i dati distribuiti attaverso i loro metadati; servizi di accesso di tipo WMS (Web Map Service), WFS (Web Feature Service) e WCS (Web Coverage Service). Sono stati inoltre sviluppati servizi di elaborazione o WPS (Web Processing Service) e sperimentate catene di servizi di tipologie diverse per permettere l'utilizzo online di modelli idrologici di previsione delle portate di bacini Alpini (progetto AWARE). Per tutti questi servizi sono stati sviluppati clienti che permettono agli utenti di usufruirne le potenzialità sul Web.

* Nel contesto WMS una "mappa" è una immagine raster del dato piuttosto che il dato stesso, nel senso che il dato associa valori ai pixel mentre la "mappa" WMS si limita a visualizzare un colore o tono di grigio

Pubblicato in Elenco metodologie