Workflow e processi web per l'analisi dei dati ecologici

workflowLe attività di Information Communication Technology (ICT) ricoprono un ruolo sempre più predominante anche nelle discipline come l'ecologia e la biologia, così come in un meno recente passato è avvenuto in modo consistente in campi come la medicina, l’astronomia o la genetica. In queste l’organizzazione dei dati in maniera standardizzata, la produzione di servizi di accesso, download e discovery dei dati attraverso il web risultano primari nella realizzazione e mantenimento a lungo termine di una rete scientifica moderna.

Proposte per organizzare infrastrutture tecnologiche adatte a supportare e migliorare le attività quotidiane di ricerca sono state fatte in passato, numerosi progetti nazionali e internazionali di ricerca sono stati realizzati e molti passi avanti sono stati fatti nella creazione di strumenti informatici adatti alle esigenze di comunità molto specifiche.

La legislazione Europea e i recepimenti nazionali hanno introdotto, rendendole obbligatorie, regole per catalogare e condividere i dati ambientali al fine di evitare duplicazioni e poter usare dei sistemi di ricerca delle informazioni semplici ed efficienti.

La prospettiva attuale è quella in cui una prima base per una Scienza Orientata ai Servizi (Service Oriented Science, cf. [1]) appare matura tanto da consentire un approccio architetturale distribuito nel web. Là dove servizi web per l’accesso alle informazioni stanno trovando linguaggi comuni (standard internazionali, e.g. OGC, ISO, W3C) e, anche in campo ecologico, si affacciano servizi web per il processamento dell’informazione, il passo possibile è quello di utilizzare tali risorse per realizzare elaborazioni di dati ecologici e ambientali.

I workflow scientifici, ossia i flussi impliciti di lavorazione seguiti nella produzione di elaborazioni scientifiche, che dal dato e dalle competenze degli attori coinvolti portano a nuova conoscenza, possono essere formalizzati (per esempio mediante il formalismo delle reti di Petri ) e, tramite software appositi, possono essere eseguiti da macchine, quando i singoli passi dell’elaborazione siano codificati e resi disponibili. Nella prospettiva delle nascenti infrastrutture per la ricerca ecologica (e.g. iniziative a cui partecipa IREA quali LifeWatch, LTER Europa), questi passaggi possono essere svolti da risorse distribuite in rete e i workflow essere implementati come orchestrazioni dei servizi esistenti.

La ricerca svolta da IREA in questo ambito si propone l’integrazione degli standard interoperabili con i framework per la composizione di workflow scientifici esistenti (e.g. orchestrazioni implemementate con l'ambiente software Taverna, sviluppo di servizi di processo con interfacce standard OGC WPS) e lo studio di nuovi paradigmi di interazione con l’utente nelle fasi di composizione e di esecuzione dei workflow (sviluppo di applicazioni web da integrare nel flusso di lavoro, con interazioni avanzate per azioni run-time eseguite dall’utente). Le competenze trasversali rappresentate in IREA (ecologiche, informatiche, modellistiche e di formalizzazione matematica) concorrono a questa attività che ha portato a proposte sullo sviluppo di ambienti di ricerca virtuali e laboratori virtuali nell’ambito della nascente infrastruttura di ricerca LifeWatch.

-        [1] I. Foster, “Service-oriented science” Science, vol. 308, pp. 814–817, 2005