• xmlui.mirage2.page-structure.header.title
    • français
    • English
  • Help
  • Login
  • Language 
    • Français
    • English
View Item 
  •   BIRD Home
  • LAMSADE (UMR CNRS 7243)
  • LAMSADE : Publications
  • View Item
  •   BIRD Home
  • LAMSADE (UMR CNRS 7243)
  • LAMSADE : Publications
  • View Item
JavaScript is disabled for your browser. Some features of this site may not work without it.

Browse

BIRDResearch centres & CollectionsBy Issue DateAuthorsTitlesTypeThis CollectionBy Issue DateAuthorsTitlesType

My Account

LoginRegister

Statistics

Most Popular ItemsStatistics by CountryMost Popular Authors
Thumbnail

Découvrabilité et réutilisation de données produites par des workflows : un cas d’usage en génomique

Gaignard, Alban; Skaf-Molli, Hala; Belhajjame, Khalid (2021), Découvrabilité et réutilisation de données produites par des workflows : un cas d’usage en génomique, Journées Francophones d'Ingénierie des Connaissances (IC) Plate-Forme Intelligence Artificielle (PFIA'21), 2021-06, Bordeaux, FRANCE

View/Open
actes_IC_CH_PFIA2021_73-80.pdf (220.5Kb)
Type
Communication / Conférence
Date
2021
Conference title
Journées Francophones d'Ingénierie des Connaissances (IC) Plate-Forme Intelligence Artificielle (PFIA'21)
Conference date
2021-06
Conference city
Bordeaux
Conference country
FRANCE
Metadata
Show full item record
Author(s)
Gaignard, Alban
Skaf-Molli, Hala cc
Belhajjame, Khalid
Abstract (FR)
Les systèmes de workflows ont largement contribué à améliorer la reproductibilité des expériences scientifiques. Cependant, relativement peu de travaux ont porté sur la réutilisation des données produites au cours de l’exécution. Dans cet article, nous faisons l’hypothèse que ces données intermédiaires doivent être considérées comme des objets de premier ordre, qui doivent être conservés et publiés. Non seulement cela permettra d’économiser des ressources de calcul et de stockage, mais surtout cela facilitera et accélérera l’évaluation de nouvelles hypothèses. Pour aider les scientifiques à annoter ces données, nous exploitons plusieurs sources d’information : i) les informations de provenance capturées lors de l’exécution des workflows, et ii) les annotations de domaine qui sont fournies par des catalogues sémantiques d’outils, tels que Bio.Tools. Finalement, nous montrons, sur un scénario réel de bioinformatique, comment des graphes de provenance peuvent être transformés et résumés, à destination des utilisateurs et des machines.
Abstract (EN)
Workflow systems have played an important role in facilitating the reproducibility of scientific experiments, yet, litttle work has been devoted to enhance the reuse of produced data. We argue that these intermediate data should be considered as first-order objects, which are worthy of preservation and publication. Not only will this save computational resources, but more importantly it will ease and accelerate the evaluation of new hypotheses. To help scientists annotate such produced data, we exploit multiple sources of information : i) provenance information captured during the execution of workflows, and ii) domain annotations provided by semantic catalogs of tools, such as Bio.Tools. Finally, we show, on a real bioinformatics scenario, how provenance graphs can be transformed and synthesized, for human and machine use.
Subjects / Keywords
FAIR; reproducibility; scientific workflows; reproductibilité; workflows scientifiques

Related items

Showing items related by title and author.

  • Thumbnail
    Découvrabilité et réutilisation de données produites par des workflows : un cas d’usage en génomique 
    Gaignard, Alban; Skaf-Molli, Hala; Belhajjame, Khalid Communication / Conférence
  • Thumbnail
    Findable and reusable workflow data products: A genomic workflow case study 
    Gaignard, Alban; Skaf-Molli, Hala; Belhajjame, Khalid (2020) Article accepté pour publication ou publié
  • Thumbnail
    SHARP: Harmonizing and Bridging Cross-Workflow Provenance 
    Gaignard, Alban; Belhajjame, Khalid; Skaf-Molli, Hala (2017) Communication / Conférence
  • Thumbnail
    Scientific workflows for computational reproducibility in the life sciences: Status, challenges and opportunities 
    Cohen-Boulakia, Sarah; Belhajjame, Khalid; Collin, Olivier; Chopard, Jérôme; Froidevaux, Christine; Gaignard, Alban (2017) Article accepté pour publication ou publié
  • Thumbnail
    CORVETTE: a cooperative workflow for virtual teams coordination 
    Baïna, Karim; Charoy, François; Godart, Claude; Grigori, Daniela; El Hadri, Saad; Skaf, Hala; Akifuji, S.; Sakaguchi, Toshiaki; Seki, Yoko; Yoshioka, Masaichiro (2004) Article accepté pour publication ou publié
Dauphine PSL Bibliothèque logo
Place du Maréchal de Lattre de Tassigny 75775 Paris Cedex 16
Phone: 01 44 05 40 94
Contact
Dauphine PSL logoEQUIS logoCreative Commons logo