Mots-clefs

, , , , , , , ,

Le Data Management Plan (DMP), ou plan de gestion des données, fait parler de lui dans la communauté scientifique. S’inscrivant dans le mouvement de l’Open Science et requis par certains bailleurs de fonds lors de la soumission d’une requête, il est en passe de devenir incontournable. Pour les chercheurs, enthousiastes ou frileux, le temps n’est plus à l’indifférence.

Mais de quoi parle-t-on au juste? Quelle application d’un DMP peut-on faire dans le cadre d’une recherche menée par des étudiants de Master? Quels en seront les apports concrets?

Quoi?

Si la locution Data management plan peut faire peur, il faut bien comprendre que parler d’un DMP c’est parler d’un document de quelques pages seulement, ayant trait à la collecte, la gestion, le partage et l’archivage des données de recherche, pendant la durée d’un projet et après son terme.

Les novices en la matière s’inspireront simplement des nombreux modèles disponibles en ligne (comme ceux proposés par le Digital Curation Centre), dont la structure varie mais pas le contenu.

blog_illustrations_22

Ceux qui craignent de ne pouvoir répondre d’emblée à toutes les questions découlant du DMP doivent être rassurés. Ce document n’est pas gravé dans le marbre mais amené à évoluer au fil du projet et de la réflexion du chercheur. Sa version finale n’est due que lorsque la recherche est achevée.

Qui, quand, pourquoi?

Dans le cadre du Master en Sciences de l’Information de la HEG, nous avons choisi de travailler sur un projet intitulé “Panorama et modélisation d’identifiants pérennes pour la création d’identités de confiance”, sous la supervision du professeur René Schneider.

Notre projet nous amène à:

  • rédiger un état de l’art sur les identifiants pérennes existants
  • concevoir un panorama visuel et esthétique de ces identifiants
  • étudier les tendances en termes d’identifiants pérennes et d’identités de confiance
  • esquisser un système d’allocation d’identifiants pérennes en Suisse

Comment?

Notre plan de gestion des données reprend la structure de DMP proposée par David Shotton, s’efforçant de répondre aux 20 questions proposées par l’auteur. Rassurez-vous, nous n’allons pas passer en revue l’ensemble de nos réponses, mais plutôt nous attarder sur quelques points notables.

  • Nature des données et formats

Les données collectées sont de trois types: données de référence (déjà traitées, annotées et/ou publiées par des pairs), données dérivées ou compilées (issues de traitement de données brutes) et données de simulation (modélisation). Elles prennent des formes diverses: textuelles, numériques, visuelles et modèles.

Nos formats de travail sont les formats .doc, .xls et .ai (image vectorielle), mais nous gardons à l’esprit que des formats ouverts sont préférables pour l’archivage à long terme, afin de garantir une meilleure accessibilité de nos données. Différentes versions de nos documents de collecte sont également exportées en format .pdf et .jpeg afin d’éviter toutes pertes ou modifications.

  • Création des métadonnées

Chaque série de données possédera des métadonnées inspirées du standard Dublin Core. Ces métadonnées doivent être suffisamment précises; elles ont un vrai rôle à jouer puisqu’elles permettront à d’autres chercheurs de comprendre l’origine de nos données et éventuellement de les réutiliser.

  • Stockage des données et sauvegardes

Pour éviter toute perte fâcheuse, nos données seront stockées sur plusieurs supports: Google Drive (notre espace commun de travail), ordinateurs personnels et disque dur externe (pour les sauvegardes hebdomadaires générales). La sauvegarde sera effectuée pour chaque nouvelle version. Ce système de stockage et de sauvegardes, bien que non pérenne, nous paraît suffisant pour un usage à court terme.

  • Archivage

La question de l’archivage reste en suspens. En effet, à ce stade du projet, nous n’avons pas une vue précise de la quantité de données collectées, ni des données à archiver à long terme.

La nature de l’entrepôt en charge de cet archivage reste également à préciser même s’il nous semble déjà clair que ce trusted repository devrait être situé en Suisse, attribuer des DOIs et exposer les métadonnées descriptives au moissonnage grâce au protocole d’interopérabilité des archives ouvertes (OAI-PMH).

Notre DMP contient donc encore des questions ouvertes. Quoi de plus normal pour un document évolutif? Nous le complèterons dans les prochains mois.

blog_illustrations_23

Quelles attentes pour notre projet?

Loin d’être un exercice de style, plus ou moins contraint, ou un acte de partage désintéressé envers la communauté scientifique, le DMP a une vraie plus-value pour le chercheur qui s’y attelle.

En effet, si le DMP a pour objet d’“offrir une perspective à long terme en définissant de quelle manière les données seront générées, collectées, documentées, partagées et préservées” (FNS, 2016) et de permettre la reproductibilité des résultats scientifiques, pour nous, c’est d’abord la garantie de se poser les bonnes questions dès le début du travail de recherche.

Ainsi, l’élaboration du DMP nous a permis de déterminer précisément sur quels supports nous allions travailler, sous quels formats, le mode de collecte de nos données, leur classement, leur description et de régler la question cruciale de la conservation. En somme, le DMP nous a fourni l’opportunité de coordonner notre travail pour avancer le plus efficacement possible. Si, en plus, nos données peuvent à l’avenir être utiles à d’autres, le bénéfice sera total.

Aurélie Jaquet, Lise Lefort & Kate Espasandin

Références

BIBLIOTHÈQUE NATIONALE DE FRANCE (BNF), 2016.  Dublin Core. bnf.fr [en ligne]. 21 décembre 2016. [Consulté le 18.08.2017]. Disponible à l’adresse: http://www.bnf.fr/fr/professionnels/formats_catalogage/a.f_dublin_core.html

FNS – Fonds national suisse de la recherche scientifique, 2016. Data Management Plan (DMP) – Directives pour les chercheuses et chercheurs. snf.ch [en ligne]. 2017. [Consulté le 10.06.2017]. Disponible à l’adresse : http://www.snf.ch/fr/leFNS/points-de-vue-politique-de-recherche/open_research_data/Pages/data-management-plan-dmp-directives-pour-les-chercheuses-et-chercheurs.aspx

INIST-CNRS, 2017. Tutoriels «Le libre accès aux résultats de la recherche dans le cadre d’Horizon 2020». Inist.fr [en ligne]. 2017. [Consulté le 11 juin 2017]. 11 mai 2017 Disponible à l’adresse: http://www.inist.fr/donnees/co/module_Donnees_recherche_35.html

JONES, Sarah, 2011. How to Develop a Data Management and Sharing Plan. dcc.ac.uk [en ligne]. 8 septembre 2011. [Consulté le 16.08.2017]. Disponible à l’adresse : http://www.dcc.ac.uk/resources/how-guides/develop-data-plan#Examples

SHOTTON, David, 2012. Twenty Questions for Research Data Management. Data management planning [en ligne]. 7 mars 2012. [Consulté le 20 mai 2017]. Disponible à l’adresse : https://datamanagementplanning.wordpress.com/2012/03/07/twenty-questions-for-research-data-management/

VAN DE SOMPEL, Herbert, TRELOAR, Andrew, 2014. A Perspective on Archiving the Scholarly Web Proceedings of iPres, Melbourne [en ligne]. Octobre 2014. [Consulté le 13.04.2017]. Disponible à l’adresse : http://public.lanl.gov/herbertv/papers/Papers/2014/iPres2014_Sompel_Treloar.pdf

 

Publicités