Mots-clés

, ,

Dans ce troisième et dernier billet de blog, nous vous faisons part d’une partie des résultats de notre recherche. Le premier objectif de cette dernière était de trouver des outils que les chercheurs puissent utiliser pour traiter et gérer leurs données tout au long de leur cycle de vie ; le second, de modéliser une chaîne de services pour les bibliothécaires – dans le cas présent, celles de la HES-SO. Nous avons élaboré deux solutions, une à court terme, pouvant être mise rapidement en application, et une, à long terme. Nous exposons dans ce billet la solution à long terme.

Pour rappel, les données de la recherche peuvent être définies comme des « enregistrements factuels (chiffres, textes, images et sons), qui sont utilisés comme sources principales pour la recherche scientifique et sont généralement reconnus par la communauté scientifique comme nécessaires pour valider des résultats de recherche » (Définition de l’OCDE).

Nous donnons ici une vue d’ensemble de notre démarche.

Méthodologie

1) Nous avons commencé par dresser une liste d’outils destinés aux chercheurs. Ces outils correspondent à une ou plusieurs des étapes du cycle de vie des données de la recherche, tel qu’il a été défini par le UK Data Archive. Cette liste contenait alors une cinquantaine d’outils, dont la moitié servait à l’analyse et à la visualisation de données.

Nous avons décidé par la suite de ne pas les prendre en compte, pour nous concentrer sur ceux qui étaient utiles pour la préparation des données avant la recherche, la gestion, le stockage, le partage et le stockage des données pendant la recherche, ainsi que sur les outils qui permettent de les préparer à l’archivage définitif, à la publication et à la réutilisation, après la recherche.

2) Élaboration d’une grille contenant des critères sur la base desquels nous avons tenté de sélectionner un outil pour chacune de ces trois phases. Les critères principaux et discriminants étaient :

– hébergement en Suisse

– open source

– reconnu par un/ des bailleurs de fonds importants (FNS et H2020)

D’autres critères ont encore été établis sur la base des exigences ou recommandations de ces bailleurs de fonds. Nous nous sommes également référées au guide du Data Curation Centre pour les dépôts.

3) Sélection des outils en appliquant ces critères.

Résultats

Avant la recherche 

Depuis l’automne 2017, le FNS, bailleur de fonds principal des chercheurs de la HES-SO, a une nouvelle exigence: les chercheurs doivent désormais rédiger un Data Management Plan à annexer à leur proposition de recherche. Le Data Management Plan sert à organiser et à prévoir la gestion des données tout au long d’une recherche. Il existe des outils en ligne qui peuvent les aider dans la composition de document, tels que DMPtool et DMPonline. Notre sélection a déterminé que DMPonline était le plus reconnu aussi au niveau international, que ce soit par des institutions académiques ou des bailleurs de fonds, et qu’il peut être adapté au contexte de la Suisse. D’ailleurs, la France a déjà réalisé cette adaptation en créant leur propre outil, OPIDoR, sur la base du code source de DMPonline.

Grâce à cet outil, le chercheur pourra donc créer un DMP, puis générer un PDF à poster sur la plateforme de candidature du FNS, MySNF.

Pendant la recherche 

Pendant la recherche, les chercheurs doivent pouvoir stocker à court et moyen terme, partager les fichiers de données entre les membres d’une équipe, sauvegarder et documenter les données, notamment par l’ajout de métadonnées, afin de les préparer à l’archivage. Nous avons donc sélectionné trois types d’outils permettant d’accomplir ces actions. Pour le stockage et le partage, celui correspondant le mieux à nos critères s’avère être SWITCHdrive, dont nous avons parlé précédemment. Ensuite, en ce qui concerne la sauvegarde des données, la meilleure solution reste de disposer d’un serveur local au sein de l’institution et de proposer aux chercheurs des espaces de stockage. Enfin, la préparation des données à l’archivage définitif et leur versement dans un dépôt peuvent se faire au moyen de deux logiciels de l’entreprise suisse Docuteam : Docuteam Packer et Docuteam Feeder.

Après la recherche 

Il existe deux types de dépôts pour l’archivage des données : ceux institutionnels et ceux ouverts aux données provenant de diverses institutions. Parmi les dépôts du deuxième type, il y a des solutions comme Zenodo ou Dryad, qui sont recommandés par le FNS. Néanmoins, l’un des critères de notre travail de recherche étant l’hébergement en Suisse, il ne reste aucun dépôt de ce type dans notre sélection. Les back-up de Zenodo se trouvent en effet en Hongrie. La solution qui paraît la plus sensée, pour le moment, est d’étendre le dépôt existant, ArODES, basé sur Invenio, et développé par TIND technologies, aux données de la recherche.

Le tableau ci-dessous résume ces résultats.

tableau_résultat_longue_duree_billet3_HR_VP

 

Publicités