Mots-clefs

, , , , , ,

La gestion des données de la recherche pose de nombreuses questions. Ce billet est pour nous l’occasion de décrire les informations principales renseignées dans un data management plan (DMP) : quelles seront les données collectées durant notre projet de recherche ? De quelle manière souhaitons-nous les partager avec le reste de la communauté scientifique ? Enfin, comment envisageons-nous leur gestion et leur archivage ?

Un projet sur l’évaluation de plateformes de veille

Dans le cadre du Master en Sciences de l’information, nous sommes mandatées pour réaliser un projet de recherche. Encadrées par Mme Madinier, notre étude, portant sur l’évaluation de plateformes de veille, s’inscrit dans le cadre d’un projet plus large, le projet webSO+. Notre recherche, de type exploratoire, proposera pour la première fois d’évaluer des plateformes non pas selon les fonctionnalités proposées, mais selon la qualité des résultats retournés.

Le data management plan : un document en passe de devenir obligatoire

Dès octobre 2017, tout chercheur suisse devra fournir un document précisant la manière dont seront gérées les données de la recherche avant, pendant et après le projet (FNSNF 2017). Plusieurs modèles existent pour la réalisation de ce document. Pour notre part, nous avons décidé de répondre aux vingt questions du chercheur David Shotton.

The DCC Curation Lifecycle Model : les étapes du cycle de vie
des données pour une curation et une préservation optimale

lifecycle_web

Source : http://www.dcc.ac.uk/resources/curation-lifecycle-model /

Des données de quelle nature ?

Nos données seront nouvelles, car créées durant notre projet. Elles sont de natures différentes :

  • Les données collectées sur les plateformes sont des données compilées, de nature en partie révisable, car elles sont le reflet de ce qui existe sur le web.
  • Les grilles d’évaluation créées pour évaluer ces données collectées s’apparentent à des données de type « simulation », le modèle d’évaluation des données étant plus important que les données en elles-mêmes (Schneider sans date).

Comment partager les données ? : la question des droits d’auteur

Désireuses que nos données soient libres d’accès et de réutilisation pour tous, nous avons dû nous poser au préalable la question des droits d’auteur.

Tout d’abord, nous devons considérer les auteurs à l’origine des données collectées depuis le web. Bénéficiant du cadre de l’exception de citation et de celui de la recherche et de l’enseignement, nous pouvons diffuser sans restriction les titres et URL de ces données.

Par ailleurs, nous avons dû nous assurer que les plateformes ne réclameraient pas de droits pour la création de recueils de données, auquel cas nous aurions dû nous soumettre à certaines restrictions de diffusion.

Enfin se pose la question de nos propres droits concernant les grilles d’évaluation que nous allons créer. Afin de permettre la diffusion et la réutilisation de nos données, nous avons fait le choix du copyright CC BY.

L’active data management : l’enjeu de la sécurité

Tout au long de notre projet, nos données seront stockées sur les disques durs de nos ordinateurs, mais aussi dans le cloud, pour en garantir une sauvegarde optimale. Pour ce faire, nous utiliserons le service Dropbox.

Les données collectées sur les plateformes étant en partie révisables, se pose l’enjeu de la fréquence d’exportation. Cependant, pour des questions de faisabilité (nous ne pouvons pas prévoir la volumétrie des données collectées), nous sommes aujourd’hui dans l’incapacité de communiquer cette information.

Zenodo : pour un archivage à court terme

Afin de permettre à la communauté scientifique d’accéder et de réutiliser rapidement nos données, il nous a paru opportun de faire le choix d’une solution pour un archivage à court terme.

Zenodo, développé par le CERN, est intéressant car :

  • il affecte automatiquement un DOI à chacun des documents déposés,
  • il utilise le protocole OAI-PMH permettant l’interopérabilité des archives ouvertes,
  • il permet de créer et de gérer des communautés en permettant la définition des droits d’accès aux données (Pôle Digitalist 2017).

Cependant, c’est un entrepôt dont l’archivage est géré par une machine, encore incapable d’assurer les mêmes tâches que les professionnels de manière automatique. Ainsi, nous devons envisager une autre solution pour l’archivage à long terme.

Quel entrepôt pour l’archivage à long terme ?

Après avoir effectué des recherches sur OpenDOAR, il apparaît qu’il n’existe pas d’entrepôt de données en Suisse pour le domaine des sciences de l’information. Le projet suisse DLCM proposera à terme une solution à ce sujet.

A ce stade du projet, nous poursuivons donc nos réflexions. Nos données n’étant pas de nature sensible, il nous serait possible de les déposer dans un entrepôt en dehors de la Suisse. Ainsi, trois entrepôts de notre domaine ont pu être identifiés et contactés. Nous attendons leur réponse.

Floriane Minana & Fanny Quiquerez

Sources

A propos des licences – Creative Commons. Creativecommons.org [en ligne]. [Consulté le 13 mai 2017]. Disponible à l’adresse : https://creativecommons.org/licenses/?lang=fr

FONDS NATIONAL SUISSE DE LA RECHERCHE SCIENTIFIQUE (FNSNF), 2017. Open Research Data : les requêtes devront inclure un plan de gestion des données. Snf.ch [en ligne]. [Consulté le 20 mai 2017]. Disponible à l’adresse : http://www.snf.ch/fr/pointrecherche/newsroom/Pages/news-170306-open-research-data-bientot-une-realite.aspx

PÔLE DIGITALIST (DLH), 2017. Datapartage – Déposer dans Zenodo-Inra. Inra.fr [en ligne]. [Consulté le 13 mai 2017]. Disponible à l’adresse : https://www6.inra.fr/datapartage/Partager-Publier/Valoriser-ses-donnees/Deposer-dans-Zenodo-Inra

SCHNEIDER, René, [sans date]. Données de la recherche : connaissances de base [document PDF].

Support de cours : Cours “M1C1 – Fondements des sciences de l’information et soutien à la recherche”, Haute école de gestion de Genève, filière information documentaire, année académique 2016-2017

SHOTTON, David, 2012. Twenty Questions for Research Data Management. Data management planning [en ligne]. 7 mars 2012. [Consulté le 20 mai 2017]. Disponible à l’adresse : https://datamanagementplanning.wordpress.com/2012/03/07/twenty-questions-for-research-data-management/

UNIL, Université de Lausanne, 2017. Réaliser un Data Management. Unil.ch [en ligne]. [Consulté le 13 mai 2017]. Disponible à l’adresse : https://uniris.unil.ch/researchdata/sujet/realiser-un-data-management-plan/

Publicités