Étiquettes

, , , , , , , , , ,

La plupart des chercheurs ne mettent pas en place une stratégie pour la gestion des données de leur recherche, alors que le Data Management Plan (DMP) devient obligatoire. La description des données est au cœur de ce dernier et exige la précision. Qu’est-ce qu’une donnée de recherche? Qu’est-ce qu’une métadonnée et existe-t-il un standard de description? Sous le prisme de notre projet de recherche, nous essayons ici d’élucider ces interrogations.

Dans le cadre du Master en Sciences de l’information, nous sommes amenées à travailler sur un projet de recherche, expérience qui nous permet d’approfondir des thématiques propres à notre domaine d’études, mais également de prendre connaissance d’une série d’informations et règles concernant la recherche. Au cours des premières semaines, dédiées à la définition du sujet et à l’organisation du travail, le DMP occupe une place centrale, devenant l’objet de longues réflexions.

Il existe plusieurs modèles de DMP, plus ou moins similaires, basés sur un noyau de questions touchant les étapes constitutives de la gestion des données de recherche. Nature, description, partage, stockage, archivage, publication et gestion future des données représentent les points cardinaux de ces documents et ont suscité de longs questionnements. Nous avons, cependant, rencontré quelques difficultés de compréhension pour la partie concernant la description des données.

Les données de notre recherche

Notre projet de recherche Evaluation des sources de veille a pour objectif d’évaluer des sources d’information (moteurs et métamoteurs de recherche) et de mettre en avant leurs attributs, notamment la pertinence des documents retournés et leur “fraîcheur”. Pour ce faire, nous avons mis en place une veille informationnelle concernant différentes thématiques sur plusieurs sources (Google, Bing, DuckDuckGo, etc…). Les documents repérés sur la toile grâce aux requêtes de recherche suivies en flux RSS sont ensuite collectés par l’agrégateur Inoreader.

Nos données de recherche peuvent être classifiées de deux manières. D’une part, nous avons des données dérivées, résultats de nos recherches (flux RSS, liens URL, documents retournés par les moteurs et métamoteurs de recherche et les feuilles CSV d’export), et, d’autre part, des données de simulation (plan de recherche, liste de mots clés et de requêtes ainsi que grille de lecture), modèles créés pour l’organisation et l’évaluation des premières.

Pour une gestion adéquate des données de la recherche, la mise en place d’une stratégie des métadonnées est indispensable, la finalité étant en effet de les rendre accessibles et exploitables par des tiers, ainsi que d’en faciliter l’archivage.

Les métadonnées

Les métadonnées sont un ensemble d’informations structurées qui décrit, explicite, localise une ressource informationnelle dans le but d’en faciliter la recherche, l’usage et la gestion. Elles permettent notamment de renseigner sur:

  • le contenu intellectuel (ex.: titre)
  • le contexte de production ( ex.: date de création)
  • les caractéristiques techniques des fichiers et des données (ex.: format)
  • les propriétés et droits d’usage des données

Accessibilité, interopérabilité et pérennité sont les trois mots clés qui les définissent. En permettant d’effectuer des recherches multicritères, les métadonnées facilitent l’accès à des ressources informationnelles pertinentes (accessibilité). Pour que les données soient réutilisables par d’autres recherches, les métadonnées doivent être lues par l’humain et les machines (interopérabilité). En documentant les migrations d’un système à l’autre et les passages de format, elles participent à l’archivage pérenne des données (pérennité).

Un standard de description

Créé en 1995, le Dublin Core est un standard de métadonnées qui permet la description de ressources physiques et numériques. Il vise à en améliorer la recherche sur le web et à définir des métadonnées communes à différents domaines de recherche à la fois simples et structurées.

Il existe deux formats de Dublin Core, le simple et le qualifié. Le premier définit 15 éléments de description répartis selon trois grands axes: contenu, propriété intellectuelle et instanciation.

DublinCoreSimple

Le deuxième comporte 18 éléments ainsi que des qualificatifs. Les trois éléments supplémentaires sont le public visé, le propriétaire de la ressource et le titulaire des droits sur cette dernière.

Nous avons opté pour le format simple car il nous semble plus accessible, facilement compréhensible, surtout pour des novices de la recherche.

L’élaboration du DMP nous a permis de nous concentrer sur les données de la recherche et leur description et ainsi, nous l’espérons, de mieux les comprendre. Nous avons donc bâti les fondements pour leur gestion, il nous reste maintenant à mettre en œuvre les décisions prises et à poursuivre notre recherche.

Laetizia Sabatini Choquard & Gaia Bongi

Références

ADAMSKI, Muriel, 2017. Les métadonnées pour les nuls. Rever.eu [en ligne]. 2017. [Consulté le 12 août 2017]. Disponible à l’adresse: http://www.rever.eu/fr/blog/les-metadonnees-pour-les-nuls

BURNHAM, M., 2012. Research Data: Definitions, Leicester, 4 septembre 2012 [en ligne]. Leicester: University of Leicester. [Consulté le 15 août 2017]. Disponible à l’adresse: http://www2.le.ac.uk/services/research-data/documents/UoL_ReserchDataDefinitions_20120904.pdf

DATAONE, 2017. Metadata. Dataone.org [en ligne]. [Consutlé le 12 août]. Disponible à l’adresse: https://www.dataone.org/best-practices/metadata

INIST, 2017. Tutoriels. Le libre accès aux résultats de la recherche dans le cadre d’Horizon 2020. Inist.fr [en ligne]. [Consulté le 13 août 2017]. Disponible à l’adresse: http://www.inist.fr/?-Tutoriels-multimedias-H2020-

LERESCHE, Françoise, 2013. Dublin Core: le format de métadonnées requis par le protocole OAI-PMH, Paris, 21 juin 2013 [en ligne]. Paris: BNF. [Consulté le 15 août 2017]. Disponible à l’adresse: http://www.bnf.fr/documents/oai_dublincore.pdf

NCSU Libraries, 2017. Metadata for Data: Data Management Plan. Lib.ncsu.edu [en ligne]. [Consulté le 15 août 2017]. Disponible à l’adresse: https://www.lib.ncsu.edu/data-management/metadata

SCHNEIDER, René, 2016. Données de la recherche. Connaissances de base [document pdf]. Support de cours : Cours « Fondements des sciences de l’information et soutien à la recherche », Haute école de gestion de Genève, filière Information documentaire, année académique 2016-2017

UNIRIS, 2017. Gestion des données de recherche. Unil.ch [en ligne]. [Consulté le 12 août 2017]. Disponible à l’adresse: https://uniris.unil.ch/researchdata/

Image

LERESCHE, Françoise, 2013. Dublin Core: le format de métadonnées requis par le protocole OAI-PMH, Paris, 21 juin 2013 [en ligne]. Paris: BNF. [Consulté le 15 août 2017]. Disponible à l’adresse: http://www.bnf.fr/documents/oai_dublincore.pdf