Étiquettes

, , ,

Un contexte

Dans le cadre du master en Sciences de l’Information que nous suivons actuellement à la HEG, nous avons été mandatés pour effectuer un travail de recherche d’une durée d’une année dans un des nombreux domaines relatifs à notre champ d’études.

Débuté en mars 2017, le rendu final du projet est arrêté pour le mois de janvier 2018, et les premiers résultats seront présentés sous forme d’un poster, le 14 décembre 2017, lors d’une session idoine.

Parmi une vingtaine de mandats différents, nous avons choisi de nous consacrer au projet de recherche proposé par le Professeur Patrick Ruch concernant le dépôt d’articles scientifiques, et plus particulièrement les archives institutionnelles suisses.

Les archives institutionnelles

En Suisse, la littérature produite par les chercheurs est généralement publiée sous forme d’articles chez des éditeurs commerciaux. Cependant, il existe aussi des dépôts d’articles au sein des institutions. Celles-ci ont pour vocation d’accueillir, de rassembler et de rendre disponible les publications écrites sous son toit. Il s’agit des archives institutionnelles. Malheureusement, toute la littérature produite dans ces institutions ne s’y trouve pas nécessairement.

Il en résulte plusieurs problèmes : d’une part, ces archives institutionnelles sont dépendantes de l’institution auxquelles elles appartiennent, donc morcelées sur le territoire Suisse, et seuls les établissements les plus fortunés peuvent avoir la chance d’en avoir une suffisamment développée. D’autre part, elles sont souvent incomplètes.

C’est pour ces raisons ainsi que pour s’aligner sur le modèle européen, qu’une stratégie nationale de l’Open Access vient d’être mise en place. Dans ce contexte, il est désormais indispensable de se pencher sur  la possibilité de créer une archive institutionnelle nationale et sa mise en application.

Le projet de recherche

Ainsi, le Professeur Patrick Ruch, nous mandate, afin de se pencher sur ce projet. Notre but est d’estimer et d’évaluer la quantité d’articles scientifiques disponibles dans les archives institutionnelles suisses, ainsi que de développer une stratégie automatique d’acquisition de notices bibliographiques et de texte intégral.

En effet, tous les articles financés par des fonds de recherche suisses sont nécessairement quelque part : dans d’autres sources, comme des archives ouvertes, des bases de données commerciales, des éditeurs etc…

L’idée est d’identifier et d’aller chercher les articles (ou leurs métadonnées) et de quantifier la proportion déjà présente dans les archives institutionnelles. Puis, à terme, proposer une méthode automatique afin de récolter informatiquement ces données. Bien sûr, nous devrons respecter les contraintes de droit d’auteur et d’embargo de publication sur certains articles.

Nous répondrons à trois questions de recherche pour arriver à ce but :

  1. Quelle est la proportion de publications produite par des chercheurs affiliés à des institutions suisses qui se trouve dans les archives institutionnelles suisses ?
  2. Comment identifier les articles issus de fonds de recherche suisse dans les sources internationales (archives ouvertes et plateformes commerciales) ?
  3. Quelle part de la publication suisse absente des archives institutionnelles peut être obtenue automatiquement depuis les sources internationales et comment en systématiser l’acquisition ?

Notre recherche, qui débute maintenant, portera en premier lieu sur l’identification et la description des ressources représentatives qui seront utilisées pour y quantifier les articles suisses. De cette manière nous serons à même de définir un panel à des fins de test de plusieurs dépôts institutionnels et de plusieurs sources internationales.

En second lieu, nous émettrons des recommandations sur l’identification automatique des articles de chercheurs affiliés à des institutions suisses dans des sources internationales et l’automatisation du moissonnage de notices.

Le data management plan

Une partie de cette recherche est également pour nous l’occasion de créer un Data Management Plan (DMP). C’est un outil qui nous permettra de structurer et de cadrer ce que nous allons faire des données de la recherche que nous produirons. Pour ce faire, nous nous poserons des questions concernant la description de nos données, la méthodologie de collecte des données, la méthode de curation des données sélectionnée, la sécurité et la confidentialité des données, le moyen de partage et d’accès aux données, et plus encore…

Nous proposerons donc une solution pour le management plan, ainsi qu’une solution pour l’archivage à court, puis à long terme.

Mais ce sujet à lui seul fera ultérieurement l’objet d’un article de notre part dans ces colonnes.

Elodie Schwob et Matthieu Putallaz