Étiquettes
audit, évaluation, bibliothèque, bibliothèques universitaires, bibliothécaire, big data, blog, cycle de vie des données, data asset framework, data curation cycle, Data management, données de recherche, Gestion de données, management, MasterID, méthodologie, numérique, recherche, séminaire, Virginia Tech
La gestion des données (en anglais : data management) est un sujet qui semble se développer de plus en plus depuis l’arrivée de l’ère numérique. Que l’on soit une grande université ou une petite entreprise, il faut trouver le moyen pour gérer l’augmentation exponentielle de ses données.
A la Virginia Tech (Institut polytechnique et Université d’état de Virginie), aux Etats-Unis, quatre bibliothécaires ont mené un audit afin d’évaluer les propriétés des données numériques de leur bibliothèque. Elles ont détaillé leur démarche dans l’article « Data management inside the library : Assessing electronic ressources data using the data asset framework methodology » dont il est question ici.
Les auteurs, Andi Ogier, Monena Hall, Annette Bailey et Connie Stovall, sont les quatre bibliothécaires qui ont mené à bien l’audit d’évaluation des propriétés des données de la bibliothèque de la Virginia Tech. Elles occupent chacune une fonction différente au sein de l’établissement ce qui leur a permis d’apporter chacune leur expertise lors de l’audit.
Le Data Asset Framework
Pour conduire l’évaluation, les bibliothécaires se sont appuyées sur une méthodologie existante, le Data Asset Framework (DAF). Ce procédé a été développé en 2008 par le Humanities Advanced Technology and Information Institute pour répondre à la problématique du « big data » en se centrant précisément sur les données de recherche. Ce genre d’outils naît du besoin de connaître et de comprendre la nature et le contexte des données. Si le DAF concerne précisément les données de recherche, il semble également important de traiter les données de façon plus générales et notamment les données dans de grandes institutions telles que la bibliothèque de la Virginia Tech. Ce besoin s’intensifie avec l’arrivée du numérique qui a considérablement modifié le rôle de la bibliothèque et complexifié la structure de ses collections. La question de la gestion des données se pose de plus en plus et la création de politiques permet de commencer à y répondre. Il semble cependant utile d’agrémenter ces bonnes pratiques avec un traitement plus traditionnel, ce que le DAF permet de faire.
La Méthodologie
Cette méthodologie DAF en 4 étapes est accessible en ligne et sa description détaillée permet aisément de l’appliquer et de l’adapter à divers contextes. Le DAF original propose de commencer par une planification de l’audit. Il s’agit ensuite d’identifier et de classifier les propriétés des données à l’aide d’un outil en ligne (accessible sur le site). La troisième étape est une évaluation plus détaillée, toujours en s’aidant de l’outil en ligne, des principales propriétés afin d’en tirer un protocole de gestion. L’audit se conclut par un rapport et des recommandations.
Méthodologie Data Asset Framework. Disponible à l’adresse: http://www.data-audit.eu/methodology.html
L’Adaptation
Dans le cas de la Virginia Tech, une étape préliminaire a permis de sélectionner l’équipe qui mènerait l’audit en prenant soin de regrouper des bibliothécaires spécialisées dans des domaines différents. Il a également été décidé de focaliser l’évaluation sur les données numériques car elles présentent la plus grande diversité à tous les niveaux (format, typologie, provenance, etc.). L’étape de planification a été appliquée de la façon conseillée par le DAF. Elle a donné lieu à un rapport initial décrivant en détail le déroulement et les bienfaits attendus de l’audit. Une telle évaluation permetant principalement d’assurer le respect du cycle de vie des données. Les auteurs ont ensuite procédé à l’adaptation des formulaires et à la passation des entretiens. L’évaluation des données a été faite dans un premier temps par des responsables de la bibliothèque lors de séances d’une heure non-préparées à l’avance. Cela a permis d’identifier des grands groupes de propriétés qui ont été affinés par les quatre spécialistes. Cet audit a donné lieu à des recommandations et à un rapport final décrivant une vingtaine de propriétés de données jugées pertinentes et améliorant la gestion interne.
Conclusions
Le fait d’utiliser une méthodologie existante a permis aux auteurs de pouvoir mener leurs entretiens sans trop de préparation préalable si ce n’est quelques petits ajustement dans les questionnaires. En plus du gain de temps considérable, le DAF a offert un cadre structuré applicable par quelqu’un d’instruit sans forcément qu’il soit un expert en recherche.
Mener des entretiens auprès de responsables a permis de sensibiliser la direction à la problématique de la gestion des données. Cette prise de conscience à un niveau relativement élevé de la hiérarchie est un bon moyen d’accélérer le processus d’amélioration de la gestion des données. Il paraît effectivement plus facile de faire descendre une information le long d’une structure hiérarchique que de la faire remonter.
Cet article nous amène, une fois de plus, à nous poser la question du rôle des bibliothécaires et plus généralement des spécialistes de l’information dans la recherche. Nous l’oublions parfois, il est donc important de le rappeler : les spécialistes de l’information peuvent et doivent prendre part à des recherches afin de contribuer à l’amélioration du traitement et de la mise à disposition de l’information ainsi que des services offerts aux usagers. La recherche permet de rester en adéquation avec son époque et de s’adapter à un monde qui évolue à toute vitesse. Comme l’article nous le prouve, rien ne nous oblige à développer de nouveaux outils et à inventer des méthodologies inédites. Malgré le fait que nous devrions tous être des chercheurs dans l’âme, nous ne sommes pas forcément tous des chercheurs expérimentés, il est donc tout à fait envisageable de se servir de démarches existantes et ayant déjà fait leurs preuves afin de les appliquer à notre propre contexte.
Référence:
OGIER, Andi, HALL, Monena, BAILEY, Annette et STOVALL, Connie, 2014. « Data management inside the library : assessing electronic ressources data using the Data Asset Framework ». Journal of Electronic Ressources Librarianship [en ligne]. 04 juin 2014. Vol. 26, n° 2, pp. 101-113. [Consulté le 23 Septembre 2014]. Disponible à l’adresse : http://dx.doi.org/10.1080/1941126X.2014.910406