Image

Knowledge management et communautés de pratique : passion éphémère ou relation à long terme ?

Étiquettes

, , , ,

Jamais dans sa jeune existence, le knowledge management (KM) n’a été aussi étroitement associé à un autre concept que celui des « communautés de pratique » (CoP). Derrière cette expression se cache une idée qui a le défaut de n’être pas encore assez clairement définie. Malgré cette difficulté, les chercheurs italiens Bolisani et Scarso ont sondé une douzaine de revues spécialisées dans le KM pour clarifier la place que ces communautés de pratique occupent dans cette littérature spécialisée. Qu’ont-ils découvert ? Une définition plus précise des CoP se profile-t-elle ?

Naissance et évolution du concept

En 1991, le chercheur Suisse Etienne Wenger et sa collègue, l’anthropologue Jean Lave, inventent le concept de « communautés de pratique » (CoP)[1]. Mais au fait, les communautés de pratique, qu’est-ce que c’est ?

L’inventeur de l’expression a lui-même fait évoluer ce concept au fil de ses publications. A l’origine, cette notion, influencée par la sociologie, se définit comme « the participation by people in an activity system about which they share understandings about what they are doing and what that means for their lives and communities » (Lave et Wenger, 1991). Les CoP sont alors considérées comme des structures auto-organisées. Quelques années plus tard, les CoP seront plutôt vues comme des systèmes d’apprentissage sociaux formés de groupes de personnes qui partagent une préoccupation à propos d’un sujet et qui approfondissent leurs connaissances et leur expertise dans ce domaine. Le concept est alors utilisé par Wenger pour réfléchir à la manière dont la connaissance est créée et comment elle circule à l’intérieur d’un groupe de personnes. C’est à partir de ce moment que ses publications vont avoir un fort impact sur le KM. En 2002, une notion importante est encore ajoutée par Wenger : les CoP doivent être des structures dirigées.

 

Les recherches de Bolisani et Scarso

Avant d’entamer leur propre revue systématique de la littérature[2], Bolisani et Scarso ont identifié deux autres travaux dans la même veine, celui des chercheurs Agrawal et Joshi (2011) et celui de Murillo (2011). Dans la première étude d’Agrawal et Joshi[3], il ressort clairement qu’il n’existe pas de définition consensuelle des CoP. Agrawal et Joshi concluent que les CoP sont des structures qui peuvent être créées intentionnellement et qu’elles sont employées pour favoriser l’apprentissage et les échanges de connaissances. Dans la seconde étude, Murillo[4] classe les publications concernant les CoP en deux grands groupes : d’une part, les scientifiques qui voient les CoP comme un phénomène spontané, des groupes autogérés et, d’autre part, ceux qui pensent qu’elles devraient être des structures dirigées.

 

Les résultats de Bolisani et Scarso

Selon l’étude de Bolisani et Scarso (2014), en 2012, les CoP restent un sujet populaire dans la documentation sur le KM.

Cette analyse chronologique des publications révèle que les premiers articles sont apparus autour de 2003, soit un an après la publication de Wenger et Al. (2002) et qu’un pic a été atteint en 2007 lorsque The Learning Organisation a publié une édition spéciale sur les CoP. (Tableau adapté et tiré de Bolisani et Scarso, 2014, p. 375)

Cette analyse chronologique des publications révèle que les premiers articles sont apparus autour de 2003, soit un an après la publication de Wenger et Al. (2002) et qu’un pic a été atteint en 2007 lorsque The Learning Organisation a publié une édition spéciale sur les CoP. (Tableau adapté et tiré de Bolisani et Scarso, 2014, p. 375)

Les deux chercheurs italiens tirent de nombreux constats de leur analyse de la littérature. On se perd d’ailleurs un peu dans cette pléthore de résultats.

Quelques résultats concernant les CoP obtenus par Bolisani et Scarso grâce à leur analyse systématique des revues spécialisées dans le KM.

Quelques résultats concernant les CoP obtenus par Bolisani et Scarso grâce à leur analyse systématique des revues spécialisées dans le KM.

Une vision domine au sein du KM : les CoP sont des structures organisationnelles qui peuvent être – et qui souvent doivent être – créées et cultivées. Bon nombre d’articles ont pour but de tirer certaines leçons qui pourraient être utiles aux managers souhaitant créer intentionnellement de nouvelles CoP dans leurs entreprises. Ce type de CoP est le plus répandu et le plus intéressant d’un point de vue pratique.

 

Les CoP sont des structures organisationnelles qui peuvent être – et qui souvent doivent être – créées et cultivées.

 

Mais la littérature sur le KM et les CoP se concentre aussi sur les communautés virtuelles. Celles-ci possèdent des caractéristiques particulières et leur gestion demande des approches spéciales.

Wenger reste une référence notamment en ce qui concerne sa définition des CoP. Malgré cela, un manque de consensus persiste en ce qui concerne les définitions et les applications de la notion de CoP. C’est la raison pour laquelle les auteurs suggèrent de s’entendre d’abord sur ce point. Pour y parvenir, ils proposent dans un premier temps de restreindre l’analyse à une catégorie particulière, par exemple les CoP créées intentionnellement au sein d’une organisation professionnelle. Cette suggestion est intéressante, mais elle introduit un biais important en écartant les autres types de CoP. En outre, avec les nombreux résultats auxquels ils sont parvenus à travers leur analyse systématique de la littérature, on déplore que Bolisani et Scarso, pourtant spécialistes du KM, ne proposent pas leur propre définition des CoP.

 

Un manque de consensus persiste en ce qui concerne les définitions et les applications de la notion de CoP.

 

Le KM et les CoP ont trop en commun pour que leur destin respectif ne soit pas étroitement lié : gestion, création, partage des connaissances, etc. Alors, à quand une définition claire et précise des communautés de pratique qui mettrait en lumière le rôle essentiel qu’elles jouent dans le domaine du KM ?

[1] Lave, J. and Wenger, E. (1991). Situated Learning: Legitimate Peripheral Participation, Cambridge University Press, Cambridge.

[2] BOLISANI, Ettore et SCARSO, Enrico (2014). The place of communities of practice in knowledge management studies: a critical review. Journal of Knowledge Management. 7 avril 2014. Vol. 18, n° 2, pp. 366-381. DOI 10.1108/JKM-07-2013-0277.

[3] AGRAWAL, A. and JOSHI, K.D. (2011). ‘‘A review of community of practice in organizations: key findings and emerging themes’’, Proceedings of the 44th HICSS, Kauai, Hawaii, 4-7 January.

[4] MURILLO, E. (2011). ‘‘Communities of practice in the business and organization studies literature’’, Information Research, Vol. 16 No. 1.

Enregistrer

Emails pour la postérité !

Jamais le débat autour de la sécurité d’emails n’a été aussi présent dans la presse internationale qu’en 2016. Les scandales de l’élection présidentielle étasunienne nous ont tenu en haleine jusqu’aux votations choquantes du 8 novembre. Au cœur de la tourmente : la mauvaise gestion des emails d’Hillary Clinton et le hacking de la boîte mail de John Podesta, son chargé de campagne. Dans ce contexte inquiétant, l’objectif de l’étude d’Anthony Cocciolo – l’élaboration de stratégies d’évaluation d’emails dans le but d’identifier puis conserver de manière pérenne des contenus sensibles – semble plus pressant que jamais.

Crise sécuritaire : la trainée de poudre d’une mauvaise gestion d’emails

La sécurité, la gestion et la conservation des emails est au centre des débats depuis de nombreuses années. Les affaires de hacking font les choux gras des journaux (Sony Pictures en 2014, Hillary Clinton en 2016…) et ravivent ainsi régulièrement les craintes des grandes institutions face aux risques sécuritaires que de mauvaises pratiques de gestion des courriers électroniques leur font encourir. En 2014, le Wall Street Journal publie un article alarmiste à ce sujet prônant une stratégie radicale pour éviter tout scandale : l’élimination systématique des emails sensibles. En réponse, Frank Bruni du New York Times écrit « delete, delete, delete. That’s a bit of your humanity being snuffed out ». Après tout, la sécurité et confidentialité de nos courriers électroniques ne sont-elles pas en partie la responsabilité des services de messagerie ? Le non-respect de la protection de nos données privées n’empiète-elle pas avant tout sur nos droits ?

Comme souligné par Anthony Cocciolo, professeur associé à la Pratt Institute School of Information, dans son article de 2016 intitulé « Email as cultural heritage resource : appraisal solutions from an art museum context », cette crise sécuritaire ne met pas seulement en péril notre patrimoine historique et culturel, mais plus immédiatement la transparence et la traçabilité d’actions et décisions institutionnelles. Si la mauvaise gestion d’emails est un risque, l’élimination systématique de données sensibles est une peine de mort. En effet, une institution sans accès aux informations cruciales à son fonctionnement (dont certaines sont échangées par email) expose son ventre mou, sa vulnérabilité.

blog2

Evaluation manuelle, une solution efficace mais inefficiente ?

Anthony Cocciolo s’attèle donc à sa tâche en analysant les boîtes mails du directeur d’un musée d’art aux Etats-Unis et de deux de ses conservateurs. Ses constats reflètent les inquiétudes de l’institution : une gestion des emails chaotique dépourvue de directives institutionnelles cohérentes. Afin d’identifier les courriers électroniques à conserver dans des boîtes mails dont le traitement et l’organisation sont les fruits de la créativité de leurs propriétaires, Cocciolo souligne l’importance de connaître les activités, missions et fonctions de l’institution ainsi que les projets principaux des protagonistes et les contacts pertinents à ceux-ci. Afin d’accélérer un processus d’évaluation manuel, le chercheur préconise l’approche dite du « réseau social » regroupant les messages par expéditeur/destinataire avant de saisir plus en détail le profil de l’individu et sa relation au propriétaire de la boîte mail.

Toutefois, cette approche, bien qu’efficace, est gravement chronophage et donc inefficiente – en 1 heure, seuls 641 emails sont traités. Ce constat alarmiste appuie donc les propos des critiques, comme Anne J. Gilliland qui insiste sur l’infaisabilité de l’évaluation des emails dûe à la quantité exponentielle des records digitaux. Dans un article paru dans Archives and Recordkeeping : Theory Into Practice en 2014, « Archival appraisal : practising on shifting sands », elle recommande une conservation totale des records digitaux sans évaluation préalable. Evidemment, cet argument, similairement à celui pour l’évaluation manuelle des emails, appartient à un monde théorique où les ressources (informatiques, humaines, financières) d’une institution sont illimitées.

Un avenir prometteur pour l’automatisation du traitement des emails

Toutefois, à l’aube de 2017, des solutions à ce problème pressant semblent pointer le bout de leur nez. Peu après la publication de l’article de Cocciolo, la Stanford University’s Special Collections and University Archives sortent sur le marché le logiciel open source ePADD, un outil d’automatisation de l’évaluation, du traitement et de la conservation des emails. Celui-ci permet l’analyse des courriers électroniques en utilisant la reconnaissance d’entités nommées et d’autres algorithmes de traitement du langage naturel. A la fois innovant et révolutionnaire, cet outil est un véritable breakthrough pour le domaine de l’archivistique. A l’échelle d’une institution, une bonne procédure de gestion d’emails, comme celle proposée par les Nations Unies à ses collaborateurs, couplé à un outil automatique d’évaluation et de traitement des emails afin de soutenir le travail de l’archiviste semble être LA solution d’avenir pour la sécurisation des courriers électroniques et leur conservation pérenne.

blog3

Références

BRUNI, Frank, 2014. « Hacking Our Humanity : Sony, Security and the End of Privacy ». The New York Times [en ligne]. 20 décembre 2014. [Consulté le 18 décembre 2016]. Disponible à l’adresse : https://www.nytimes.com/2014/12/21/opinion/sunday/frank-bruni-sony-security-and-the-end-of-privacy.html

CIEPLY, Michael et BROOKS, Barnes, 2014. « Sony Cyberattack, First a Nuisance, Swiftly Grew Into a Firestorm ». The New York Times [en ligne]. 30 décembre 2014. [Consulté le 18 décembre 2016]. Disponible à l’adresse : https://www.nytimes.com/2014/12/31/business/media/sony-attack-first-a-nuisance-swiftly-grew-into-a-firestorm-.html

CLARK, Don, OVIDE, Shira et DWOSKIN, Elizabeth, 2014. « Are You Sure You Want to Use Email ? ». The Wall Street Journal [en ligne]. 19 décembre 2014. [Consulté le 18 décembre 2016]. Disponible à l’adresse : http://www.wsj.com/articles/are-you-sure-you-want-to-use-email-1419030075

COCCIOLO, Anthony, 2016. « Email as cultural heritage resource : appraisal solutions from an art museum context ». Records Management Journal [en ligne]. [Consulté le 18 décembre 2016]. Disponible à l’adresse : dx.doi.org/10.1108/RMJ-04-2015-0014

GILLILAND, Anne J., 2014. Archival appraisal : practising on shifting sands. In : BROWN, Caroline (ed.). Archives and Recordkeeping : Theory into Practice. Londres : Facet Publishing. ISBN 978-1-8560-4825-5

LEE, Micah, 2016. « Dear Clinton team : we noticed you might need some email security tips ». The Intercept [en ligne]. 13 octobre 2016. [Consulté le 18 décembre 2016]. Disponible à l’adresse : https://theintercept.com/2016/10/13/dear-clinton-team-we-noticed-you-might-need-some-email-security-tips/

O’HARROW, Robert Jr., 2016. « How Clinton’s email scandal took root ». The Washington Post [en ligne]. 27 mars 2016. [Consulté le 18 décembre 2016]. Disponible à l’adresse : https://www.washingtonpost.com/investigations/how-clintons-email-scandal-took-root/2016/03/27/ee301168-e162-11e5-846c-10191d1fc4ec_story.html

STANFORD UNIVERSITY (California), 2015. ePADD. Stanford University Libraries [en ligne]. [Consulté le 18 décembre 2016]. Disponible à l’adresse : https://library.stanford.edu/projects/epadd

UNITED NATIONS, 2012. Managing Emails as Records. United Nations : Archives and Records Management Section [en ligne]. [Consulté le 18 décembre 2016]. Disponible à l’adresse : https://archives.un.org/content/managing-emails-records

La gestion documentaire de centres d’artistes autogérés de la région montréalaise

Étiquettes

, , , , , , , ,

Les centres d’artistes autogérés ont fleuri dans les années 70 au Canada. A Montréal, Denis Lessard, consultant en archivistique, auteur et artiste, s’est intéressé à leur gestion documentaire et a élaboré pour eux un plan de classification type.

Lire la suite

Archives institutionnelles : quatre archétypes

Grâce à l’Open Access, un nouveau moyen de stockage, préservation et partage des productions des chercheurs, enseignants, étudiants et scientifiques a pu voir le jour : les archives institutionnelles. Ces archives ouvertes pourraient devenir indispensables à la communauté scientifique d’ici quelques années, que ce soit au niveau de la pérennisation des résultats et des données ou pour leur réutilisation par d’autres chercheurs. Dans un article, Joachim Schöpfel et Hélène Prost proposent quatre archétypes d’archives institutionnelles : quels sont-ils et quels sont les facteurs à prendre en compte pour réussir l’implémentation d’une telle plateforme? Lire la suite

« Pinning to promote »: les réseaux sociaux visuels au secours des bibliothèques ?

Étiquettes

, , , , , ,

Avez-vous remarqué que les lecteurs désertent votre bibliothèque depuis quelques mois ? Avez-vous transpiré en analysant les statistiques de rotation de vos collections ? Vous avez en conséquence et sans aucun doute redoublé d’esprit pour essayer de ramener de la vie dans vos espaces ou pour rendre vos livres plus visibles et attirants pour vos publics… mais avez-vous pensé à des outils visuels de curation comme Pinterest, Learnist ou Pearltrees ?

Suivant la vague du numérique et du Web 2.0, les habitudes des utilisateurs se métamorphosent en même temps que la documentation alors que leur exigence ne fait qu’augmenter. Les étudiants peuvent maintenant suivre des cours en e-learning depuis leurs lits ou d’autres pays et constituer leurs bibliographies grâce aux ressources électroniques. Certains parlent de la mort du livre et des bibliothèques, d’autres décident d’affronter et de rallier la technologie à leur cause afin d’explorer de nouvelles manières de diffuser et promouvoir leurs collections. Les spécialistes de l’information se sont notamment intéressés à différents outils de curation sociaux et visuels dans deux optiques : la valorisation de l’offre de services et la formation des utilisateurs.
Lire la suite

En passant

La gestion des données de la recherche, enjeu principal des bibliothèques académiques. 5 affirmations (voire plus?) proposées par Liz Lyon

Étiquettes

, , ,

Liz Lyon proposait dans un article paru en 2012, « The Informatics Transforms : Re-Engineering Libraries for the Data Decade », cinq affirmations comme voies possibles du changement induit par la gestion des données de la recherche pour les bibliothèques académiques. Alors que le Research Data Management (RDM) se profile comme un domaine en plein essor dans le paysage suisse (et international) des Sciences de l’information, nous sommes particulièrement curieux de connaître ces cinq pathways to change. Lire la suite

Des données brutes à la connaissance partagée : l’e-science et les bibliothèques

Quel est le nouveau paradigme qui permettra aux chercheurs de faire face au Big Data? Quelles sont les nouvelles voies de la communication scientifique ? Comment les bibliothèques académiques peuvent-elles survivre à la disparition de la publication papier ? Autant de questions actuelles que l’article de Tony et de Jessie Hey explore de façon visionnaire, proposant aux bibliothécaires un virage stratégique : mettre leurs compétences au service des nouveaux besoins des chercheurs. Si aujourd’hui, une décennie plus tard, toutes les prévisions des deux auteurs ne se sont pas (encore ? ) réalisées, un état des lieux rapide permet de comprendre que leurs recommandations n’ont rien perdu de leur pertinence… Lire la suite

Quels sont les bénéfices perçus par l’utilisation des bibliothèques publiques ?

Étiquettes

, , , , , , ,

Etude sur des usagers de cinq pays

Contexte


L’étude de Pertti Vakkari et al. publiée en 2016 dans le Journal of documentation ; « Patterns of perceived public library outcomes in five countries » a pour but de répondre à la question : quels sont les bénéfices des usagers adultes dans les domaines de la vie en fréquentant une bibliothèque publique.

Cette étude menée sur plusieurs années, se concentre sur cinq pays : les USA, la Finlande, les Pays-bas, la Norvège et la Corée du Sud. Le choix des pays a l’avantage de collecter des données sur des contrées aux cultures très différentes mais économiquement comparable ; les pays d’Europe du Nord, les USA et la Corée du Sud.

Collecte d’information


Les données utilisées par cette étude proviennent généralement de bibliothèques publiques dans les cinq pays précités ainsi que d’informations récoltées grâce à un questionnaire envoyé à un échantillon d’usagers dans ces mêmes pays.

Le questionnaire, employé pour mener à bien cette étude, est inspiré d’une recherche précédente finlandaise, portant sur le même sujet. Ledit questionnaire comporte deux grands axes, tout d’abord les données sur les personnes qui ont répondu (âge, pays d’origine, sexe etc.) puis sur les quatre dimensions définies par l’étude finlandaise traitant des différents types d’avantages pouvant être retirés par la fréquentation d’une bibliothèque publique. Ces bénéfices sont répartis selon quatre dimensions ; le travail, l’éducation, la vie quotidienne et les hobbys.

Résultats


Pour mieux analyser les résultats de cette enquête, il est important de se pencher tout d’abord sur les statistiques des bibliothèques publiques dans les pays concernés par l’étude.

articlesj_1

 

Ce tableau permet de mettre en avant plusieurs constats, premièrement le peu de différences entre le nombre total de bibliothèques en Corée du Sud face à la Norvège qui compte presque dix fois moins d’habitants. Ce constat est à relativiser car le nombre d’heures d’ouverture des centres d’information documentaire est plus de trois fois supérieur en Corée du Sud.

On peut aussi constater que la Finlande est le pays qui possède le plus de documents par habitants. De plus, c’est le pays pour lequel le coût des opérations est le plus élevé. Ce qui suggère une offre abondante ainsi que du personnel probablement plus nombreux pour accueillir les lecteurs.

Ce graphique quant à lui permet de présenter les principaux résultats, les usagers de tous pays confondus indiquent que la lecture comme passe-temps est la plus répandue.

articlesj_2

Les cinq premiers résultats sont pour la plupart identiques dans chacun des pays même si cela n’est pas dans le même ordre.

Critique


Il est important de porter un regard critique sur les résultats de cette étude, afin de pouvoir les utiliser au mieux.

Pour commencer, le questionnaire n’a pas été transmis à tous les répondants de la même manière. En effet, en Finlande le questionnaire a été transmis par email et l’échantillonnage a été effectué via une enquête postale alors que pour les autres pays c’était à l’aide d’un panel web.

De plus, la sélection des pays n’est pas vraiment justifiée mais l’on s’imagine qu’elle est basée sur l’intérêt de chercheurs ou spécialistes pour cette thématique.

Les principaux biais à prendre en compte pour cette étude sont notamment le fait que certaines catégories de population sont plus représentées que d’autres. Les jeunes et les personnes très éduquées sont majoritaires dans la plupart des pays. La seule nation pour laquelle l’échantillon est représentatif sur tous les points est les Pays-Bas.

Conclusion


Il est important de relever le fait que cette étude est la première à utiliser un questionnaire similaire pour des usagers de bibliothèques publiques dans différents pays simultanément.

Les résultats de cette enquête sont importants pour les bibliothécaires car ils valorisent certains constats pouvant être utilisés pour leur politique documentaire. De plus ce type d’étude a toujours une pertinence d’un point de vue politique, notamment pour mettre en avant les avantages culturels d’un centre de documentation ou justifier les coûts de la culture.

Cette étude est intéressante pour le monde de la bibliothéconomie toutefois, il est nécessaire de prendre en compte les divers biais qu’elle renferme afin de pouvoir utiliser les résultats de façon réfléchie et pertinente.

Référence

VAKKARI, Pertti, AABØ, Svanhild, AUDUNSON, Ragnar, HUYSMANS, Frank, KWON, Nahyun, OOMES, Marjolein et SIN, Sei-Ching Joanna, 2016. Patterns of perceived public library outcomes in five countries. Journal of Documentation. 14 mars 2016. Vol. 72, n° 2, pp. 342‑361. DOI 10.1108/JD-08-2015-0103.

Vers une automatisation de la conception des vocabulaires contrôlés ?

Étiquettes

, , , , ,

Depuis le début des années 2000, l’essor de la numérisation au sein des administrations ainsi que la multiplication des procédures législatives, administratives et techniques ont poussé au développement de la gestion de l’information. Cependant, les logiciels documentaires disponibles sur le marché sont extrêmement coûteux. Inaccessibles pour les petites et moyennes organisations, celles-ci se contentent, pour accéder à leurs contenus, d’une recherche full text.

Dans leur article Classification automatisée : rêve ou réalité ? Analyse critique de l’usage du text mining pour la conception de vocabulaires contrôlés, Raphaël Hubain, Seth van Hooland et Ruben Verborgh tentent de trouver une solution à ce problème par la conception et la mise en place d’un vocabulaire contrôlé. Leur objectif est de réduire les coûts non seulement en automatisant certaines procédures, mais également en utilisant des outils open source. Daté de 2016, cet article donne un bon aperçu de l’avancée actuelle des recherches sur le sujet.

Méthodologie de l’étude de cas

L’article présente une étude de cas menée par les auteurs au sein d’une organisation de taille moyenne appartenant à l’industrie bio-pharmaceutique. Afin de faciliter la reproduction de leurs recherches, les aspects méthodologiques et techniques du projet ainsi que les données d’évaluation sont mis à disposition sur le site internet LemuridaeText Mining for Information Governance .

Recherche full text versus vocabulaire contrôlé

Comme l’explique W. Bruce Croft (2015), la recherche full text connaît des limites qui sont inhérentes au langage naturel. Il s’agit du problème de la synonymie ainsi que de celui de l’homonymie. Il est alors nécessaire de mettre en place un vocabulaire contrôlé qui va permettre, au moment de l’indexation, d’insérer un calque sémantique.

Les auteurs de l’article, tout comme Peter Morville (2007), précisent qu’il est toutefois important d’effectuer un arbitrage coûts-bénéfices avant la mise en place d’une taxonomie. En effet, sa conception requiert d’importantes ressources humaines. Cependant, s’en dispenser engendre également des coûts car cela nécessite à l’usager final du système de passer plus de temps à concevoir une requête complexe afin d’obtenir des résultats pertinents.

Usage du text mining dans le domaine documentaire

Afin de faire baisser les coûts liés à la conception et à la mise en place d’un vocabulaire contrôlé, les auteurs de l’article ont essayé d’automatiser certains processus à l’aide de techniques issues du text mining.

D’une part, la conception de taxonomie peut faire appel à des méthodes d’extraction de termes et d’extraction de relations sémantiques entre les termes. D’autre part, l’analyse documentaire peut se réaliser grâce à des méthodes d’annotations sémantiques.

 

loadimg1-php

Système documentaire basé de manière semi-automatisée. Les scripts 1 à 4 utilisent des méthodes issues du text mining. Source : Raphaël Hubain et al. (2016)

L’annotation sémantique consiste en l’ajout de métadonnées à certains concepts porteurs d’une information spécifique et recherchée. L’étiquette ajoutée peut être une information, il s’agit de la reconnaissance d’entités nommées, ou un lien vers une source d’information, c’est la désambiguïsation d’entités nommées. Dans cette étude de cas, le vocabulaire contrôlé a été converti en Skos (Simple Knowledge Organization System).

 

loadimg2-php

L’annotation sémantique permet à l’usager, in fine, d’accéder à plus de documents pertinents. Source : Raphaël Hubain et al. (2016)

 

Des résultats mitigés mais des perspectives pour l’avenir

Les auteurs ont évalué leurs résultats en termes d’adéquation à l’usage et en termes d’évaluation des gains.
Afin de mesurer la performance de leur vocabulaire contrôlé, deux critères ont été utilisés : la précision et le rappel (également décrits par W. Bruce Croft, 2015).
Si les résultats se révèlent être à ce niveau-là insatisfaisants, le coût en ressources humaines a cependant largement été réduit grâce à l’automatisation de certaines procédures. Ce propos doit tout de même être nuancé, car dans cette étude le vocabulaire mis en place possède une structure peu complexe.

Malgré tout, cette recherche ouvre la voie à de nouvelles expérimentations, les logiciels open source étant nombreux et les communautés d’utilisateurs et de développeurs importantes.

Le text mining : une réelle opportunité pour l’indexation ?

Bien que l’indexation automatique soit un domaine de recherche existant depuis de très nombreuses années – citons par exemple les travaux de S.M. Humphrey et N.E. Miller (1987) –  les résultats des recherches actuelles sont encore insatisfaisants. Face à ce constat, on peut légitimement se demander si ces nouvelles technologies sont véritablement pertinentes pour la conception de vocabulaires contrôlés. Le professionnel de l’information documentaire a toujours, dans tous les cas, un rôle important à jouer. Dans l’étude présentée, en effet, sa présence est essentielle pour la conception et la validation du thésaurus créé.

Si ces avancées technologiques se confirment et s’imposent, faudra-t-il alors reconsidérer le contenu de la formation des professionnels de l’information documentaire afin de s’y adapter, comme le suggère Jean-Philippe Accart ? Ou est-ce que le véritable pari réside, comme l’explique Peter Morville (2007), dans la mise en place et le renforcement de collaborations interdisciplinaires ?

Références

ACCART, Jean-Philippe, 2016. Être documentaliste aujourd’hui. Jpaccart.ch [en ligne]. Juin 2015. [Consulté le 25.10.2016]. Disponible à l’adresse : https://www.jpaccart.ch/edito-du-mois/edito-90-juin-2015-etre-documentaliste-aujourdhui.html?highlight=YToxOntpOjA7czoxMDoib250b2xvZ2llcyI7fQ==

CROFT, W. Bruce, 2015. Search engines: information retrieval in practice [en ligne]. Boston : Pearson Addison-Wesley. [Consulté le 25.10.2016]. Disponible à l’adresse : http://ciir.cs.umass.edu/downloads/SEIRiP.pdf

HUBAIN, Raphaël, HOOLAND, Seth van et VERBORGH, Ruben, 2016. Classification automatisée : rêve ou réalité ? Analyse critique de l’usage du text mining pour la conception de vocabulaires contrôlés. I2D – Information, données & documents [en ligne]. Février 2016. [Consulté le 25.10.2016]. Disponible à l’adresse : https://www.cairn.info/revue-i2d-information-donnees-et-documents-2016-2-age-70.htm [accès par abonnement]

HUMPHREY, Susanne M. et MILLER, Nancy E., 1987. Knowledge-based indexing of the medical literature: The Indexing Aid Project. Journal of the American Society for Information Science, 1987, Vol. 38, no 3, p. 184.

MaSTIC – Université libre de Bruxelles and Ghent University – iMinds, 2015. Automated SKOS Vocabulary Design. Lemuridae – Text Mining for Information Governance [en ligne]. 2015. [Consulté le 25.10.2016]. Disponible à l’adresse : http://hubain.be/lemuridae/index.php/automated-skos-vocabulary-design/

MORVILLE, Peter, 2007. Comment définir l’architecture de l’information. In : Architecture de l’information pour le web . 3e éd.. Paris : O’Reilly. pp. 3‑16. ISBN 978-2- 84177-460-9.

 

L’architecture de l’information : comment définir une discipline en constante évolution

Étiquettes

, , , , ,

Aujourd’hui l’architecte de l’information peut être considéré comme une figure centrale des systèmes d’information. Sa vocation est d’organiser l’information au sein des sites web afin de la rendre accessible à l’utilisateur. Son métier rappelle celui de l’architecte des bâtiments, de même que celui du bibliothécaire. Analyse d’un métier multidimensionnel à travers l’illustration des concepts clé qui le caractérisent, les disciplines qui délimitent son champ d’action à la recherche d’une définition qui évolue au fil du temps et au rythme des changements qui se produisent dans les systèmes d’information. Lire la suite