• A propos de

Recherche d'ID

~ Carnet de recherche des étudiants du master en sciences de l'information de la Haute école de gestion de Genève

Recherche d'ID

Archives de Tag: métadonnées

Les métadonnées, ou l’art de la description

02 lundi Oct 2017

Posted by gbongi in Actualités

≈ Poster un commentaire

Étiquettes

accessibilité, data management plan, Description des données, DMP, données de recherche, Dublin Core, Gestion des données de la recherche, Inoreader, interopérabilité, métadonnées, pérennité

La plupart des chercheurs ne mettent pas en place une stratégie pour la gestion des données de leur recherche, alors que le Data Management Plan (DMP) devient obligatoire. La description des données est au cœur de ce dernier et exige la précision. Qu’est-ce qu’une donnée de recherche? Qu’est-ce qu’une métadonnée et existe-t-il un standard de description? Sous le prisme de notre projet de recherche, nous essayons ici d’élucider ces interrogations. Lire la suite →

Publicités

Pas encore vu, lu, su ?

27 mardi Jan 2015

Posted by Aurélie Vieux in Lecture

≈ 1 Commentaire

Étiquettes

économie du document, bibliothèque, définition, formation, identité numérique, MasterID, métadonnées, professionnel ID, séminaire

 

couverture du livre présenté

Couverture du livre de J.M Salaün

A l’origine de ce billet

Dans le cadre d’un cours dédié à l’économie de l’information en Master ID, quatre étudiants de la précédente volée (2012-2014) avaient réalisé un compte rendu de lecture sur un ouvrage largement commenté de Jean-Michel Salaün, enseignant-chercheur reconnu dans le milieu francophone des sciences de l’information. Ce semestre, l’ouvrage « Vu, lu, su : les architectes de l’information face à l’oligopole du web », paru aux Editions de la Découverte en 2012, re-pointe le bout de son nez et continue d’intéresser les étudiants !

Dès lors, la question a été de savoir comment faire profiter à la volée actuelle de ce travail réalisé par d’autres étudiants. Quoi de mieux qu’un billet de blog ? Celui-ci vise à introduire cette fiche de lecture et à donner l’envie de lire cet ouvrage, qui a sans aucun doute marqué les sciences de l’information !

L’eau à la bouche

Plus qu’un simple résumé par chapitre, cette fiche présente l’auteur, une bibliographie sélective de ses travaux, le contexte de parution et de réception de l’ouvrage. Elle fait également référence à d’autres comptes-rendus permettant de multiplier les interprétations. Une autre plus-value de ce travail estudiantin tient dans le dernier chapitre de la fiche de lecture. Les quatre étudiants y apportent leur propre analyse.

Image d'un livre-gâteau prêt à être dégusté

Source : Babelio. Disponible à l’adresse suivante : http://www.babelio.com/forum/viewtopic.php?t=8634&sid=bedb1e29c766f55645a879a7ea794a70

De quoi parle ce livre ?

En bref, dans cet essai, l’auteur propose d’approcher le Web sous un angle inhabituel, celui du document et non pas des sciences de l’information. En inscrivant le Web dans une histoire longue – celle des bibliothèques, des centres d’archives, de l’imprimerie, de l’édition, de la presse, de la radio-télévision – il prend le contrepied de la plupart des commentateurs et des penseurs du domaine qui développent leurs réflexions de manière collective et immédiate.

Sous l’angle du document

Après avoir présenté le modèle économique de la bibliothèque comme à l’origine du premier système de capitalisation de la connaissance, il retrace son évolution avant de le relier/l’opposer au Web. Il s’intéresse d’abord à la mutation du « document » en tant qu’objet d’études dans l’histoire des sciences de l’information. Pour lui, un document est une construction de trois dimensions caractéristiques : sa forme (vu), son contenu (lu) et son médium (su). D’abord considéré comme un objet informationnel composé d’une information enregistrée sur un support physique, il s’est mué vers ce qu’il nomme un « protodocument », une information en elle-même immatérielle détachée de toute réalité physique. Pour devenir un document, le protodocument doit pouvoir être vu, lu, su.

visualisation des 3 dimensions du documents

Source : blog « L’économie du document : bloc-notes de Jean Michel Salaün ». Disponible à l’adresse suivante : http://blogues.ebsi.umontreal.ca/jms/index.php/post/2011/03/30/La-redocumentarisation-en-quatre-images

La redocumentarisation du Web

L’auteur observe ensuite comment le document se construit sur le Web : qu’est-ce qu’un document sur le Web et est-ce que la définition qu’on a établi jusque-là est toujours valable ? Pour répondre à cette question, il analyse le Web sous l’angle tridimensionnel du document. Il constate un phénomène de « redocumentarisation », qui s’opère selon un mode de publication documentaire inversé. En effet, le fonctionnement du premier système documentaire était garanti par un processus de production en deux temps : création, publication des documents par les auteurs, puis, collecte, indexation et catalogage par les bibliothécaires est bouleversé, ces deux moments se confondant. Ainsi, l’ordre établi est modifié et les étapes d’indexation ou de catalogage, dorénavant appelées métadonnées, sont effectuées au même moment que sa mise en ligne. Cette « réingénierie documentaire » amène alors l’auteur a une profonde remise en question des critères de validité de l’information : un document se construit aujourd’hui davantage sur sa popularité et sa rapidité à être échangé (su) que sur sa véracité (lu).

Jean-Michel Salaün évoque également une conséquence de cette réorganisation documentaire, la documentarisation des individus. Il met en garde sur les risques liés à la manipulation du « je-document » et explique l’importance de gérer son identité numérique et les traces que tout un chacun laisse sur la toile.

L’économie du document

En utilisant toujours sa « grille de lecture » du document, Salaün explore ensuite l’économie du document sur le Web et présente les marchés correspondant à chacune des trois dimensions:

  • la vente de biens (e-books, matériel, modèle « vu »),
  • la vente d’accès (abonnements, licences, modèle « lu »),
  • la vente d’attention (pub en ligne, modèle « su »).

Toutefois, le média Web est hybride et qu’il rend les frontières floues entre les différents modèles. En ce sens, le Web concurrence doublement les autres modèles en s’appuyant sur un accès aux documents (payant ou gratuit) et en accaparant l’attention du consommateur. Le Web « documentarise » les médias traditionnels et commercialise la bibliothèque en formant une nouvelle « industrie de la mémoire » dont il décline les cinq pôles. Il précise que le Web représente à la fois une chance de développement pour ces marchés et en même temps une concurrence.

Le néodocument

A la fin de son essai, l’auteur définit ce qu’il appelle à présent un néodocument : un document numérique créé et échangé sur le Web dont il décrit les quatre paradoxes :

  • Propriété et partage,
  • Lecture et calcul,
  • Conversation et traces,
  • Mémoire et oubli.

Salaün termine son analyse en investiguant le modèle commercial du Web et pousse encore son analogie tridimensionnelle du document plus loin en l’associant à chacune des trois logiques économiques mises en place par les mastodontes de la toile : Apple (lu), Google (su) et Facebook (vu).

Et les professionnels dans tout ça ?

En guise de conclusion, l’auteur explique que les professionnels n’ont pas toujours été associés à cette bascule documentaire du Web. Pourquoi ? Parce qu’ils n’étaient pas toujours formés aussi bien aux savoirs documentaires traditionnels qu’aux développements informatiques du Web. Pour lui comme pour d’autres penseurs, la formation des professionnels doit être adaptée et intégrer de nouvelles compétences pour gérer le néodocument dans l’environnement Web.

A votre tour de goûter

L’originalité de ce livre tient dans sa forme, l’essai. Il en a les forces, mais aussi les limites : bien que documenté et bien structuré, cet ouvrage ne s’appuie pas sur des résultats de recherches scientifiques, mais uniquement sur des lectures et des réflexions personnelles et menées dans le cadre du réseau RTP-doc.

En espérant que ce billet vous aura envie d’entamer la lecture de ce compte-rendu, qui, comme le livre lui-même est un essai, c’est à dire le reflet d’une interprétation propre à quatre étudiants en sciences de l’information.

Lien vers le compte-rendu de lecture-Vu,Lu,Su

 

 

 

 

 

Des hyperliens comme métadonnées ?

15 lundi Déc 2014

Posted by Aurèle Nicolet in Lecture

≈ 7 Commentaires

Étiquettes

hyperlien, master ID, métadonnées, profil informationnel, taxonomie, unité lexicale d'hypertexte, web design

Avec le développement du Web sémantique, le besoin de métadonnées se fait de plus en plus ressentir. Si le HTML5 offre la possibilité d’inclure des métadonnées pour décrire une page web, il est encore difficile de l’étendre à l’ensemble d’un site.

Dans leur article Approche extensive des métadonnées pour un site web : principes d’élaboration et applications d’une taxonomie, Nathalie Pinède et David Reymond proposent une méthodologie basée sur une taxonomie des unités lexicales d’hypertexte (ULH) qui permettrait d’offrir une vision synthétique d’un site web.

ULH ?

Qu’est-ce que ces fameuses ULH ? Ce sont les hyperliens qui permettent d’accéder, depuis la page d’accueil, aux couches plus profondes du site web, comme les onglets de navigation. Sur ce blog, on peut donner comme exemple « À propos de » ou « Master ID » situés en haut à gauche de la page. Ce sont des « textes passeurs » pour reprendre l’expression d’Yves Jeanneret dans son livre Y a-t-il (vraiment) des technologies de l’information ?.

Le postulat de départ de Pinède et Reymond est que les ULH sont suffisamment porteuses de sens par rapport à leur site web pour qu’elles puissent être utilisées comme métadonnées vis-à-vis de son contenu. En effet, Jakob Nielsen et Marie Tahir, dans leur livre L’art de la page d’accueil présentent la page d’accueil comme la table des matières, le point d’orientation du site web. Pour cette raison, les ULH qui la composent sont sélectionnées avec soin.

Méthodologie

Ne pouvant naturellement pas s’intéresser à l’ensemble du web, nos auteurs ont délimité leur terrain d’études aux sites web organisationnels, plus particulièrement à ceux des universités françaises. Le choix de ces sites s’explique principalement en raison de leur complexité – puisqu’en réalité le site web regroupe une mosaïque de sites rattachés à l’université par un même nom de domaine – et de leur besoin de créer une image institutionnelle malgré cette diversité.

Puis, Pinède et Reymond ont analysé les pages d’accueil en se basant sur le travail de Nielsen et Tahir et les ont décomposées en trois zones de navigation : structurelle, par profil et des liens outils.

© Pinède et Reymond, 2011.

Schéma d’une page d’accueil – © Pinède et Reymond, 2011.

La navigation structurelle regroupe l’accès aux contenus du site. La navigation par profil adapte le site aux différentes cibles – étudiants, chercheurs, etc. – ou à la langue de l’utilisateur. Enfin, les liens outils correspondent aux différentes aides à la navigation.

Les pages d’accueil analysées et décomposées, les ULH, ont d’abord été récoltées manuellement, puis de façon automatisée. Malheureusement, nous n’avons pas les détails de la procédure.

Mise en place de la taxonomie

Une fois les données recueillies, les auteurs ont procédé à leur classement qui a fait l’objet d’ajustements progressifs. Certaines ULH n’ont finalement pas été intégrées, car spécifiques à un domaine d’études ou ambivalentes.

Premier constat. La majorité des ULH se situent dans la catégorie structurelle et, parmi celle-ci, au sein des classes « formation », « recherche » et « ressources documentaires », ce qui s’avère cohérent avec les différentes missions d’une université.

Ensuite, bien que les unités lexicales ont été reprises telles quelles et n’ont pas été normalisées, Pinède et Reymond ont pu constater une moyenne globale de 68% au plan de recouvrement, ce qui tend à démontrer l’existence d’un phénomène de standardisation naturelle et à encourager l’extension de la taxonomie à d’autres types de sites organisationnels.

Un outil de gestion collaborative

Une fois établie, la taxonomie devait être capable de s’adapter aux évolutions des sites web. L’automatisation étant très lourde à mettre en place, si ce n’est impossible, nos auteurs ont établi une plate-forme de gestion des ULH collaborative, conçue pour offrir différentes applications, telles que la mesure de la marginalité et la visualisation d’un profil informationnel d’un site web.

La marginalité d’une page d’accueil se mesure au nombre d’ULH peu fréquentes la composant. Elle peut servir d’outil de décision lors du choix des termes, que ce soit en vue d’une normalisation ou au contraire d’un souci d’originalité.

La visualisation du profil informationnel d’un site web est une représentation sous forme de radar de la popularité des thèmes. Chaque ULH trouvée sur la page d’accueil et correspondant à la taxonomie augmente le thème ad hoc. Cette vue permet de vérifier l’adéquation de la structure d’un site avec les domaines et activités de son institution et constitue, de ce fait, un outil stratégique.

© Pinède et Reymond, 2011.

Profil informationnel d’un site web – © Pinède et Reymond, 2011.

Conclusion

Si on peut critiquer un certain flou sur la méthodologie utilisée, que ce soit le nombre exact de sites dans le corpus ou la technique d’automatisation de la récolte d’ULH, l’article de Pinède et Reymond propose un outil aux potentialités intéressantes, bien que, contrairement aux autres articles traités dans le séminaire, il ne s’intéresse pas ou très peu à l’usager. Pour cela, le web designer devra utiliser l’application en complément d’autres outils comme l’oculométrie.

Encore une fois, les humanités numériques…

03 mercredi Déc 2014

Posted by sarasteflonati in Lecture

≈ 2 Commentaires

Étiquettes

archive, biblio-info-webo-métrie, bibliothèque, bibliothèque numérique, cultural informatics, humanités numériques, master ID, métadonnées, nouvelles technologies, numérisation, sciences humaines et sociales, text encoding initiative, ThatCamp, utilisateur, visualisation des données

L’occasion de s’occuper de nouveau des humanités numériques dans ce blog vient de l’article de Chris Alen Sula, Digital Humanities and Libraries : A Conceptual Model, in « Journal of Library Administration », n. 53, 2013, p. 10-26, également disponible sur le site de l’auteur http://chrisalensula.org/digital-humanities-and-libraries-a-conceptual-model/#comment-2635. L’article de ce jeune professeur assistant à la School of Information & Library Science du Pratt Institute (New York) a été proposé comme lecture de référence concernant la Biblio–Info–Webo-métrie dans le cadre du séminaire de recherche du prof. Stéphanie Pouchot pour notre master en Information documentaire.

Après toute l’effervescence de cet été au bord du Lac Léman, entre l’HEG de Genève et les pôles d’excellence lausannois à propos des Digital Humanities (DH 2014), c’est une bonne opportunité pour faire un point de situation au niveau théorique dans une large perspective de recherche et d’application aux pratiques documentaires, englobant les deux côtés de l’Atlantique.

Mais procédons avec ordre, d’abord le modèle conceptuel des DH en liaison avec les bibliothèques, proposé par Sula, et ensuite, la vague des humanités numériques en Suisse.

L’organisation du savoir

Le prérequis fondamental pour l’élaboration d’un modèle conceptuel est la définition des savoirs et des champs d’action concernés, au-delà de la simple constatation que le numérique est désormais impliqué dans tous les domaines. Bien qu’il y ait eu jusqu’à présent du retard des sciences humaines et sociales (SHS) par rapport aux nouvelles technologies de l’information et de la communication (NTIC) au niveau de la recherche académique, le numéro des publications scientifiques concernant les DH dans le milieu de la science de l’information entre 2005 et 2012 a doublé.

« Digital Medievalist » né en 2005, « Digital Humanities Quarterly », publié à partir de 2007 et « Journal of the Text Encoding Initiative », paru en 2011, donnent juste une petite idée de la variété des titres et donc de la complexité du domaine transdisciplinaire des DH.

L’identification des sujets typiques des DH grâce à des modèles génératifs probabilistes comme LDA (Latent Dirichlet allocation), l’analyse de mots-clés et la visualisation de ces données sont au cœur de la recherche de l’auteur qui mène à définir les champs d’intérêt commun entre les bibliothèques, lieux historiquement élus de la transmission de la connaissance, et les nouveaux défis posés aux savoirs des SHS par les NTIC.

Du cadre historique au modèle conceptuel…

Pour l’histoire des DH, des premières formes d’analyse textuelle aux réseaux sociaux, pour des raisons d’exhaustivité on préfère plutôt renvoyer à la présentation de Jean-Philippe Magué faite à l’HEG en occasion de la journée consacrée aux « Humanités numériques et information documentaire : un panorama ».

Néanmoins, parmi la vaste bibliographie fournie par Sula, trois points nous paraissent importants pour la définition d’un modèle conceptuel des DH et des bibliothèques :

  1. M. Zorich en A survey of digital humanities centers in the United States (2008) fait le point de la situation américaine de la perspective des structures, de leur financement, de leurs services et de leur production en matière de DH. Là où les humanités numériques sont nées à côté de la linguistique informatique et des cultural studies, et se sont plus développées, on constate que, encore en 2011, seulement le 8% des bibliothèques accueillent un centre dédié aux DH… et ce n’est pas uniquement une affaire de financement, mais plutôt l’absence d’une vision stratégique commune!
  2. Showers dans Does the library have a role to play in digital humanities ? (2012) pour synthétiser le problème identifie 5 zones de superposition entre DH-bibliothèques: 

    Managing data / « embedded » librarianship / digitalisation&curation /

    digital preservation / discovering&dissemination

 

  1. Les réflexions autour des cultural informatics (autrement dits archives & museum informatics), dévéloppées par J. Furner et P. F. Marty, visent à inviduer la façon dans laquelle les institutions culturelles (bibliothèques, archives et musées) créent, (ré)organisent les produits de l’information et travaillent avec les répresentations du contenu (métacontenu). Dans le graphique de Sula on souligne à ce propos le continuum qu’il y a entre la préservation et la divulgation du patrimoine des institutions mentionnées et les nouvelles technologies.

fig3

© Sula, 2013

… à la pratique

Pour cela Sula ne nous donne pas de recettes, hormis celle de poser l’utilisateur, avec ses besoins d’accès à l’information, au centre du système DH-bibliothèques.

L’article, approfondi du point de vue théorique et bibliographique, nous laisse plutôt le soin de trouver des exemples concrets de projets entre les centres de recherche en DH et les bibliothèques.

Concernant la Suisse, bien qu’il y ait du retard par rapport au cadre américain, plusieurs manifestations au niveau international ont contribué à développer une certaine sensibilité vers cette thématique.

  • Novembre 2011 : série de conférences THATCamp, à l’Université de Lausanne, où le Laboratoire de cultures et humanités digitales LaDHUL naît en 2013 ;
  • Septembre 2012 : workshop Digital text/Genetic document aux Archives littéraires suisses de la Bibliothèque nationale à Berne, dédié à l’application de la Text Encoding Initiative à la critique génétique ;
  • Février 2013 : le DHLab de l’EPFL crée avec l’Université Ca’ Foscari de Venise le Joint Research Center for Digital Humanities and Future Cities in Venise, pour une nouvelle valorisation de la ville des doges et de sa riche bibliothèque ;
  • Juin 2013 : première DH Summer School, à l’Université de Berne, où le Centre des humanités numériques est très actif avec plusieurs recherches soutenues par le Fond national suisse et l’Académie suisse des SHS;
  • Juillet 2014 : au cours du congrès DH 2014, qui s’est déroulé entre l’Université de Lausanne et l’EPFL, l’association francophone en humanités numériques Humanistica est officiellement présentée.

… to be continued !

Sara Lonati

Lien vers la présentation : Lonati_DH_and_Libraries

Licence Creative Commons
Le contenu de ce blog est mis à disposition selon les termes de la Licence Creative Commons Attribution - Pas d'Utilisation Commerciale - Pas de Modification 4.0 International.

Articles récents

  • Recherche d’ID devient Recherche d’IdéeS 08.01.2019
  • Soutenances des mémoires de Master IS 15.08.2018
  • Last but not least : les résultats de notre recherche sur les outils Open Source pour la gestion des données de la recherche 06.03.2018

Commentaires récents

liser0n dans PID: un panorama pour les gouv…
Vincent BOISARD dans Peut-on évaluer les plateforme…
gbongi dans Evaluation des moteurs de rech…

Archives

Tags

bibliothèque blog gestion des connaissances master ID MasterID nouvelles technologies projet de recherche Science de l'information séminaire évaluation

Méta

  • Inscription
  • Connexion
  • Flux RSS des articles
  • RSS des commentaires
  • WordPress.com
Publicités

Enseignement supérieur

  • HEG
  • Master en sciences de l'information

Créez un site Web ou un blog gratuitement sur WordPress.com.

Annuler
Confidentialité & Cookies : Ce site utilise des cookies. En continuant à utiliser ce site, vous acceptez leur utilisation.
Pour en savoir davantage, y compris comment contrôler les cookies, voir : Politique relative aux cookies