Étiquettes

, , , ,

Le concept LOD (Élodie si on le prononce à l’anglaise) est évoqué de plus en plus fréquemment lorsqu’il s’agit de l’avenir des métadonnées des bibliothèques, actuellement stockées en format MARC. Néanmoins, même si l’on comprend son fonctionnement, on peine souvent à en saisir les avantages pour les bibliothèques et leurs utilisateurs. Voici quelques éléments en faveur d’Élodie…

A) Meilleures possibilités de recherche

  • Les LOD permettent des recherches plus précises, notamment grâce aux informations supplémentaires provenant de sources externes, qui peuvent être intégrées dans une requête, et grâce aux inférences. Ainsi, il serait par exemple possible de lancer une requête trouvant tous les premiers romans d’auteurs de moins de 40 ans [1].
  • Une fonction de recherche géographique peut être implémentée sur la base des LOD, en liant les données existantes à des données de géolocalisation. Par exemple, data.bnf.fr propose à l’utilisateur de rechercher des documents en utilisant une carte du monde.
  • Les LOD sont également prometteurs dans le domaine des recherches multilingues. Par exemple, dans TheEuropeanLibrary, un utilisateur francophone recherchant « libraries » se voit proposer le sujet « bibliothèques », car ces deux termes sont liés en LOD.
  • Grâce aux informations provenant de fichiers d’autorités en LOD, il est possible de développer une fonction d’auto-complétion avec contextualisation, afin d’aider l’utilisateur à la désambiguïsation des personnes lors de la recherche. C’est ce qu’a fait le Leibniz-Informationszentrum Wirtschaft, en Allemagne, en version bêta (exemple ci-dessous)[2].desambiguisation2
  • Enfin, comme en LOD tout est lié, on peut également chercher les relations entre des entités. Le portail Kulttuurisampo dispose d’un service établissant des liens entre les personnes. Voici ci-contre ce qu’il propose comme relation entre Pablo Picasso et Napoléon.relations

L’amélioration des possibilités de recherche permettrait d’élargir le rôle actuel du catalogue d’un dispositif de localisation vers un véritable outil de recherche.

B) Meilleure interopérabilité des données

Un format de données basé sur le modèle RDF (un format LOD) a l’immense avantage d’être utilisé également hors du monde des bibliothèques, à l’inverse de MARC. Cela facilite grandement le partage des données, notamment au travers de leur mise à disposition en téléchargement ou via une API. En effet, ces données pourront être réutilisées non seulement par d’autres bibliothèques, mais également par des développeurs d’applications sans lien avec le monde des bibliothèques. On imagine également un partage facilité avec les éditeurs et les libraires [3]. Les vendeurs de systèmes intégrés de gestion de bibliothèque n’auraient plus le monopole du marché des bibliothèques, car RDF est maîtrisé par de nombreux autres prestataires de solutions informatiques.

Le modèle RDF est flexible et facilement adaptable. Ainsi, des métadonnées de formats très divers (MARC, Dublin Core, EAD, etc.) peuvent être converties en un format unique basé sur RDF. Dans ce cas de figure, il est possible de proposer une recherche fédérée bien plus performante que dans le cas où plusieurs bases de données séparées doivent être interrogées. C’est ce qu’a réalisé avec succès la Bibliothèque nationale de France, à travers son service data.bnf.fr. Cette flexibilité de format ouvre aussi la possibilité de la publication des données de circulation en bibliothèque si souhaité.

L’interopérabilité du modèle RDF et les multiples avantages qui en découlent peuvent déboucher, plus concrètement, sur des gains de temps et d’argent.

C) Meilleure sérendipité

  • Les LOD permettent de lier automatiquement des ensembles de données entre eux. C’est ce qu’ont fait plusieurs bibliothèques pour enrichir leurs catalogues : intégrer dans la notice d’un document le premier paragraphe de Wikipédia sur son auteur, ou un lien vers une notice d’autorité externe plus détaillée.
  • Une recherche fédérée dans divers types de données (mentionnée plus haut dans cet article) permet de faire découvrir à l’utilisateur des informations utiles dont il ne connaissait peut-être pas l’existence. Le Centre Pompidou à Paris a par exemple misé là-dessus en proposant des dossiers pédagogiques en ligne et des descriptions d’événements organisés dans ses locaux. Ces informations sont parfaitement intégrées aux descriptions d’œuvres d’art et aux notices bibliographiques présentes sur le site web, et sont enrichies d’images et de vidéos.
  • Sur la base des LOD, il est possible de créer des représentations attractives des données bibliographiques existantes, qui ont pour avantage de permettre la « navigation » dans les données, plutôt que l’exploration par requêtes comme cela se fait dans les catalogues traditionnels. La Bibliothèque nationale de France a par exemple développé la navigation sur une carte géographique (déjà mentionnée plus haut dans cet article), mais également la navigation dans le temps. Avec data.bnf.fr, on peut en effet découvrir les œuvres d’un auteur sur une frise chronologique interactive, en version bêta. Voici un exemple des œuvres de Blaise Cendrars ci-dessous.blaisecendrars

D) Meilleure visibilité sur le web

Si les données bibliographiques sont publiées dans un format LOD, elles seront indexées par les moteurs de recherche [4] et apparaîtront, par exemple, dans les résultats Google pour une requête ciblée. C’est l’avantage d’utiliser un format compatible avec les standards du W3C. Les données en format MARC, à l’inverse, restent cachées dans le Deep Web, c’est-à-dire qu’elles sont accessibles uniquement via des interfaces spécialisées comme les OPACs. Cela permet également d’apporter le contenu des catalogues là où se trouvent les utilisateurs, notamment sur les moteurs de recherche. Peu à peu, le concept de « portail » devient obsolète.

Les objets publiés en LOD possèdent des identifiants uniques et persistants (des URIs). Ceci est également un facteur pouvant générer des liens tiers pointant vers le catalogue, et ainsi améliorer l’indexation et la visibilité des contenus des bibliothèques sur le web [5].

♦ ♦ ♦

Voici en résumé quelques arguments en faveur d’Élodie (ou contre Marc, indirectement), un thème qui pourra bouleverser, dans un avenir proche, le monde des données en bibliothèque.

Vous connaissez d’autres avantages ? N’hésitez pas à les ajouter en commentaires !

Jasmin Hügi et Nicolas Prongué

Références

  1. FÜRSTE, Fabian M. Linked open library data: bibliographische Daten und ihre Zugänglichkeit im Web der Daten. Wiesbaden : Dinges & Frick, 2011. BIT online innovativ, Bd. 33. ISBN 9783934997363
  2. NEUBERT, Joachim et BORST, Timo. Die Nutzung von LOD-Personennormdaten zur Disambiguierung bei Erfassung und Recherche. Deutscher Bibliothekartag 2012 [en ligne]. Hamburg. 24 mai 2012. [Consulté le 26 novembre 2013]. Disponible à l’adresse : http://www.opus-bayern.de/bib-info/volltexte//2012/1240/pdf/lod_normdaten.pdf
  3. BYRNE, Gillian et GODDARD, Lisa. The Strongest Link: Libraries and Linked Data. D-Lib Magazine [en ligne]. novembre 2010. Vol. 16, n° 11/12. [Consulté le 28 février 2013]. DOI 10.1045/november2010-byrne. Disponible à l’adresse : http://www.dlib.org/dlib/november10/byrne/11byrne.html
  4. OSTROWSKI, Felix et POHL, Adrian. Zur Entwicklung eines Linked-Open-Data-Dienstes für Bibliotheksdaten. In : Vernetztes Wissen – Daten, Menschen, Systeme. [en ligne]. Forschungszentrum Jülich GmbH Zentralbibliothek, Verlag, 2012. pp. 271‑291. [Consulté le 3 juillet 2013]. Reihe Bibliothek / Library 21. Disponible à l’adresse : http://hdl.handle.net/2128/4699
  5. Library Linked Data Incubator Group Final Report. World Wide Web Consortium (W3C) [en ligne]. 25 novembre 2011. [Consulté le 3 juillet 2013]. Disponible à l’adresse : http://www.w3.org/2005/Incubator/lld/XGR-lld-20111025/