Étiquettes

,

Il y a quelque temps, nous avons été priés d’expliquer les avantages que représentent les Linked Open Data en bibliothèque. Mais avant de se lancer dans une telle démarche, nous souhaitons tout d’abord définir la signification du concept Linked Open Data, souvent abrégé LOD. En français, on parle parfois de données ouvertes et liées, mais le terme anglais semble prévaloir (surtout en Suisse).

Le concept de Linked Open Data regroupe en fait deux aspects différents, le « linked » et l' »open », qu’il s’agit de clarifier.

Linked Data

Comme le nom l’indique, les Linked Data décrivent des données reliées entre elles. Pour qu’elles puissent être reliées, il faut a) qu’elles soient publiées sur le web et b) qu’elles aient un identifiant unique sous forme de HTTP URI.

Les données sont liées entre elles au travers de combinaisons « donnée-lien-donnée », ou « sujet-prédicat-objet », qu’on appelle triplets dans le jargon. Un triplet ressemble à ceci:

<http://www.rero.ch/dicker_joel> <http://www.owl.org/same_as>
<http://www.viaf.org/joel_dicker>. [exemple fictif]

La troisième partie de ce triplet peut faire l’objet d’un autre triplet, tel que celui-ci [exemple semi-fictif]:

 Joël Dicker VIAF owl sameas W3C Joël Dicker Wikipédia

Ce qui rend les Linked Data intéressants, c’est qu’une signification est attribuée au lien lui-même qui relie deux données. Ainsi, dans l’exemple ci-dessus, le lien sémantique nous dit que la donnée 1 représente le même concept que la donnée 2.

De cette manière, tout sur le web peut être relié à n’importe quoi d’autre sur le web. Grâce à RDF, un standard commun qui permet d’unifier le formatage de ces triplets, prend forme un réseau global, appelé web des données. La figure ci-dessous, appelée Linked Open Data Cloud, vous illustre ce réseau de données.

Linked Open Data Cloud

Linked Open Data Cloud

En bref, pour avoir des Linked Data, il faut [1]:

  • Des identifiants uniques sous forme de HTTP URIs;
  • Le respect d’un standard commun du web (RDF);
  • Des liens vers des données externes.

Open Data

Inscrit dans la tendance parfois appelée « Open Everything« , l' »Open Data » met les données dans la ligne de mire. Ce phénomène se répand dans le secteur de l’administration publique ainsi que dans les milieux scientifiques. Le but est d’arriver à une meilleure transparence en partant du principe que ces données représentent un bien commun et devraient donc être accessibles par tous.

Alors quels critères les données doivent-elles remplir pour être considérées comme ouvertes? Ces critères relèvent de trois aspects: technique, économique et juridique [2].

  • Les données doivent être fournies dans un format non-propriétaire (par exemple .csv au lieu de .xlsx).
  • Les données doivent pouvoir être utilisées librement et sans discrimination.
  • Les données doivent être sous une licence ouverte (par exemple CC0) qui ne restreint pas l’utilisation, la réutilisation ni la redistribution.

Linked Open Data

Que veut donc dire la combinaison de ces deux termes? L’un n’inclut ou n’exclut pas l’autre, donc des données ouvertes ne doivent pas forcément être liées et des données liées ne doivent pas forcément être ouvertes. Mais elles peuvent être les deux. La combinaison de ces deux aspects crée une interopérabilité technique (avec RDF), juridique (sans restriction par le copyright) et économique (libre d’accès par tous) qui ouvre un large éventail de possibilités d’utilisation.

Pour mieux comprendre le potentiel des Linked Open Data et comment celles-ci peuvent être exploitées, nous consacrerons un prochain billet aux avantages qui peuvent en découler pour les bibliothèques.

Jasmin Hügi et Nicolas Prongué

Références

[1] GANDON, Fabien, 2012. Le web sémantique: comment lier les données et les schémas sur le web. Paris : Dunod. InfoPro. Management des systèmes d’information. ISBN 9782100572946.

[2] CHIGNARD, Simon, 2012. L’open data: comprendre l’ouverture des données publiques. Limoges : Fyp. Entreprendre. ISBN 9782916571706.