Soutenez
le Trésor national
Formulaire de recherche

Pour les professionnels

Les enjeux du web de données en bibliothèque

Les catalogues au défi du web

On désigne généralement par le terme de web sémantique un ensemble de standards et de technologies développé par le W3C (l'un des principaux organismes de normalisation du web) visant à faciliter l'exploitation des données structurées, notamment en permettant leur interprétation par des machines. Le web de données (Linked Data en anglais) consiste à exposer ces données structurées sur le web et les relier entre elles, ce qui permet d'accroître leur visibilité et leur réutilisation. Les bibliothèques produisent depuis longtemps dans leurs catalogues des données structurées et contrôlées qui ont une valeur sur le web. Elles pourraient devenir des acteurs majeurs du web de données. Voici un aperçu des motivations et des initiatives actuelles des bibliothèques pour s'insérer dans ce nouvel environnement.

Pourquoi les bibliothèques doivent faire évoluer leurs catalogues ?

Les technologies du web sémantique s'adressent aux acteurs intéressés par la publication de données structurées sur le web : les bibliothèques ont donc vocation à s'intéresser à leur utilisation. Le partage des données structurées et de confiance fait partie des missions des bibliothèques, qui utilisent déjà des protocoles comme Z 39.50 ou OAI-PMH pour améliorer l'interopérabilité et l'échange de données.

Le web de données représente une opportunité nouvelle de diffuser et encourager la réutilisation des métadonnées bibliographiques, en favorisant :
  • la visibilité et le référencement des données sur le web, en facilitant aux moteurs de recherche et aux internautes l’accès aux données ;
  • l’interopérabilité, en permettant la fédération de silos de données de nature, de provenance et de structure différentes ;
  • la fiabilité, en traçant l’origine de la ressource, grâce aux identifiants web URI, permettant ainsi aux bibliothèques de se lier à des données fiables tout en se positionnant comme tiers de confiance ;
  • la souplesse de réutilisation par des tiers, en permettant de récupérer et de retraiter l’ensemble de données nécessaires, de les croiser avec des jeux de données extérieures ou des données locales.

Contexte international

Les catalogues traditionnels de bibliothèques évoluent pour s’adapter à l’environnement technologique et être partie prenante du web. Il s’agit de valoriser des données bibliographiques qui intéressent les usagers-internautes, y compris au-delà du périmètre des bibliothèques, et de s’adapter à l’évolution des pratiques de recherche et des usages du web.

Pour ce faire, les catalogues se transforment :
  • en s’adaptant aux standards du web et en s’inscrivant dans le web de données, selon les normes établies par le W3C ;
  • en s’appuyant sur de nouveaux modèles conceptuels élaborés par l’IFLA, en particulier les modèles FRBR ;
  • en réfléchissant à l’adoption d’un nouveau code de catalogage reflétant ces modèles, en particulier RDA.

Le groupe d'incubation du W3C

Un groupe d'incubation du W3C s’est consacré aux bibliothèques et au web de données (Library Linked Data), de mai 2010 à août 2011, visant à améliorer l’interopérabilité globale des données de bibliothèques sur le web grâce au web sémantique et au web de données.

Il a publié trois rapports :
  • un rapport final avec des recommandations sur des développements futurs ;
  • un rapport sur des cas d’usages ;
  • un rapport sur les vocabulaires et référentiels du web de données existants.

Quelques exemples d'application du web sémantique dans les bibliothèques

Depuis la fin des années 2000, la montée en puissance du web de données et la maturité des technologies associées ont suscité des premières réalisations notables :
  • fin 2008, la publication par Libris, catalogue collectif des bibliothèques suédoises, de l'intégralité de ses données bibliographiques dans le web de données;
  • en mai 2009, la publication par la Bibliothèque du Congrès de ses autorités sujet (LCSH) en SKOS. Depuis, d'autres bibliothèques ont annoncé la publication d'une partie de leurs données dans le web de données. C'est notamment le cas des Bibliothèques nationales allemande, hongroise, espagnole et britannique;
  • le projet Europeana Linked Open Data expose les métadonnées de bibliothèques européennes en RDF;
  • le projet VIAF qui agrège les données d'autorités de plusieurs bibliothèques nationales et dont l'un des objectifs est la publication de ces données dans le Web de données;
  • l'initiative BIBFRAME, pilotée par la Bibliothèque du Congrès, qui vise notamment à définir un nouveau format des données des catalogues en remplaçant les formats MARC existants par une structure RDF;
  • le projet datos.bne.es, piloté par la Bibliothèque nationale d'Espagne;
  • le référentiel des autorités Sudoc, IdRef, piloté par l'ABES;
  • La BnF est elle-même engagée dans le web sémantique par le biais des projets data.bnf.fr et OpenCat.
En savoir plus

Web de données à la BnF

jeudi 2 octobre 2014

Écouter la page

Consulter

Partagez