On désigne généralement par le terme de Web sémantique un ensemble de technologies développé par le
W3C (l'un des principaux organismes de normalisation du Web) visant à faciliter l'exploitation des données structurées, notamment en permettant leur interprétation par des machines.
Le Web de données (Linked Data en anglais) combine les technologies du Web sémantique avec les principes fondamentaux du Web (protocole HTTP, identifiants URI), avec pour objectif la construction d'un réseau d'informations structurées, disponibles en ligne et facilement réutilisables dans de nombreux contextes.
Le Web sémantique et les bibliothèques
Dans la mesure où les technologies du Web sémantique s'adressent aux personnes ou aux organisations intéressées par la publication de données structurées sur le Web, les bibliothèques ont toujours eu vocation à s'intéresser à leur utilisation. Le partage des données structurées fait partie des missions des bibliothèques, qui ont développé des protocoles comme Z 39.50 puis OAI-PMH pour améliorer l'interopérabilité. Pour elles, Le Web de données représente une opportunité essentielle de rendre leurs données plus utilisables. Toutefois, pendant quasiment dix ans, ces techniques n'étaient pas suffisamment matures pour démontrer leur utilité pratique et convaincre les bibliothèques de les adopter de façon profonde.
Vers la fin des années 2000, la montée en puissance du Web de données et la maturité des technologies correspondantes ont suscité les premières adoptions notables :
- fin 2008, la publication par Libris, catalogue collectif des bibliothèques suédoises, de l'intégralité de ses données bibliographiques dans le Web de données ;
- en mai 2009, la publication par la Bibliothèque du Congrès de ses autorités sujet (LCSH) en SKOS ;
- en 2010, d'autres bibliothèques (Bibliothèque nationale allemande et Bibliothèque nationale hongroise) ont annoncé la publication d'une partie de leurs données dans le Web de données ;
- le projet Europeana Linked Open Data expose les métadonnées de bibliothèques européennes en RDF ;
- le projet VIAF qui agrège les données d'autorités de plusieurs bibliothèques nationales et dont l'un des objectifs est la publication de ces données dans le Web de données.
En France, les premières expérimentations concrètes dans le domaine des bibliothèques furent l'inclusion de données en RDFa dans le catalogue
Calames.
Le projet
data.bnf.fr, en ligne depuis juillet 2011, regroupe des liens et des contenus de la BnF, ou extérieurs, dans des pages auteur, œuvre et thème, en s’appuyant sur les outils du Web sémantique. L’ensemble des données du site sont disponibles en RDF (Resource description framework). Dans ce cadre, les 160 000 notices d’autorité RAMEAU sont exposées en SKOS. Elles sont librement réutilisables sous réserve de la mention d’attribution de la source (Licence ouverte de l’État).
Faire évoluer les catalogues
À l’heure actuelle, les réflexions sur l’évolution des normes et modèles de catalogage dans les bibliothèques intègrent naturellement la problématique de l’évolution des standards traditionnels vers le Web sémantique. La structuration des métadonnées, telle qu'elle est traditionnellement pratiquée par les bibliothèques, est très adaptée à l'expression suivant les standards du Web sémantique, et le Web de données est une réponse aux besoins de partage des données et d'interopérabilité des bibliothèques.
SKOS et Dublin Core
L'utilisation de certains vocabulaires du Web sémantique pour structurer les données, comme Dublin Core (pour les descriptions bibliographiques) ou SKOS (pour les données d’autorité) est déjà une pratique répandue dans les bibliothèques. Ces standards ont pour principal attrait la possibilité de partager l’information avec des communautés en dehors du domaine des bibliothèques, ce que permettent plus difficilement les formats MARC.
OAI-ORE, un standard de description des objets numériques
L’Open Archive Initiative, responsable du protocole OAI-PMH, a ainsi commencé à développer un nouveau standard, OAI-ORE (Object re-use and exchange) qui utilise les technologies du Web sémantique pour décrire des objets numériques complexes et échanges ces descriptions sur le Web.
RDA, un nouveau code de catalogage
RDA (Ressources : Description et Accès), nouveau code de catalogage à vocation internationale publié en 2010, prend acte du modèle FRBR et organise les règles de description de manière à faciliter la représentation de l’information bibliographique sous forme de graphe, en utilisant les technologies du Web sémantique.
Le groupe d'incubation du W3C
Un groupe d'incubation du W3C, s’est consacré aux bibliothèques et au Web de données (Library Linked Data), de mai 2010 à août 2011.
Ainsi que le précise sa charte, ce groupe avait pour objectif d’améliorer l’interopérabilité globale des données de bibliothèques sur le Web grâce au Web sémantique et au Web de données.
Il a publié trois rapports :
- un rapport final avec des recommandations sur des développements futurs ;
- un rapport sur des cas d’usages ;
- un rapport sur les vocabulaires et référentiels du Web de données existants.