Bibliothèque nationale de France

Formulaire de recherche

  Pour les professionnels

Écouter la page :

Et aussi...

Les principaux standards :

Le Web de données à la BnF : data.bnf.fr

data.bnf.fr est un projet défini dans le cadre du schéma numérique de la Bibliothèque nationale de France, qui a pour but de rendre ses données plus visibles et plus utiles sur le Web.
Mis en ligne en juillet 2011 dans une première version, data.bnf.fr comporte désormais plus de 200 000 pages auteur, œuvre et thème. Ces pages regroupent plus de 2 millions de références des catalogues de la BnF (BnF catalogue général, BnF archives et manuscrits) et plus de 140 000 liens vers Gallica.

Présentation du projet

data.bnf.fr permet de rassembler autour de ses pages auteur, œuvre et thème, des ressources de la Bibliothèque nationale de France, ainsi que des ressources extérieures. Ces pages articulent les différents contenus, liens et services que la BnF fournit sur Internet. L’internaute accède ainsi aux documents des catalogues de la BnF ainsi qu’aux documents numérisés de Gallica.

Les œuvres et les auteurs exposés dans data.bnf.fr correspondent à un corpus « classique » de ressources citées et étudiées. Le corpus initial de data.bnf.fr porte sur des œuvres et des auteurs majeurs pour lesquels il existe de nombreuses notices dans les différentes bases de la BnF.
Il s’élargit progressivement à des œuvres (musicales, anonymes…) et des auteurs nouveaux (juristes, compositeurs…). Cette extension permet de mettre en valeur les auteurs et œuvres moins connus et moins présents sur le Web. Enfin, il contient l'ensemble des autorités sujet du référentiel RAMEAU.

data.bnf.fr permet :
  • d’accéder aux ressources de la BnF directement depuis une page Web, sans connaître auparavant les services de la BnF et sans passer par un portail spécifique ;
  • de s’orienter dans les ressources de la BnF et de trouver éventuellement des ressources extérieures.
L’objectif est donc de valoriser la richesse des fonds de la BnF sur le Web et de servir de pivot entre les différentes ressources. data.bnf.fr est au service des autres applications de la BnF.

Enfin, le projet s’inscrit dans une démarche d’ouverture de la BnF au Web de données et d’adoption des standards du Web sémantique.

Des pages HTML

data.bnf.fr expose des données structurées de haute qualité. Elles regroupent des contenus, des liens et des services sur une page unique.

Les pages HTML de data.bnf.fr sont générées automatiquement à partir des données existantes accessibles dans les différentes bases de la BnF (BnF catalogue général, BnF archives et manuscrits, Gallica, etc.). Les notices d’autorité fondent les pages du site : les autorités personne et organisation (PEP et ORG) pour les pages auteur, les autorités titres (TIC, TUT, TUM) pour les pages œuvre et les autorités RAMEAU pour les pages thématiques.

Enfin, ces pages sont indexées par les moteurs de recherches. Ceux-ci ne référencent pas les données et les métadonnées qui sont cachées dans les bases de données non indexables de la BnF. Le projet data.bnf.fr améliore la visibilité des ressources de la BnF, souvent dissimulées dans le Web « profond », et signale les documents numériques directement accessibles.

Un nouveau modèle de données

Le modèle de données de data.bnf.fr permet la fédération de données issues de ressources internes, mais aussi l’intégration de liens de sources externes. L’articulation des différents silos de données s’appuie sur les notices d'autorité qui disposent d’identifiants pérennes (adresses Web), les identifiants ARK.

Un premier travail a porté sur les évolutions des modèles bibliographiques, en particulier le modèle FRBR. Les données sont rassemblées autour des entités œuvre, auteur et thème, à des niveaux différents : œuvre, manifestation, expression et item. Les auteurs sont reliés aux documents selon leur type de contribution et à différents niveaux : auteur d’une œuvre, traducteur, illustrateur ou préfacier d’une édition, possesseur d’un manuscrit par exemple.

Cette réflexion a été complétée par une modélisation visant à exprimer ces données en RDF en vue de leur exposition dans le Web de données. Pour la BnF, l'utilisation de ces standards techniques doit garantir l'interopérabilité entre les bases internes et avec l'extérieur, en utilisant des données structurées exploitables par les machines de façon renouvelée.

Exposition des données en RDF (Resource Description Framework)

Le respect des standards du Web de données doit permettre, à terme, l'exposition et l'intégration de données utiles, fiables et validées dans l'univers croissant du Web sémantique. Ceci doit être fait conformément aux initiatives internationales qui facilitent l'utilisation des données publiques, informationnelles ou administratives.

Cette présence sur le Web de données implique la mise en place de solutions techniques pour créer des liens (URI déréférençables, système de négociation de contenu, accès aux données brutes). Ces liens permettent notamment aux données de la BnF de dialoguer avec des ressources externes.

data.bnf.fr est un projet ouvert : les données peuvent être réutilisées, selon les besoins, intégralement ou partiellement, notamment par des développeurs et des professionnels des bibliothèques. La licence d’utilisation permet ainsi la récupération et la réutilisation gratuites et libres des données en RDF, sous réserve du maintien de la mention de la source BnF.

Parmi les données exposées et récupérables, se trouvent les notices d'autorité sujet du référentiel RAMEAU (Répertoire d'autorité-matière encyclopédique et alphabétique unifié). Elles ont été converties dans le langage RDF SKOS (Simple Kowledge Organisation System), dans le cadre du projet européen TELplus. Ce référentiel est désormais maintenu à jour sur data.bnf.fr avec la base de données totale et actualisée de la BnF.

Quatre grands objectifs

  1. Créer des unités documentaires « pivots »
    Il s'agit de fournir des pages Web synthétiques sur des auteurs, des œuvres et des thèmes. Ces pages favorisent les rebonds vers toutes les ressources pertinentes de la BnF (notices de catalogues, documents numérisés dans Gallica, images, expositions virtuelles, etc.). Ainsi, chaque fiche est conçue comme un nouveau point d'accès aux données et aux services de la BnF.
  2. S'adapter aux évolutions du Web
    Il s'agit de rendre ces pages riches, faciles à utiliser et accessibles. Ces pages synthétiques rassemblent les divers contenus, liens et services des ressources Internet de la BnF. Cela suppose un travail d'alignement et d'enrichissement des contenus, mais aussi un travail sur les adresses des ressources, sur l'accès aux données par les machines, et sur la structure des données pour les rendre aussi utiles que possible et en permettre une exploitation pertinente.
  3. S'associer au Web sémantique
    Il s'agit d'exposer ces données dans le Web de données (« linked data »). Il s'agit de mettre à disposition les données des pages grâce à des formats structurés qui permettent leur mise en relation avec des partenaires possédant des données complémentaires (par exemple des extraits de Wikipedia). Ces mises en relation constituent une opportunité de renforcer la visibilité des ressources de la BnF et de multiplier les possibilités pour les internautes de les consulter. Enfin, l’exposition des données de data.bnf.fr aux formats du Web sémantique favorise la réutilisation des données par des tiers, et la création de nouveaux services par des acteurs tant publics que privés.
  4. Mesurer les usages
    Il s'agit de disposer d'outils de mesure de fréquentation et d'avoir une meilleure connaissance des pratiques des internautes, des tendances temporelles et géographiques associées à la consultation de ces pages. À terme, il s'agit de développer le site, en fonction des consultations des internautes et des retours des réutilisateurs.

vendredi 22 mars 2013