Récupérer des notices descriptives de documents numérisés en Dublin Core (OAI-NUM)

Contours de l’offre

La BnF met à disposition sur l’entrepôt OAI-NUM l’ensemble des notices descriptives des collections qu’elle numérise (livres, périodiques, manuscrits, documents iconographiques, cartes et plans, partitions, documents sonores, etc) et accessibles dans la bibliothèque numérique Gallica. Plus précisément, cela concerne :

  • les collections de la BnF ;
  • les collections des bibliothèques partenaires numérisés dans le cadre des marchés de la BnF.

Cet ensemble représente plus de 3 millions de notices, mises à disposition dans un format simplifié (Dublin Core) via le protocole d’échange de données OAI-PMH.

Ne sont pas concernées les collections des bibliothèques partenaires référencées uniquement dans Gallica (et non sur les autres catalogues de la BnF) et consultables sur des sites tiers.

La BnF met à disposition un guide d’interopérabilité OAI-PMH pour permettre aux bibliothèques un référencement de leurs documents numériques dans Gallica via le protocole OAI-PMH.

L’entrepôt OAI-NUM est mis à jour chaque semaine avec les nouveaux documents numérisés par la BnF.

 

Quels formats ?

Ces notices sont proposées dans trois formats de métadonnées :

  • Dublin Core simple (oai_dc) : les principes retenus à la BnF dans l’utilisation des éléments du Dublin Core simple sont présentés dans le Guide d’utilisation du Dublin Core à la BnF.
  • MPEG21-DIDL (didl) : utile en particulier pour la représentation de la granularité des objets numériques (fascicules de périodiques, légendes des photographies dans un album). À l’intérieur de la structure DIDL, le format choisi est le Dublin Core simple.
  • TEL-Application profile (tel_ap) : il s’agit d’un profil d’application du Dublin Core spécifiquement développé dans le cadre du projet européen The European Library. En plus des éléments du Dublin Core simple, le TEL – Application profile utilise quelques éléments du Dublin Code qualifié (ex. <dcterms:issued>), de MODS (ex. <mods:location>), et quelques éléments spécifiques à TEL-AP pour préciser le lien aux ressources numérisées lorsque c’est pertinent (<tel:seeonline> vers la ressource numérisée, et <tel:fulltext> vers le texte OCRisé).

 

Modalités techniques de récupération

Ces notices sont récupérables via le protocole OAI-PMH, dans l’entrepôt OAI-NUM (URLde base, page de description Identify).
L’entrepôt est organisé en sets regroupant les notices, et en particulier :

  • Sets par types de documents (ex. gallica:typedoc:cartes:atlas)
  • Sets par regroupement thématique (ex. gallica:corpus:afrique)
  • Sets par indexation sujet suivant la classification décimale Dewey (gallica:theme:1:18, qui correspond à la philosophie antique, médiévale et orientale)

L’entrepôt est interrogeable par la formulation de requêtes dont on peut retrouver le détail sur le site api.bnf.fr

 

Conditions d’utilisation

La BnF a, depuis le 1er janvier 2014, placé ses métadonnées descriptives (données bibliographiques et d’autorité) sous la « Licence Ouverte /Open Licence » de l’État élaborée par la mission Etalab. L’utilisation de ces métadonnées est libre et gratuite sous réserve du maintien de la mention de leur source et de l’indication de leur date de récupération.

Dans les notices récupérées depuis les entrepôts OAI de la BnF, vous devez conserver :

  • le numéro ARK contenu dans la balise <identifier> du header de chaque « record » (ex. : <identifier> oai:bnf.fr:gallica/ark:/12148/cb30000001q</identifier>) ;
  • la date contenue dans la balise <responseDate> de chaque « record » (ex. : <responseDate>2013-12-19T13:59:03Z </responseDate>).

 

Exemples de réutilisation

Réutilisation des données de OAI-NUM :

Pour toute question sur la récupération des données :