Bibliothèque nationale de France

Formulaire de recherche

  Pour les professionnels

Écouter la page :

Télécharger

une présentation du protocole OAI-PMH [fichier .pdf – 1789 Ko – 29/06/09 – 49 p.]
principes de base (historique, modèle de données, acteurs : fournisseurs de données et de services), requêtes et réponses, l’OAI à la BnF, un ensemble de liens pour en savoir plus.

OAI-PMH

OAI-PMH est le sigle de Open archives initiative - protocol for metadata harvesting, ce qui signifie « protocole pour la collecte de métadonnées de l'Initiative pour les Archives ouvertes ».

Description du protocole

Le protocole OAI-PMH est un moyen d'échanger sur Internet des métadonnées entre plusieurs institutions, afin de multiplier les accès aux documents numériques.

Il permet :

  • d'accroître la visibilité des collections numériques sur Internet,
  • de reconstituer virtuellement des corpus à partir de ressources accessibles sur différents sites,
  • d'alimenter des portails thématiques.

Son utilisation est libre, tout comme ses spécifications, disponibles sur le site www.openarchives.org.

L'OAI-PMH définit deux types d'acteurs :

  • les fournisseurs de données, qui déposent leurs métadonnées sur un serveur web appelé "entrepôt",
  • et les fournisseurs de service qui collectent (on dit aussi "moissonnent") ces données pour les intégrer à l'index de leurs propres bibliothèques numériques.

Un même établissement peut jouer les deux rôles : diffuser ses métadonnées et collecter celles des autres.

Le fonctionnement de base du protocole OAI-PMH repose sur une communication de client à serveur. Le client envoie des requêtes au serveur en http, le serveur répond par un flux de données en XML.

Les entrepôts OAI de la BnF

Un autre moyen d'accéder aux données

La Bibliothèque nationale de France a ouvert deux entrepôts OAI destinés à faciliter l'accès à ses collections et à ses données.

Le premier, OAI-NUM, contient les notices de tous les documents numérisés par la BnF et accessibles via la bibliothèque numérique Gallica. En revanche, on n'y trouvera pas les documents des bibliothèques partenaires signalés dans Gallica.
Le second, OAI-CAT, a pour vocation de contenir l'ensemble des notices des documents de la Bibliothèque nationale de France, numérisés ou non. Il contient actuellement plus de 11 millions de notices.

Ces deux entrepôts sont organisés en ensembles ou sets regroupant les notices :

  • par types de documents,
  • par dossiers thématiques ou par fonds correspondant à l'organisation des collections,
  • par indexation sujet suivant la classification décimale Dewey.

Enrichis régulièrement, ils sont librement moissonnables en vertu du protocole OAI-PMH et permettent de référencer dans d'autres bases les documents numérisés et les données bibliographiques produites par la BnF.

Conformément au protocole, la BnF utilise le Dublin Core non qualifié pour les métadonnées descriptives de ses documents.

mardi 2 août 2011