MARC en XML

En 2001, la Bibliothèque du Congrès a développé un ensemble d’outils pour permettre l’utilisation des données structurées en format MARC dans un environnement XML.
 

 

En effet, l’utilisation de XML est particulièrement intéressante pour:

  • éditer et afficher les notices selon des présentations différentes (par exemple, pour présenter les résultats d’une recherche selon l’arborescence du modèle FRBR, voir l’outil FRBR Display Tool développé par la Bibliothèque du Congrès);
  • gérer la cohérence et la correction des notices;
  • convertir les notices MARC vers d’autres formats en XML, comme Dublin Core ou MODS;
  • fournir ou échanger les notices MARC selon des protocoles fondés sur XML, comme les protocoles OAI-PMH ou SRU.

Le centre de ce dispositif est constitué par un schéma XML très simple qui exprime en XML la structure du format MARC 21: MARCXML

Le principe de ce schéma est le suivant: Chaque zone du format MARC devient un élément, comportant en attributs l’étiquette et les indicateurs. Les sous-zones deviennent elles-mêmes des sous-éléments, avec le code de sous-zone en attribut. Les zones de contrôle du format MARC (zones 00X) ainsi que le label de notice constituent des éléments spécifiques à l’intérieur desquels les données codées sont traitées comme des chaînes de caractères.

Cela permet des conversions entièrement réversibles, sans aucune perte d’information, d’une notice MARC conforme à la norme ISO 2709 vers une notice MARC en XML, et vice-versa.

MARCXML permet d’exprimer en XML des métadonnées descriptives riches, avec un niveau de complétude et de granularité identique au format MARC 21. Il peut être utilisé

  • dans le protocole OAI-PMH,
  • comme extension du schéma METS pour les métadonnées descriptives.

L’expérience a rapidement montré l’intérêt du schéma MARCXML. Une généralisation à l’ensemble des formats MARC du principe sur lequel repose MARCXML (fondé sur le seul format MARC 21) a semblé souhaitable. Ce travail a été mené dans le cadre de l’ISO: la norme ISO 25577 Information et documentation ? MarcXchange a été publiée en 2008.

Elle a pour objectif de fournir une alternative à la norme ISO 2709 Information et documentation ? Format pour l’échange d’information et de permettre l’échange de notices MARC avec des outils XML. Elle définit aussi une structure pour traiter des notices créées dans n’importe quel format MARC dans un environnement XML.

La norme ISO 25577 Information et documentation ? MarcXchange reprend la structure définie par le schéma MARCXML, mais la complète par deux attributs introduits dans l’élément correspondant à chaque notice MARC:

  • l’attribut «format» qui indique le format MARC utilisé dans la notice (par exemple, UNIMARC)
  • l’attribut «type» qui précise s’il s’agit d’une notice bibliographique ou d’autorité.

Le dernier état du projet de norme ISO 25577 Information et documentation ? MarcXchange est disponible (en anglais) sur le site de la Bibliothèque du Congrès qui est l’agence de maintenance de la norme.