Bibliothèque nationale de France

Formulaire de recherche

  Pour les professionnels

Écouter la page :

Télécharger

Numérisation et métadonnées

A la BnF, la numérisation est considérée depuis l'origine (début des années 1990) comme une technique de reproduction et de conservation à part entière des documents. Les choix de formats, de résolution, de prise de vue reflètent ce principe. La numérisation en mode image continue d’être une priorité car elle permet de proposer aux utilisateurs une reproduction fidèle du document original. Dès lors, la structure et l’organisation du document numérique sont traités selon des méthodes précises afin d’en assurer à la fois la communication et la conservation.
L’ensemble des règles de numérisation sont regroupés dans la Charte technique de numérisation de la BnF.

Documents numériques et métadonnées

Un document numérique est une suite de fichiers sans lien entre eux, décrit par un identifiant unique englobant un ensemble de métadonnées :

  • des métadonnées descriptives pour :
    • donner une description bibliographique approfondie et détaillée dans un format normalisé permettant l'échange de données ;
    • rattacher le document à l’original ou à différentes versions d’un document ;
    • donner accès à la copie numérique.
  • des métadonnées de structure pour :
    • rattacher les fichiers d'un même document entre eux ;
    • reconstituer la structure du document : connaître tous les fichiers qui composent un document (fichiers textes, images...) ; connaître la relation physique entre ces fichiers (ordre d'affichage, fichier cible donnant accès à l'ensemble) ; .
  • des métadonnées administratives pour :
    • gérer les droits : d’accès (droits d'auteur, confidentialité) et d'usage (droits d'impression, de reproduction, de modification...) ;
    • préserver les informations techniques nécessaires à la lecture des fichiers ;
    • garantir l’intégrité des fichiers et le suivi de leurs éventuelles modifications.

Métadonnées

Une métadonnée est un ensemble structuré d'informations décrivant une ressource quelconque.
Les métadonnées ne décrivent pas nécessairement des documents électroniques. Elles ne sont pas forcément contenues dans le document.

Identification d'un document numérique : le schéma XML refNum

Dans les années 1990, pour gérer les métadonnées de production des documents numériques, la BnF a mis au point le schéma XML refNum, schéma propre à l'établissement et utilisé par les applications de contrôle des données livrées par les prestataires et les ateliers. La structure du schéma refNum est proche du standard METS, mais simplifiée pour faciliter la production.

Le schéma XML refNum décrit les données descriptives et techniques associées au document numérisé. Il a plusieurs fonctions :

  • identifier le document par des métadonnées bibliographiques, de production (date de numérisation, résolution, scanners utilisés, historique des traitements, etc) et de structure du document numérique ;
  • fournir la correspondance entre les images numériques et leur équivalent logique dans l'original. Le fichier refNum permet par exemple à l'utilisateur sur Internet d'obtenir la page 3 de l'original même si cette page correspond à la vue n° 5 dans le document numérique.

Le schéma comprend 3 grandes parties :

  • bibliographie : ces données générales et succinctes définissent le type de document original (iconographique, monographie, périodique), le titre, l'auteur, la date d'édition et le nombre de pages. Elles ne se substituent pas aux données du catalogue ;
  • production : ces données renseignent sur les conditions de numérisation, notamment date de numérisation, nombre d'images, données liées à la livraison, liste des traitements et leur historique ;
  • structure : il s'agit de la liste des images (ou "vues-objet") composant le document numérique, et leurs métadonnées variables selon le projet : légende si besoin sur le contenu de l'image, foliotation ou pagination, profondeur de capture, résolution, etc. ainsi que des commentaires de conformité par rapport au document original.

A compter de 2009, dans le cadre de la mise en place du système de préservation et d'archivage réparti (SPAR), les métadonnées des documents numériques seront exprimées en METS. Le schéma refNum étant maintenu pour la production, les fichiers de métadonnées seront transformés en METS lors de leur entrée dans le système d'archivage.

METS = Metadat Encoding and Transmission Standard

Le schéma METS, maintenu par la Bibliothèque du Congrès, est un standard permettant d'encoder les métadonnées descriptives, administratives et de structure spécifique aux objets numériques.

Voir

METS primer and reference manual
pour une documentation complète sur METS

jeudi 5 août 2010