Soutenez la BnF
Formulaire de recherche

Pour les professionnels

Les métadonnées techniques pour la préservation numérique

Problématique

Les métadonnées de préservation gérées dans SPAR avec METS et PREMIS s’appliquent à tout type de document numérique. D’autres informations, essentielles à la pérennisation, sont spécifiques à un type de contenu particulier. Par exemple :
  • Pour le texte : l’encodage, la structure éventuelle en XML…
  • Pour l’image : la résolution, le profil colorimétrique, la profondeur d’encodage…
  • Pour le son : le débit, le codec, la fréquence d’échantillonnage…
  • Pour la vidéo : le nombre d’images par seconde, le profil colorimétrique, la durée...
  • Pour des contenus web : le format déclaré dans l’en-tête, la réponse du serveur collecté…
Ces informations ont donc vocation à être exprimées dans un schéma XML spécifique à chaque type de contenu. Elles sont extraites des fichiers par des outils d’analyse, qui produisent généralement une sortie XML exploitable. Pour chaque type de métadonnées techniques, une étude approfondie a permis de déterminer quels schémas utiliser dans SPAR. Trois grands types de critères ont été pris en compte :
  • Interopérabilité et pérennité : caractère standard du format
  • Finesse de structuration : capacité du format à exprimer toutes les informations souhaitées
  • « Sociabilité » du format : large adoption par d’autres institutions, maintenance collaborative, présence d’une liste de diffusion…

Formats de métadonnées techniques utilisés dans SPAR

La liste des formats de métadonnées du tableau ci-dessous présente l'usage au dernier trimestre 2013. Ces formats et les outils associés sont l'objet d'une veille permanente et sont susceptibles de changer avec l'évolution des techniques.

Type de contenu Format géré Format de métadonnées Outil de validation et de caractérisation
Image TIFF
JPEG
MIX version 1.0 JHOVE version 1.5
Texte XML
HTML
TXT
textMD version 3.0 JHOVE version 1.5
Son WAV MPEG-7 version 2.0 MediaInfo version 0.7.35
Vidéo MPEG-2 MPEG-7 version 2.0 MediaInfo version 0.7.35
Archives du web ARC containerMD version 1.0 JHOVE 2 version 2.1

vendredi 15 novembre 2013

Partagez