Collections numériques préservées dans SPAR : filières et modèles

La Bibliothèque nationale de France conserve un grand nombre de collections numériques et numérisées, dont la masse et la diversité ne cesse de croître. Elle doit prendre en compte cette hétérogénéité dans ses solutions de préservation, mais aussi harmoniser les données selon les normes et standards nationaux et internationaux.
 

Gérer la diversité des collections : les filières et les chaînes

Afin de gérer la diversité des collections numériques de la bibliothèque, il a fallu définir des sous-ensembles cohérents du point de vue de leurs conditions de préservation pérenne. Afin de s’abstraire des variations périodiques de l’organisation de l’établissement, des «filières» ont été définies, en s’appuyant sur le statut juridique des documents qui les composent (dépôt légal, acquisitions, archives…), et qui influe sur les conditions de conservation possibles (durée, droit de modification de la forme des informations, conditions de diffusion, etc.).

Ces filières sont:
  • la numérisation de conservation (reproductions de haute qualité et fidélité à l’original, qui constituent un exemplaire de secours);
  • l’audiovisuel et le multimédia (documents nés numériques ou numérisés, sous des formes patrimoniales ou transitoires, pour la diffusion);
  • la numérisation de consultation (reproductions partielles ou de qualité moyenne qui n’ont pas vocation à être conservées de manière pérenne);
  • le dépôt légal automatique (documents nés numériques collectés de manière automatisée, telles les collections d’archives du web);
  • le dépôt légal négocié (documents déposés après négociation des formes et conditions avec les éditeurs ou diffuseurs);
  • la production administrative et technique (archives internes de la BnF);
  • les dons et acquisitions;
  • le tiers archivage.

Dans SPAR, chaque filière est divisée en autant de chaînes que les spécificités techniques ou de gestion des collections le nécessitent. Il peut être utile, par exemple, de séparer dans SPAR la préservation de documents de formats différents bien que de même nature juridique, afin d’y appliquer des contrôles spécifiques.
On peut également vouloir regrouper des documents dont la création correspond à des générations technologiques successives, afin de traiter plus finement les différences qui en résultent. On peut encore décider de séparer en autant de chaînes des ensembles documentaires dont la provenance diffère, pour en faciliter la manipulation.

Ces filières et chaînes sont développées à mesure des besoins.

En savoir plus

Normaliser les documents : le paquet d’informations

Si les sources de documents sont variées, on s’efforce dans SPAR d’harmoniser et de normaliser la façon dont les données sont formées et traitées.

L’application SPAR manipule des paquets d’informations tels que définis par la norme OAIS, quelles que soient la diversité et la complexité des données versées dans le système.

Un paquet d’informations est un ensemble composé d’un document numérique et de tous les types de métadonnées nécessaires à le rendre accessible et compréhensible sur le long terme. C’est un ensemble indissociable afin de garantir la préservation de ce document.

Un paquet d’informations peut contenir, par exemple, des images et des textes, et l’information de structure qui les organise en pages.

La norme OAIS rappelle que les paquets d’informations peuvent prendre différentes formes :

  • des paquets d’informations à verser (Submission Information Package, SIP) tels que soumis par le producteur des données ;
  • des paquets d’informations archivés (Archival Information Package, AIP), dans l’état optimal pour la préservation ;
  • des paquets d’informations diffusés (Dissemination Information Package, DIP) qui peuvent en être issus.

La BnF s’efforce d’unifier la façon dont les paquets d’informations sont archivés dans SPAR, par l’utilisation de formats de métadonnées normalisés.

Les paquets d’informations ont un identifiant ARK unique et pérenne. Il est possible de créer de nouvelles versions de ces paquets d’information lorsque l’on souhaite modifier les données, et de nouvelles éditions lorsque l’on modifie uniquement les métadonnées. Les éditions précédentes d’une version ne sont pas conservées.

En savoir plus

Politique de préservation : les accords de qualité de service

Les conditions de versement, préservation et diffusion des paquets d’information versés dans chaque chaîne sont contractualisées dans des accords de qualité de service. Ces accords permettent de consigner les besoins des utilisateurs et de paramétrer le système en prenant en compte ces demandes et les capacités du système. La définition de la qualité de service est une phase cruciale, qui demande une bonne connaissance des collections et des capacités du système.

Les critères à définir, pour assurer un traitement des documents par SPAR conforme aux besoins, comprennent:
  • pour le versement: la volumétrie, les flux, les formats de fichiers attendus, et les contrôles qui doivent porter sur ces formats, etc;
  • pour la conservation: la durée de conservation, le nombre de copies, la conformité des métadonnées aux modèles choisis, les stratégies de préservation (émulation, migration), etc;
  • pour l’accès : les droits, les flux, etc.

 Exemples de paramètres définis par les accords de qualité de service de versement, préservation et accès