Architecture logicielle de SPAR

SPAR, le système de préservation numérique de la BnF s’inspire dans sa réalisation des entités du modèle fonctionnel de la norme OAIS. Rôles, objectifs et interactions de ces entités y sont définis, ce qui permet la spécification de modules aux fonctions claires.

Organisation générale des modules de SPAR

Les relations entre les modules de SPARsont clairement définies grâce à la norme OAIS.Ils sont donc indépendants : les composants sont ainsi plus faciles à remplacer, assurant la pérennité des fonctions, et une distribution propice aux performances attendues.

Modules Pré-versement

Ces modules, un par chaîne, effectuent les traitements nécessaires à la normalisation des données avant leur versement dans SPAR proprement dit. Les données et métadonnées soumises par le producteur ou extraites de systèmes externes (catalogues, annuaires, etc.) sont mises sur le modèle de SIP attendu par le système.

Module Versement

Ce module reçoit les données à verser (SIP) de la part des producteurs, ou du module Pré-versement si les données ont été préalablement mises en forme. Une fois le versement validé au regard de l’accord de qualité de service, les données, éventuellement transformées pour les besoins de la préservation, sont empaquetées pour l’archivage (AIP) avant d’être remises au stockage.

Module Stockage

Ce module assure les opérations liées au stockage des fichiers numériques qui lui sont confiés sous forme de paquets à archiver (AIP). Il est une couche d’abstraction des mécanismes et des systèmes de stockage vis-à-vis des autres modules. Il garantit l’intégrité des données, et assure l’adéquation des modes de stockage aux exigences des producteurs et de la communauté des utilisateurs, en termes de performance et disponibilité.

Module Gestion des données

Ce module assure les fonctions et services relatifs à l’indexation, la conservation et l’accès aux métadonnées, tant à l’Information de description, qui identifie et documente les paquets dans SPAR, qu’aux données administratives utilisées pour gérer le système.

La solution technique choisie repose sur plusieurs entrepôts :
  • L’entrepôt des documents de référence contient tous les manifestes METS des paquets d’information, et les schémas XML utilisés par le système.
Ces métadonnées structurées en XML sont partiellement indexées en RDF selon les besoins.
  • L’entrepôt Complet regroupe la plupart des métadonnées pour les recherches portant sur toutes les collections, à des fins de planification des opérations de préservation.
  • L’entrepôt Sélection couvre les métadonnées pour des requêtes rapides, notamment pour le fonctionnement interne du système.
  • L’entrepôt de référence contient les métadonnées communes à plusieurs paquets, et qui définissent les choix de préservation : descriptions des formats, des processus, exigences de chaque chaîne ou filière, etc.

L’avantage d’utiliser une même modélisation en RDF pour l’ensemble des métadonnées de SPAR est de permettre une grande liberté dans la construction des requêtes, indépendamment des solutions techniques et de l’évolution des besoins.

En savoir plus

Module Accès

Ce module est en charge de fournir les données à diffuser sous la forme de paquets d’informations diffusées, dits DIP, à la communauté des utilisateurs. Pour cela, il offre des fonctionnalités de recherche et de demande de rapports, ainsi que des mécanismes de génération et de transformation des données archivées en données diffusables.

Module Administration

Ce module assure l’organisation de toutes les procédures de préservation et surveille leur bon déroulement. Pour cela, il est en relation avec les producteurs et les utilisateurs ainsi qu’avec toutes les autres entités fonctionnelles dont il orchestre le travail. Il garantit le bon déroulement de l’ensemble des fonctions du système et peut rendre des comptes.

Module Planification de la Préservation

Ce module permet de définir et de surveiller les formats et les standards utilisés dans le système SPAR. Il doit être en mesure de planifier les changements de solutions de versement, préservation ou accès en fonction des mutations technologiques et des changements dans le contexte de la BnF.