MPEG-21 DIDL : Digital Item Declaration

MPEG-21 est un ensemble de normes et maintenues par le Motion Pictures Experts Group et normalisées à l’ISO sous le numéro ISO/IEC-21000. Le but de MPEG-21 est de faciliter l’interopérabilité entre des objets numériques complexes ainsi que leur gestion. Cette norme couvre aussi bien des aspects de description que de droits, de gestion d’identifiants ou d’outils de référence. DIDL correspond à la partie 2 de cette norme (ISO/IEC-21000-2) et porte sur la description de l’objet numérique. DIDL date de 2003 (dernière révision : 2005).
 

DID et DIDL

Le modèle et une expression de ce modèle

Le modèle DID, Digital Item Declaration, qui exprime de manière abstraite les différentes informations identifiées, doit être distingué du langage DIDL, Digital Item Declaration Language, qui exprime ces informations dans un langage particulier, XML.

Très concrètement, à une entité selon DID correspond donc un élément XML en DIDL.

 

Fonctionnement général de DIDL

DIDL permet d’exprimer trois grandes familles d’information :

  • des informations de structure, qui permettent de distinguer plusieurs niveaux de granularité dans un document ;
  • des informations descriptives, qui permettent de décrire tout ou partie du document ;
  • des informations de gestion, qui permettent de configurer le document numérique.

Structure : exprimer les différents niveaux du document

DIDL distingue 4 niveaux principaux dans les informations de structure, soit, du plus global au plus précis :

  • container : ensemble de containers ou d’items ;
  • item : ensemble d’items ou de components ;
  • component : division intellectuelle d’un item regroupant une ou plusieurs resources ;
  • resource : fichier numérique individuel.

Les 3 niveaux container, item, component sont des niveaux abstraits ; le seul niveau concret, car correspondant à un fichier, est resource.

Un item est le niveau de référence en DIDL : il s’agit du niveau ayant la cohérence intellectuelle la plus forte ; c’est également à ce niveau que l’information est échangée ou manipulée. Il correspond dans la plupart des cas à un document numérique particulier.

Un container est vu comme un regroupement d’items sans forte cohérence intellectuelle, tandis qu’un component est une brique constitutive d’un item. Il s’agit de la représentation intellectuelle d’une resource (un fichier concret).

Exemple : Dans une monographie numérisée, un item peut correspondre au document, et chaque fichier numérique sera une resource. Entre les deux, le niveau component correspond à la page.

 

Description : décrire les différents niveaux du document

En DIDL, il est possible d’attacher une ou plusieurs descriptions à chacun de ces niveaux, par le biais d’un élément descriptor, comprenant :

  • un statement si la description est textuelle. Dans ce cas elle peut être exprimée en XML selon le format de notre choix (Dublin Core simple ou qualifié, MARCXML, MODS…) ;
  • Un component comprenant une resource si la description est elle-même un fichier.

Cette fonction de DIDL permet d’effectuer une description à niveaux d’un document numérique.

 

Métadonnées de gestion : configurer le document numérique

DIDL permet une gestion extrêmement puissante des différentes parties du document numérique. On peut ainsi soumettre l’affichage de certaines parties du document à des conditions. Cela peut être utile pour :

  • gérer un document dont certaines parties sont sous droits et d’autres libres de droits. Exemple : texte d’un fascicule de périodique libre de droits, images dans ce fascicule sous-droits : on peut vouloir afficher le texte mais masquer les images ;
  • afficher tel ou tel format de fichier selon l’application qui les lit.
    Exemple : images en résolution dégradée pour un navigateur Web, images en haute résolution sur le réseau interne de l’établissement.

MPEG21-DIDL à la BnF

Description à niveaux pour les lots d’images et les fascicules de périodiques numérisés

MPEG-21 DIDL est utilisé comme format de l’entrepôt OAI-NUM pour l’affichage des périodiques et des lots d’images dans Gallica. En effet, les descriptions en Dublin Core simple utilisées pour les autres types de documents ne permettent pas de gérer les différents niveaux de ces documents (lot / image, périodique / fascicule).

La BnF n’utilise qu’une partie réduite des possibilités de DIDL, qu’elle utilise à des fins de description à niveaux du document numérique, et n’implémente pas du tout les métadonnées de gestion.

Le niveau Item est utilisé pour deux niveaux hiérarchiques distincts :

  • périodique et fascicule dans un cas,
  • lot d’images et image individuelle dans l’autre cas.

En effet, ces niveaux ont tous les 4 une très forte cohérence intellectuelle, ce qui justifie l’utilisation d’Items à deux niveaux.

Les descriptions sont exprimées dans des statements en Dublin Core simple. Au niveau du premier Item, il permet de décrire un titre de périodique ou un lot d’image, et au niveau du second Item, un fascicule ou une image individuelle.

Dans le cas des lots d’images, la description de l’image (second item) est souvent exprimée à la fois au niveau de l’item et au niveau du component. Cette information n’a pas besoin d’être répétée, l’information descriptive étant facultative et la description d’un niveau supérieur valant pour le niveau inférieur.