Dublin Core

Le Dublin Core est un format descriptif simple et générique créé en 1995 à Dublin (Ohio) par OCLC (Online Computer Library Center) et le NCSA (National Center for Supercomputing Applications).
La version actuelle du format est la Dublin Core Metadata Element Set, Version 1.1: Reference Description (l’INRIA propose une traduction et une description des éléments en français).
L’agence de maintenance du format Dublin Core est la DCMI (Dublin Core Metadata Inititative), organisation non gouvernementale et non lucrative, enregistrée à Singapour et œuvrant au développement de formats de métadonnées interopérables.

Objectif du Dublin Core

L’objectif du Dublin Core est de fournir un socle commun d’éléments descriptifs pour améliorer le signalement et la recherche de ressources au-delà des diverses communautés et des nombreux formats descriptifs propres à chaque spécialité, tout en restant suffisamment structuré.
Le Dublin Core prévoit 15 éléments tous facultatifs et tous répétables, qui portent sur la description :
  • du contenu : Title, Subject, Description, Source, Language, Relation, Coverage ;
  • de la propriété intellectuelle : Creator, Contributor, Publisher, Rights ;
  • de l’instanciation : Date, Type, Format, Identifier.

Dublin Core et bonnes pratiques

Le Dublin Core a vocation à permettre une interopérabilité minimale entre des systèmes conçus indépendamment les uns des autres. Les règles internationales et nationales applicables à l’information bibliographique doivent être respectées. 
Le respect de ces règles permet de rapprocher des ressources malgré une faible structuration, et de construire des services bibliographiques grâce à l’emploi conjugué du Dublin Core, des schémas d’encodage associés et des bonnes pratiques. Certains schémas d’encodages sont préconisés directement dans la norme, d’autres sont intégrés dans les termes descriptifs du Dublin Core qualifié ; d’autres sont extérieurs mais applicables.

Nom donné à la ressource : le titre est généralement le nom formel sous lequel la ressource est connue. 

  • Si le titre est forgé ou restitué (au cas où il ne figure pas sur la ressource), il doit être mis entre crochets.
  • Pour tous les documents décrits selon l’ISBD, l’élément Title correspond à la totalité de la zone du titre. Le titre dépendant est introduit par « . ».
  • S’il existe un ou plusieurs titre(s) parallèle(s) dans une autre langue, on crée pour chacun d’eux un Title avec un attribut « xml:lang ». La valeur de cet attribut est conforme à ISO 639 2b (code pour la représentation des noms de langues sur trois caractères.

L’entité principalement responsable de la création du contenu de la ressource.
Les exemples de créateur comprennent une personne, une organisation ou un service. Généralement, on utilisera le nom du créateur pour désigner cette entité. 

  • Cet élément correspond le plus souvent à l’auteur et aux éventuels co auteurs.
  • Les normes AFNOR NF Z 44 060 (Forme et structure des vedettes de collectivités-auteurs) et NF Z 44 061 (Forme et structure des vedettes noms de personnes, des vedettes titres, des rubriques de classement et des titres forgés) doivent être appliquées. Dans le cas courant, on préférera la forme « Nom, Prénom (date date) » aux autres formes, y compris à la transcription simple du nom tel qu’il figure sur la ressource. 
  • On crée autant d’éléments Creator qu’il y a d’auteurs et co auteurs.
  • Il n’y a pas de limitation à trois auteurs.
  • L’élément Creator sert à indiquer l’auteur de la ressource et non l’auteur de la chose représentée (dans le cas d’un portrait photographique, le créateur est le photographe, la personne représentée est le sujet ; dans le cas d’un monument photographié, le nom de l’architecte ne doit pas apparaître en créateur).
  • La distinction entre les éléments Creator et Contributor est parfois factice. Selon le type des documents décrits et la fonction, l’information peut être placée dans différents éléments Dublin Core : Contributor, Creator, Description (pour les anciens possesseurs).

Thème du contenu de la ressource.
Généralement, le sujet est exprimé sous forme de mots clés ou d’expressions ou par des codes de classification décrivant un thème de la ressource. La pratique recommandée est de choisir une valeur dans un vocabulaire contrôlé ou dans un plan de classification. 

  • Cet élément est utilisé pour décrire le contenu intellectuel de la ressource. Il ne sert pas à préciser la forme ni le genre de la ressource.
  • Dans le domaine bibliographique francophone, on privilégiera tant que faire se peut une construction avec les vedettes et la syntaxe RAMEAU.
  • Les descripteurs sujets de nature temporelle (tranches chronologiques ou événements : « 15e siècle », « Révolution française ») ou géographiques et spatiaux (« Roubaix (Nord)    Rue Hoche ») doivent être indiqués dans l’élément Coverage.
     

Une présentation du contenu de la ressource.
Les exemples de description comprennent notamment : résumé, table des matières, référence à une représentation graphique du contenu, exposé du contenu en texte libre. 

  • L’information porte sur le contenu intellectuel de la ressource.
  • La description matérielle des documents relève de l’élément Format.

L’entité responsable de la mise à disposition ou diffusion de la ressource. Les exemples d’éditeur comprennent une personne, une organisation ou un service. Généralement, on utilisera le nom de l’éditeur (le nomd’une maison d’édition) pour désigner cette entité. 

  • Il s’agit de la personne physique ou morale responsable de l’édition ou de la publication de la ressource.
  • Le nom de l’éditeur peut être complété par la mention du lieu d’édition entre parenthèses (on évitera de transposer la syntaxe ISBD « Ville : Editeur » car ce n’est pas la logique retenue par le Dublin Core).
  • Si le nom de l’éditeur et le lieu d’édition ne sont pas connus, il n’y a pas de raison de créer un élément Publisher vide.
     

Entité responsable de contributions au contenu de la ressource.
Les exemples de contributeur comprennent une personne, une organisation ou un service. Généralement, on utilisera le nom d’un contributeur pour désigner cette entité. 

  • Les normes AFNOR NF Z 44 060 (Forme et structure des vedettes de collectivités-auteurs) et NF Z 44 061 (Forme et structure des vedettes noms de personnes, des vedettes titres, des rubriques de classement et des titres forgés) doivent être appliquées. Dans le cas courant, on préférera la forme « Nom, Prénom (date date) » aux autres formes, y compris à la transcription simple du nom tel qu’il figure sur la ressource.
  • On crée autant d’éléments Contributor qu’il y a d’auteurs et co auteurs.
  • Il n’y a pas de limitation à trois auteurs.
  • L’élément Contributor sert à indiquer l’auteur de la ressource et non l’auteur de la chose représentée (dans le cas d’un portrait photographique, le créateur est le photographe, la personne représentée est le sujet ; dans le cas d’un monument photographié, le nom de l’architecte ne doit pas apparaître en contributeur.
  • La distinction entre les éléments Creator et Contributor est parfois factice. Selon le type des documents décrits et la fonction, l’information peut être placée en dans différents éléments Dublin Core : Contributor, Creator, Description (pour les anciens possesseurs).
     

Date d’un événement dans le cycle de vie de la ressource. Il s’agira généralement de la date de création ou de mise à disposition de la ressource.
Il est recommandé d’encoder la valeur de la date conformément au profil défini dans la norme ISO 8601 ou recommandation Date and Time Formats du W3C, qui comprend (notamment) des dates suivant la forme AAAA MM JJ. 

  • Date ou période supposée ou avérée à laquelle la ressource a été créée ou publiée.
  • Cet élément doit être utilisé pour indiquer la date de création de la ressource sous sa forme originelle, qui peut être analogique ou numérique.
  • L’utilisation du format AAAA MM JJ pour la date (AAAA MM JJ/AAAA MM JJ ou AAAA/AAAA pour les intervalles de temps) doit faire préférer « 14..  » ou « 1401/1500 » à « 15e siècle ».
     

Nature ou genre du contenu de la ressource.
L’élément type contient des termes qui décrivent des catégories, des fonctions, des genres généraux ou des niveaux d’agrégation de contenu. La pratique recommandée est de choisir une valeur dans un vocabulaire contrôlé (par exemple, dans la liste du DCMI Type Vocabulary). Pour décrire la manifestation physique ou numérique de la ressource, utiliser l’élément Format. 

  • Il s’agit du type de présentation matérielle ou numérique du contenu de la ressource.
  • Au moins un élément Type est conforme au Vocabulaire DCMI Type qui comprend 12 valeurs : collection, dataset, event, image, interactive resource, moving image, physical object, service, software, sound, still image, text. 
  • Les types définis par la DCMI ne couvrent pas tous les besoins des bibliothèques. On redoublera l’élément Type avec les valeurs suivantes correspondant au format Unimarc (label, position 6) : 
    • text 
      • « language materials » ou « ressource textuelle » ;
      • « manuscript » ou « manuscrit » ;
    • image 
      • still image correspond à « two-dimensional graphics (pictures, designs etc.) » ou « document graphique à deux dimensions (images, dessins, etc.) » ;
      • moving image correspond à « projected and video material » ou « ressource projetée ou vidéo » ;
    • mais aussi : 
      • « notated music » ou  musique notée » ;
      • « notated music, manuscript » ou  musique notée, manuscrite » ;
      • « cartographic materials » ou  resource cartographique » ;
      • « cartographic materials, manuscript » ou  ressource cartographique, manuscrite » ;
    • sound 
      • « sound recordings, non-musical » ou « enregistrement sonore, non-musical » ;
      • « sound recordings, musical » ou « enregistrement sonore, non-musical ».
         

La manifestation (ou matérialisation) physique ou numérique de la ressource.


Typiquement, le format peut comprendre le type de medium ou les dimensions de la ressource. L’élément Format peut être utilisé pour identifier le logiciel, le matériel ou tout autre équipement nécessaire pour afficher ou exploiter la ressource. Les exemples de dimensions comprennent la taille et la durée. Il est recommandé de sélectionner une valeur dans un vocabulaire contrôlé (par exemple, la liste des Internet Media Types définissant les formats de supports informatiques). 

  • Les valeurs de cet élément, pour la description d’une ressource numérique, proviennent de la liste des types MIME (Multipurpose Internet Mail Extensions).maintenue par The Internet Corporation for Assigned Names and Numbers.
  • L’élément Format sert aussi à, dans le cas d’une ressource numérisée, à décrire la ressource originelle (nombre de pages, dimensions, etc.).
     

Référence univoque à la ressource dans un contexte donné.
Il est recommandé d’identifier la ressource au moyen d’une chaîne de caractères ou d’un numéro conforme à un système formel d’identification. Les systèmes d’information officiels comprennent notamment le « Uniform Resource Identifier » (URI / identificateur de ressources uniformes), qui inclut le « Uniform Resource Locator » (URL), le « Digital Object Identifier » (DOI / identificateur d’objet numérique) et le « International Standard Book Number » (ISBN). 
 


Référence à une ressource dont la ressource décrite est dérivée.
La ressource décrite peut être dérivée de la source en tout ou partie. La pratique recommandée est d’identifier la ressource mentionnée dans l’élément Source par une chaîne de caractères ou par un numéro en conformité avec un système formel d’identification. 

  • L’élément Source sert à indiquer la cote de l’exemplaire analogique qui a été numérisé. La cote doit être autonome et comprendre le nom complet de l’institution.
  • Si seule une partie de l’original a été numérisée (ex : miniature d’un manuscrit), l’indication des pages ou feuillets fait partie de la source.
     

La langue du contenu intellectuel de la ressource.
Il est recommandé d’utiliser une des valeurs définies dans la RFC 3066 qui, avec la norme ISO 639, définit des codes de langues primaires à deux et à trois caractères, ainsi que des sous codes facultatifs. Exemples : « en » ou « eng » pour l’anglais, « fr » ou « fre » pour le français, « akk » pour l’akkadien et « en-UK » pour l’anglais utilisé au Royaume-Uni. 

  • L’élément Language s’applique aussi bien aux ressources textuelles ainsi qu’aux ressources audio et vidéo qui comportent des passages parlés.
  • Pour une ressource textuelle, il s’agit de la langue dans laquelle elle a été écrite.
  • Pour les œuvres multilingues, il y a autant d’éléments Language que de langues utilisées.
     

Référence à une ressource apparentée.
Il est recommandé d’identifier la ressource apparentée par une chaîne de caractères ou d’un numéro conforme à un système d’identification officiel. 

  • L’élément Relation est utilisé pour indiquer toutes les relations méréologiques (de tout à partie), notamment les références bibliographiques de l’ouvrage dont est extraite une image, ou le titre du périodique dont est issu un article, ou la collection dont fait partie une monographie. Cet élément peut ainsi contenir un titre, un ou plusieurs noms d’auteur, une date.
  • Il sert aussi à donner des liens vers des ressources qui mentionnent celle décrite, telle une notice de catalogue en ligne.
     

Périmètre ou domaine d’application du contenu de la ressource, c’est à dire ou la couverture spatio temporelle de la ressource.
Généralement, l’élément couverture inclut une position géographique (le nom d’un lieu ou les coordonnées d’une entité administrative).Il est recommandé de sélectionner une valeur dans un vocabulaire contrôlé (par exemple, le thésaurus de noms géographiques TGN Thesaurus of Geographic Names et d’utiliser, quand cela est approprié, des noms de lieux ou de périodes plutôt que des identifiants numériques tels que des coordonnées ou des intervalles de dates. 

  • L’élément Coverage sert à préciser le sujet quand il s’agit d’une période temporelle ou d’une étendue spatiale.
  • Il est employé uniquement pour l’indexation matière et non pour indiquer la période ou le lieu de création de la ressource.
  • Voir les remarques des éléments Subject et Date pour la syntaxe à préférer.
     

Informations sur les droits associés à la ressource.
Généralement, l’élément gestion des droits contient une mention de la gestion des droits afférents à la ressource ou une référence au service fournissant cette information. L’information sur les droits englobe souvent les droits de propriété intellectuelle (IPR), le copyright et divers droits de propriété. Si l’élément gestion de droits est absent, aucune hypothèse ne peut être émise sur les droits associés à la ressource. 

  • L’élément Rights permet de déclarer les droits applicables à la ressource décrite.
  • Cet élément peut indiquer les restrictions portant sur l’utilisation de la ressource, le titulaire des droits auquel il est nécessaire de s’adresser pour connaître les conditions d’utilisation de la ressource, mais aussi une URL pointant vers un document décrivant les droits applicables à la ressource.
  • L’absence d’information ne vaut pas déclaration de liberté d’utilisation. Il est donc nécessaire d’indiquer « public domain » ou « domaine public » pour les ressources entrées dans le domaine public et libres de droit. 

Voir aussi

•  Description et accès : règles internationales 
•  Description et accès : règles françaises 
•  Présentation de l’ISBD


Format indépendant des formats d’encodage et de stockage

Le Dublin Core est indépendant des formats d’encodage et de stockage de l’information.
La DCMI propose néanmoins des recommandations et bonnes pratiques pour permettre l’emploi uniforme de Dublin Core :
Le Dublin Core est utilisé par de nombreuses organisations et est notamment le format obligatoire de base dans le cadre du protocole OAI-PMH.

 

VOIR AUSSI


Dublin Core qualifié (qualified Dublin Core)


Un format descriptif un peu plus fin se fonde sur le Dublin Core : le Dublin Core qualifié (qualified Dublin Core). Il comprend trois éléments supplémentaires :
  • audience ;
  • provenance ;
  • rightsholder.
Il comprend également des qualificatifs :
  • de raffinement, permettant de préciser les éléments Description, Coverage, Date, Title, Relation ; 
  • pour les schémas d’encodage, permettant d’associer la valeur d’un élément à un vocabulaire et une syntaxe contrôlés.
Enfin, pour répondre à des besoins spécifiques, la DCMI développe depuis 2000 le concept de « profils d’application » qui permettent à chaque communauté d’étoffer la capacité descriptive de Dublin Core en y adjoignant de nouveaux éléments. 
 

 

Le Dublin Core à la BnF


Le Dublin Core non qualifié est utilisé à la BnF pour gérer la collection de documents numérisés dans Gallica, qu’ils proviennent des fonds de la BnF ou d’autres institutions patrimoniales.
Il est également utilisé pour accroître sur internet la visibilité des catalogues et des collections numérisées.
Il ne se substitue pas aux autres formats bibliographiques des bibliothèques et des archives (INTERMARC, EAD…), mais permet à d’autres acteurs qui utilisent d’autres formats (musées, archives, opérateurs d’agrégation de contenus culturels, …) de référencer les données de la BnF dans un format simple et facilement interopérable.
Les données ne sont pas nativement formatées en Dublin Core mais dérivées de notices ou de bases de données existantes. Elles sont stockées dans les entrepôts OAI de la BnF.