Actualités du catalogue nº 51 (mars 2021)

À la Une : Cataloguer des Œuvres et des Expressions en UNIMARC ?

En septembre 2020, lors de la réunion annuelle du Permanent UNIMARC Committee (PUC), organe international rattaché à l’IFLA qui maintient et fait évoluer le format UNIMARC, des nouveautés ont été adoptées pour rendre le format compatible avec le modèle IFLA LRM, et en particulier pour permettre le catalogage des Œuvres et des Expressions.

 

L’analyse de la compatibilité du format UNIMARC avec le modèle IFLA LRM constitue l’un des principaux axes de travail 2019-2021 du PUC. En 2019, la France a été mandatée pour une première exploration, qui a pris la forme d’un balayage général du modèle IFLA LRM. Ce travail a fait ressortir des besoins d’évolutions et des questionnements structurels, mais aussi les atouts d’UNIMARC : une très bonne granularité, beaucoup de liens entre notices, un format de données d’autorité déjà largement utilisé et l’utilisation de référentiels codés.

Le Comité français UNIMARC (CfU) a parallèlement mené une analyse fine sur les besoins d’évolutions pour exprimer en UNIMARC les chapitres publiés du code de catalogage RDA-FR, qui concernent principalement les Œuvres et les Expressions. Elle a fait ressortir que, si certains attributs des Œuvres et Expressions dans RDA-FR n’avaient aucune correspondance dans le format, la majorité était déjà présente, parfois dans le format UNIMARC autorités (A), plus souvent dans le format UNIMARC bibliographique (B). Le CfU a saisi cette occasion pour proposer au PUC un ensemble cohérent d’évolutions afin de permettre le catalogage des entités Œuvre et Expression conformément à IFLA LRM, mais aussi à RDA-FR.

Presque toutes les propositions du CfU ont été acceptées lors de la réunion annuelle du PUC en septembre 2020, un approfondissement du travail sur la compatibilité entre UNIMARC et IFLA LRM est prévu pour 2021. C’est une étape importante, qui entérine la volonté du PUC de faire évoluer UNIMARC pour l’adapter au modèle IFLA LRM.

Le principe d’une adaptation d’UNIMARC au catalogage par entités a été retenu, dans la mesure où les nouveautés n’empêcheront pas de continuer à utiliser le format pour du catalogage « classique ». L’idée du PUC est de prévoir deux filières de catalogage cohérentes au sein du format : l’une correspondant à un catalogage en UNIMARC tel qu’il est actuellement pratiqué ; l’autre correspondant à un catalogage en UNIMARC conforme à IFLA LRM, qui permette notamment de créer des notices d’Œuvre, d’Expression, de Manifestation et d’Item complètes et d’exprimer toutes les relations prévues par le modèle.

 

L’examen des propositions du CfU par le PUC a également permis d’entériner le fait que les entités Œuvre et Expression relèveraient du format A, là où le format B continuerait d’être utilisé pour les entités Manifestation et Item. Dans les cas où les attributs de l’Œuvre ou de l’Expression avaient une correspondance en UNIMARC B, le choix a été fait de créer une zone ou sous-zone pour cet attribut dans le format A, et de restreindre son équivalent en format B à la filière de catalogage non-conforme à IFLA LRM. Les propositions de création de zones et de sous-zones pour des attributs qui n’avaient pas de correspondance en UNIMARC concernent donc également le format A.

Les nouveautés acceptées par le PUC devraient être publiées courant 2021 sur le site de l’IFLA ; elles seront relayées puis traduites sur le site Transition bibliographique. Il sera dès lors possible de créer en UNIMARC des notices d’Œuvre et d’Expression complètes. Le travail devra se poursuivre pour les autres entités du modèle IFLA LRM. Pour l’heure, les agences bibliographiques ne fournissent pas encore de notices d’Œuvre et d’Expression, mais un travail est en cours pour le faire, peut-être d’abord sous une forme expérimentale.

 

Focus sur Noemi, le futur outil de production des métadonnées de la BnF

Cataloguer selon le code RDA-FR des Œuvres, des Expressions ou des agents sera-t-il bientôt possible ? C’est en tout cas l’objectif que s’est fixé la BnF, co-pilote de la Transition bibliographique, en lançant le projet Noemi (Nouer les Œuvres, Expressions, Manifestations et Items).

Noemi est le nom de la future application de catalogage de la BnF, qui permettra de décrire ses documents suivant un nouveau format, Intermarc-NG (pour « Intermarc Nouvelle Génération », refonte du format actuel de la BnF, destinée à lui permettre de cataloguer suivant le code RDA-FR adapté au modèle IFLA LRM).

 

Les enjeux sont multiples : techniques, en développant une nouvelle application full-web fondée sur le socle logiciel libre Wikibase ; normatifs, en inscrivant dans le format l’ensemble des modifications nécessaires au passage au modèle entité-relations porté par IFLA LRM ; organisationnels, en veillant à l’association de l’ensemble des personnes concernées au déroulé du projet pendant toute sa durée, afin que ce changement majeur d’outil et de pratiques professionnelles soit accompagné au mieux. C’est un chantier relativement inédit, tant par son ampleur (plus de 20 millions de notices à « migrer ») que par les transformations qu’il implique. Tout d’abord, l’application de catalogage nécessite une réflexion approfondie sur l’ergonomie et les fonctionnalités (écrans de recherche, de traitement, affichage des résultats et des entités, navigations dans les arbres OEMI…).

Peut-on encore parler de migration des données quand on part de notices bibliographiques pour en faire des Œuvres, des Expressions et des Manifestations, avec une ventilation des éléments d’informations de départ dans les entités pertinentes ? Quelles conséquences cette nouvelle structuration des données bibliographiques a-t-elle sur le reste du système d’information de la bibliothèque (interfaces publiques, applications de communication, de conservation…) ? Si le format Intermarc-NG reste par ailleurs compatible avec l’ISO 2709, il s’éloigne des standards classiques des formats MARC, avec la fin des indicateurs et du guide, et surtout de la distinction entre format A (Autorités) et B (Bibliographique), pour un passage à un format pleinement intégré.

Après la livraison d’un prototype testé par l’ensemble des catalogueurs de la BnF à l’été 2018, les développements des fonctionnalités et écrans pour le catalogage unitaire s’achèvent au premier semestre 2021, en même temps qu’un premier test de migration de 100 000 notices bibliographiques. Prochaines étapes de la feuille de route pour un déploiement prévu courant 2023 : le développement des fonctionnalités spécifiques aux traitements par flux (chargements, dérivations et dépôt légal dématérialisé), la création d’un module de traitement par lots, la finalisation de l’Intermarc-NG, la reprise de la documentation professionnelle (Kitcat) et le lancement du cycle de formation initiale en interne.

 

Veille catalogue : RobotDonnées à l’œuvre !

Pour faire évoluer ses données selon le modèle IFLA LRM, la BnF expérimente la génération automatisée de notices d’œuvres à partir des données actuelles de son Catalogue général. Cela permet par la même occasion de dédoublonner des notices Noms de personne.
 

La BnF dispose d’une plate-forme baptisée RobotDonnées, développée spécifiquement pour ses besoins. Cet outil permet des traitements de données grâce à des calculs algorithmiques, en fonction de paramètres définis par l’utilisateur. La création de notices d’œuvres se fait par corpus successifs : écrivains français du XXe siècle en premier lieu, puis écrivains anglais du XXe siècle, écrivains français de la période 1830-1900, réalisateurs de films.

En amont de cette création de notices d’œuvres, le regroupement des titres communs pour un même nom d’auteur permet d’identifier des doublons d’auteurs. RobotDonnées signale des auteurs homonymes ayant publié des œuvres aux titres identiques et suggère de les dédoublonner ou de réaliser des réattributions.

Ce processus permet d’assurer de manière automatisée un dédoublonnage à grande échelle et fournit matière, pour les rapprochements incertains demandant plus de vérifications, à des corrections fines à l’unité s’inscrivant dans les chantiers de reprise réalisés par les experts données d’autorité Noms de personne.

Alors que ce chantier se poursuit, plus de 15 000 notices d’auteurs ont ainsi déjà été fusionnées et 32 000 notices bibliographiques ont été redirigées vers la notice d’autorité correspondante.
 

Trois questions à… Vincent Boulet, chef du service des Référentiels, sur la politique identifiants de la BnF

Vincent Boulet, chef du service des Référentiels, département des Métadonnées, BnF
La politique identifiants de la BnF s’inscrit dans le cadre global de la stratégie développée par l’établissement sur les métadonnées. À l’occasion de sa publication, son rédacteur, Vincent Boulet, en précise l’objectif.
 

Pourquoi la BnF a-t-elle défini une politique identifiants  ?

Depuis plusieurs années, la BnF a acquis de la maturité dans le domaine de la gestion voire de l’attribution d’identifiants, en développant une responsabilité particulière sur ISSN, ARK et ISNI, entre autres, et en expérimentant concrètement cette dernière dans ses outils. Elle a donc été confrontée à des questions très immédiates : pourquoi choisir un identifiant plutôt qu’un autre ? Comment l’intégrer dans ses données et sur quel périmètre ? Comment gérer leur pérennité alors que les données elles-mêmes évoluent sans cesse (par exemple, avec les fusions et les scissions de notices) ? Quels services proposer aux acteurs qui récupèrent les données de la BnF ?

Cette démarche n’a certes pas été totalement empirique. Chacun des identifiants possède une politique propre. Et la littérature internationale de bonnes pratiques de gestion d’identifiants est abondante. Mais il a nous a semblé qu’il était temps, sur la base de cette expérience propre appuyée sur les bonnes pratiques internationales, de définir une politique d’établissement. Celle-ci a été élaborée en prenant en considération un double aspect : guider l’établissement dans ses choix futurs et les expliciter auprès des communautés avec lesquelles la BnF est associée dans l’écosystème national et international des données. Les identifiants sont en effet très variés, allant des identifiants internationaux, renvoyant à une norme ISO, aux identifiants propres à chaque établissement, voire à chaque système de gestion. Face à cette multiplicité, il a semblé important de définir – et de donner à connaître – les critères sur lesquels la BnF se fonde afin de choisir et de promouvoir les identifiants sur lesquels elle s’engage.

C’est pourquoi, la politique identifiants trouve désormais sa place aux côtés de la politique de catalogage et de la politique d’indexation déjà publiées, en attendant une réflexion plus globale sur la stratégie de l’établissement relative aux métadonnées.
 

Quelles sont les conditions qui justifient d’un engagement de la BnF sur un identifiant ?

Il faut d’abord se poser la question de l’utilité des identifiants pour une agence bibliographique nationale. Au-delà des objectifs portés par les identifiants qui peuvent sembler évidents (comme la traçabilité des ressources, leur visibilité ou l’interopérabilité des métadonnées), les identifiants constituent des outils de politique qualité, car ils facilitent l’identification de corpus de données et de ressources sur lesquels s’exerce un contrôle qualité particulier ; ils permettent également l’automatisation raisonnée des circuits de métadonnées en aidant les flux et les croisements de données.

C’est pourquoi le principe clé est celui de la pérennité. Elle repose sur des critères politiques tout autant que sur des considérations techniques. La pérennité suppose en priorité une gouvernance partagée et transparente, une sociabilité large et internationale, un modèle économique viable et soutenable pour l’identifiant lui-même et pour ses membres, une stratégie de normalisation, un mécanisme de redirection ainsi qu’une stabilité technique. L’ensemble de ces facteurs objective la confiance dans le fait que la BnF puisse s’engager sur un identifiant donné.
 

Comment se décline cet engagement pour la BnF ?

S’engager sur les identifiants signifie tout d’abord que la BnF les intègre dans ses circuits de données et dans sa politique de développement des métadonnées. Elle garantit donc, grâce à ces identifiants, la permanence de l’accès aux ressources et la bonne identification de celles-ci, que ce soit dans la gestion interne ou dans les transactions avec des tiers. La BnF, comme agence bibliographique nationale, développe en outre une ligne de services sur ces identifiants, qu’elle diffuse librement en application de la Licence ouverte du dispositif national Etalab.

Cet engagement se décline différemment selon les identifiants. Ainsi, la BnF a une responsabilité propre sur l’ISSN, l’ISNI et l’ARK. Elle utilise et développe des services autour d’identifiants comme l’ISBN ou l’EAN dont la responsabilité d’attribution est assurée par une agence tierce. Des identifiants comme ceux de VIAF, IdRef ou Geonames sont intégrés dans les données de la BnF : celle-ci n’appuie pas de services sur ces identifiants mais elle s’engage à en maintenir l’alignement. Enfin, certains identifiants locaux sont diffusés dans les données de la BnF, comme le numéro de notice FRBNF ou le NNA. En tant que numéros de gestion liés à une application locale, ce ne sont cependant pas des identifiants sur lesquels la BnF a vocation à s’engager sur la durée. C’est tout l’enjeu de la politique identifiants que de préciser clairement ces degrés différents d’engagement de la BnF.
 

Le saviez-vous ? L’Observatoire du dépôt légal est désormais disponible sur le site de la Bibliographie nationale française.

La BnF publie chaque année depuis 9 ans une synthèse et des statistiques sur la production éditoriale nationale en s’appuyant sur les dépôts et collectes réalisés grâce au dépôt légal : l’Observatoire du dépôt légal. Pour la première fois, il est consultable, en édition web, sur le site de la Bibliographie nationale française modernisé en 2020.

Éclairage original sur la production culturelle française, l’Observatoire propose une synthèse et une sélection de jeux de données qui permettent de suivre les évolutions en cours dans les secteurs des livres et périodiques imprimés, des partitions, des documents cartographiques, mais aussi de la vidéo, du son, des documents multimedias et multisupports, des documents graphiques et photographiques, ou des sites web.

L’édition 2019 consacre un focus à la bande dessinée, dans le cadre de « BD 20-21 », l’année de la bande dessinée en France. On y trouvera des statistiques sur la volumétrie des bandes dessinées reçues au dépôt légal (plus de 45 000 titres en dix ans !), sur l’essor de la bande dessinée documentaire, sur le profil des auteurs, ou encore sur les bandes dessinées issues de traductions.

L’Observatoire présente également la bande dessinée sous toutes ses formes : des albums et romans graphiques à la BD multimedia, en passant par les graphzines et les adaptations vidéo de bandes dessinées.  

Couverture de l’Observatoire du dépôt légal 2019 - BnF

 

En pratique : Évolutions des données en UNIMARC dans les produits et services de la BnF en 2021

En mars 2021, les notices en UNIMARC proposées par la BnF dans ses produits et services bibliographiques évoluent.Trois nouveautés sont à retenir : la fin du double export de l’adresse bibliographique au profit de l’usage d’une ou plusieurs zone(s) ; la mise à disposition dans tous les produits et services des notices RAMEAU ayant fait l’objet d’une scission ; l’affichage en clair dans les notices de certaines informations spécifiques au Centre national de la littérature pour la jeunesse.

Adresse bibliographique.

En 2019, la zone de l’adresse bibliographique en UNIMARC a évolué pour permettre une description conforme au modèle conceptuel IFLA LRM et au code de catalogage RDA-FR des informations liées à la publication, diffusion, distribution, production et fabrication des ressources : cela a donné lieu à la création de la nouvelle zone B/214, destinée à renseigner l’adresse bibliographique dans les notices bibliographiques où elle est décrite selon le code RDA-FR. Les notices bibliographiques dont l’adresse est décrite selon les normes AFNOR fondées sur l’ISBD doivent quant à elles continuer d’utiliser la zone B/210.

La mise en œuvre de ces nouveautés dans les données de la BnF s’est faite en deux temps. Dans le format UNIMARC, les zones B/214 et B/210 ne peuvent apparaître simultanément dans une notice, mais en janvier 2020, un double export de l’adresse bibliographique a été mis en place afin de permettre aux réutilisateurs de faire des mises à jour dans leurs systèmes dans de bonnes conditions. Dans les notices où l’adresse bibliographique était décrite conformément à RDA-FR, et pour lesquelles était prévue la création d’une ou plusieurs B/214, une ou plusieurs zones B/210 ont été maintenues. À compter de mars 2021, ce double export de l’adresse bibliographique prend fin au profit de l’usage d’une ou plusieurs zone(s) B/214, ou une ou plusieurs zone(s) B/210, selon ce qui est prévu par le format UNIMARC.

 

Le détail de ces nouvelles modalités de fourniture de la zone de l’adresse est disponible dans le document présentant les nouveautés de la livraison de janvier 2020 de la Transition bibliographique, sur la page Suivre les évolutions des données du site bnf.fr. Un échantillon de 10 notices en UNIMARC au format ISO-2709 mettant en œuvre ces nouveautés est également disponible sur la page Notices de BnF catalogue général modifiées dans le cadre de la Transition bibliographique du site api.bnf.fr.

 

Scission des notices RAMEAU.

Une nouveauté est également à signaler du côté des notices RAMEAU. Les notices supprimées après avoir fait l’objet d’une scission n’étaient jusqu’à présent mises à disposition que dans les produits mensuels avec en position 5 du label la valeur d (notice détruite). À partir de mars 2021, elles seront disponibles dans tous les produits (mensuels, rétrospectifs) et services (SRU, Z39.50) et resteront toujours visibles dans BnF catalogue général. Une note 835 $a « Cette notice ne doit plus être utilisée. Il faut désormais construire l’indexation suivante : [libellé de la 1ère notice issue de la scission] — [libellé de la 2e notice issue de la scission] » permettra d’indiquer les nouvelles notices à utiliser en remplacement.

Référentiels du CNLJ.

Certaines informations spécifiques renseignées par le Centre national de la littérature pour la jeunesse (CNLJ), qui sont actuellement fournies sous forme codée, seront désormais affichées en clair dans les notices. Cela concerne les zones UNIMARC suivantes :

  • B/321 (Note sur les index, extraits et citations publiés séparément) – référentiel des revues dépouillées par le CNLJ ;
  • B/329 (Commentaire critique de la Joie par les Livres) – référentiel CNLJ des avis critiques ;
  • B/333 (Note sur le public destinataire) – référentiel CNLJ des publics destinataires ;
  • B/608 (Indexation matière : point d’accès forme, genre ou caractéristiques physiques) – référentiel CNLJ des genres.

Signalement de ressources

Une nouvelle version de data.bnf.fr à la navigation plus aisée

La nouvelle version de data.bnf.fr, en ligne depuis mars 2021, offre de nouvelles fonctionnalités pour naviguer dans les données du site. Les pages contiennent désormais des filtres et des facettes pour identifier notamment les éditions d’une œuvre dans une certaine langue. Deux nouvelles sections ont été ajoutées, l’une dédiée aux adaptations des œuvres d’un auteur, l’autre aux thèmes associés à l’auteur. Enfin, pour un corpus d’œuvres littéraires majeures, un nouveau service (« Data vous conseille ») met en avant des numérisations sélectionnées manuellement dans Gallica.

Rencontres

Journée professionnelle sur la diffusion des données de la BnF (en visioconférence, le 28 mai 2021)

Ce rendez-vous sera l’occasion de présenter les nouveautés développées depuis la précédente journée qui s’était tenue en 2018, tant sur les données (livres et musique dématérialisés) que sur les fonctionnalités des services de récupération (SRU, transfert de notices en ligne) ou sur les sites permettant leur exploration (Bibliographie nationale française, BnF API et jeux de données). Inscriptions en ligne ouvertes.

Journée Afnor-BnF sur l’accessibilité (à la BnF, le 25 juin 2021)

Lors de cette journée seront présentés les dispositifs et bonnes pratiques sur lesquels l’ensemble des acteurs de la chaîne du livre peuvent d’ores et déjà s’appuyer dans la perspective de la transposition en droit français de la directive européenne sur l’accessibilité des biens et des services : charte du Syndicat national de l’édition sur l’édition accessible, format ePub3, outils de vérification, articulation entre formats des éditeurs et formats de bibliothèques, interopérabilité des outils de lecture, texte alternatif aux images… La journée débutera par une présentation pédagogique donnant à voir ce que signifie lire en situation de handicap.

Publications

RDA-FR : publication de la règle sur la mention d’édition

Avec la publication en décembre 2020 de l’élément 2.5 Mention d’édition, le code de catalogage RDA-FR a intégré  la zone 2 de l’ISBD. Dans la logique d’harmonisation entre les différentes normes AFNOR Z44, cet élément a vocation à s’appliquer à tous les types de ressources c’est pourquoi les exemples ont été choisis pour illustrer les ressources de texte imprimé, d’image fixe, cartographiques ou encore audiovisuelles. Cet élément est consultable sur le site Transition bibliographique dans le document de référence sur la Section 1 - Enregistrement des attributs des Manifestations et des Items, mis à jour au fur et à mesure des publications.

Journée sur la place des bibliothèques dans la stratégie de données à l’échelon du territoire : vidéos en ligne

Cette rencontre, organisée le 15 janvier 2021 par la BnF et le CNFPT, s’inscrit dans le cadre d’un partenariat avec le Service du livre et de la lecture du Ministère de la culture visant à accompagner les bibliothèques territoriales face aux défis représentés par la mise en œuvre au niveau national de la Transition bibliographique.  Les enregistrements vidéo sont disponibles sur Wikiterritorial, rubrique E-communautés culture et territoires.

En chiffres

Volumétrie du Catalogue général de la BnF au 31 décembre 2020 :

  • 14 813 988 notices bibliographiques ;
  • 5 878 939 notices d’autorité, dont 3 088 898 diffusables.

 

En savoir plus sur la lettre d’information Actualités du catalogue