Actualités du catalogue nº 54 (mars 2022)

À la Une – Des nouvelles de la normalisation

Ce début 2022 marque l’aboutissement de travaux normatifs importants pour la Transition bibliographique, entamés pour certains depuis plusieurs années. Panorama.

 

Identification des collectivités. Suite à la clôture de l’enquête Afnor le 25 février dernier, le chapitre de RDA-FR consacré à l’identification des collectivités (RDA-FR section 3, chapitre 11) est en passe d’être publié. Avec ses 175 pages, le texte dépasse de loin les limites de l’actuelle norme Afnor. Les règles et recommandations couvrent en effet tous les aspects de l’identification et de la description des collectivités, depuis les critères d’identification d’une collectivité jusqu’à la construction des points d’accès la représentant, en passant par le choix du nom et les différents attributs.
Ce chapitre revêt une importance particulière car il annulera et remplacera à terme (selon un calendrier d’implémentation décidé ultérieurement par les deux agences bibliographiques nationales) l’actuelle norme Afnor NF Z44-060 Catalogue d’auteurs et d’anonymes – Forme et structure des vedettes de collectivités-auteurs (1996).
 

Logo de la Transition bibliographique - BnF

Relations entre œuvres et expressions. Les relations entre œuvres et expressions couvrent pas moins de 4 chapitres, publiés en début d’année, du code RDA-FR (section 8, chapitres 23 à 26). Rédigés par le sous-groupe Œuvres et Expressions du groupe Normalisation de la Transition bibliographique, ces chapitres affinent les relations génériques prévues par le modèle IFLA LRM (modèle de référence pour les bibliothèques) tout en veillant à ce que chaque indicateur de relation spécifique soit en conformité avec le modèle.
On y trouve : les éléments généraux sur l’enregistrement des relations (chapitre 23), le détail des indicateurs de relation utilisables entre les œuvres et les expressions accompagnés d’une définition et d’un ou plusieurs exemples (chapitres 24 à 26), ainsi qu’une annexe générale et des annexes spécifiques par types d’œuvres et d’expressions offrant une vue synthétique de l’ensemble des indicateurs de relations utilisables entre ces entités. 
Une fois implémentés dans les catalogues de bibliothèque, ces indicateurs de relation offriront aux utilisateurs un plus grand confort de recherche et de nouvelles possibilités de navigation, en permettant par exemple de rebondir depuis une œuvre littéraire vers ses différentes adaptations (au cinéma, à la télévision, en BD, etc.) et vice-versa, chacune de ces adaptations étant traitée comme une œuvre distincte.
 

Description des manifestations. Du côté des manifestations, outre le travail continu sur les attributs qui permettant de les décrire, le sous-groupe Manifestations et Items publie cette année l’ensemble des recommandations générales sur l’enregistrement de ces attributs (RDA-FR section 1, chapitre 1) : aux consignes de transcription déjà publiées en 2015 viennent ainsi s’ajouter un rappel du périmètre et des objectifs du code RDA-FR, des lignes directrices sur le choix de la langue de la description, une typologie des différents types de descriptions, et des recommandations pour savoir quand créer une nouvelle description.

Focus – Trajectoire 2022 du Fichier national d’entités (FNE)

En 2022, le FNE vise deux objectifs importants pour sa réalisation : le lancement de l’élaboration d’une ontologie RDA-FR et le début du développement des fonctionnalités de la plateforme. 
 

L’année 2021, malgré le contexte peu favorable, a été riche en réalisations pour le FNE : consolidation de la gouvernance du projet ; approfondissement des instructions des groupes de travail désormais en ordre de marche ; renforcement des liens entre le FNE et le programme Transition bibliographique. En fin d’année, un séminaire BnF/Abes consacré au FNE a permis de fixer deux axes forts de travail pour 2022 : concevoir une ontologie RDA-FR qui servira de modèle de données au FNE et lancer les premiers développements de la plateforme.

 

Schéma de co-production du FNE (Fichier national d’entités), 2021

Dans le cadre du programme Transition bibliographique, la BnF et l’Abes souhaitent développer et publier une ontologie RDF exprimant le code de catalogage RDA-FR et permettant de diffuser dans un environnement web sémantique des données structurées conformément à ce code. Cette ontologie s’adressera à l’ensemble des acteurs concernés par RDA-FR et notamment aux éditeurs de SGB, qui pourront s’appuyer sur ce modèle pour mettre en œuvre la LRMisation de leurs propres systèmes. Sa première utilisation nationale se fera dans le cadre du FNE qui en a besoin pour la structuration de ses données. À ce titre, des membres du groupe de travail Modélisation applicative du FNE et du groupe Normalisation de la Transition bibliographique ont été chargés de sa mise en œuvre. Cette conception se fera de façon progressive, afin de répondre aux phases de développements du FNE, en commençant par les entités Agents et en s’appuyant sur des compétences en matière de construction et de gestion d’ontologies dans le cadre d’une prestation externalisée confiée à un spécialiste.

La deuxième orientation donnée par le séminaire BnF/Abes est de développer un pilote FNE permettant d’expérimenter concrètement les premières fonctionnalités d’une plateforme de co-production pour les entités Agents. Cette phase opérationnelle marque le début de l’implémentation des instructions effectuées jusqu’à présent par les groupes de travail du FNE, notamment en termes de scénarios de modélisation, de définition de fonctionnalités de l’outil et d’alignements des données de la BnF et de l’Abes.

De façon plus globale, 2022 offrira aux équipes de l’Abes et de la BnF l’opportunité d’articuler au mieux les travaux du programme Transition bibliographique avec ceux du FNE, projet qui concrétise au niveau national l’adoption du nouveau code de catalogage RDA-FR.
 

Veille catalogue – Des requêtes en langage naturel dans data.bnf.fr

Une interface visuelle de construction de requêtes est désormais disponible pour naviguer dans les données de data.bnf.fr. L’entrée dans le graphe devient plus intuitive et la connaissance du modèle de données n’est plus un prérequis pour explorer ce gisement.
 

data.bnf.fr propose un outil permettant l’interrogation par le langage SPARQL pour profiter au mieux de la richesse et de la structuration de cette base de données en triplets RDF. S’il est puissant, SPARQL est toutefois d’utilisation complexe, surtout pour des non-initiés. D’où l’initiative de proposer un outil qui permette de construire des requêtes dans un langage plus naturel : Sparnatural.
 

Exemple d’une requête dans data.bnf.fr générée avec l’outil Sparnatural et son équivalent en langage SPARQL

Une convention entre la BnF, les Archives nationales et le Département numérique pour la transformation des politiques culturelles et l’administration des données (ministère de la Culture) a missionné la société Sparna pour faire évoluer ce composant logiciel sous licence libre, Sparnatural, afin de mieux l’adapter aux besoins de chaque institution. Pour data.bnf.fr, il s’agit de faciliter l’accès aux données de la BnF dont l’utilisation rencontre deux obstacles : la complexité de la syntaxe SPARQL et la richesse du modèle de données propre à data.bnf.fr.
Grâce à Sparnatural les équations de recherche ne sont plus rédigées en langage SPARQL, mais construites sous forme de phrases à partir de briques correspondant à des entités que l’utilisateur assemble. L’entrée progressive dans le graphe de connaissances de data.bnf.fr se trouve ainsi facilitée.

 

Le développement et le paramétrage de cet outil sont menés en collaboration entre la BnF et les Archives nationales, ainsi que des institutions partenaires engagées dans l’exposition de leurs données sur le web (dont l’Abes et Persée). L’objectif final est de rendre cette nouvelle interface plus proche des attentes de ses utilisateurs potentiels.

 

 

Trois questions à… Aurélien Conraux sur la politique des données du ministère de la Culture

Portrait d’Aurélien Conraux, ministère de la Culture

Aurélien Conraux, administrateur ministériel des données délégué du ministère de la Culture, présente son rôle et décrypte la feuille de route « Données et contenus culturels » publiée en 2021. L’occasion de souligner également l’importance du partage des données pour le secteur culturel et les bibliothèques en particulier.

Qu’est-ce qu’un administrateur ministériel des données ?

L’AMD, ou AMDAC si on prend le titre complet d’administrateur ministériel des données, algorithmes et codes sources, est un poste que chaque ministère a dû créer en 2021 pour coordonner sa politique des données. Au ministère de la Culture, qui depuis son origine a eu une organisation très spécialisée par secteur, il s’agit dans un premier temps de proposer une vision commune sur les données, les algorithmes et les codes, puis de l’expliciter et de faciliter les projets de mise en œuvre.

Si on se représente les bibliothèques, les archives, le spectacle vivant et tous autres les secteurs culturels, ainsi que l’administration centrale, les DRAC et les opérateurs comme des musiciens au sein d’un grand orchestre produisant des données de tout type, il s’agit d’assurer le rôle de metteur en scène ou de chef d’orchestre. L’AMD n’est pas le compositeur, ni le propriétaire de la salle de concert. Il organise des consultations, contribue à la formulation d’une politique couvrant l’ensemble du cycle de vie de la donnée et cherche la meilleure stratégie d’application : par l’open data, le web sémantique, l’intelligence artificielle, l’utilisation de référentiels et la diffusion de données actionnables tant par des humains que des machines… L’AMD assure aussi le lien avec d’autres acteurs institutionnels comme la Direction du numérique de l’État.

En 2022, l’enjeu est bien sûr d’accroître la capacité du Service du numérique du ministère en matière d’identification, structuration, valorisation, ouverture et diffusion de données, mais aussi de construire puis animer un réseau de référents « Données » dans le ministère, les DRAC et les établissements sous tutelle, afin de faire circuler l’expertise et les projets déjà existants.
 

La « feuille de route des données et contenus culturels » constitue-t-elle la partition ?

Pas tout à fait, car chaque établissement a sa propre stratégie numérique détaillée. La feuille de route est plutôt une synthèse qui permet la comparaison et l’alignement entre ministères, puisque nous opérons tous sur le même modèle. Ce document, paru en 2021, formalise une première stratégie d’ensemble du ministère (services déconcentrés et opérateurs inclus) en matière d’ouverture, de partage et de valorisation des données et contenus culturels.

La feuille de route identifie des axes prioritaires et des exemples concrets de projets, mais sans être exhaustive, notamment sur la formation et la question des compétences : le sujet est immense et toutes les institutions sont concernées. Le ministère bien sûr, mais la BnF également, qui est en train de finaliser un plan de sensibilisation et formation aux outils d’intelligence artificielle pour développer l’analyse des données. Peut-être faut-il d’ailleurs préciser que par « données », il faut entendre non seulement les données de gestion du ministère (les statistiques et indicateurs sur les activités ou les jeux de données permettant le fonctionnement courant, comme l’annuaire des sites et lieux culturels), mais aussi les contenus culturels, c’est-à-dire l’ensemble des données numériques de la culture (par exemple la numérisation) accompagnées de leurs métadonnées techniques et de gestion. C’est donc un périmètre assez vaste.
 

Quelles incidences sur les bibliothèques et la BnF ?

Si l’objectif est d’embarquer l’ensemble du secteur culturel dans le même vaisseau pour explorer la carte du monde des données, on voit déjà pas mal de parallèles, de convergences même, avec le Schéma numérique de la BnF.

Le monde des bibliothèques en général, depuis l’adoption du protocole d’échange bibliographique Z39-50, a une culture de l’ouverture, de l’échange et de l’interopérabilité des données. Avec une vision transverse, on peut aller plus loin aujourd’hui, par exemple par la mutualisation, dans un projet comme le FNE, de la création des autorités entre bibliothèques, archives, etc., mais aussi en enrichissant ou en analysant notre stock numérique grâce à l’intelligence artificielle pour en faire sortir de nouvelles descriptions, de nouveaux contenus, et in fine de nouveaux intérêts pour les lecteurs et de nouveaux publics pour le patrimoine écrit, l’image ou le multimédia.

La donnée peut également valoriser et rendre concrets les services numériques partagés, permettre le développement de politiques publiques encore plus efficaces, et mieux comprises. Plus de 4 000 bibliothèques sont par exemple abonnées au service « Philharmonie Live » de la Cité de la Musique, et peuvent « prêter » des concerts archivés ou même les diffuser dans leurs locaux ; qui le sait ? En tant que citoyen, je veux voir en un clic sur une carte de France si ma médiathèque en fait partie, et en tant qu’agent du ministère, je souhaite voir où porter les efforts pour que cette carte se remplisse. Les données permettent cela, utilisons-les !


Le saviez-vous ? – Le référentiel des types de ressources continues s’enrichit de nouvelles valeurs

En 2021, le Réseau international de l’ISSN a obtenu du Marc Advisory Committee, qui administre Marc21, puis du Permanent UNIMARC Committee, une évolution du référentiel servant à caractériser le type de ressource continue dans chacun des deux formats bibliographiques. Grâce à cette évolution, UNIMARC et MARC21 partagent désormais la même typologie.
 

La demande, qui consistait à enrichir la typologie des ressources continues dans le sens d’une plus grande finesse, vise à permettre notamment la création de nouveaux services : facettes dans le Registre ISSN ou dans les catalogues en ligne ; réalisation d’extractions plus ciblées ; calcul de volumétries à des fins statistiques ; études sur la production de ressources continues à l’échelle mondiale.

Kiosque à journaux, Paris / Agence Meurisse, 1929 (image de presse) - BnF, département des Estampes et de la photographie

L’évolution réside ainsi dans la création de nouvelles valeurs (revue, magazine, bulletin, dépôt d’archives numériques, répertoire), dans la mise à jour de certaines définitions et dans un principe de subsidiarité (à chaque terme spécifique correspond un terme plus large, utilisable par défaut). Le format Intermarc-B de la BnF, en voie d’être remplacé par un Intermarc Nouvelle Génération, ne dispose pas aujourd’hui d’un référentiel unifié à l’instar d’UNIMARC et de Marc21. C’est pourquoi la BnF a mis au point une conversion des données de format à format qui lui permet d’exploiter au mieux le contenu de deux positions de données fixes en Intermarc-B (009 pos. 01 et 008 pos. 35). L’export en position 0 de la zone UNIMARC B110 de la valeur la plus précise possible permet ainsi aux utilisateurs des données de la BnF de bénéficier des évolutions internationales dans le cadre du signalement et de l’identification des ressources continues.

En pratique – Réforme de Rameau : changement pour la subdivision géographique

La règle de la construction indirecte de la subdivision géographique est supprimée depuis février 2022. Pendant une période d’environ deux mois, la BnF procède aux retraitements, dans son catalogue, des notices d’autorité Rameau et des zones d’indexation des notices bibliographiques. C’est un préalable nécessaire à la mise en œuvre en catalogage courant de la suppression de cette règle.
 
La Toscane / Philippe Briet, 1668 (carte) – BnF, bibliothèque de l’Arsenal

Partie intégrante de la réforme de Rameau, cette évolution avait été annoncée en 2019 comme l’un des chantiers induits par le retournement aux lieux. Elle mettra fin à une redondance de l’information dans les chaînes d’indexation : il ne sera désormais plus nécessaire pour localiser – par exemple – un concept de faire précéder le nom du lieu de celui du pays auquel il appartient.
Exemple :
606 $3 $a Tourisme $3 $y Italie $3 $y Toscane $g Italie
Devient 606 $3 $a Tourisme $3 $y Toscane $g Italie

L’accompagnement des réutilisateurs se fera en deux temps. Pendant l’année 2022, un tableau de suivi disponible sur le site Rameau fournira :

  • les listes des FRBNF, à mesure de l’avancée des traitements ;
  • la liste de toutes les notices bibliographiques modifiées à l’issue du chantier ;
  • un lien permettant de récupérer sur api.bnf.fr un produit spécifique (en Intermarc ou en UNIMARC) de mise à jour des notices d’autorité Rameau modifiées.
     

Dès janvier 2023, on trouvera dans ce tableau les liens vers des ressources permettant de faire une mise à jour différée dans son système :

  • la liste de toutes les notices bibliographiques modifiées à l’issue du chantier, ainsi que vers toutes les notices bibliographiques liées aux notices d’autorité Rameau concernées par le chantier créées ou modifiées depuis la fin des traitements ;
  • un produit spécifique (en Intermarc ou en UNIMARC) de mise à jour des notices d’autorité Rameau modifiées.
     

La fiche Kitcat sur la création des noms géographiques est mise à jour, à partir de mars 2022, pour tenir compte de ces nouvelles pratiques. 

 

Signalement de ressources – Des liens entre notices d’œuvres et notices bibliographiques

Dans le cadre de la mise en adéquation du Catalogue général avec le modèle IFLA LRM, la BnF a, depuis 2016, recours à un algorithme issu de data.bnf.fr pour calculer automatiquement des liens entre des notices d’autorité titres et des notices bibliographiques. Une campagne de calcul de nouveaux accès titre est réalisée chaque année. 
 

Cette campagne annuelle vise à mettre à jour les notices des documents récemment catalogués, l’accès titre n’étant pas réalisé en production par les catalogueurs. L’ajout de ces accès dans les notices permettra, à terme, de créer à partir des notices bibliographiques des manifestations et expressions qui seront liées à la bonne œuvre. Les accès titre sont calculés sur la base de deux critères :

  • la notice d’autorité titre et la notice bibliographique ont pour auteur la même notice d’autorité personne ;
  • l’une des zones de titre de la notice bibliographique peut être rapprochée de l’une des formes recensées sur la notice d’autorité titre.

Ainsi, fin 2021, une nouvelle campagne de création de liens a permis d’associer près de 20 000 notices bibliographiques de monographies à 5 500 notices d’autorité titres (titres conventionnels et titres uniformes musicaux). Par ailleurs, près de 3 300 notices analytiques ont été liées à environ 2 000 notices d’autorité titre. Les notices bibliographiques concernées décrivent tous types de ressources, ainsi que des spectacles.

Les accès ainsi créés se concrétisent par l’ajout, en format Intermarc, d’une zone 144, 145, 744 ou 745 dans la notice bibliographique. Ces zones calculées automatiquement sont identifiables par la sous-zone $8 AAAAMMJJPRR1V04 (par exemple : 145 6$311959847$w.0..b.eng.$aThe |picture of Dorian Gray$820220113PRR1V04 pour un lien versé au 13 janvier 2022). En format UNIMARC, les accès titres sont en zone 500, et les liens automatiques sont identifiables par un $2 lien automatique.

 

Publications

3e Conférence internationale sur l’Intelligence Artificielle appliquée aux bibliothèques, archives et musées (8-10 décembre 2021)

Comment l’intelligence artificielle transforme-t-elle les données et le numérique dans les bibliothèques, les archives et les musées ? Comment s’adapter à ces changements et améliorer nos compétences et nos savoir-faire vis-à-vis de cette technologie ? Ces questions étaient au cœur de l’édition 2021 de la conférence « Les futurs fantastiques », organisée à la BnF en collaboration avec les bibliothèques de l’Université Paris-Saclay et les membres de la communauté ai4lam. Les captations et supports des présentations sont en ligne

 

6e journée professionnelle du groupe Systèmes & Données de la Transition bibliographique(3 décembre 2021)

Intitulée « Découvrir l’entité Expression : son intérêt pour les utilisateurs », cette journée s’est articulée autour de l’entité Expression avec la présentation d’outils mis à disposition des bibliothèques pour avancer dans la Transition bibliographique. Au programme : un rappel de la définition normative de cette entité dans le modèle IFLA-LRM ; des exemples de sa mise en application dans le nouvel outil de production de la BnF Noemi, dans la base bibliographique Electre et dans le nouveau catalogue du Conservatoire national supérieur de musique et de danse de Paris ; les évolutions de l’outil Bibliostratus ; une table-ronde entre plusieurs clubs utilisateurs de SGB. L’enregistrement vidéo est à retrouver sur la chaîne Youtube de la BnF, les présentations des intervenants et les réponses aux questions posées en séance sont disponibles sur le site de la Transition bibliographique.

 

En chiffres

Volumétrie du Catalogue général de la BnF au 31 décembre 2021 :

  • 15 080 158 notices bibliographiques ;
  • 5 884 668 notices d’autorité, dont 3 103 911 diffusables.

 

En savoir plus sur la lettre d’information Actualités du catalogue