Bibliothèque nationale de France

Formulaire de recherche

  Pour les professionnels

Écouter la page :

Contact

Pour toute question sur OpenCat
Courriel : data@bnf.fr

Consulter

L'expérimentation OpenCat

Comment bénéficier des enrichissements apportés par la BnF aux données de ses catalogues ?

La Bibliothèque nationale de France expose ses données sur data.bnf.fr depuis 2011. Elle souhaite faire bénéficier les autres bibliothèques publiques des enrichissements effectués sur ses propres données grâce aux technologies du web sémantique. C’est l’objet de l’expérimentation OpenCat, réalisée en partenariat avec la bibliothèque municipale de Fresnes et la société Logilab, avec le soutien du ministère de la Culture et de la communication dans le cadre des projets 2012 "Services numériques culturels innovants".

Le projet OpenCat

Conçu comme une preuve de concept, le projet OpenCat a abouti à un prototype logiciel basé sur la plateforme ouverte CubicWeb, qui contient :
  • les regroupements par œuvres (sur le principe du modèle FRBR) réalisés pour le site data.bnf.fr ;
  • les données locales d’une bibliothèque publique (la bibliothèque municipale de Fresnes) correspondant au corpus de données commun avec le contenu actuel de data.bnf.fr (soit 4 000 œuvres environ) ;
  • des liens vers d'autres sources d'informations disponibles sur le web (compléments bibliographiques, éléments contextuels illustrés, ressources documentaires en ligne).

Schéma des données utilisées par le prototype OpenCat :
Schéma des données utilisées par le prototype Opencat
Les résultats de recherche de l’internaute se trouvent enrichis d’informations tirées d'autres réservoirs de données culturelles sans qu'il lui nécessaire de sortir de l'interface de consultation des collections de la bibliothèque :
  • compléments bibliographiques provenant d’autres catalogues ;
  • illustrations de portraits d’auteurs ou d’images de couvertures ;
  • liens vers Gallica, la bibliothèque numérique de la BnF (texte intégral, manuscrits, images, documents sonores) ;
  • liens vers d’autres ressources de la BnF (expositions virtuelles, dossiers pédagogiques ou signets) ;
  • liens vers d’autres contenus du web (conférences en ligne de l’Université de tous les savoirs).
La récupération des données de la BnF garantit des notices de qualité et apporte des identifiants pérennes de référence (tels que ARK) utilisés comme pivots vers d'autres ressources culturelles du web.

Le prototype de visualisation

Le prototype issu de ce projet est en ligne.

Il a été développé dans le cadre d'un projet de recherche et développement sur le traitement et l'alignement des données de bibliothèques grâce aux technologies du web sémantique.

Vos retours nous sont précieux sur ces points en particulier (plus que sur l'interface graphique). N'hésitez pas à nous contacter pour nous faire part de vos observations.

Les développements à venir du projet

Pour lier ses collections à d’autres contenus disponibles sur le web, il faut disposer :
  • d’identifiants pérennes d'accès à vos ressources (URI) ;
  • de données structurées (auteurs, titres, ISBN, cote, etc.) ;
  • d’un logiciel permettant de rapprocher des données issues de sources hétérogènes (ex. : notices en Unimarc, instruments de recherche en EAD, pages web).
L’expérimentation OpenCat répond à ce dernier point. Elle procède d'une démarche ouverte qui peut être poursuivie par d’autres acteurs : au-delà des données elles-mêmes, toute bibliothèque peut réutiliser les briques logicielles du projet pour développer une interface de visualisation qui lie ses propres collections aux ressources en ligne les plus pertinentes pour ses usagers.

La prochaine étape consiste à mettre en ligne dans les semaines à venir un prototype de démonstration où chaque bibliothèque pourra ajouter et tester des données issues de son propre catalogue. Vous pourrez ainsi visualiser le regroupement par œuvres de vos documents correspondant au corpus de données disponible dans data.bnf.fr, et leurs liens vers d'autres jeux de données déjà réalisés pour le prototype.

Vous pourrez développer au-dessus de vos catalogues votre propre interface de visualisation à partir du cœur logiciel, des données et des alignements du prototype. La plateforme CubicWeb sur laquelle OpenCat a été développé est un logiciel libre de réutilisation. Le prix Utilité Publique du concours Dataconnexions lui a été attribué en 2013 pour le principe de sa base générique. On peut facilement adapter celle-ci à ses propres données qui peuvent provenir de bases hétérogènes : notices en UNIMARC, instruments de recherche en EAD, pages web, etc.

vendredi 17 mai 2013