Des données à la portée de tous

Dès le début des années 2010, la BnF a engagé une démarche d’ouverture de ses données, dont elle encourage les appropriations les plus variées. Chacun a ainsi la possibilité de s’aventurer par des chemins inédits jusqu’au cœur de l’activité de l’institution mais aussi de renouveler cette activité. En effet, grâce aux retours des utilisateurs, la Bibliothèque ne cesse d’améliorer ses services autour des données.
 

 

Comme la Belle au bois dormant son prince charmant

Les catalogues, la bibliothèque numérique Gallica, le dépôt légal ou les archives du web engrangent une multitude de données dont la plupart sommeillent encore, dans l’attente de l’intelligence interactive qui les fera sortir de la nuit. Ces données se prêtent à tous les usages imaginables, qu’ils soient le fait d’économistes soucieux d’observer les évolutions du monde de l’édition, d’informaticiens désireux d’entraîner leurs réseaux de neurones ou de tester leurs algorithmes, de généalogistes souhaitant contextualiser les résultats de leurs recherches, ou de curieux avides d’enrichir leur visite du cimetière du Père Lachaise. C’est ainsi que la plate-forme « George, le 2e texte » (george2etexte.free.fr), conçue par un collectif, présente aux élèves et étudiants des textes écrits par des femmes. Ces utilisations visent non seulement à optimiser des projets relevant de domaines variés, mais aussi à développer une lecture originale des collections patrimoniales. 

Un réservoir unique au monde

La BnF propose des données uniques en raison de leur étendue et de leur diversité : Gallica fédère les ressources de près de 400 organismes et le Catalogue général compte plus de 14 millions de notices de documents de tous types.


La valeur de ce réservoir repose également sur la structuration de ses éléments : ils sont organisés en grands ensembles – auteurs, œuvres, thèmes, dates, lieux – qui peuvent s’articuler entre eux. C’est le cas dans data.bnf.fr.


Enfin, les données de la BnF se prêtent à des expérimentations en toute légalité. Mises à disposition sous licence ouverte, elles sont réutilisables librement et gratuitement (y compris à des fins commerciales) sous réserve d’en mentionner la source. Cette licence est compatible avec les standards des licences open data définies à l’étranger. Par ailleurs, aucune donnée personnelle n’est diffusée. Le cas échéant, dans le cadre de projets précis, des traitements d’anonymisation peuvent être appliqués.

En pratique


La politique de la BnF en matière d’ouverture repose sur une offre de données, sur la fourniture d’outils (interfaces de programmation, dites API) et sur des dispositifs collaboratifs. Le site api.bnf.fr décrit différents jeux de données et API et propose des tutoriels, par exemple afin de récupérer les informations associées à un document numérisé (via l’API « Document » de Gallica ) ou les noms de guitaristes dans les collections de la BnF (via le SPARQL endpoint de data.bnf.fr).


Le Gallica studio assure une veille sur les réappropriations originales de Gallica, complète la palette des outils, et documente les projets de différentes communautés. 


En outre, les experts de la BnF répondent aux demandes particulières et fournissent des corpus spécifiques. Ils animent des événements autour des données, tel le hackathon organisé tous les ans en novembre à la BnF.

S’adresser à un bibliothécaire

Sindbad
Poser une question