Les milles et une vies des collections numérisées

« Une mine d’or », « une caverne d’Ali Baba », « un extraordinaire terrain de jeu » : quand il s’agit d’évoquer les collections et les services offerts par la Bibliothèque nationale de France sur ses différentes plateformes en ligne, les aficionados de Gallica, de RetroNews ou de la Banque d’images ne sont pas avares de métaphores enthousiastes. Depuis les premières numérisations engagées dans la foulée du projet de « bibliothèque d’un genre entièrement nouveau » voulu par François Mitterrand, les ressources en ligne de la BnF et leurs usages se sont considérablement développés et diversifiés. Retour sur une offre aussi multiforme que les profils de ses usagers sont variés.

 

Près de 10 millions de documents dans Gallica, 2 000 titres de presse ancienne (soit environ 20 millions de pages) dans Retronews, plus d’un million de dessins, affiches et photographies dans la Banque d’images, et plus de 200 000 enluminures et décors de reliure dans Mandragore, la base iconographique des manuscrits : les chiffres, vertigineux, n’ont cessé de croître depuis les débuts de la numérisation dans les années 1990 puis le passage à la numérisation de masse dans les années 2010. Aujourd’hui, une large part de l’immense richesse des collections patrimoniales de la BnF est accessible en ligne gratuitement pour tous. Livres, journaux et revues, estampes, cartes, manuscrits, partitions, monnaies, objets et costumes – la liste des types de documents continue elle aussi de s’allonger : après le son, la vidéo, puis les objets en 3D, les premiers jeux vidéo rejoindront Gallica fin 2023.

2022 © Julien Colombier

 

S’adapter aux évolutions

À mesure que les collections en ligne ont grandi, les outils de consultation ont évolué, les moteurs de recherche ont progressé. Les interfaces ne cessent de s’adapter aux évolutions des usages et aux nouvelles attentes des internautes. Elles doivent aussi prendre en compte la volumétrie et les spécificités des documents numérisés : on ne cherche pas dans 5 000 items comme dans 5 millions, on ne consulte pas un dictionnaire du XVIIe siècle comme une monnaie grecque, un portulan comme un numéro du Petit Journal, un manuscrit autographe de Beethoven comme une sphère armillaire.

Aux côtés de Gallica, dont le site web a connu en 25 ans d’existence plusieurs métamorphoses, d’autres sites ont été créés pour répondre aux besoins de publics donnés : la Banque d’images est destinée aux professionnels de l’image, les Essentiels de la BnF aux publics scolaires et aux enseignants. RetroNews, de son côté, donne accès depuis 2016 à la numérisation de la presse par BnF-Partenariats, filiale de la BnF. Dans leur majorité ces sites proposent des contenus éditorialisés pour accompagner les internautes dans la prise en main des collections. RetroNews est ainsi un véritable média autant qu’une porte d’entrée vers les collections. Ces plateformes vont également à la rencontre de nouveaux publics potentiels sur les réseaux sociaux – démultipliant ainsi les chemins vers le patrimoine numérisé.

L’enjeu de la découvrabilité

Il y a mille et une façons d’explorer les collections de la BnF en ligne, selon que l’on vient délibérément y chercher un document ou que l’on y arrive par hasard, via une requête sur un moteur de recherche ou au détour d’un lien trouvé sur l’un des catalogues en ligne de la Bibliothèque, une page Wikipédia ou encore un billet de blog. Mais il y a aussi mille et une façons de passer à côté de ces ressources, tant leur visibilité est aujourd’hui tributaire des algorithmes des moteurs de recherche. Aussi la découvrabilité des collections en ligne – soit leur capacité à être repérées parmi un vaste ensemble d’autres contenus – est devenue un enjeu de taille pour la BnF. À côté d’initiatives structurantes comme data.bnf.fr, qui accroît la visibilité des données de la Bibliothèque en les exposant sur le web de façon à ce que les moteurs de recherche les indexent plus facilement, des outils de médiation numérique ont été mis en place pour guider les internautes à travers la masse des collections numérisées.

Faciliter l’accès aux collections

Des sélections thématiques de documents par grands champs disciplinaires – sciences naturelles, droit, éducation, économie, numismatique, ou plus récemment psychanalyse – voient régulièrement le jour sur Gallica. Des listes de publications périodiques permettent également de se frayer un chemin dans la presse locale, régionale ou des anciennes colonies françaises, ou d’explorer titre par titre la presse médicale et scientifique, la presse culinaire, féministe ou enfantine, la presse de mode, de musique ou de spectacle. Des entrées par grandes aires géographiques donnent à voir l’ampleur des collections extra-européennes présentes dans les fonds de la Bibliothèque – collections que la série de sites web Patrimoines partagés s’attache à mettre en valeur (voir Chroniques n°95).
Le site des Essentiels de la BnF, qui recense les multiples ressources culturelles et pédagogiques de la Bibliothèque et vient de faire l’objet d’une refonte majeure, propose lui aussi un accès par grandes disciplines – littérature, arts, histoire, société, sciences ; il offre également la possibilité, avec les 
« Histoires courtes », de se promener en s’amusant dans les collections au fil de podcasts, vidéos et albums d’images.

La fouille d’images dans Gallica

La bibliothèque numérique Gallica renferme des millions d’images en comptant toutes celles qui se nichent au cœur des pages numérisées : photos de presse, schémas scientifiques, enluminures. Leur repérage par segmentation constituera la première étape du projet « Gallica Images » qui débute cette année. Une fois identifiées, les images seront analysées par des logiciels (classification, indexation, caractérisation des couleurs). Ces nouvelles données permettront d’enrichir les fonctionnalités de recherche dans Gallica : il sera possible d’y chercher une image précise, des motifs, des visages de personnalités… Cette application majeure, à très large échelle, de l’intelligence artificielle à la BnF est portée en partenariat avec la Bibliothèque nationale et universitaire de Strasbourg (BNU) et l’Institut national d’histoire de l’art (INHA), et a reçu une subvention d’1,3 million d’euros dans le cadre de France Relance.

Faire se rencontrer les collections et les internautes

Pour faire connaître l’ampleur et la richesse de ses collections numérisées, la BnF a construit au fil des années une présence multiforme sur le web : ses divers blogs, carnets de recherche et comptes sur Facebook, Twitter, Pinterest, Instagram ou YouTube contribuent à rendre visibles et à faire vivre les collections numérisées, en créant un rapport spontané et direct avec les usagers, en allant chercher les internautes là où ils se trouvent – sur les réseaux sociaux, mais aussi directement dans leurs boîtes mail. Aux côtés de newsletters anciennes, comme celle de Gallica, diffusée depuis 2009, ou de la Banque d’images, qui chaque mois valorisent les nouveaux corpus de documents mis en ligne, des lettres d’information spécialisées ont vu le jour chez RetroNews, qui propose La lettre éducation, à destination des enseignants, et La lettre généalogie, pour les amateurs de recherches généalogiques. Des podcasts, avec Séries noires à la Une, et une revue papier – RetroNews, la revue – complètent l’offre éditoriale multiforme construite autour des collections de presse de la BnF.

2022 © Julien Colombier

Des bibliothécaires à vos côtés

Il arrive que les internautes, ne sachant pas où et comment trouver les documents qu’ils recherchent, aient besoin d’aide dans leur prise en main des outils et collections en ligne. 

Là aussi, outre Sindbad, la Bibliothèque a mis en place au fil du temps plusieurs dispositifs destinés à accompagner les usagers des ressources en ligne. L’assistance Gallica, joignable par mail ou via le formulaire de signalement d’anomalie disponible sur le site de la bibliothèque numérique, constitue l’un de ces recours – tout comme celle qui est proposée plus spécifiquement pour la reproduction de documents. Par ailleurs, grâce à l’essor de l’utilisation des outils de visioconférence ces dernières années, la BnF propose aux internautes des ateliers d’aide à la recherche documentaire à distance. Il est ainsi possible de réserver un créneau d’une heure pour un rendez-vous en ligne individuel et personnalisé avec un bibliothécaire.

Sindbad, des bibliothécaires à votre écoute

Comment retrouver un décret de naturalisation ? Pourquoi compte-t-on les œufs à la douzaine ? Est-il possible de consulter l’Enfer de la Bibliothèque nationale ? Où télécharger des livres audio pour enfants ? Depuis 2005, le Service d’information des bibliothécaires à distance de la BnF (Sindbad) fournit des références et des bibliographies sur tous les sujets et répond gratuitement, dans un délai de trois jours ouvrés, aux questions qui lui sont posées. Plus d’une centaine de bibliothécaires, répartis dans l’ensemble des départements de la Bibliothèque, se chargent quotidiennement de répondre aux quelque 10 000 questions posées chaque année via le formulaire en ligne, par courrier ou par téléphone. Un service de chat est également accessible en ligne de 13 h à 17 h, du lundi au vendredi.

Les perspectives ouvertes par l’IA

Restent encore à inventer d’autres manières d’entrer dans les collections numérisées, de les découvrir et de les habiter. Les possibilités ouvertes par l’intelligence artificielle sont elles aussi infinies, et la BnF, qui s’est récemment dotée d’une feuille de route pour l’IA, les expérimente et les implémente progressivement dans ses plateformes en ligne. Ainsi l’outil de fouille d’images GallicaPix sera bientôt intégré dans la bibliothèque numérique Gallica : en s’appuyant sur des techniques d’intelligence artificielle de reconnaissance visuelle et d’apprentissage profond, GallicaPix permettra de faire des recherches au sein de corpus d’images largement inexploités jusque-là, comme les photographies ou les dessins publiés dans la presse, les illustrations présentes dans les livres ou les manuscrits… Autant de chemins qui demandent à être tracés dans l’infini territoire des collections numérisées, autant d’usages à venir et de façons d’habiter la Bibliothèque en ligne. 

Voir aussi « À travers la bibliothèque en ligne – Verbatims »

Mélanie Leroy-Terquem

Article paru dans Chroniques n° 96, janvier- mars 2023