Du numérique à l'IA, 30 ans d'innovation

La création de la Bibliothèque nationale de France en 1995 résultait de la volonté d’inventer une bibliothèque ancrée dans son temps. Cette promesse a été largement tenue : au fil des trois dernières décennies, la BnF a été au rendez-vous de toutes les (r)évolutions technologiques.

 

Salle des machines – Serveurs © Gilles Coulon / Tendance Floue / BnF

 

La création de la BnF a été de pair avec celle d’un système d’information (SI) moderne permettant d’informatiser les métiers et les catalogues de la Bibliothèque, que l’on rêvait alors de diffuser sur le Minitel. C’est avec l’arrivée du web à la fin des années 1990 que la BnF s’est dotée d’outils qui rendaient accessibles ses services et ses collections à distance : un site institutionnel, un catalogue en ligne et une bibliothèque numérique, Gallica, inaugurée en 1997, accueillant les premières collections numérisées. Face à la croissance des géants du numérique tels que Google au début des années 2000, la BnF tient le cap de la souveraineté. Des investissements infrastructurels significatifs renforcent les capacités de stockage des collections « dématérialisées », derrière lesquelles se cachent des salles machines de grande capacité et un système souverain d’archivage pérenne, SPAR, créé en 2010. Au fil des années 2000, la numérisation s’industrialise avec le traitement de centaines de milliers de documents par an. Aujourd’hui, environ un quart des collections sont numérisées, soit 11 millions de documents. Grâce à une politique de coopération active, allant du soutien à la numérisation des collections jusqu’au partage de son infrastructure en marque blanche – qui permet à des partenaires de bénéficier de leur propre bibliothèque numérique paramétrée et personnalisée à leurs couleurs –, plus d’un quart de ces documents sont issus des collections de 300 partenaires à travers le territoire. L’ambition de faire de Gallica la bibliothèque numérique du patrimoine écrit et iconographique français est ainsi devenue réalité.

Des collections aux données

La grande (r)évolution des années 2010 est la mise en données du monde. Avec près de 500 milliards de mots numérisés et océrisés, deux pétaoctets de collections audiovisuelles et deux pétaoctets d’archives du web, la BnF dispose d’un réservoir unique de données patrimoniales, associées à des métadonnées de qualité. Ses près de 20 millions de notices bibliographiques sont structurées selon des normes et des formats internationaux. Elles sont ainsi interopérables, ce qui constitue un atout à l’heure du web sémantique et de l’intelligence artificielle (IA). En 2026, avec la migration de ces notices dans un nouveau catalogue et un nouveau format, ce sont 80 millions d’entités qui décupleront la découvrabilité des collections. Afin de rendre accessible ce réservoir, des infrastructures et des services de mise à disposition sont progressivement créés : des métadonnées sémantisées via le site data.bnf.fr en 2011, des API Gallica publiques en 2017, un DataLab sur le site François-Mitterrand en 2021, un service de fourniture de données à façon en 2023.

Les enjeux de l’IA

Munie d’une feuille de route depuis 2021, la BnF travaille à l’élaboration d’outils d’intelligence artificielle au service de ses missions, avec des projets comme Gallica Images, présenté au Sommet pour l’action sur l’IA de février 2025, au service de la découvrabilité de ses collections iconographiques. Elle entend aussi contribuer au renforcement de l’écosystème IA français par la fourniture de données. L’enjeu est de taille, alors que la France et l’Europe cherchent à créer une IA respectueuse de la propriété intellectuelle, de l’éthique et de la diversité culturelle. La BnF ne pourra répondre à cette ambition qu’à condition de continuer à moderniser son SI mais aussi de penser les conditions de la soutenabilité de ce modèle. C’est un enjeu démocratique que les pouvoirs publics peuvent et doivent relever.

 

Isabelle Nyffenegger et Evarestos Pimplis

Article paru dans Chroniques n° 103, avril-juillet 2025