La BnF et le CNRS vers la science et au-delà – Écho de recherche
Partenaires scientifiques depuis 1978, la BnF et le CNRS ont renouvelé, en avril 2025, la convention qui encadre les collaborations de recherche entre les deux institutions. Marie Gaille, directrice de CNRS Sciences humaines & sociales, et Thierry Pardé, directeur à la Stratégie et à la recherche de la Bibliothèque, font le point sur les évolutions en cours.
Chroniques : Quels sont les principaux domaines dans lesquels s’exercent les collaborations entre la BnF et le CNRS ?
Thierry Pardé : Les relations entre nos deux institutions sont anciennes ! Un certain nombre de laboratoires, qui ont ensuite été labellisés CNRS, sont même nés dans les locaux de la Bibliothèque. L’une des collaborations fondatrices a été tout naturellement celle qui a lié la BnF à l’Institut de recherche et d’histoire des textes (IRHT), créé en 1937, parce qu’il est tourné vers l’histoire des écritures, des bibliothèques, des textes et de l’art du livre dans tous ses aspects. Ensuite, diverses collaborations se sont développées, ancrées dans les collections patrimoniales de la BnF, en musicologie, par exemple, avec aujourd’hui l’Institut de recherche en musicologie (IReMus) qui oeuvre à la reconstitution de l’intégralité des œuvres des compositeurs. Mais aussi en numismatique, en archéologie…
Marie Gaille : La linguistique et les sciences du langage, les travaux sur la littérature, les arts, l’histoire des textes sont aussi des disciplines phares de ces collaborations, qui se sont également ouvertes depuis dix ans aux sciences sociales et politiques, à l’économie et à l’histoire. L’archivage du web par la BnF a également permis d’élargir le spectre vers d’autres sciences, par le biais de la mise à disposition de nouveaux matériaux documentaires. Ces collaborations s’inscrivent à la fois dans une grande ouverture aux données numériques, avec un intérêt marqué, par exemple, pour les effets de l’IA générative sur les productions intellectuelles et artistiques, et dans un nouveau regard sur la matérialité des collections.
Ces dernières années ont vu le développement des recherches en sciences de la donnée et en humanités numériques. Qu’en est-il des collaborations en cours dans ce domaine ?
T. P. : La Bibliothèque dispose d’un gigantesque réservoir de données et métadonnées francophones : plus de 500 milliards de mots accessibles en ligne ! Cela résulte à la fois de sa politique de numérisation engagée depuis 25 ans et de la collecte de fonds nativement numériques – archives du web, collections sonores, photographies, vidéos – amplifiée prochainement par la mise en oeuvre de la loi Darcos sur le dépôt légal numérique. Pour faciliter le travail sur ces corpus numériques, la BnF a créé en 2020, en partenariat avec Huma-Num, le DataLab, un espace dédié qui accueille des chercheurs en sciences humaines et sociales (SHS) désireux de réaliser des traitements de fouille de textes, d’images et de données.
M. G. : Huma-Num, l’une des très grandes infrastructures de recherche en France, accompagne les différentes étapes du cycle de vie des données numériques en sciences humaines et sociales. Le DataLab, auquel Huma-Num collabore, permet de proposer aux chercheurs, au sein de la BnF, un espace d’expérience et d’échanges de pratiques dans une optique collective de travail et de mutualisation. Parmi les enjeux de recherche actuels, ceux qui concernent l’intelligence artificielle sont cruciaux, notamment autour des questions de souveraineté des États sur les outils. On sait aujourd’hui que la plupart des corpus sur lesquels s’entraînent les IA sont en langue anglaise, ce qui ne peut suffire dès lors que les chercheurs commencent à utiliser l’IA (méconnaissance de corpus et d’épistémologies produits dans les autres langues). Trouver les moyens d’exploiter, d’entraîner des modèles d’IA sur de larges corpus en langue française constitue donc un défi majeur. Une réflexion est en cours sur la manière dont la BnF et le CNRS pourraient travailler ensemble sur ces sujets.
Pourriez-vous nous parler de projets récents menés en collaboration entre les deux institutions ?
M. G. : Les projets HERMES et SPHINX, portés respectivement par l’université de la Sorbonne Nouvelle et par Sorbonne Université, dont le CNRS est partenaire, impliquent la BnF. HERMES porte sur la préservation de patrimoines culturels inclusifs et SPHINX concerne les patrimoines empêchés et les patrimoines partagés.
T. P. : Ces projets sont marqués par la volonté de mettre les recherches en SHS au service de grands défis sociétaux, incluant une dimension fondamentale de partage des savoirs. C’est l’une des tendances de fond que favorise la nouvelle convention-cadre, qui donnera à la BnF les moyens de s’inscrire dans les grandes initiatives portées par le CNRS, notamment dans le domaine majeur de l’IA.
Propos recueillis par Sylvie Lisiecki
Article paru dans Chroniques n° 104, septembre-décembre 2025

