Soutenez la BnF
Formulaire de recherche

Pour les professionnels

Nathalie Lussier - Canada

Nathalie Lussier, pensionnaire « Profession Culture » à la BnF
Sujet d'étude : L'archivage du web et le dépôt légal du numérique
Département BnF d'accueil : Département du dépôt légal
Tuteur : Gildas Illien, chef du service du dépôt légal numérqiue

L'archivage du web et le dépôt légal du numérique

Pensionnaire du programme Profession Culture, Nathalie Lussier a passé six semaines à la BnF en 2010 pour s’initier aux arcanes de la collecte des sites Web dans le cadre du dépôt légal. Comment « moissonner » des sites sur la Toile, selon l’expression québécoise, pour mieux les engranger dans le dépôt légal ? Un séjour qui a permis à la BnF de lui transmettre son savoir-faire pionnier en la matière, mais aussi de sensibiliser ses propres équipes aux méthodes à la fois innovantes et pragmatiques de Bibliothèque et Archives nationales du Québec.
Nathalie Lussier

Nathalie Lussier

« Ce que vous appelez l’archivage du Web, nous au Québec, nous le nommons moissonnage » indique avec un agréable accent québécois Nathalie Lussier, stagiaire à la BnF en 2010 au titre de Profession Culture. Cette bibliothécaire expérimentée, elle-même chargée du dépôt légal des publications en ligne à Bibliothèque et Archives nationales du Québec (BAnQ) a découvert le département du Dépôt légal de la BnF, sous ses deux angles : imprimé et numérique, appréciant vivement que la structure de l’archivage du Web « soit déjà en place à la BnF ».

Sa collègue Carole Gagné, bibliothécaire également, est restée trois semaines à Paris pour suivre le même stage. Toutes deux en auront beaucoup appris. L’archivage du Web : un sujet d’autant plus captivant pour Nathalie qu’il sort du rôle de bibliothécaire traditionnel. « Et surtout, se passionne-t-elle, il a à voir avec cette question : comment traiter l’intangible ? Voilà un beau défi qui me stimule beaucoup. Grâce à la BnF, à notre tuteur Gildas Illien, chef du service dépôt légal numérique, et à son équipe, nous pourrons donner de l’ampleur à notre dépôt légal au Québec ».

Préservation pérenne des sites Web

Jusqu’ici, à Bibliothèque et Archives nationales du Québec, le principe du dépôt légal des sites Web était similaire à celui du papier : on effectuait le traitement à la pièce des publications gouvernementales en ligne, ne faisant ressortir qu’une publication à la fois. « Or, dans le monde du Web, assure Nathalie, il n’est plus possible de travailler sur un si petit échantillonnage. Nous voulons aussi embrasser d’autres secteurs de l’édition… Mais il est juridiquement assez problématique pour nous de réaliser ce moissonnage. » Car au Québec, on rencontre une difficulté sur ce point : « Vous avez une loi, en France, qui permet le dépôt légal automatique de tous les sites Web publics, poursuit-elle. Mais pas nous, qui relevons de la loi fédérale sur le droit d’auteur : nous devons demander l’autorisation de moissonner à chaque producteur ou éditeur de site, ce qui alourdit beaucoup la tâche. Nous en sommes même venus à poser l’hypothèse d’un moissonnage sans diffusion, qui se situerait dans un volet unique de conservation. Il faut réfléchir… »

Dans un premier temps, les deux stagiaires ont suivi un parcours centré sur des visites et des entretiens, qui leur a permis d’avoir une vision « macroscopique » de l’organisation du dépôt légal, sur tous les supports, ainsi que dans toutes ses ramifications et tous ses métiers : de  la collecte, à la diffusion ou à la conservation. Nathalie et Carole ont ainsi rencontré des responsables de services d’entrées et de services bibliographiques mais aussi des chargés de collection responsables des circuits ou encore de la valorisation. Des collections imprimées ou audiovisuelles du dépôt légal éditeur et imprimeur, les stagiaires sont ensuite passées à l’archivage des sites Web.

« Il est très intéressant de noter, observe Nathalie Lussier, qu’en 2010 la BnF a - pour la première fois - effectué une collecte plus large du domaine fr. De plus, elle collecte d’autres sites, repérés par ses départements de collection : il s’agit de collectes plus ciblées, de la même façon qu’on réalise des acquisitions. Les sites sont moissonnés (ou “photographiés”) au moyen de logiciels qu’on appelle robots moissonneurs ou “aspirateurs”. Ils le sont parfois en profondeur (capture de la page d’accueil, et de toutes les rubriques du site), donc davantage que lors d'une collecte de surface. Par exemple, le département Droit, Economie et Politique maintient un “panier” d’URL à collecter, et fixe ses critères de moissonnage : à quelle profondeur collecter ? Combien de fois par an ? Pour quel budget (c’est-à-dire, pour combien d’URL) ? ». D’autres départements ont instauré des procédures similaires. Un réseau de correspondants, créé il y a cinq ans, alimente cette immense base de sites candidats au moissonnage : « Un aspect excessivement intéressant du travail du service du dépôt légal numérique de la BnF est la constitution de ce réseau, très bien structuré (quatre-vingt correspondants au total) chargés d’acheminer des URL. C’est une des choses très pratiques que nous avons apprises lors de notre stage ».

Sélection et collecte sur la Toile

Les trois dernières semaines, Carole Gagné ayant dû rentrer au Canada, Nathalie Lussier a expérimenté seule l’autre partie du stage, plus pratique : une immersion complète dans l’équipe du service du dépôt légal numérique, dont elle a partagé le quotidien, les réunions, les instructions. Venue chercher une expertise en matière de sélection et de collecte sur la Toile, elle y aura appris ainsi qu'au contact d'experts des systèmes d'information, trois opérations essentielles : (1) comment gérer une collection d’URL provenant des correspondants. (2) Comment démarrer et surveiller une collecte sur la Toile (3). Comment préserver ces données au niveau informatique.
« Nous devons maintenant déterminer ces différents rôles au sein de Bibliothèque et Archives nationales du Québec, poursuit Nathalie Lussier, pour savoir qui gèrera la collection d’URL, qui surveillera la collecte, et qui la préservera informatiquement. Parfois ces rôles se chevauchent et c’est très intéressant. Ce sont des aspects importants, qui n’étaient pas encore définis chez nous. A présent, j’y vois plus clair et me sens confortée dans mes choix».
Rappelons qu’il existe deux bibliothèques nationales au Canada : d'une part, la Bibliothèque et Archives Canada (BAC), qui se trouve à Ottawa, et d’autre part, Bibliothèque et Archives nationales du Québec (BAnQ), située à Montréal. Or cette dernière ne dispose pas de moyens comparables à ceux de la BnF. « À l’échelle humaine qui est la nôtre, l’expérience est forcément plus modeste mais reste incontournable. Il nous faut juste bien nous organiser et bien structurer notre projet afin qu’il soit mieux implanté à BAnQ ».
La priorité actuelle de BAnQ, est d’élaborer un module de dépôt légal qui incorporera le dépôt des fichiers déposés par les éditeurs. D’ici à deux ans devrait s’y ajouter le moissonnage des sites Web, ce qui suppose une collecte automatique élargie, et une collecte ciblée appliquée aux publications en ligne québécoises, ainsi que des volets thématiques. Un vaste chantier de travail en perspective,  qui implique une évolution culturelle quant à la perception du « document » en ligne : « Nous considérons qu’un site n’est ni une publication, ni une archive, c’est une œuvre en soi, et qu’il est préférable de collecter dans son contexte en ligne plutôt qu’en petits morceaux. C’est notre vision, précise Nathalie Lussier.  Nous allons progresser étape par étape, réaliser un test, puis modéliser. »

Brassages professionnels

Son stage à la BnF fut aussi l’occasion pour elle d’assister à un congrès international sur la préservation numérique et l’archivage du Web, en septembre, à Vienne, en Autriche, en compagnie d’une délégation de la BnF: «  Le point d’accès constitue un problème important pour la communauté internationale du Web, relève-t-elle. Car il est différent pour chacun ».
C’est lors d’un autre congrès au Canada, cette fois, intitulé « Bibliothèques nationales, francophonies dans le monde », que Nathalie se souvient avoir rencontré pour la première fois Gildas Illien, par l’intermédiaire de sa coordinatrice Mireille Laforce. Elle l’a revu à Ottawa en 2009 lors d’une assemblée générale du consortium IIPC (Internet International Preservation Consortium). C'est à cette occasion  qu'il l’avait invitée, elle et sa collègue Carole Gagné, à postuler au programme Profession Culture de la BnF : « Nous n’y croyions pas, raconte-t-elle. Au Québec, on voyage peu. Ce n’est pas comme vous en Europe. Mais notre projet a été accepté très vite par les deux bibliothèques nationales qui ont un passé de projets communs ». Et de conclure modestement : « Nous sommes près des États-Unis et, culturellement, nous avons une méthode plus anglo-saxonne de voir les choses, c’est sûr. À l’issue de mon stage, je considère que j’ai reçu de la Bibliothèque nationale de France… plus que je ne lui ai apporté ».

Sait-elle que Gildas Illien compte sur la lecture de son rapport de stage pour porter un regard critique sur les habitudes de travail à la française ? Et que son équipe est heureuse d’avoir pu initier les deux stagiaires québécoises à sa méthodologie de la collecte automatique des sites Web, aujourd’hui reconnue dans le monde des bibliothèques nationales ? Bienfaits de ces rencontres et de ces brassages professionnels, qui accroissent la transmission des savoir-faire et l’estime mutuelle.


lundi 14 février 2011

Écouter la page

Partagez