Dépôt légal des sites web : mode d'emploi

Naviguer par thèmes


Je suis domicilié en France

Mon site est collecté par la BnF dans le cadre du dépôt légal de l’internet français, grâce à un processus de moissonnage par robot en grande partie automatisé. 
Tout type de sites ou contenus diffusés sur l’internet sont concernés : sites institutionnels ou personnels, revues, blogs, sites commerciaux, livres numériques, réseaux sociaux… Seules les parties publiques sont moissonnées.
Compte tenu du nombre de sites et publications web concernés, le dépôt légal du web n’est pas exhaustif.  
Les sites relatifs à la radio et à la télévision sont collectés par l’Ina.
 

Je souhaite signaler mon site web à la BnF

Je n’ai rien à déposer ni copie des contenus de mon site sur support (CD, DVD, clé USB), ni envoi par courriel.
Aucune démarche n’est requise (ni déclaration, ni dépôt de fichier numérique, ni envoi).
Ma seule obligation est de ne pas entraver la BnF dans son processus de collecte, notamment de ne pas bloquer le robot. 
La BnF ne pouvant garantir l’exhaustivité de ses collectes, je peux, si je le souhaite, signaler mes publications ou mon site web, en indiquant leurs adresses URL dans un message adressé à depot.legal.web@bnf.fr.
Si le contenu d’un site est inaccessible pour des raisons techniques (base de données, contenu protégé par mot de passe, formulaire d’accès…) ou économiques (contenu payant, abonnement…), sa collecte est impossible à ce jour et ne requiert aucune démarche obligatoire de ma part. Si besoin, la BnF peut prendre contact.
 

Mon site est collecté

Une fois par an, la BnF mène une collecte large : l’objet de cette collecte est d’archiver le plus grand nombre de sites de l’internet français, mais pas forcément dans leur intégralité.
Certains sites sont sélectionnés par des bibliothécaires selon des critères documentaires. Ils font l’objet de collectes ciblées qui ont des fréquences (1 fois par an à plusieurs fois par jours) et des profondeurs (entièrement ou en partie) variables.
Un site qui a fait l’objet d’une demande de collecte est archivé dans un délai maximum de trois mois. 
Les fichiers sont datés du jour de leur collecte et indexés avec leur adresse (URL). Dans tous les cas, la BnF n’envoie pas de récépissé de collecte.
 

Pas de signalement exhaustif

Pour savoir si un site est collecté, je peux :
  • consulter data.gouv.fr et api.bnf.fr : les listes des sites qui ont fait l’objet de collectes ciblées et du « web électoral » sont disponibles à la consultation et au téléchargement. 
  • consulter les Archives de l’internet et le retrouver grâce à son adresse URL (voir étape 6)
  • écrire à l’adresse générique depot.legal.web@bnf.fr
Il n’existe pas de liste des sites collectés dans le cadre de la collecte large (voir étape 3)
 

Les fichiers collectés, les archives de l'internet

Les archives de l’internet sont conservées dans le système de préservation et d’archivage réparti de la BnF, SPAR.

Consulter les archives de l'internet

En vertu du code de la propriété intellectuelle, les archives ne sont pas en ligne (sur internet).
Elles sont disponibles dans les espaces Recherche de la BnF ainsi que dans les établissements partenaires en région sous des conditions identiques (inscription, respect du code de la propriété intellectuelle). 
Le téléchargement des fichiers et les copies d’écran sont interdits et empêchés par un dispositif de sécurité.
Les archives de l’internet ne peuvent être supprimées, en revanche l’accès peut être exceptionnellement réservé.

Proposer un site à la collecte

Il est également possible de signaler pour archivage tout site relevant du domaine français à l’adresse depot.legal.web@bnf.fr. Cela comprend :

  • Les sites en .fr et tous les domaines de premier niveau français (les sites se terminant par .bzh, .corsica, .paris, .gf, .mq, .gp…)
  • Tous les sites dont les auteurs sont domiciliés en France
  • Tous les sites produits ou hébergés en France

En savoir plus sur le fonctionnement technique de la collecte

Suggérer un site web