Soutenez
le Trésor national
Formulaire de recherche

Collections et services

Archives de l'internet

Les « archives de l’internet », photographies de l’internet français constituées par la BnF, peuvent être consultées en Bibliothèque de recherche.

Un cadre juridique établi en 2006

La Bibliothèque a pour mission de collecter, conserver et communiquer les sites de l'internet du « domaine français » au titre du dépôt légal (Code du patrimoine, articles L131-1 à L133-1 et R131-1 à R133-1). À ce titre, elle moissonne en priorité :

  • les sites en .fr ou autres extensions liées au territoire (.re., .nc., etc.) ;
  • des sites hors .fr (.com, .org, etc.) mais dont les auteurs sont domiciliés en France ou les contenus sont produits en France.

Les collectes sont réalisées à l'aide de robots qui copient pages, images, animations, fichiers audio et vidéo. Les sites sont ensuite datés et indexés pour être restitués dans leur contexte de publication original, ce qui permet de naviguer dans les archives comme sur l’internet, en cliquant de lien en lien.

Des échantillons représentatifs

Tous les sites et toutes les pages des sites ne peuvent être archivés. La BnF constitue des échantillons représentatifs de l’internet français en combinant deux modes d’archivage :

  • les collectes larges permettent de constituer des échantillons représentatifs du Web (4 millions de sites en 2013). Réalisées une fois par an, elles portent aujourd'hui principalement sur les domaines .fr et .re, grâce à un partenariat avec l’Association française pour le nommage internet en coopération (AFNIC) et sur les domaines .nc, grâce à un partenariat avec l’Office des postes et télécommunications de Nouvelle-Calédonie.
  • les collectes ciblées portent sur une sélection d’environ 30 000 sites repérés par des bibliothécaires de la BnF ou des partenaires externes. Ces sites sont choisis en raison de leur thème (la littérature, le développement durable…) ou de leur rapport à un événement (comme les élections ou les Jeux Olympiques en 2012). Les collectes ciblées sont soit plus profondes (pour archiver les grandes bases documentaires), soit plus fréquentes (par exemple, une centaine de journaux en ligne font ainsi l’objet d’une collecte quotidienne afin de saisir l’actualité du web).

Modes de consultation

 

Fin 2013, les archives de l’internet de la BnF contiennent 21,2 milliards de fichiers ; certaines ressources remontent à 1996. La recherche se fait à partir des adresses des sites et, en complément, des « parcours guidés » présentent des sélections autour d'un thème précis, pour une première approche de la collection.

Il n’existe pas de liste complète des sites accessibles dans les archives de l'internet. Cependant, les fiches thématiques de data.bnf.fr signalent les sites web sélectionnés par la BnF dans le cadre des collectes ciblées. Par exemple : http://data.bnf.fr/11932277/litterature_francaise/

Les recherches sur l'ensemble des collections doivent être faites dans les salles de lecture, sur des postes informatiques qui permettent leur consultation. Pour accéder aux archives de l’internet, il faut justifier d'une recherche d'ordre universitaire, professionnel ou personnel, nécessitant le recours aux collections de la Bibliothèque de recherche.

jeudi 21 août 2014

Écouter la page

Contact

Pour s’assurer de la présence d’un site dans les archives de l’Internet, une demande peut être adressée par courriel avant de se déplacer sur place

En savoir plus

Partagez