Soutenez Saint-Louis
Formulaire de recherche

Collections et services

Archives de l'internet

Les « archives de l’internet », photographies de l’internet français constituées par la BnF, peuvent être consultées en Bibliothèque de recherche.

Un cadre juridique établi en 2006

La Bibliothèque a pour mission de collecter, conserver et communiquer les sites de l'internet du « domaine français » au titre du dépôt légal (Code du patrimoine, articles L131-1 à L133-1 et R131-1 à R133-1). À ce titre, elle moissonne en priorité :

  • les sites en .fr ou autres extensions liées au territoire (.re., .nc., etc.) ;
  • des sites hors .fr (.com, .org, etc.) mais dont les auteurs sont domiciliés en France ou les contenus sont produits en France.

Les collectes sont réalisées à l'aide de robots qui copient pages, images, animations, fichiers audio et vidéo. Les sites sont ensuite datés et indexés pour être restitués dans leur contexte de publication original, ce qui permet de naviguer dans les archives comme sur l’internet, en cliquant de lien en lien.

Des échantillons représentatifs

Tous les sites et toutes les pages des sites ne peuvent être archivés. La BnF constitue des échantillons représentatifs de l’internet français en combinant deux modes d’archivage :

  • les collectes larges permettent de constituer des échantillons représentatifs du Web (4,1 millions de sites en 2014). Elles sont réalisées une fois par an, grâce à un partenariat avec l’Association française pour le nommage internet en coopération (AFNIC), la société de conseil en systèmes et logiciels informatiques OVH et l’Office des postes et télécommunications de Nouvelle-Calédonie (OPT-NC).
  • les collectes ciblées portent sur une sélection d’environ 20 000 sites repérés par des bibliothécaires de la BnF ou des partenaires externes. Ces sites sont choisis en raison de leur thème (la littérature, le développement durable…) ou de leur rapport à un événement (comme les élections ou les Jeux Olympiques en 2012). Les collectes ciblées sont soit plus profondes (pour archiver les grandes bases documentaires), soit plus fréquentes (par exemple, une centaine de journaux en ligne font ainsi l’objet d’une collecte quotidienne afin de saisir l’actualité du web).

Modes de consultation

 

Fin 2014, les archives de l’internet de la BnF contiennent 23,6 milliards de fichiers ; certaines ressources remontent à 1996. La recherche se fait à partir des adresses des sites et, en complément, des « parcours guidés » présentent des sélections autour d'un thème précis, pour une première approche de la collection.

Il n’existe pas de liste complète des sites accessibles dans les archives de l'internet. Cependant, les fiches thématiques de data.bnf.fr signalent les sites web sélectionnés par la BnF dans le cadre des collectes ciblées. Par exemple : http://data.bnf.fr/11932277/litterature_francaise/

Vous pouvez consulter les archives de l'internet dans toutes les salles de lecture de la Bibliothèque de recherche, sur les postes informatiques ou sur votre ordinateur portable via le portail d'accès aux ressources numériques AVEC.

Depuis le 16 septembre 2014, les 26 bibliothèques chargées du dépôt légal imprimeur en région sont autorisées à proposer, dans leurs emprises, la consultation de ces archives dans leur intégralité, sous les mêmes conditions qu'à la BnF.

jeudi 26 mars 2015

Écouter la page

Contact

Pour s’assurer de la présence d’un site dans les archives de l’Internet, une demande peut être adressée par courriel avant de se déplacer sur place

En savoir plus

Partagez