Consulter les Archives de l'internet

La page que vous souhaitez consulter n’est plus sur le web vivant ? Vous souhaitez savoir à quoi ressemblait le site du musée du Louvre, de l’Élysée ou de la Ligue des droits de l’homme il y a dix ans, retrouver un blog d’amateur d’histoire aujourd’hui disparu, vous replonger dans le web de la fin  du début des années 2000 ? 
Dans le cadre de ses missions de dépôt légal, la BnF collecte à intervalles réguliers des milliers de pages web afin de constituer la mémoire de notre temps et de ce média incontournable qu’est devenu le web. Sa collection de sites archivés, parmi les plus anciennes et les plus riches dans le monde, est ouverte à toute personne justifiant d’une recherche académique, professionnelle ou personnelle. 
 

Modalités d’accès

Les archives de l’internet - © Guillaume Murat/BnF - Guillaume Murat
Les archives du web sont consultables :  
  • Dans les salles Recherche des différents sites de la BnF, par les personnes titulaires d’un pass recherche. Les archives de l’internet y sont consultables soit sur les postes informatiques en accès libre et sans réservation, à partir du portail documentaire, soit par le biais de votre ordinateur personnel en téléchargeant l’application AVEC.
  • Dans les bibliothèques de dépôt légal imprimeur en région offrant un accès aux archives de l’internet. Les conditions de consultation sont disponibles auprès des établissements concernés.

Par respect du droit de la propriété intellectuelle, les collections ne sont pas accessibles en ligne. 

Applications et outils d’accès

L’application Archives de l’internet : Remonter le temps

Les collections de dépôt légal du web sont consultables dans l’Application Archives de l’Internet qui permet de visualiser dans un navigateur les contenus collectés, dans un contexte de navigation similaire à celui qui existait au moment de la collecte, et de naviguer dans le web du passé comme sur l’internet vivant, en cliquant de lien en lien, à partir d’une recherche par URL.
L’application Archives de l’Internet fonctionne de la même manière que la Wayback Machine d’Internet Archive. Les collections proposées par les deux outils sont complémentaires. Les contenus relevant du web français sont, depuis le début des années 2000, mieux couverts dans les collections de la BnF que dans les collections d’Internet Archive, le web français étant collecté plus en profondeur par les robots de la BnF dans le cadre de ses missions de dépôt légal.

Modes de recherche et points d’entrée

Plusieurs modes de recherche sont disponibles :
  • La recherche par mot dans le contenu des pages archivées est disponible pour les collections suivantes : Actualités, Covid-19, Attentats 2015, Les Incunables du web français.
  • La recherche par URL est disponible sur la totalité des collections d’archives web, via l’application archives de l’Internet. En dehors des collections citées plus haut, il faut connaître l’URL exacte d’un site pour la consulter. Pour retrouver des URL, plusieurs astuces ou modes de recherche s’offrent à vous : rechercher des URL sur le web vivant via un moteur de recherche, notamment Google ; les jeux de données disponibles sur les sites API et Jeux de données et data.gouv.fr répertorient au format tabulé les URL de départ des collectes ciblées, et permettent une recherche par thème, mot clé ou chaîne de caractère.
  • Les « parcours guidés » proposent d’explorer des thématiques à travers une sélection de sites web
  • Des outils d’exploration enrichie et d’aide à la fouille de texte et de données sont également proposés au sein du BnF DataLab et en fonction de vos projets de recherche.
De nombreuses possibilités d’accompagnement à l’utilisation des archives du web, formations, ateliers, aide ponctuelle à la recherche documentaire ou accompagnement de projets de recherche, vous sont proposées.

Réutilisation des contenus archivés

L’exception de courte citation vous permet de citer et reproduire des extraits de textes contenus dans les pages archivées. La réutilisation et la reproduction des contenus web archivés dans une publication ou pour un usage commercial requièrent l’autorisation préalable des ayants droit. 
Le permalien (ex: http://archivesinternet.bnf.fr/20200310105902/http://www.bnf.fr/fr) présent dans le bandeau orange des archives du web vous permettra de faire dans vos publication référence à la capture précise d’une page web collectée à un instant T. 
Un service d’extraction de sites web à partir des archives de l’Internet est proposé par le Département Images et Prestation numériques de la BnF. Un formulaire d’autorisation de reproduction, à signer par les titulaires des droits d’auteur sur le site, est à votre disposition. 

Contact

Ressources