Archives de l'Internet
Les archives de l’Internet constituées par la BnF peuvent être consultées en Bibliothèque de recherche, sur les sites F.-Mitterrand et Richelieu.
Depuis le 1er août 2006, la Bibliothèque a pour mission de collecter, conserver et communiquer les sites Internet du « domaine français » au titre du dépôt légal (Code du patrimoine, articles L131-1 à L133-1 et R131-1 à R133-1).
À ce titre, la BnF collecte en priorité des sites :
- en .fr,
- hors .fr (.com, .org, etc.) mais dont les auteurs sont domiciliés en France ou les contenus sont produits en France.
Les collectes sont réalisées à l'aide de robots moissonneurs qui copient pages, images, animations, fichiers audio et vidéo. Les sites sont ensuite datés et indexés pour être restitués dans leur contexte de publication original, ce qui permet de naviguer dans les archives comme sur l’Internet, en cliquant de lien en lien.
Tous les sites et toutes les pages des sites ne peuvent être archivés. La BnF constitue des échantillons représentatifs de l’Internet français en combinant deux modes d’archivage :
- les collectes larges permettent de constituer des échantillons représentatifs du Web (2 millions de sites en 2011). Ces collectes, réalisées une fois par an, portent aujourd'hui principalement sur les domaines .fr et .re, grâce à un partenariat avec l’Association française pour le nommage Internet en coopération (AFNIC)
- les collectes ciblées portent sur une sélection d’environ 20 000 sites repérés par des bibliothécaires. Ces sites sont choisis en raison de leur thème (la littérature, le développement durable…) ou de leur rapport à un événement (comme les élections ou les Jeux Olympiques en 2012). Les collectes ciblées sont soit plus profondes (pour archiver les grandes bases documentaires), soit plus fréquentes (une centaine de journaux en ligne font ainsi l’objet d’une collecte quotidienne afin de saisir l’actualité du Web).
Fin 2011, les archives de l’Internet de la BnF contiennent 16,5 milliards de fichiers ; certains remontent à 1996. La recherche se fait à partir du nom des sites et, en complément, les "parcours guidés" présentent des sélections autour d'un thème précis, pour une première approche de la collection.
Les politiques du développement durable dans les archives de l'Internet
Parcours guidé – Le Web vert : les politiques du développement durable
© BnF
Internet encourage-t-il la diffusion d'initiatives en faveur du développement durable ? Ses archives révèlent-elles, sur la durée, des effets de mode ou des engagements... durables ? Pour répondre à ces questions, un nouveau parcours a été conçu par la BnF et l’Observatoire sur la Responsabilité Sociétale des Entreprises. Il montre plusieurs facettes du développement durable vu à travers la communication qu'en font sur le Web les administrations, les entreprises et la société civile.
Les sites du « web militant » dans les archives de l'Internet
Parcours guidé - Web militant
© BnF
Les sites sélectionnés dans le « parcours guidé »
Web militant illustrent la variété des formes d’actions militantes et la diversité des « causes » contemporaines : défense des droits et acquis des travailleurs, mouvements des « sans » (papiers, logement) et de lutte contre les discriminations, tendances écologistes, mouvements alternatifs, etc.
Les journaux personnels et littéraires dans les archives de l'Internet
Parcours guidé – (S') écrire en ligne : journaux personnels et littéraires
© BnF
Internet s'affirme de plus en plus comme le champ d'une façon nouvelle de concevoir l'écriture et l'expression autobiographique. Le « parcours guidé »
(S') écrire en ligne : journaux personnels et littéraires montre à travers une sélection de sites archivés comment le passage du papier à l'écran et la forme du blog ont transformé le journal intime, mais aussi l'écriture et la critique littéraires.
Les sites électoraux 2002, 2004 et 2007 dans les archives de l'Internet
Parcours guidé – Cliquer, voter : l’Internet électoral
© BnF
Le « parcours guidé »,
Cliquer, voter : l’Internet électoral, propose une sélection illustrée et commentée des sites des acteurs, observateurs et témoins des campagnes électorales (élections présidentielles et législatives de 2002 et 2007, élections régionales et européennes de 2004).
À noter
Il n’existe pas de liste des sites accessibles dans les archives de l’Internet. Les recherches doivent être faites dans les salles de lecture, sur les postes informatiques qui permettent de consulter les archives.
Pour accéder aux archives de l’Internet, il faut justifier d'une recherche d'ordre universitaire, professionnel, ou personnel, nécessitant le recours aux collections de la Bibliothèque de recherche.
Pour s’assurer de la présence d’un site dans les archives, avant de se déplacer sur place, une demande peut être adressée par
courriel.