Les archives de l’Internet sont issues de collectes larges et de collectes ciblées. Celles-ci regroupent les collectes « courantes » (qui concernent des sites de référence sur un champ disciplinaire donné) et les collectes « projet » (qui ont une vocation transversale et portent sur un événement ou un thème particulier).
Les collectes courantes
Les collectes courantes portent sur plus d’une dizaine de milliers de sites, sélectionnés par les départements de la BnF suivants :
- Arts du spectacle
- Audiovisuel
- Cartes et plans
- Dépôt légal
- Droit, économie, politique
- Estampes et photographie
- Information bibliographique et numérique
- Littérature et art
- Musique
- Philosophie, histoire, sciences de l'homme
- Recherche bibliographique
- Sciences et techniques
Depuis 2011, ces collectes sont réalisées à des fréquences variables pour les différents sites selon les demandes des départements (de « une fois par semaine » à « une fois par an »).
Les collectes projet
Les collectes projets se caractérisent par leur sensibilité plus forte à l’actualité et par leur transversalité. Elles sont souvent réalisées en coopérations avec des partenaires externes (bibliothèques, centres de recherches, associations).
En 2012, les collectes suivantes ont été menées par la BnF :
- Actualités : un centaine de sites d'actualité (presse nationale et régionale, presse magazine...) sont capturés tous les jours.
- Vidéos : sélection de vidéos de la plate-forme de diffusion Dailymotion.
- Journaux personnels : sélection de 450 sites illustrant l'expression intime et littéraire en ligne, réalisée en partenariat avec l’Association Pour l’Autobiographie.
- Solidarité(s) : la collecte de 570 sites sur le thème des solidarités englobe les associations de solidarité et plus largement des sites consacrés à la philanthropie et à l'économie sociale et solidaire.
- Mouvements sociaux : cette collecte de 230 sites donne à voir la diversité des mouvements contemporains, les pratiques et le sens de l'activité contestataire. Les sites ont été sélectionnés en partenariat avec le Centre d’Histoire Sociale de Paris 1, le CERI de Science Po et la Bibliothèque de Documentation Internationale Contemporaine.
- Responsabilité Sociétale des Entreprises : réalisée avec l’Observatoire de la Responsabilité Sociétale des Entreprises, cette sélection de 150 sites illustre l'activité de reporting et de communication « développement durable » des entreprises sur l'Internet.
- Publications officielles : 800 sites de l’Etat, des administrations territoriales ou des organes européens et internationaux.
- Accords internationaux : sites de l’administration américaine archivés dans le cadre de la dématérialisation des échanges internationaux des publications officielles.
Deux collections sont spécifiques à l’année 2012 :
- les sites des élections présidentielles et législatives, soit plus de dix milles sites capturés en coopération avec vingt bibliothèques régionales ;
- les sites des jeux olympiques et paralympiques, soit près de 1 600 sites capturés en lien avec le laboratoire Pacte de l’Université de Grenoble.
Enfin, la BnF dispose d’une procédure de « collecte d'urgence » qui permet de capturer rapidement des sites à collecter à une date précise (pour les sites de salons ou de festivals, par exemple) ou susceptibles de disparaître.