Les services du BnF DataLab

Pour faciliter l’accès à toute la richesse des données présentes dans ces collections numériques, le BnF DataLab offre un ensemble de services d’accueil et d’accompagnement des chercheurs. Chacun de ces services a été pensé selon le circuit d’un projet de recherche en commençant par la constitution d’un corpus.

 

BnF Datalab - 2021 - Elie Ludwig - BnF

Connaître les collections et constituer son corpus

L’élaboration du corpus constitue la pierre angulaire de tout projet de recherche. Dans le cas de la BnF, cela nécessite une bonne connaissance des fonds, de l’histoire du catalogage, ainsi qu’une maîtrise des outils de recherche bibliographique et un accompagnement expert, quelle que soit la nature des documents.

À la variété des documents et de leur nature (texte, image, vidéo, carte, jeu vidéo, etc.) s’ajoute l’exigence de connaissance de leur statut légal, des modalités d’exploitation et des formats.

À chaque étape de la constitution d’un corpus, les experts de la BnF proposent un accompagnement aux chercheuses et chercheurs :

  • Dans la connaissance des sources : pour renseigner sur les collections et les fonds, en fonction des problématiques de recherche, comme sur les métadonnées disponibles (format, localisation).
  • Dans la définition du périmètre : pour accompagner la sélection des documents pertinents et délimiter le périmètre d’un corpus.
  • Dans l’extraction des contenus : pour aider à la prise en main des outils d’extraction (API, sparql, rapport de recherche Gallica, export professionnel du catalogue général) ou réaliser les extractions dans les cas plus complexes (archives du Web, données sous droit, résolution supérieure de documents, volume important).

Venir travailler dans les espaces du BnF DataLab

Le BnF DataLab ouvre ses portes à toute la communauté scientifique, à partir d’un niveau master, dont les travaux de recherche portent sur les collections numériques de la BnF.Les espaces sont composés de :

  • 10 box individuels, chacun avec un poste informatique et 2 écrans.
  • 3 salles de groupe de 8 places et 1 salle de groupe de 4 places, avec un grand écran permettant le travail présentiel ou hybride collectif.
  • 1 espace dédié aux événements de valorisation scientifique avec grand écran, permettant d’accueillir une vingtaine de personnes.
  • 1 salle de formation avec 12 postes informatiques et 1 poste formateur.

Chaque poste donne accès à l’infrastructure informatique du BnF DataLab. Ce qui inclut des outils avancés sur les archives du web, et des machines virtuelles dédiées au traitement massif de données notamment sous droit. Du matériel informatique complémentaire est disponible sur demande à l’accueil de la salle X : adaptateurs, casques, clés USB, etc.
Pour accéder à ces différents espaces situés dans la salle X, en bibliothèque de Recherche du site François-Mitterrand, il convient de disposer d’un Pass recherche et d’une accréditation BnF DataLab :

Les box et salles de groupe se réservent depuis l’espace personnel comme les autres places situées en bibliothèque de Recherche.

Se former, échanger, expérimenter

Intégré dans une communauté de pratiques centrée sur les données patrimoniales, le BnF DataLab organise ou accueille des événements dont l’objectif est de favoriser les échanges.

  • Des formations dispensées par les experts de la BnF ou par des chercheurs·ses en lien avec le BnF DataLab sur des outils et des méthode de travail : OCR, HTR, NLP, NER etc.
  • Des ateliers de pratique dispensés par nos partenaires : prise en main d’outils de géoréférencement, de segmentation, de traitement massif d’images, de prompt engineering.
  • Des rencontres BnF DataLab pour découvrir des projets de recherche : des journées d’étude, des restitutions autour des projets en résidence.
  • Des hackathons et autres datasprints : des équipes se lancent sur une problématique autour d’un ou plusieurs jeux de données à résoudre en un temps record dans les espaces du BnF DataLab.