Bibliothèque nationale de France
La BnF
En savoir plus
La recherche à la BnF Chroniques, juillet-septembre 2006Contact
Délégation à la Stratégie et à la RecherchePlan triennal de la recherche
Subventionné
L’objectif d’OPTIMA est de rendre possible une édition hypertextuelle érudite de fonds, en privilégiant d’abord la conception et la mise au point d’outils numériques fondamentaux. Ce programme est financé par l’Agence Nationale de la Recherche et implique l’Institut des textes et des manuscrits modernes (ITEM) , la BnF le Laboratoire d'Informatique, de Traitement de l'Information et des Systèmes (LITIS), le Laboratoire d'Informatique de l'université Paris-Nord (LIPN).Il s’agit de convertir une masse de manuscrits autographes – dont l'accès se trouve réservé à un public initié en raison de leur complexité graphique – en un "avant texte" transcrit et classé permettant d’interpréter les processus à l’origine du texte.
L’expérience portera sur plusieurs grands corpus comportant des modèles d’écritures diversifiées : Flaubert, Proust, Valéry, fiches de travail de Fernand Braudel et se déroulera sur trois ans. 15 000 images haute définition seront produites, sous le contrôle de la BnF. Le LITIS et le LIPN seront chargés d’élaborer les outils d’aide à la visualisation, à la transcription au classement et à l’annotation numériques, ainsi que ceux permettant la recherche et l’édition en ligne.
La présentation d’OPTIMA [fichier .html]
Subventionné
Ce projet a débuté en juillet 2006, pour une durée totale de quatre ans.Son premier objectif est de développer une théorie, des méthodes et des outils pour permettre l'interopérabilité des métadonnées à travers des liens sémantiques entre vocabulaires d'indexation hétérogènes. Ces techniques sont assez similaires au domaine de l'alignement d'ontologies.
Il s'agit de mettre en correspondance de façon (semi-) automatique les vocabulaires utilisés pour décrire des collections et les schémas de métadonnées qui les structurent. Dans un premier temps, les recherches porteront sur les vocabulaires de descripteurs utilisés pour l'indexation matière des ressources iconographiques.
Les collections choisies pour la phase expérimentale sont :
Un démonstrateur a été réalisé par les équipes hollandaises associant dans une même interface les accès aux différentes collections et permettant des recherches par un des vocabulaires sur l'ensemble des données. Il permettra de réfléchir aux extensions éventuelles de ces techniques à d'autres domaines ou vocabulaires et trouvera un prolongement au sein du programme européen TEL+.
Partenaires
Subventionné
Le projet IDA a réuni l’Institut des textes et des manuscrits modernes (ITEM), l'Institut National de Recherche en Informatique et en Automatique (INRIA) et la BnF autour de la problématique de la mise à disposition de corpus de manuscrits numérisés en vue de l'annotation collaborative en ligne par des équipes de chercheurs.A travers la numérisation des trois manuscrits de Proust, Flaubert et Valéry, les partenaires du projet ont exploré les conditions particulières de qualité qui sont nécessaires à la mise à disposition d'un corpus de haute qualité numérique. L'analyse de ces manuscrits par les équipes de l'ITEM, de la transcription à la création de classements et de parcours de lecture, se voit ainsi facilitée par l'outil numérique, pour autant que celui-ci prenne en compte les besoins de métadonnées techniques normalisées et de références stables, indispensables pour bâtir des applications d'annotation collaborative des corpus.
L'expérience technique du projet IDA pourra ainsi servi le projet OPTIMA qui constitue le passage à l'échelle quantitative du corpus de manuscrits littéraires.
Subventionné
Dans le cadre de l'appel à projet Technolangue du Ministère de la recherche, la BnF a été partenaire du projet Agile/Watson.A partir de technologies utilisées dans le traitement automatique de la langue, et dans une optique d'accès et de détection des contenus, l'objectif était d'en appliquer les principes au pré-filtrage, catégorisation et extraction-résumé de données collectées pour le dépôt légal du Web et de les évaluer. Un outil a été développé et le projet Watson a été l’occasion d'utiliser les captures de sites réalisées par la BnF lors des élections présidentielles et législatives 2002, en se plaçant du point de vue du chercheur qui souhaiterait travailler sur de tels corpus.
Dans le prolongement du programme, un pilote d’utilisation par un groupe de chercheurs de ce corpus, complété par les élections régionales et européennes 2004 a été réalisé.
Le produit ayant servi au développement de l'outil dans Watson a été acquis par la BnF et mis en œuvre en complément des autres outils d’accès aux archives web développés dans le cadre du consortium IIPC.
Subventionné
Ce projet de recherche sur les usages d'une bibliothèque électronique en ligne a été subventionné par le Ministère de la recherche dans le cadre d'un appel à projet RNRT (Réseau National de Recherche en Télécommunications) sur les nouveaux usages, lancé en fin 1999. Conduit en partenariat avec France Télécom Recherche et Développement - pilote du projet et contributeur notamment avec son secteur de recherche en sciences cognitives - il s'est déroulé d'octobre 2001 à janvier 2003.L'objectif de la BnF était de disposer d'informations qualitatives sur l'utilisation de la bibliothèque numérique en ligne Gallica afin de faire évoluer le service en terme de contenu, d'architecture et d'ergonomie.
La méthodologie d'investigation utilisée dans le projet consistait dans l'installation d'une sonde sur les postes informatiques d'un panel représentatif d'utilisateurs de Gallica. La sonde captait, dans le respect des données privées et avec l'accord de l'utilisateur, son activité sur Internet y compris sur Gallica. Les données de 15 500 sessions ont ainsi pu être recueillies.
Un panel de 100 utilisateurs volontaires avait été sélectionné à partir d'une enquête du public de Gallica conduite avec l'aide de la société Ipsos en mars 2002. Il était constitué d'utilisateurs d'Internet expérimentés ayant une longue pratique et un usage quotidien du web, et utiliseurs réguliers de Gallica.
Par ailleurs des entretiens individuels détaillés ont été organisés avec certains membres du panel pour permettre une meilleure interprétation de l'analyse des transactions.
Les résultats ont souligné que le panel était constitué d'un noyau d'utilisateurs actifs et motivés ayant un intérêt réel pour le projet et utilisant fréquemment des bibliothèques numériques en ligne. Les données sur les modes de consultation de Gallica - situé dans l'environnement du web global - ont montré la position de Gallica (qui figure très haut dans le classement des sites fréquentés) en tant qu'intermédiation dans le monde Internet et vers la sphère marchande, avec des allers et retours entre les sites de commerce et le site institutionnel, dans une utilisation parallèle et souvent synchrone.
Usages des bibliothèques électroniques en ligne - Projet BibUsages : rapport final juillet 2003 [fichier .pdf – 677 Ko – 60 p.]
jeudi 5 août 2010