Référentiels,
données d'autorité,
thésaurus, |
Journée d'étude BnF / AFNOR CG46
Pour réfléchir au rôle des référentiels dans l'interopérabilité des systèmes d'information et dans le web sémantique.
Vendredi 28 Mars
2008, 9h30-17h30 - Bibliothèque
nationale de France - Site François-Mitterrand –
Petit auditorium
| voir aussi | Référentiels, données d’autorité, thésaurus, ontologies, taxonomies… Pour en savoir plus ! par Cécile Kattnig, in BBF, 2008, t. 53, n°5 |
Vous pouvez télécharger les fichiers en cliquant sur
l'icone![]()
(En cas de problème d'affichage, clic droit de la souris sur le lien et
choisir "Enregistrer la cible sous").
| Présentation de la journée Cette journée d'étude consacrée aux référentiels a connu un vif succès puisque 250 personnes s'y sont inscrites et 80 demandes n'ont pu être satisfaites. Le besoin d'interopérabilité entre les différents outils utilisés par les professionnels est souligné par la grande diversité des personnes réunies pour débattre de ce thème : des bibliothécaires, des archivistes, des documentalistes, des représentants du monde des musées, des consultants, des formateurs, des informaticiens, des représentants de la Délégation générale à la modernisation de l'Etat et des ministères de l'enseignement supérieur, de la culture. Après avoir précisé la terminologie qui s'attache à cette grande famille que constituent les référentiels, et en avoir fait une typologie, quelques exemples de vocabulaires contrôlés ont mis en évidence la convergence des besoins entre différents secteurs professionnels. Puis la structuration même des données a été abordée : comment identifier et organiser les informations susceptibles de garantir l'interopérabilité entre des systèmes d'information hétérogènes ? Des pistes de réponses ont été exposées des points de vue documentaire, juridique et administratif. Rendus publics sur le Web, les référentiels ont cessé d'être des outils réservés aux professionnels pour lesquels ils ont été conçus. Le point de vue des utilisateurs des données a été examiné en présenatnt des rapports d'enquêtes rendant compte de la diversité des usages des référentiels sur le Web, mais aussi en donnant la parole au retour d'expérience d'une librairie en ligne, la librairie Decitre. Il n’est pas possible d’imposer à tous les mêmes référentiels. Pour y remédier, l'une des solutions consiste à exploiter les relations sémantiques entre différents vocabulaires contrôlés pour les rendre interopérables. La présentation du projet de recherche STITCH (Semantic Interoperability To access Cultural Heritage) sur ce thème a visé à démontrer la faisabilité d'une telle orientation. En conclusion de cette journée, une table ronde a donné la parole à 5 experts d'horizons très divers (audiovisuel, archives, information géographique, information scientifique, description de l'image) pour exposer leurs points de vue sur le rôle des référentiels dans le développement du Web sémantique. |
| Introduction par Raymond
Bérard, Président
de AFNOR CG46 et Directeur de l'Agence bibliographique nationale
de l'enseignement supérieur |
|
| Point
sur les travaux marquants de la Commission Générale "Information
et documentation"
par Françoise
Bourdon, Présidente
de AFNOR CG46/CN357 et Bibliothèque nationale de France, Agence
bibliographique nationale |
|
|
Rappel de la structure de la Commission
Générale CG46 "Information
et documentation" et
présentation des travaux en cours dans les différents groupes d'experts
rattachés à la commission de normalisation 357 "Modélisation,
production et accès aux documents".
en savoir + sur la CG46 [fichier .pdf - 108 Ko] |
|
par Sylvie
Dalbin,
consultante, Assistance et Techniques
documentaires |
|
|
Référentiels,
données d'autorité, thésaurus, ontologies, taxonomies … Quels
sont ces outils, à quels besoins répondent-ils et quels sont
les types de données qui s'y rattachent ? Cette première intervention
explicite la terminologie en s'appuyant sur des exemples de
vocabulaires contrôlés empruntés à différents secteurs professionnels,
soulignant par là-même la convergence des besoins. Sites pris en exemple : - l'Inventaire national du patrimoine naturel (http://inpn.mnhn.fr/inpn/fr/download/Ref_index.htm) - le Centre de ressources de la gestion de l'information (CRGI) du Secrétariat du Conseil du Trésor du Canada (http://www.tbs-sct.gc.ca/im-gi/references/ref-res_f.asp) - le Réseau européen d'observation et d'information sur l'environnement l'EIONET piloté par l'Agence Européenne pour l'Environnement (EEA) (http://www.eionet.europa.eu) |
|
Présentation Comment organiser les données pour répondre au mieux aux besoins ? Quelle méthodologie suivre pour identifier et structurer les informations susceptibles d'être réutilisables d'un processus métier à un autre ? La définition de bibliothèques de composants peut-elle garantir l'interopérabilité entre des systèmes d'information hétérogènes ? La question est étudiée selon 3 points de vue : documentaire, juridique et administratif. |
|
|
par Anila
Angjeli, Bibliothèque nationale de France, Agence bibliographique
nationale
|
|
Dans
l'univers de la documentation, la gestion des vocabulaires contrôlés
est au coeur du métier. Aujourd'hui l'enjeu est d'utiliser ces
référentiels de façon transverse dans les applications mises
au service des bibliothèques, des centres d'archives, des musées,
etc.
Exemple des données d'autorité dans un contexte en évolution lié
aux mutations technologiques, aux évolutions des usages et des
usagers et au décloisonnement des secteurs.
|
|
|
par François-Xavier Nuttall,
Confédération internationale des sociétés d'auteurs et compositeurs |
|
Dans
le monde juridique, la gestion des droits sur la propriété intellectuelle
requiert une parfaite identification des protagonistes et des
œuvres concernées. Le recours à des identifiants normalisés
au niveau international et accompagnés d'un jeu de métadonnées
est-il viable ? Exemple de la CISAC,
organisation non gouvernementale à but non lucratif, qui s’attache
à promouvoir et protéger les droits des auteurs depuis 1926 dans
les domaines musical et audiovisuel.
|
|
|
par Sylvie
Colas et Sylvain Bellengier, Ministère du budget, des comptes
publics et de la fonction publique |
|
Dans
le monde de l'administration, comment la définition de modèles
de données pour les échanges électroniques contribue-t-elle à
améliorer l'efficacité et la flexibilité des systèmes d'information?
Comment favorise-t-elle l'interopérabilité au sein de l’administration,
entre les administrations et les entreprises, au niveau national
et international ?
Dans le cadre de la révision générale des politiques publiques, nouveau cadre de la réforme de l'Etat, la Direction générale de la modernisation de l'Etat (DGME) accompagne les ministères dans leurs actions de transformation en apportant une expertise sur les leviers les plus structurants (optimisation des organisations, des processus, des systèmes d'information...). Elle développe également des projets interministériels dans les domaines de la simplification, de l'accueil et de l'administration électronique basés sur l'harmonisation des échanges de données, notamment le projet ESOPE. |
|
Présentation Rendus publics sur le Web, les référentiels ont cessé d'être des outils réservés aux professionnels pour lesquels ils avaient d'abord été conçus. Les usagers se les approprient et même s'en nourrissent pour en produire d'autres. Les usages se diversifient et influencent à leur tour la structuration des données. |
|
Comptes
rendus de différents rapports d'enquête sur l'utilisation des
thésaurus et des vocabulaires contrôlés sur le Web
par Catherine Marandas, Bibliothèque nationale de France, Agence bibliographique
nationale
|
|
Une enquête RLG lancée en juillet-août 2007 auprès
de 18 institutions partenaires aux Etats-Unis et en Grande-Bretagne
(bibliothèques, archives, musées) pour connaître les pratiques
en matière de métadonnées descriptives révélait une très grande
disparité des ces pratiques et des outils utilisés. Les résultats
de cette enquête ont entraîné la mise en place de nouveaux axes
de travail au niveau d'OCLC.
Consultation de l'enquête : - Analyse : Karen Smith-Yoshimura (www.oclc.org/programs/publications/reports/2007-03.pdf) - Questionnaire et Graphiques : Karen Smith-Yoshimura et Diane Cellentani (www.oclc.org/programs/publications/reports/2007-04.pdf) Et aussi : - Terminologies services meeting (http://www.oclc.org/programs/events/2007-09-12.htm) - Programmes lancés par OCLC/RLG (http://www.oclc.org/programs/ourwork/renovating/default.htm) |
|
Exemple
d'une librairie en ligne, la librairie Decitre : utilisation
des référentiels par le libraire et par ses clients (le Web 2.0)
par Guillaume
Decitre et Françoise Julien, Librairie Decitre |
|
Librairie
centenaire, distributeur spécialisé de livres et de papeterie implanté
dans la région Rhône-Alpes, la librairie Decitre a développé un
espace de vente en ligne (5e en France) qui reçoit 8 000 visites
par mois. Pourquoi un site en ligne, l'attente des internautes,
la structuration des informations dans un souci de gestion et de
satisfaction des clients ont été les thèmes abordés. |
|
par Antoine
Isaac, Bibliothèque nationale des Pays Bas,
Division Recherche et développement et Vrije Universiteit Amsterdam |
|
Quand les données sont fiables et bien
structurées elles peuvent être exploitées pour créer de nouveaux
outils. Il n'est pas envisageable d'imposer à tous le respect d'un
même et unique référentiel pour indexer tous les documents. Faire
dialoguer entre eux des vocabulaires hétérogènes pour faciliter
l'accès à de multiples collections est beaucoup plus pragmatique.
Le projet STITCH (Semantic Interoperability To access
Cultural Heritage) donne l'occasion d'étudier comment peuvent être exploitées
les relations sémantiques entre différents vocabulaires contrôlés pour
les rendre interopérables et même susceptibles d'offrir un accès multilingue
aux collections qu'ils référencent.
Accès au démonstrateur du projet STITCH permettant une interrogation simultanée de différentes bases de données (Mandragore base iconographique du département des Manuscrits de la BnF et la Collection d’enluminures de la Bibliothèque royale des Pays-Bas) à partir de la même interface. |
|
Les référentiels existants ont-ils un rôle à jouer dans le Web sémantique ? Quelles étapes faut-il franchir pour les rendre plus faciles à exploiter par les moteurs de recherche ? Les nouveaux usages vont-ils générer de nouveaux besoins ? Etc. Cette table ronde a été l'occasion de revenir sur les thèmes marquants abordés tout au long de la journée par le témoignage d'intervenants venant d'horizons très divers sur la façon dont les référentiels, thésaurus ou données d’autorité sont utilisés dans leur secteur d’activité. Débats animés par Emmanuelle Bermès, Bibliothèque nationale de France, Département de la Bibliothèque numérique. | |
![]() De gauche
à droite : Antoine Isaac, Elizabeth Giuliani, Emmanuelle
Bermès, Claire Sibille, Patrick Leboeuf, Christian Fluhr
-
© BnF, 28 mars 2008 | |
Invités
:
Christian Fluhr, Société NewPhenix Christian Fluhr a été professeur à l'Institut national des sciences et techniques nucléaires (CEA) et a fait partie du Laboratoire d'intégration des systèmes et technologies (CEA-LIST). Il a dirigé le Laboratoire d'ingénierie de la connaissance multimédia multilingue (CEA-LIST/LIC2M), laboratoire qui développe des outils d'indexation textuelle multilingue des données images et multimédia et des outils d'analyse linguistique et sémantique permettant des requêtes en langage naturel. Il a piloté (avec la société Tribun et le pôle Nicéphore Cité) les campagnes d'évaluation de la reconnaissance automatique d'image ImagEVAL. Il travaille actuellement au sein de la société NewPhenix. | |
Christian Fluhr a évoqué l’utilisation des outils linguistiques
automatiques pour le traitement des données structurées mais
aussi des données brutes. Interrogé sur ce que ces traitements
linguistiques peuvent apporter, du point de vue des usages,
à l’utilisateur final, il a précisé les utilisations possibles
de ces technologies dans le contexte de la recherche d’information.
L’utilisateur final, qui ne connaît pas les langages normalisés
que sont les référentiels, va poser ses questions en langage
naturel : il s’agit donc d’analyser sa question pour lui
répondre de manière précise grâce à une méthodologie proche
de celle qui a été présentée au cours de la journée, si ce
n’est que les vocabulaires normalisés employés sont plus abondants
quantitativement. Christian Fluhr a aussi présenté la problématique
particulière de l’indexation multilingue de corpus d’images,
et les difficultés que pose l’utilisation de "mots-clés"
pour décrire les images dans ce contexte.
| |
Elizabeth
Giuliani, Bibliothèque
nationale de France/Département de l'Audiovisuel et Présidente de
AFNOR CG46/CN6 "Numérotation
et identification"
Conservateur général, adjointe au directeur du Département de l'Audiovisuel de la BnF, elle y coordonne les activités de contrôle bibliographique et les relations avec le Système d’information. Membre actif des instances de normalisation documentaire françaises, européennes et internationales, elle préside, au sein de la CG 46 de l’AFNOR, les commissions de normalisation relatives, l’une (CN6) à l’Identification et la numérotation des documents, l’autre (OCEAN) à l’élaboration d’une norme européenne d’identification des œuvres cinématographiques. | |
Elizabeth Giuliani a évoqué les tensions politiques qui sous-tendent la
normalisation dans le contexte particulier de la mise en place de référentiels
pour des contenus non textuels. Le contrôle des systèmes d’identifiants
et des métadonnées associées apparaît comme un enjeu stratégique dans
la mesure où il donne la maîtrise sur des contenus qui sont protégés
à plusieurs niveaux, et dont les ayants droit veulent connaître l’utilisation
précise. Dans ce contexte, la normalisation des référentiels apparaît
comme un outil de pouvoir. | |
Antoine Isaac, Bibliothèque nationale des Pays Bas,
Division Recherche et développement et Vrije Universiteit Amsterdam Antoine Isaac est post-doctorant impliqué au Pays‑Bas dans le projet TEL+ (The European Library) et en partenariat avec la BnF dans le projet STITCH (Semantic Interoperability To access Cultural Heritage). | |
Impliqué au niveau du W3C dans les travaux autour du Web
sémantique qui visent à proposer des formats communs pour intégrer des
données provenant de sources différentes notamment le modèle
SKOS (Simple
Knowledge Organization System), Antoine Isaac a décrit ce processus de normalisation comme une structure
légère, ouverte, se basant sur des cas d’utilisation. L’objectif est d’intéresser
des communautés existantes à ces normes en leur proposant d’extraire de leurs
pratiques des régularités d’usage.
| |
Patrick Leboeuf, Institut géographique national Patrick Leboeuf, Ingénieur, Chef du Service Information en Ligne à l’Institut Géographique National et coordinateur du projet Géoportail. En charge du développement et de l’administration de ce portail des territoires et des citoyens, il a pour mission d’assurer la diffusion de tous les référentiels géographiques de l’IGN par les canaux traditionnels mais aussi sur Internet. | |
Patrick Leboeuf a présenté un secteur, celui de l’information géographique,
qui est au cœur de bien des enjeux sur le web d’aujourd’hui. En effet, il existe
beaucoup d’informations qui peuvent être référencées dans l’espace et l’information
géographique permet de rendre un meilleur service à l’internaute, avec un contenu
plus ciblé et une présentation simplifiée. Ce meilleur service rendu peut porter
aussi bien sur une information promotionnelle que réglementaire. Les référentiels
qui se basent sur des coordonnées géographiques permettent de lever les ambiguïtés
qui peuvent résider dans l’homonymie des toponymes ou l’approximation des adresses
postales. | |
Claire Sibille, Direction des Archives de France et
membre de la Section des normes et bonnes pratiques du Conseil international
des archives
Claire Sibille est conservateur en chef à la direction des Archives de France depuis mai 2003. Archiviste-paléographe, elle a été en poste au Service historique de l'armée de terre puis à la section des archives privées du Centre historique des Archives nationales. Elle a contribué à la publication de plus de 3000 pages d'instruments de recherche, dont l'état des fonds privés des Archives nationales, et a été membre du conseil d'administration de l'Association des archivistes français de 1998 à 2004. Responsable du suivi de la normalisation de la description archivistique, elle contrôle l'élaboration des inventaires produits par les services d'archives publics français et participe à différentes commissions de normalisation. | |
Claire Sibille a présenté l’approche métier spécifique à l’archivistique
et la mise en place des référentiels autour de normes plutôt récentes. Celles-ci
s’élaborent dans une logique d’ouverture : complémentarité avec d’autres
normes, dialogue avec d’autres professions. La modélisation est un élément
clef de la convergence des référentiels.
|
|