Soutenez
le Trésor national
Formulaire de recherche

Pour les professionnels

Colloque sur l'indexation en français et en arabe

Sommet de la Francophonie à Beyrouth, 28-29 septembre 2001

Synthèse des interventions et directions de travail

Ce colloque a permis de présenter plusieurs expériences intéressantes et d'explorer des pistes prometteuses pour promouvoir un accès par sujet multilingue et performant dans les bibliothèques du monde arabe.
Au terme de deux jours de débats de qualité, les participants ont tous déclaré vouloir continuer à travailler ensemble sur le sujet. Une première étape s'imposait : la restitution des acquis du colloque, pour servir de base aux futurs travaux.
C'est ce que propose ce document, organisé en deux parties :

  • une synthèse des interventions et des directions de travail, établie par Max Naudi, Service de coordination bibliographique de la Bibliothèque nationale de France, et Wahid Gdoura, au titre de l'AFLI (Arabic Federation of Libraries and Information/ Fédération arabe des bibliothécaires et de l'information) ;
  • les suggestions et recommandations des participants, recueillies à la fin de la manifestation et qu'il a paru souhaitable de conserver en l'état, pour en respecter l'esprit.

La synthèse s'articulera selon les grands thèmes abordés et à partir de deux constats qui ont été le point de référence constant de toutes ces communications.
Constat d'abord de notre nouvel environnement commun, environnement global qui est celui des réseaux et du multilinguisme. Il impose aujourd'hui à tous la nécessité de coopérer pour mieux partager le travail et récupérer au meilleur coût le travail déjà effectué.
Constat ensuite des problèmes et des freins que posent dans les pays arabes la pratique des catalogues séparés et la complète atomisation des outils d'indexation. Ce second constat ne fait que renforcer encore le besoin de coopération. Il rend encore plus urgente la nécessité d'outils communs permettant l'échange et la récupération des informations bibliographiques.

1. Utiliser les réseaux et les outils communs

1.1 La situation libanaise décrite par D. Issa ("Les collections de bibliothèques au Liban : état des lieux et traitement des collections") rend bien compte du problème. Malgré leur diversité et leur richesse (richesse d'ailleurs très inégalement répartie), les collections multilingues sont mal mises en valeur parce que traitées dans des catalogues séparés et avec des outils multiples, ce qui interdit toute intercommunication entre langues, cultures et établissements.

Mais un tel constat ne doit pourtant pas inciter à l'attentisme dans l'espoir que "la technique" résoudra tout. Non pas "malgré", mais "avec" les avancées réelles de l'ingénierie linguistique (M. Hassoun, "Indexation automatique du document écrit en langue arabe") comme des procédés techniques mis en œuvre sur Internet (M. Ben Henda, "Les apports d'Unicode, HTML4 et Dublin Core pour le traitement du texte multilingue"), les outils développés ont plus que jamais leur rôle à jouer, notamment pour l'accès par sujet, enjeu central de l'accès à l'information. Mais il faut savoir les choisir, les améliorer, assurer leur complémentarité et leur compatibilité pour pouvoir les adapter au nouvel environnement des réseaux (métadonnées d'autorité dans le cadre du Dublin Core).

 

1.2 C'est sur ces bases que le langage d'indexation RAMEAU à été proposé à la communauté francophone à la fin des années 90. Il se présente comme un outil commun et ouvert, très facilement accessible et évaluable par tous au sein d'un véritable réseau (M. Naudi, "RAMEAU : le travail en réseau et le Web").

Deux communications ont permis de vérifier son adaptation et son adaptabilité dans les pays arabes francophones. Particulièrement riche et documentée, celle de S. Mahmoud ("Multitude des lexiques d'indexation en langue arabe et apport de RAMEAU à la Bibliothèque nationale de Tunisie") souligne l'apport très positif de RAMEAU pour l'indexation des documents en français. Mais elle l'évalue aussi dans deux domaines (histoire et médecine) pour l'ensemble des documents, y compris en arabe, et conclut à sa bonne adaptation en dépit de quelques manques qu'il convient de combler en commun.
N. Derrough ("Problématique de l'adoption / adaptation d'un fichier d'autorités-matière en Algérie : le cas du CERIST") parvient à la même conclusion sur l'apport de RAMEAU, sauf toutefois pour l'indexation de thèses scientifiques ou d'articles de périodiques spécialisés. Notant par ailleurs certains manques, il se demande s'il convient de préférer l'adaptation ou l'adoption de RAMEAU. La question vaut d'être posée, mais il faut remarquer que l'adaptation d'un référentiel est une entreprise délicate qui risque rapidement de couper son auteur de la communauté qui utilise le référentiel commun et donc des réservoirs bibliographiques auxquels il donne accès.

Mieux vaut donc sans doute privilégier la pleine appartenance au réseau et participer au développement de l'outil commun pour mieux en retirer tout le bénéfice économique et intellectuel. C'est l'option choisie par la Bibliothèque nationale de Tunisie dont plusieurs propositions ont déjà enrichi RAMEAU de notions relatives à l'histoire et à la culture d'un pays arabe. Illustration de la coopération intellectuelle et professionnelle entre deux langues, deux cultures, ce choix permet à la Bibliothèque nationale de Tunisie de bénéficier de tout l'acquis des indexations RAMEAU.
Même si l'on peut penser que, à terme, des parties "locales" pourront se développer dans le cadre d'une coopération globale, il semble essentiel dans un cadre multilingue d'employer les outils communs appropriés, aussi bien RAMEAU pour les pays francophones que les LCSH pour les anglophones.

2. Fournir l'accès multilingue

2.1 Mais l'accès multilingue effectif ne requiert pas seulement l'utilisation de référentiels communs et reconnus. Il nécessite aussi que, quelles que soient les langues des documents, des indexeurs et des utilisateurs, l'accès à tout soit donné pour tous. Tel est en effet notre rôle.
La pratique des catalogues séparés très largement répandue dans les pays arabes, et qui se justifiait tant que les problèmes de multi-alphabétisme étaient insolubles, doit donc être revue en fonction des avancées technologiques pour que tout utilisateur puisse avoir accès dans sa propre langue à tous les documents pertinents.

L'expérience de l'Institut du monde arabe (N. Dechache, "Indexation et thesaurus bilingues à l'IMA") est à cet égard particulièrement intéressante. Même si elle est limitée à un fonds et à un public particuliers, elle prouve toute la pertinence de l'approche multilingue globale, développée sur les bases d'un thesaurus propre, en français (langue source).
Cette expérience n'est pas unique et l'on peut encore citer, bien que la communication n'ait pu être présentée (M. Allouh, "Evolution de la pratique de l'indexation à la Fondation du roi Abdul-Aziz"), l'accès multilingue effectif offert à Casablanca, là aussi sur les bases d'un fonds spécifique et d'un thesaurus propre, en français à l'origine (thesaurus Ibn Rushd).

Des parallèles existent aussi au Liban, mais avec l'anglais comme langue source, sur la base d'une traduction des LCSH. Le cas de l'Institut d'études palestiniennes (M. Nsouli, "L'indexation en arabe : l'expérience de l'IEP") est le plus comparable puisque, destiné là encore à un fonds spécifique, il donne accès à tous les documents, quelle qu'en soit la langue.
Pour sa part, l'Université américaine de Beyrouth (A. Taleb, "L'indexation en arabe: l'expérience de la bibliothèque de l'AUB") apporte une solution bilingue un peu différente puisqu'elle ne fournit l'accès en arabe à tous les documents que s'il existe au moins un document en arabe sur le sujet. Elle poursuit donc, dans une certaine mesure, la pratique des catalogues séparés mais, grâce au long travail effectué et à un fonds encyclopédique considérable, dispose déjà de plus de 20 000 vedettes bilingues anglais-arabe.

 

2.2 Tous ces cas montrent donc clairement que, pour assurer l'accès en arabe à l'ensemble des documents, un référentiel arabe comparable doit correspondre au référentiel utilisé en français (et/ou en anglais). Mais ce référentiel comparable en arabe reste difficile à établir, comme l'ont souligné plusieurs intervenants, en raison notamment des problèmes propres que pose la langue arabe elle-même.
Les nombreux problèmes soulevés par l'établissement d'équivalences à partir d'une langue source (problèmes de traduction et de translittération, problèmes linguistiques, etc.) ont ainsi été très bien décrits par F. Berrada-Laadan ("[Institut du monde arabe] La version arabe du thesaurus"). Ils restent sans doute une difficulté dont il faut tenir compte même si des moyens permettent heureusement de minimiser certains d'entre eux, tels le codage des caractères (M. Ben Henda) ou la voyellisation (M. Hassoun).

D'autres réclament des solutions "politiques" nuancées pour choisir les termes, et introduire des variantes voire des "doublons" (pluriglossie analysée par F. Berrada-Laadan).
Plus grave encore est enfin le problème parfaitement mis en lumière par K. Habchi ("Les outils d'indexation en arabe spécialisés en IST") des lacunes importantes de l'arabe en terminologie scientifique et technique que ne peuvent combler ni les créations spontanées ni les traductions des chercheurs faute d'une production scientifique suffisante en arabe. Pour ce problème bien réel, seule une initiative cette fois proprement politique (structure, commission de terminologie) pourrait apporter une solution satisfaisante.

3. Aller vers un référentiel arabe commun

3.1 Malgré ces difficultés, il n'en reste pas moins qu'un outil en arabe, comparable par exemple à RAMEAU, est aujourd'hui indispensable pour bien utiliser les réseaux et fournir un véritable accès multilingue. Face à l'éparpillement des listes de vedettes-matière en arabe, un très large consensus s'est donc fait jour pour appeler à l'adoption d'un référentiel commun.
Celui-ci devra s'appuyer sur l'enseignement pour s'implanter durablement, comme l'a souligné N. Zhiri ("L'enseignement de l'indexation à l'Ecole des sciences de l'information de Rabat"), mais il devra surtout passer par une large coopération entre les professionnels des pays intéressés pour pouvoir s'imposer et se développer selon la meilleure méthode.

La première voie envisageable, suivie par exemple pour élaborer le thesaurus bilingue de l'Institut du monde arabe, est la traduction à partir d'une langue source autre que l'arabe.
Et cette méthode peut bien sûr être utilisée sur des bases beaucoup plus larges comme le montre le cas du CERIST d'Alger (N. Derrough). Ayant constaté que RAMEAU, qui exprime des concepts, peut aussi bien s'appliquer à des documents en arabe qu'à des documents dans d'autres langues, le CERIST fournit en effet de nombreux exemples de vedettes en français qui ont été traduites pour compléter le référentiel arabe utilisé qui s'avérait insuffisant.
Intéressante quant au fond, cette expérience a toutefois ses limites car ces traductions locales risquent vite de se trouver en contradiction avec d'autres faites ailleurs sur les mêmes bases, problème traditionnel auquel se heurte tout travail local sur RAMEAU comme sur les LCSH. C'est pourquoi la Bibliothèque nationale de Tunisie (S. Mahmoud) prône une solution plus complète et radicale : l'abandon de toute autre liste en arabe au profit d'une arabisation (traduction/adaptation) de RAMEAU qui devrait être impérativement réalisée en coopération internationale.

L'intérêt de cette démarche est évident puisque, partant d'un référentiel encyclopédique à la couverture reconnue, elle présente un avantage économique tout en évitant de possibles conflits entre listes arabes existantes. Aussi certains "anglophones" l'ont-ils déjà suivie.
A cet égard, même s'il ne s'agit que d'une initiative locale, on doit souligner l'intérêt du travail réalisé à l'AUB (A. Taleb) qui a déjà permis une importante "arabisation" à partir des LCSH. Pour raisonner toujours en termes strictement économiques, on peut imaginer qu'en utilisant comme pivot les vedettes-matière de la Bibliothèque du Congrès, les équivalents arabes (AUB) et français (RAMEAU) pourraient être facilement connectés, donnant accès à de vastes réservoirs bibliographiques et permettant de réelles perspectives d'évolution.

 

3.2 Cette méthode efficace n'est pourtant pas sans effets négatifs puisqu'elle contraint le référentiel arabe à une autre langue. C'est là l'inconvénient de tous les thesaurus multilingues traditionnels où une langue unique, source ou pivot, est en fait "plus égale" que les autres, qu'elle appauvrit en imposant une vision culturelle unique.
Il semble donc intellectuellement préférable d'opter pour un référentiel propre, apte à refléter la culture et les réalités du monde arabe. Mais ce référentiel arabe commun ne pourrait guère être la somme des langages d'indexation existants : ils sont si divers, dispersés, contradictoires parfois, que les relier tous par mapping serait fort coûteux et difficile.

Il paraît dès lors raisonnable de choisir un des outils existants ou, du moins, de fédérer les listes autour d'un outil leader. Telle est la proposition de S. Khalifah ("Pour l'élaboration d'une liste de vedettes-matière arabe unifiée et normalisée") qui envisage ce regroupement autour de la "macroliste" développée en Egypte. L'expérience acquise comme les conditions de maintenance (3e édition prévue en 2002) et de développement de la liste (guide, garantie documentaire) en font une solution séduisante, mais l'aire de diffusion et donc les possibilités d'adhésion d'une part, les conditions techniques d'accessibilité d'autre part, ne vont pas sans poser question.
Une autre solution se proposant aussi en fédérateur est le thesaurus de la Fondation Shoman en Jordanie (E. Abu-Eid, "Un thesaurus arabe en version électronique"). Son accessibilité dans une version aux possibilités techniques probantes, sa taille et ses capacités de mise à jour sont autant d'atouts. Mais les conditions de son élaboration sont moins convaincantes et son trilinguisme, voulu comme un "plus", serait un inconvénient. Ni reconnus ni utilisés par les communautés linguistiques concernées, les équivalents anglais et français donneraient en effet accès aux seuls documents indexés avec ce thésaurus et non aux gisements extérieurs.

Quelle que soit la méthode choisie (traduction, choix, fédération) pour développer un outil unifié en arabe, il est en effet essentiel d'éviter l'isolement en le reliant aux référentiels communs français et anglais pour offrir un véritable accès multilingue et retirer tout le profit intellectuel et économique que permet aujourd'hui l'environnement des réseaux.
Ce but est la base même du projet européen MACS, Multilingual access to subjects, reliant les langages allemand (SWD) anglais (LCSH) français (RAMEAU) pour permettre la recherche par sujet à partir d¹une seule langue dans les catalogues de langues différentes (M. Naudi, "Présentation du projet MACS"). Fondé sur l'égalité des langues et des langages d'indexation, il propose une méthode et des principes faciles à développer ou à transposer, et engage, par son esprit novateur de respect des cultures en présence, les travaux du Groupe IFLA de révision des thesaurus multilingues sur la voie inédite des "non-identical thesauri".

4. Référentiel arabe : coopération et perspectives de travail

L'absence de concertation entre professionnels et institutions arabes a abouti à une multitude de listes de vedettes matières en arabe : toutes les expériences sont intéressantes mais constituées isolément, les solutions avancées sont parfois contradictoires.

Parallèlement à la multiplicité des langages documentaires arabes, de nombreux lexiques relatifs aux sciences et techniques souvent élaborés par les académies arabes témoignent des lacunes à combler dans ce domaine et de la dispersion des efforts.

La coopération envisagée doit donc se faire à plusieurs niveaux :

  • entre professionnels praticiens de l'indexation (bibliothécaires et documentalistes) ;
  • entre professionnels de l'information et chercheurs (linguistes, académies de langues).

Perspectives de travail :

  • études de terrain pour appréhender le contexte (historique, géographique, culturel) de chaque liste ;
  • étude comparée des listes existantes : analyse critique intégrant les critères d'exhaustivité, d'actualisation, etc... ;
  • étude sémantique de certains thesaurus pour dégager les traits spécifiques des terminologies employées ;
  • étude des processus d'indexation des vedettes matières, traduction des termes scientifiques et techniques ;
  • évaluation par les professionnels et les usagers ;
  • expériences d'indexation en réseau, en arabe et avec des listes multilingues.

L'AFLI se propose de coordonner ces travaux qui permettraient une démarche d'harmonisation pour les listes vedettes-matière en arabe, avec un partenariat AFLI/ALECSO. L'établissement d'un guide pour l'indexation à l'usage des professionnels arabes et francophones pourrait être l'aboutissement de la démarche.

Suggestions et recommandations des participants

Un objectif général :
Un réseau documentaire réunissant autour de la Méditerranée les pays européens et les pays arabes partageant les mêmes valeurs professionnelles et culturelles.

1. Des recommandations et des vœux

Parvenir à une identification des langages documentaires arabes avec plusieurs options :

  • en choisir un après l'évaluation de l'existant ;
  • en créer un si aucune des listes existantes ne donne satisfaction ;
  • garder les listes existantes en créant les équivalences nécessaires.

Etablir une liste d'autorités unifiée pour les noms arabes (noms propres, noms géographiques) après un vaste échange d'informations entre professionnels à ce sujet .

 

Adopter un thesaurus multilingue déjà existant en l'élargissant au besoin.

 

Adopter dès le départ une méthodologie permettant de travailler en parallèle sur les deux langues (ne pas isoler le travail sur les listes des vedettes matières en arabe).

 

Organiser le travail discipline par discipline.

 

Approfondir la connaissance du projet européen MACS.

 

Travailler sur les correspondances en anglais et en français dans les corpus déjà existants d'une liste sélectionnée de vedettes matière en arabe.

2. Des modalités pratiques

Se donner les moyens de rester en contact et de travailler ensemble :

  • un fichier d'adresses électroniques établi par l'Association libanaise des bibliothèques ;
  • un forum de discussion à créer.

Travailler en réseau : un réseau informel fondé sur le volontariat pour entraîner une dynamique des institutions.

Organiser une prochaine rencontre. La ville d'Aman (Jordanie) est proposée.

mercredi 14 octobre 2009

Écouter la page

Partagez