Bibliothèque nationale de France

Formulaire de recherche

  Pour les professionnels

Principaux standards du Web Sémantique : les URI et RDF

Les URI

Sur le Web, on utilise le mécanisme des URI (Uniform ressource Identifier) pour identifier les ressources.
Pour être valides, les URI doivent :

  • respecter la syntaxe définie dans la RFC 3986 ;
  • être enregistrées, et donc commencer par un préfixe enregistré auprès de l'IANA, suivi d'une syntaxe autorisé pour ce préfixe (exemples de préfixes enregistrés : http, ftp, urn, info...).

Les URL sont des URI dont le préfixe est 'http' et dont la particularité est d'identifier une ressource principalement par le mécanisme qui permet d'y accéder (par exemple, son emplacement sur un serveur, l'adresse d'un résolveur de liens jointe à des paramètres d'accès, etc.). On parle alors également d’« URI déréférençable ».

Lorsque des mesures ont été prises pour la bonne gestion des URL, en particulier leur pérennité même si le moyen d'accès ou la localisation de la ressource sont modifiés, on parle d' « URL gérées » ou encore d'« URI http ».

La note du W3C « Adresses URI sympa pour le Web sémantique » précise les modalités de mise en œuvre des URI déréférençables pour le Web sémantique. Elle définit les mécanismes de négociation de contenu qui permettent, à partir d'une même URI http, de renvoyer soit une page HTML, soit des informations en RDF, suivant les préférences du client.

RDF, modèles et syntaxes

RDF (Ressource Description Framework) est un modèle de description des données dans lequel toute ressource est identifiée par une URI, et où l'on peut faire des assertions ou déclarations sur ces ressources sous la forme d'un triplet sujet/prédicat/objet.
Dans ce triplet, le sujet et le prédicat sont toujours exprimés par des URI. L'objet peut être exprimé sous la forme d'une URI ou d'une chaîne de caractère (littéral).
Un ensemble de triplets RDF qui décrivent une ressource ou un ensemble de ressources composent un graphe.

Les données en RDF peuvent être sérialisées en utilisant différentes syntaxes :

  • la syntaxe RDF/XML, qui correspond à l'expression en XML de données en RDF (cette syntaxe est la plus fréquente pour les échanges de données et les conversions) ;
  • les syntaxes spécifiques de type N3, N-Triple et Turtle ;
  • la syntaxe RDFa qui permet d'encapsuler des données en RDF dans une page HTML.

La particularité du modèle de triplet est que chaque assertion est indépendante. Il n'existe donc pas de notion de « validation » d'un graphe, même si c'est la syntaxe RDF/XML qui est utilisée.

mercredi 1 août 2012