Vendredi 20 octobre 2017
NASDAQ : 6629.0532 23.9863   nasdaq0.36 %
RECHERCHE
OK
 
NEWSLETTER
newsletter
Abonnez-vous gratuitement
à notre newsletter
hebdomadaire - Cliquez ICI
Indexel
  • DOSSIERS
  • PRATIQUE
pub Publicité
 

APPLICATIONS

"Common Tags" : le web sémantique sur les rails

Imprimer Envoyer à un ami Contacter la rédaction
Par Alain Bastide le 10/09/2009 - indexel.net
 
Common-tags

Après les microformats, le web sémantique vient d'être enrichi par les "common tags", une technologie qui clarifie l'ambiguïté des mots clés du web 2.0. À la clé : des recherches plus efficaces. Décryptage.

 

Les internautes friands des services du web 2.0 - réseaux sociaux, blogs, partage de photos et de sites favoris, etc. - ont pris l'habitude de "taguer" les différents contenus qu'ils partagent sur la toile à l'aide de mots clés (ou tags). Dans le même esprit, les créateurs de contenus web estampillent leur production à l'aide de ces étiquettes. Sur un blog, cet article serait par exemple accompagné des tags "Common Tag" et "web sémantique".

Grâce aux tags, les internautes disposent d'un moyen plus fiable pour rechercher des informations sur un sujet précis à l'aide de moteurs prenant en compte ces étiquettes tels que Google Blog Search ou Technorati. Les résultats de recherche sont plus pertinents car c'est l'auteur de l'article, de la photo, ou du favori partagé qui choisit les mots clés (tags) les mieux adaptés pour décrire le contenu.

Lever l'ambigüité sémantique

stephane bordagePourtant tout le monde n'utilise pas les mêmes tags pour décrire un même contenu. Par exemple, pour décrire une photo de New York, certains utiliseront le tag "New York", d'autres l'acronyme "NY", d'autres encore un mot clé plus métaphorique comme "Big Apple". Tous ces tags décrivent pourtant un même concept : la ville de New York. "Alors que l'esprit humain sait associer ces différents tags au même concept, un logiciel en est incapable", explique Stéphane Bordage (photo), directeur associé de la société Breek, spécialiste du web 2.0. D'autre part, certains tags peuvent être ambigus. Le tag "Orange" décrit-il un fruit ? Une couleur ? L'Orange County aux États-Unis ? Ou bien le fournisseur télécoms français ?

Pour clarifier ces ambiguïtés, des spécialistes du web 2.0 - AdaptiveBlue, Faviki, Freebase, Yahoo!, Zemanta, et Zigtag notamment - ont lancé en juin dernier l'initiative "Common Tag". Cette technologie permet de lier un tag à une référence unique et explicite d'un concept. Cette référence est stockée dans un répertoire mondial unique sous la forme d'une URI (une adresse web unique et permanente) et d'une description RDFa associée.

Pertinence des recherches et enrichissement des contenus

L'intérêt des common tags est double. D'une part, il permet d'obtenir des résultats de recherche encore plus pertinents en proposant à l'internaute de choisir un concept précis parmi plusieurs possibilités pour un même tag. D'autre part, les éditeurs de contenus web peuvent enrichir automatiquement leur site, sans risque d'ambiguïté. Un blog pourra par exemple ajouter automatiquement au billet initial et sans aucune intervention de l'auteur : des actualités, des commentaires, des livres, un définition Wikipédia mais aussi des photos ou des vidéos. Avec la certitude que si l'article porte sur "Orange" (le fruit), le contenu rapporté automatiquement portera bien sur le même concept. Mieux, le tag lui même pourra automatiquement être traduit dans la langue maternelle de l'internaute en fonction des réglages de son navigateur. Et le contenu rapporté pourra également être filtré en fonction de l'internaute (langue, centres d'intérêt, etc.).

Common Tag est un format important car il tente de standardiser des démarches similaires, mais propriétaires, telles que Open Calais de Reuters. Les common tags enrichissent également les autres technologies émergeantes du web sémantique telles que les microformats (notre article), dont l'objectif n'est pas de décrire formellement le contenu d'une page, mais plutôt de proposer une version structurée et non ambigüe des données qu'elle contient (adresse, personne, livre, etc.). "Cela revient à passer de l'analogique au numérique ! Grâce aux microformats et aux common tags, le web se transforme en une gigantesque base de données. Ce qui remettra inévitablement en cause le rôle prédominant des moteurs de recherche tels que Google" , estime Stéphane Bordage.

Des millions de dictionnaires

sami jaber"Il existe déjà de nombreuses tentatives de standardisation de ces technologies telles que RDF ou OWL", rappelle Sami Jaber (photo), fondateur de DNG Consulting, un cabinet de conseil spécialisé dans les architectures web 2.0. Autre inconvénient, "Common Tag nécessite une infrastructure centralisée, et donc coûteuse, telle qu'on la retrouve avec les DNS racines. Qui gèrera et financera les annuaires sémantiques et les millions de dictionnaires ?", s'interroge le spécialiste.

Particulièrement intéressante pour les développeurs car facile à mettre en œuvre - contrairement aux standards actuels du W3C -, cette initiative devra recueillir plus de supporteurs et s'inscrire dans un groupe de standardisation (tel que le W3C) pour emporter l'adhésion générale. Ce qui n'est pas impossible. HTML 5.0 a en effet été mis au point pas un groupe d'acteurs indépendants avant de rejoindre le W3C. Et l'instance de normalisation travaille sur un standard proche, dans l'esprit, des Common Tag : Powder.

LIRE AUSSI
 
Partager :
LIRE AUSSI
 
pub Publicité

CloudStack by IkoulaCloudStack by Ikoula

Cloud Computing : Atouts et freins, acteurs du marché, conseils et témoignages