Vendredi 25 mai 2012
NASDAQ : 2839.38 10.74   nasdaq0.38 %
RECHERCHE
OK
 
NEWSLETTER
newsletter
Abonnez-vous gratuitement
à notre newsletter
hebdomadaire - Cliquez ICI
Indexel
  • DOSSIERS
  • PRATIQUE
pub Publicité
 

INFRASTRUCTURE, SUR LE TERRAIN

Europages simplifie la gestion de ses annuaires avec le stockage XML

Imprimer Envoyer à un ami Contacter la rédaction
Par Marie Varandat le 21/10/2002 - indexel.net
 
CVD_Thierry_COHENSOLAL

L´annuaire européen des affaires vient d´adopter le XML pour gérer les documents en plusieurs langues à partir desquels la société extrait les informations utiles à la publication de ses annuaires aux formats papier, CD-ROM et Web. Plus évolutif et simple à gérer, ce dispositif a considérablement accéléré les développements et le traitement de l´information. Le témoignage de Thierry Cohen Solal, responsable du système d´information.

 

Confronté à la gestion d´un annuaire en seize langues sur trois supports différents (papier, Internet et CD-ROM), Europages.fr référence plus de 500 000 entreprises dans plus de trente pays européens. Les informations sont extraites de documents variés dont notamment des publicités, nomenclatures, pages du Web, flux enregistrés sur son site, etc. En 2001, la société abandonne le métalangage SGML (ancêtre du XML) au profit du XML. "Avec le SGML nous ne pouvions pas maîtriser autant de langues. En outre, les outils de manipulation du SGML sont rares et limités. Avec le XML, nous avons gagné en souplesse et en évolutivité", explique Thierry Cohen Solal, responsable du système d´information de la société Euredit, l´éditeur d´Europages.

Euredit manipule en effet des informations structurées de type nom, adresse, raison sociale, etc. mais qu´il faut extraire de documents. Si la base de données relationnelle se prête bien à la manipulation de ce type d´informations, elle suppose, en revanche, un travail colossal en amont pour extraire les données des documents. "Pourquoi aller "casser" l´information d´un document en tables quand il suffit de l´envoyer dans une base XML pour bénéficier des mêmes avantages en termes de requêtes, d´indexation ou encore de gestion des données ?", souligne Thierry Cohen Solal.

Manipuler les informations de documents comme les données d'une base

"C´est tellement simple de conserver le document tel quel qu´on se demande bien pourquoi il faudrait développer des "moulinettes" pour extraire les informations afin d´aller les ranger dans une case pour ensuite les ressortir et les assembler de nouveau sous forme de document. Sans compter qu´un système de base de données relationnelle nécessite beaucoup plus de développements et surtout une réflexion importante avant d´arriver à trouver le modèle de données qui convient aux différentes exploitations que l´on peut en avoir", ajoute Thierry Cohen Solal.Euredit a donc opté pour le stockage en XML. S´appuyant sur la base de donnée de Software AG, Tamino, son infrastructure de stockage et de manipulation des informations a été conçue en mois de trois mois. Tous les documents et autres flux de données enregistrés sur le Web sont automatiquement convertis en XML selon un schéma défini par la société. Elle peut ainsi, sur simple requête avec le langage associé au XML, XQuery, extraire les informations et les transformer pour les adapter au support de publication qu´il s´agisse du CD-ROM, du site Web ou de l´annuaire au format papier.

La simplicité du XML limite les besoins en compétences et développements

"Le succès du XML a favorisé la normalisation et le développement d´outils qui facilitent considérablement la manipulation de données", souligne Thierry Cohen Solal. "A partir d´une seule source d´information, je peux automatiser l´émission et la présentation d´une multitude de documents différents en appliquant le principe des feuilles de style et le langage de transformation des données XSLT. En d´autres termes, il me suffit d´appliquer une feuille de style pour extraire les informations de ma source de données et automatiquement adapter le contenu ainsi que la présentation aux contraintes de publication des trois supports de notre annuaire : papier, CD-Rom et Web. L´équivalent avec une base de données relationnelle nécessiterait un travail colossal et n´offrirait jamais la même souplesse".Avant d´adopter Tamino, Euredit a toutefois évalué la base de données relationnelle d´Oracle et abandonné la solution pour des raisons de performances, de compétences et d´évolutivité. Oracle 8i sait en effet gérer le XML, mais comme une base relationnelle. Même si elle offre les mêmes fonctionnalités de requêtage et de transformation que Tamino, Oracle 8i éclate le document en tables et colonnes. Résultat, la reconstitution de l´information est coûteuse en performances. Une base de données relationnelle suppose en outre la maîtrise d´un modèle de données complexe et du langage SQL normalisé mais néanmoins spécifique à chaque éditeur de base.

"Les bases XML nécessitent moins de compétences : il suffit de maîtriser le langage XML sans avoir à se soucier de la manière dont est constituée la base", précise Thierry Cohen Solal. "En outre, avec le modèle relationnel, toute évolution de notre annuaire impliquerait une refonte générale de la base pour adapter la structure de tables aux nouvelles données. Avec un modèle XML, il suffit de modifier le schéma du document pour que les évolutions soient automatiquement prises en compte. En d´autres termes, et s´il ne fallait retenir qu´une chose de notre expérience, c´est la simplicité du stockage XML et sa capacité à évoluer avec de nouveaux besoins qui font toute la puissance du modèle".

 
Partager :
 
pub Publicité

Cloud Computing : Atouts et freins, acteurs du marché, conseils et témoignages