Vendredi 25 mai 2012
NASDAQ : 2839.38 10.74   nasdaq0.38 %
RECHERCHE
OK
 
NEWSLETTER
newsletter
Abonnez-vous gratuitement
à notre newsletter
hebdomadaire - Cliquez ICI
Indexel
  • DOSSIERS
  • PRATIQUE
pub Publicité
 

INFRASTRUCTURE, SUR LE TERRAIN

Ouest France Multimédia automatise la gestion de son site grâce au XML

Imprimer Envoyer à un ami Contacter la rédaction
Par Marie Varandat le 18/12/2002 - indexel.net
 
Cvd_ouestfrance

Ouest France a préféré la base relationnelle Oracle aux bases natives XML pour gérer le contenu de son site. Il faut dire que lorsqu´elle a fait son choix, les bases XML n´existaient pas encore. Mais elle referait le même choix aujourd´hui car c´est grâce à la combinaison des outils SQL et XML qu´elle a réussi à automatiser des processus complexes pour offrir à ses visiteurs des services différentiateurs.

 

Il y a deux ans, Ouest France Multimédia, division du grand quotidien en charge de la publication sur le Web, faisait un pari sur le long terme en adoptant le XML pour stocker ses articles. "Aujourd´hui, c´est dans l´ère du temps", note Michel Le Nouy (photo ci-dessous), responsable technique d´Ouest France Multimédia "mais à l´époque on en était encore aux balbutiements du XML. A tel point que, faute de solution sur le marché, nous avons dû développer nos propres outils de transformation et de manipulation des informations". Deux ans plus tard, la société a gagné son pari : en s´appuyant sur la base Oracle pour stocker son contenu XML, elle s´est offert la souplesse dont elle avait besoin pour développer un modèle économique innovant et rentable sur le Web.

Automatiser l'exploitation des documents en fonction des profils des clients

Pour Ouest France Multimédia, l´enjeu dépassait en effet l´archivage et la restitution d´articles comme l´explique Michel Le Nouy : "nous voulions offrir différentes vues à partir d´un même document, pouvoir adapter automatiquement le contenu à différents périphériques dont notamment le téléphone et offrir des services de recherche avancée". Concrètement, Ouest France propose des informations gratuitement sur son site mais également des services payants tels qu´une revue de presse personnalisée, de la veille sur les appels d´offres et annonces légales, l´accès aux archives, etc. Gérer autant d´abonnements personnalisés ou de services à la carte manuellement relève de l´impossible. Sans compter que le site s´enrichit tous les jours de nouveaux articles qu´il faut indexer, archiver, etc. Avec le XML et quelques mécanismes qui automatisent les processus, une personne suffit pour ajouter près de 5000 articles ou documents par jour à la base du site et gérer tous les abonnements et services payants ou gratuits ! "Il nous a quand même fallu une année de développement pour mettre au point notre plate-forme", reconnaît Michel Le Nouy. "C´est long mais ça valait le coup car aujourd´hui tout est automatisé, la personne dédiée n´étant là que pour superviser et optimiser l´application".

Comment ça marche ?

L´automatisation repose en fait sur des mécanismes de transformation des informations et d´annotation en XML de tous les articles publiés par Ouest France Multimédia, y compris ceux du journal papier. Stockés dans une base Sybase, ces derniers sont extraits, "nettoyés", annotés puis stockés dans la base Oracle du site. L´annotation consiste à ajouter des balises pour qualifier la nature de l´information : balise pour indiquer qu´il s´agit d´un titre, ou encore <ÉCONOMIE> pour indiquer que l´information appartient à la rubrique du même nom. Ouest France multimédia a ainsi défini un ensemble de règles pour annoter ses articles, l´opération s´effectuant automatiquement et de manière transparente pour ses rédacteurs afin de ne pas perturber leurs habitudes ou charge de travail.Capitales, ces annotations permettent ensuite d´effectuer des requêtes pour retrouver tous les articles traitant d´un thème, extraire les paragraphes de plusieurs articles où figure le nom du président américain ou encore alerter un client quand une annonce légale est publiée dans son domaine d´activité... La globalité de l´opération - extraction, annotation et stockage dans la base - prend environ 15 minutes et ne nécessite aucune intervention humaine. Faute d´outils adaptés sur le marché à l´époque, Ouest France Multimédia a développé ses propres solutions d´extraction et de transformation des informations en pages HTML en s´appuyant sur les fonctions XML de la base de donnée Oracle. "A l´époque, les bases XML natives n´existaient pas, explique Michel Le Nouy pour justifier son choix. Ceci étant, aujourd´hui encore, je referais le même choix".

La richesse du XML combinée à la puissance du SQL

Pour des raisons de performances, la société stocke les articles sous deux formes : en bloc dans le champ d´une base, et "éclatés" dans des tables et colonnes (lire également notre article "Stockage de contenus XML : base ´´native´´ ou relationnelle ?") . Le premier mode permet de ressortir uniquement un document dans sa globalité. Le second, à l´inverse, extrait une information spécifique sans avoir à parcourir ou ressortir la globalité du document au préalable, opération coûteuse en performances et ressources machine. "Un disque dur coûte beaucoup moins cher qu´une licence Oracle ! Je préfère donc investir dans le double stockage et optimiser les requêtes afin d´économiser les ressources machines et ainsi limiter le nombre de licences à acheter", explique Michel Le Nouy. "C´est vrai qu´avec une base native XML, je n´aurais pas besoin de ce double stockage pour parvenir au même résultat, mais je ne pourrais pas non plus faire autre chose que du XML. Or, avec une base relationnelle dotée de fonctions XML je peux faire des requêtes en SQL et calculer bien plus rapidement le nombre d´articles écrits par tel ou tel auteur, tout en renvoyant l´extrait des 10 premiers par ordre d´importance. En XML pur c´est un peu plus compliqué".

 
Partager :
 
pub Publicité

Cloud Computing : Atouts et freins, acteurs du marché, conseils et témoignages