Lundi 18 décembre 2017
NASDAQ : 0.0 0   nasdaq0 %
RECHERCHE
OK
 
NEWSLETTER
newsletter
Abonnez-vous gratuitement
à notre newsletter
hebdomadaire - Cliquez ICI
Indexel
  • DOSSIERS
  • PRATIQUE
pub Publicité
 

INFRASTRUCTURE

Big Data : 7 points clés pour comprendre un phénomène vertigineux

Imprimer Envoyer à un ami Contacter la rédaction
Par Thierry Lévy-Abégnoli le 21/12/2011 - indexel.net
 
Bigdata

Le concept du Big Data vise à analyser en temps réel des données disparates se comptant en péta-octets. Les coûts de ces applications baissent grâce à de nouveaux algorithmes exécutés dans le nuage.

 

1. Volume, vélocité, variété des données

Le Big Data recouvre des applications cherchant à analyser des données pour en tirer du sens. Elles répondent à la règle dite des 3V : volume, vélocité, variété. Les volumes passent en effet du téra-octet au péta-octet, à cause de leurs types (vidéos, photos, sons...) et de leur génération en masse par des populations entières (réseaux sociaux, mobiles). "De plus, elles sont aussi produites par des machines telles que des GPS, bornes RFID, caméras ou capteurs de température", ajoute Romain Chaumais, cofondateur d'Ysance. Par exemple, alors que des agents EDF relevaient les consommations une fois par an, les nouveaux "compteurs intelligents" comme le Linky transmettent quatre mesures par heure.

Deuxième V, la vélocité spécifie une notion de temps réel. Les données arrivent en flux et les applications – on parle de big analytics – doivent réagir en 24 heures, une minute, voire moins d'une seconde. Par exemple, il s'agit de détecter une fraude à la carte de crédit, de faire du trading automatique ou de surveiller un site industriel.

Isabelle Carcassonne"Le troisième V évoque la variété des données dont 80 % sont non structurés : fichiers log de sites web, sons, vidéos, contenus de blogs ou de réseaux sociaux", énumère Isabelle Carcassonne (photo), directeur marketing business & analytics optimization chez IBM.

2. Une rupture avec le décisionnel traditionnel

"La Business Intelligence classique part de la stratégie de l'entreprise et allume des voyants correspondant aux objectifs", résume Romain Chaumais. À l'inverse, le Big Analytics dégage une logique dans un océan de données bien trop nombreuses pour qu'un humain puisse les analyser. "Le datamining automatisait déjà cette analyse mais avec des échantillons représentatifs. Le Big Data attaque les données dans leur totalité, ce qui permet d'identifier la moindre anomalie", détaille Romain Chaumais.

3. Six exemples d'applications Big Data

Grâce au Big Data, une marque d'équipements sportifs analyse le sentiment des consommateurs au travers des messages déposés sur 2 600 blogs pour comprendre si leur égérie véhicule bien le bon message. Pour sa part, la ville d'Ottawa analyse des données météo pour placer en temps réel ses équipes urgentistes. Un acteur du e-commerce cherche à comprendre ce qui fait basculer l'internaute dans l'acte d'achat, en fonction des clics ou des formulaires remplis, etc. Voyages-SNCF met à jour plus de 100 millions d'offres toutes les cinq minutes. Un géant de la grande distribution crée des prix spécifiques pour chacun de ses magasins afin d'optimiser ses marges.

Mouloud Dey"Tout cela représente plus de 200 000 références interdépendantes, à multiplier par le nombre de magasins et de contraintes", commente Mouloud Dey (photo), directeur business solutions chez SAS. Enfin, les opérateurs télécoms analysent les données de smartphones (géolocalisation, numéros appelés, sites visités) afin de pouvoir retrouver tout événement en moins de 30 minutes, puis probablement d'optimiser leurs réseaux.

4. Des projets économiquement viables

"Ces applications étaient impossibles à des coûts raisonnables il y a deux ans. Aujourd'hui, même les PME peuvent se les offrir !" affirme Isabelle Carcassonne. Le retour sur investissement peut même être rapide à condition de se concentrer sur une question précise. Ainsi, une PME proposant des jeux sur Facebook (1,5 million de joueurs) voulait comprendre comment un joueur devient addictif. Une analyse a conclu que ce joueur basculait quand au moins dix de ses amis virtuels jouent au même jeu. La stratégie a été adaptée en conséquence. "Le coût de quelques milliers d'euros a permis un ROI de quelques jours", précise Romain Chaumais.

5. Des solutions d'un nouveau type

Romain ChaumaisPour réaliser ces analyses, SGBD-R et algorithmes classiques sont hors course. Il faut de nouvelles technologies dites de Business Analytics & Optimization (BAO). "Ces technologies sont arrivées par des acteurs comme Google ou Yahoo. Ils ont développé des algorithmes massivement parallèles de type Map & Reduce, qui fonctionnent sur des clusters de serveurs", explique Romain Chaumais (photo). Ces algorithmes sont dans l'open source, avec par exemple le logiciel Hadoop. Peu d'entreprises ont toutefois les moyens de les exécuter en interne. Mais même les PME peuvent louer les ressources suffisantes sur un cloud.

6. Des acteurs traditionnels qui se positionnent

En 2011, tous les grands acteurs se sont positionnés. IBM, Oracle et Microsoft proposent des offres basées sur Map Reduce. IBM cible plutôt les grandes entreprises ayant déployé un cloud privé, même si son offre Cognos Consumer Insight peut être proposée en mode SaaS. De son côté, Teradata a racheté le spécialiste Aster Data et propose de déployer un cluster dans une ferme de machines classiques. Microsoft a lancé une offre packagée sur Windows Azure, tandis qu'Oracle fait de même sur le cloud Amazon AWS, tout en proposant un logiciel. Quant à SAS, son offre High Performance Analytics est déclinée sous forme de logiciel et d'un service cloud.

7. Un travail en amont pour collecter et préparer les données

Ces services et ces logiciels travaillent sur des données non structurées qui doivent faire l'objet d'un travail en amont de collecte et de mise en cohérence de l'information. "Mais ce travail est classique et certaines données, comme des fichiers logs de sites Web, peuvent être envoyées sous leur forme brute", affirme Romain Chaumais.

LIRE AUSSI
 
Partager :
LIRE AUSSI
 
pub Publicité

CloudStack by IkoulaCloudStack by Ikoula

Cloud Computing : Atouts et freins, acteurs du marché, conseils et témoignages