Depuis que l'informatique existe, les entreprises cherchent à agréger des informations de différentes natures pour en faciliter la manipulation. Elles espèrent ainsi gagner en réactivité et en productivité mais aussi obtenir une vision plus synthétique de leur activité. L'arrivée du web, des e-mails, des messageries instantanées et des moteurs de recherches a décuplé la part de l'information non structurée dans l'entreprise. Heureusement, il existe aujourd'hui des techniques et des méthodologies qui permettent de réconcilier information non structurée, semi-structurée, et structurée afin de les exploiter en même temps, dans des interfaces utilisateurs communes. Cette sélection de livres vous permettra d'approfondir vos connaissances sur ce sujet. Elle vous aidera également à mettre concrètement en oeuvre des outils tels que les moteurs d'indexation ou des technologies telles que les microformats. Bonne lecture.
L'information non structurée dans l'entreprise - usages et outils
Alain Garnier - Hermès Siences - 250 pages - 55 euros - Octobre 2007.
Co-fondateur d'Arisem (racheté par Thales), Alain Garnier partage avec ses lecteurs le fruit de quinze ans de pratique, conseil et recherche sur la question de l'information non structurée dans l'entreprise. Cet ouvrage de référence répond à des questions telles que : pourquoi mettre en place un moteur de recherche ? Les blogs ou les bases de connaissances correspondent-ils à vos besoins ? Qu'est ce qui se cache derrière les termes de Text-mining, Crawler ou Clustering ? Après avoir répondu à ces problématiques, le livre propose un panorama complet des outils actuels et des usages associés. Nourri des cas les plus récents, il traite de manière pratique, au travers de nombreux exemples issus de l'industrie ou du service, des pistes concrètes pour les dirigeants et les managers pour réussir cette mutation au sein des grandes entreprises comme des PME. La démarche de mise en oeuvre ainsi que les meilleures pratiques sont présentées secteur par secteur, fonction par fonction.
La re-documentarisation du monde
Roger T. Pédauque - Cépaduès - 212 pages - 23 euros - Janvier 2007.
Roger T. Pédauque est le pseudonyme d'un réseau de scientifiques francophones appartenant au groupe pluridisciplinaire "Documents et contenu : création, indexation, navigation" (RTP-DOC) du CNRS. Il s'agit donc d'un ouvrage de fond qui réunit sur 12 chapitres une synthèse des travaux des différentes équipes du CNRS. Il aborde des thèmes tels que la recherche de documents numériques, la numérisation de documents papier, le web sémantique, la définition de corpus textuels et de terminologies, les documents collaboratifs, la publication, etc. A réserver aux spécialistes.
La gestion électronique documentaire
Jean-Yves Prax et Simon Larcher - Dunod - 342 pages - 40 euros - mars 2004, troisième édition.
Si vous souhaitez mettre en oeuvre une gestion électronique de documents (GED), intégrer des fonctions de flux documentaires dans un intranet ou un workflow, ou que vous vous intéressez à la gestion de documents électroniques, ce livre est fait pour vous. Il détaille en effet l'ensemble des étapes liées à la mise en place d'un système de GED. Particulièrement didactique, il présente aussi des retours d'expériences concrets et des études de cas.
Mining the talk: Unlocking the business value in unstructured information
Scott Spangler et Jeffrey Kreulen - IBM Press - 240 pages - 33 euros - Août 2007 (anglais).
Ecrit par deux chercheurs du centre de recherche et développement d'IBM à Almaden (Silicon Valley), cet ouvrage décortique les raisons qui ont fait de l'information non structurée et de la communication informelle les deux principaux vecteur des échanges dans l'entreprise. Les auteurs se concentrent ensuite sur la mise en oeuvre concrète de techniques pour organiser, structurer et fluidifier les échanges basé sur des informations non structurées. Ils expliquent aussi comment associer des données (informations structurées) avec des informations non structurées. Une excellente mise en perspective avant d'aborder les aspects plus opérationnels du projet.
Microformats: empowering your markup for Web 2.0
John Allsopp - friends of ED - 368 pages - 20 euros - Mars 2007 (anglais).
Les microformats proposent un pont entre le contenu non structuré (pages HTML) et les bases de données. Quelques "tags" transforment en effet une simple page HTML en un objet structuré, fortement typé. L'auteur démontre au travers d'exemples concrets le potentiel de cette approche : trouver plus facilement une information plus fiable, partager des données entre plusieurs applications, etc. Un excellent ouvrage qui permet de comprendre pourquoi Google, Yahoo !, Mozilla et Microsoft considèrent les microformats - on parle aussi de web sémantique - comme l'une des plus prometteuses technologies du web 2.0.
Lire aussi :
Microformats : plus de sens aux pages web
Détecter automatiquement les appels d'offre