Actualités : analyse de données, Business Intelligence, Data Science, Big Data


Des chiffres, des lettres et du décisionnel


Rédigé par Michael ALBO, Directeur financier le 18 Février 2008

Dans un marché de la BI arrivé à maturité, les éditeurs décisionnels recherchent des relais de croissance, d'innovation et de rentabilité. Jusqu'ici délaissées, les données non structurées pourraient devenir le nouvel eldorado des éditeurs pour les années à venir. Un immense marché, au croisement de la BI, du KM et de l’ECM, est en train de naître.



Des chiffres, des lettres et du décisionnel
L'éditeur Business Objects (nouvellement SAP) a annoncé la semaine dernière la sortie de sa nouvelle plateforme BusinessObjects XI 3.0. Signe des temps, cette nouvelle plateforme fait une large place à la prise en charge des données non structurées (courriers électroniques, fichiers bureautiques, contenus web, flux RSS, …). Son nouveau produit PoleStar, reprend l'ergonomie des moteurs de recherche en proposant une interrogation à partir de mots-clés. En fonction des éléments identifiés, le produit interroge les sources disponibles, génère le graphique le plus pertinent et permet l’exploration des données. Ce nouveau type d'interface devrait ravir tout autant l'utilisateur, libéré de la compréhension de l’organisation des données, que le service informatique, libéré de la conception des états. Bénéficiant du rachat en 2007 de l'éditeur Inxight, Business Objects a aussi développé son offre avec beaucoup de succès dans le domaine de l'interrogation des données non structurées et l'analyse des données textuelles.

Ce mouvement technologique vers les données non structurées n'est pas isolé et de nombreux éditeurs tentent de combiner la simplicité des moteurs de recherche avec les fonctionnalités de leurs outils décisionnels. En 2006 et 2007, Cognos, Hyperion, SAS et Information Builders, avaient déjà tissé des partenariats avec Google pour élargir leurs offres en ce sens.

Pour parvenir au même but, Microsoft a fait évoluer sa plateforme SQL Server et a accru les fonctionnalités décisionnelles de son produit SharePoint. L’une des principales nouveautés de SQL Server 2008 sera de lier les données non structurées identifiées au sein du système d’information à des éléments stockés dans les bases de données. En proposant des fonctions de recherche et d’analyse croisées de ces deux types de données, Microsoft consacre lui aussi le rapprochement des bases de données et des moteurs de recherche d’entreprise.

En 2008, tous les grands éditeurs BI travaillent à l'incorporation des données non structurées dans les flux alimentant les systèmes décisionnels et les tableaux de bord des utilisateurs.

Au fur et à mesure de l'augmentation de la pertinence et de la qualité des résultats produits par ces nouveaux outils, le poids des données non structurées va progressivement augmenter dans le processus de décision pour se rapprocher de son poids réel dans le système d'information (on parle souvent de 80% d'informations non structurées pour 20% d'informations structurées). Avec un peu de recul, on se demandera certainement pourquoi nous avons jusqu'à présent dépenser autant d'effort pour n'exploiter que 20% de l'information disponible.

La parabole du réverbère

L'histoire du décisionnel ressemble par plusieurs aspects à l’histoire de l’ivrogne qui cherche ses clés sous un réverbère, non pas parce qu’il a la conviction de les avoir perdues à cet endroit, mais parce que c'est le seul endroit où il y a de la lumière. La focalisation initiale des éditeurs décisionnels sur des données structurées plus faciles à agréger relève du même état d'esprit.

Le décisionnel a pris la forme que nous lui connaissons au début des années 90 avec l'essor des bases de données relationnelles et des progiciels métiers. A cette époque, les ordinateurs savaient réaliser des calculs sur des données numériques mais avaient plus de difficultés à comprendre ou à synthétiser des données textuelles. L'information nécessaire à la prise de décision existait souvent au sein du système d'information sous la forme de rapports, de compte-rendus de réunion, de courriers, ... mais était difficilement mobilisable faute d'outils adaptées. Cette information utile à la décision, comme la clé de notre histoire, restait dans l'obscurité.
Bien qu'elles constituent une source importante d’informations pour les entreprises, les informations non structurées sont longtemps restées inexploitées dans les projets décisionnels faute d’outils capables de gérer leur complexité. A défaut de traiter méthodiquement ces données d'une grande richesse, on se limitait souvent à l'adjonction de quelques notes ou documents en pièces jointes pour appuyer les analyses réalisées sur des données commerciales ou financières. N'étant pas incorporées dans le reporting produit par les outils décisionnels, ces éléments qualitatifs se retrouvaient au mieux relégués parmi les annexes du rapport principal composé de tableaux de chiffres et de graphiques.
Avec l'augmentation des capacités de traitement et des performances de nos ordinateurs, la donne technologique a changé et les progrès réalisés dans le traitement automatique du langage (extraction de mots-clés, textmining, cartographie, catégorisation automatique, ...) permettent aujourd'hui l'utilisation des données non structurées au sein de systèmes d'analyse de documents et de systèmes d'aide à la décision. Le cercle de lumière de notre réverbère s'agrandit peu à peu.

En parallèle de ces progrès technologiques, le nombre de sources mobilisables pour participer au processus de décision a augmenté de façon exponentielle. Le décisionnel traditionnel, né et théorisé alors qu'Internet et les contenus web n'existaient pas, s'est développé avec pour seul terrain d'investigation les quelques sources de données internes de l'entreprise. En 15 ans, la situation a bien changé et nous sommes passés d'un déficit d'information à une véritable surcharge. Malheureusement pour notre ivrogne, la taille de la rue à explorer grandit au moins aussi vite que le cercle de lumière de notre réverbère.

Voir au delà du réverbère

Initiée il y a maintenant plusieurs années, la bataille des données structurées est terminée dans nombre d'entreprises alors que celle de la maîtrise des données non structurées ne fait que démarrer. Après avoir massivement investi dans leurs systèmes transactionnels et décisionnels, les entreprises ne peuvent aujourd'hui espérer d'innovations de rupture dans ces domaines. Au mieux, elles gagneront encore en ergonomie ou en puissance de traitement mais, du point de vue applicatif, les grandes fonctionnalités décisionnelles sont figées depuis une dizaine d'années. Il suffit de reprendre les white papers rédigés par les éditeurs pendant les années 90 pour s'en convaincre (requêtage, zoom, drill-down, permutation, reporting, planification budgétaire, consolidation, ... tout était déjà écrit). L'architecture web a remplacé le client/serveur mais les usages restent identiques. En l'absence de nouvelles promesses, les principales innovations du décisionnel structuré se concentrent sur les business models liés à l’open source et sur la baisse du ticket d’entrée des solutions.

L'émergence de systèmes décisionnels couplant données structurées et non structurées représentent une chance tant pour des éditeurs en quête d'un nouveau champ de bataille que pour les managers convaincus que la réalité est souvent plus complexe qu'un tableau de chiffres.
Nos systèmes décisionnels, s'alimentant majoritairement à partir des flux comptables et financiers; présentent au décideur une vision de l'environnement concurrentiel uniquement façonnée par les données collectées au sein de l'entreprise. Dépassant cette limite, les systèmes décisionnels du futur permettront le croisement d'informations collectées en interne avec des informations externes pour dresser un tableau plus réaliste du champ concurrentiel et aider le décideur dans son appréciation du rapport de force et des moyens d'actions de ses concurrents.

Ce changement de paradigme, appuyée par ces nouveaux outils, est tout simplement révolutionnaire et fait voler en éclat l'ancienne frontière entre l'informatique décisionnelle (business intelligence) et de l'intelligence économique (competitive intelligence) pour le plus grand bénéfice des décideurs en entreprises.

Cette vision du futur explique la combat de titans qui se déroule actuellement autour du moteur de recherche. Ce composant critique va rapidement devenir le point d'entrée unique de l'information d'entreprise permettant l'agrégation de l'ensemble des données disponibles, qu'elles soient structurées ou non. C'est autour de ce composant central d'accès à l'information que viendront se brancher les briques décisionnelles d'analyse et de présentation de l'information.

Ces outils décisionnels d'un nouveau genre, s'alimentant auprès de sources plus nombreuses et plus complexes, vont, dans un premier temps, accroître l'impression de surabondance d'information. Pour le manager saturé d'informations comme pour les éditeurs, le prochain défi sera de tisser des liens dans l'information disponible pour en révéler le sens. Pour réussir ce nouveau défi et bénéficier du dynamisme du marché de l'information non structurée, l'informatique décisionnelle va devoir étendre son champ de compétences et s'enrichir de nouveaux professionnels maîtrisant l'ingénierie linguistique et les technologies sémantiques. Nous assisterons certainement dans les années à venir au rapprochement des marchés de la Business Intelligence (BI), du Knowledge Management (KM) et de la gestion de contenu d’entreprise (ECM). La consolidation de 2007 n'était que le préambule des gigantesques mouvements qui se préparent. L'avenir du décisionnel promet d'être passionnant.

Si le sujet du mariage du décisionnel et des données non structurées vous intéresse, je vous invite à me retrouver à la conférence Search 2008 qui se tiendra Jeudi 21 Février à Paris. Je développerai ce thème en introduction de l’atelier Intelleco, cabinet de référence en intelligence économique et stratégique, qui a associé les concepts de la business intelligence et de la competitive intelligence au sein d’IntelligenceMaker, une plateforme de structuration de l’information au service de la décision.
Si cette conférence vous intéresse : http://www.search2008.org/




Commentaires

1.Posté par GAGNEBIN le 19/02/2008 07:43
Question toute pratique: lorsque ces données non-structurées sont intégrées à un dwh, comment le business est-il censé prendre en charge la gestion fonctionnelle de ces données? L'IT est responsable de la structure technique, mais il faudrait que quelque part de la méthologie soit développée pour mettre à niveau le business opérationnel. Qu'en pensez-vous?

2.Posté par Stefan le 20/02/2008 13:42
Très bonne remarque M....Gagnebin :-).

Stocker et historiser des données non structurées ou semi-structurées reste un gros défi pour une maîtrise business car manque d'interfaces et méthodologies. Rechercher inteligemment c'est bien et aujourd'hui faisable pour la plupart des éditeurs, mais accéder ultérieurement à ces recherches , toujours de manière intelligente est la vraie capitalisation que ces outils devrait apporter.

Dans ce sens , il convient de rajouter que sans une gestion cohérente des métadonnées, l'accès simple ne fournit pas une valeur ajoutée notable afin de justifier les coûts d'une telle solution.

Nous pouvons donc facilement rebondir sur l'article BO du projet Polestar en posant la légitime question : Avez vous un outil MDM naturellement complémentaire à cette approche? Car à ce jour je ne vois aucun digne de ce nom. Que vont d'ailleurs devenir les modules ETL/EII dans le monde SAP qui possède déjà ce type de technologie ( en mieux mais fonctionnellement restreinte à SAP !!! )

D'ailleurs je ne vois pratiquement AUCUN vrai gros projet EIM / MDM , malgré les progrès notables d'autres éditeurs ( IBM etc. ) dans la matière.

Si d'autres personnes ont une telle expérience , je serais très intéressé par leur feed back :-)

Merci.

3.Posté par Michel Bruley le 26/02/2008 16:52
Un article très intéressant qui fait à juste titre la promotion de l’utilisation émergente des données non structurées. Mais il serait erroné de conclure qu’il ne reste plus rien à faire sur les fameuses 20% de données structurées issues des transactions, car ces données du fait de leur qualité intrinsèque peuvent servir de base à des investissements métiers lourds (plusieurs millions d’euros dans les grands comptes pour chaque thème : CRM, SCM, FM, …). Enfin si les idées majeures de l’exploitation des données transactionnelles ont effectivement plus de dix ans, certaines n’en sont qu’à l’aube de leur mise en œuvre, c’est par exemple le cas pour l’intégration active des systèmes opérationnels et décisionnels.

4.Posté par Michel Kergoat le 27/02/2008 11:11
À mon avis, il convient de distinguer recherche d'information et analyse d'information.

Les données structurées ont - encore - une valeur ajoutée qui justifie les budgets investis : elle permettent l'analyse. Particulièrement les faits des historiques des entrepôts de données. Cette analyse, du fait de la structure, se fait dans les temps impartis. Et les décisions sont prises sur les résultats des analyses.

À mon sens, l'analyse de données non structurées n'est pas vraiment faite pour prendre des décisions, mais pour rechercher des informations.
Une requête Google Desktop ou autre indexeur me permet de gagner du temps, de maximiser les recherches, de savoir si un mail existe, et de l'afficher, mais c'est tout. Je ne crois pas que ce soit d'une requête sur des données non structurées que sortirait un graphique de tendances, sauf contre-exemple.
Les éventuelles analyses décisionnelles - slices & dice, agrégations, etc. - se fferaient sur les méta données, comme le signale M. Stefan, qui sont... structurées !-)
Le text mining, quand à lui, pourrait... donner de la structure ! Comme ce scientifique qui a étudié l'influence de l'humeur des dirigeants sur les marchés économiques à partir des styles de rédaction des mails, mais il n'a pas eu la réponse en 5 minutes ;-)

(Contribution personnelle et indépendante de ma société)

5.Posté par Michel Bruley le 27/02/2008 12:13

Pour ceux que cela intéresse, ci-joint un lien vers un podcast en Anglais du CTO et co-fondateur d’Attensity sur l’intérêt et la possibilité de lier des approches de Data Warehousing et de Text Analytics.

6.Posté par Michael ALBO le 27/02/2008 13:09
Bonjour à tous,

Je suis très heureux du débat initié par vos commentaires.
Bien entendu, le décisionnel à base de données structurées a encore de beaux jours devant lui, le débat n'est pas là, vous l'aurez compris. Comme pour tout marché mature, je pense seulement qu'il ne nous étonnera plus (ni technologiquement, ni financièrement). Les éditeurs devront de plus en plus faire face sur ce segment de marché à des acteurs développant des stratégies "Low Cost" ou Open Source, d'où une dégradation progressive des marges.
Pour preuve, les éditeurs leaders de la BI a généré de la croissance en 2007 mais elle est beaucoup moins rentable qu'auparavant. Un exemple chiffré vaut mieux que des paroles. Fin janvier 2008, Business Objects a annoncé un chiffre d'affaires en hausse de 20% à plus de 1,5 milliard de dollars mais une baisse de sa marge d'exploitation, passée de 9% en 2006 à 7% en 2007. Le bénéfice net est en forte baisse, à 53,6 M$ contre plus de 75 M$ sur l'exercice précédent. Les nouveaux clients ne souhaitent visiblement pas payer une technologie banalisée au prix fort...
Concernant l'affirmation de Michel Kergoat ("l'analyse de données non structurées n'est pas vraiment faite pour prendre des décisions, mais pour rechercher des informations."), je pense justement tout le contraire. Pour développer mon argumentation, je serai obligé de faire une réponse qui dépasserait largement le cadre d'un simple commentaire. Aussi, ma réponse prendra donc la forme d'un prochain article dédié à cette question.

Nouveau commentaire :
Twitter

Vous pouvez commenter ou apporter un complément d’information à tous les articles de ce site. Les commentaires sont libres et ouverts à tous. Néanmoins, nous nous réservons le droit de supprimer, sans explication ni préavis, tout commentaire qui ne serait pas conforme à nos règles internes de fonctionnement, c'est-à-dire tout commentaire diffamatoire ou sans rapport avec le sujet de l’article. Par ailleurs, les commentaires anonymes sont systématiquement supprimés s’ils sont trop négatifs ou trop positifs. Ayez des opinions, partagez les avec les autres, mais assumez les ! Merci d’avance. Merci de noter également que les commentaires ne sont pas automatiquement envoyés aux rédacteurs de chaque article. Si vous souhaitez poser une question au rédacteur d'un article, contactez-le directement, n'utilisez pas les commentaires.


Twitter
Rss
LinkedIn
Facebook
Apple Podcast
App Store
Google Play Store