Abed AJRAOU, Directeur de l’offre Information Management, Devoteam Corporate
Deux messages importants que je vais développer dans ce billet. Le premier est de considérer la mise en œuvre du « Big Data » d’un point de vue « Business » et non d’un point de vue « Technologique » et le deuxième est l’importance de la visualisation des données.
Big Data ou l’analytique autour des données dites Big Data ?
Je ne suis pas de ceux qui sont adeptes du terme Big Data car ce terme n’a de sens que si l’on apporte une analyse à ces données. En effet, les données grossissent, sont de plus en plus disparates, et ceci, de plus en plus rapidement. Et alors ? À vrai dire, ces problématiques n’ont d’intérêt que si l’on s’intéresse à les analyser et à en tirer de la valeur, ce qui rendra mon entreprise plus compétitive. Et, j’ajouterai que ces gains doivent être très clairement quantifiables.
Alors quels sont les intérêts business du Big Data? Lorsque nous voyons toute la masse de données que les entreprises n’exploitent pas, les intérêts sont justement quasi infinis ! Citons quelques exemples : Consolidation des différents CRM existants : en règle générale, les entreprises réalisent assez bien le multicanal, mais la consolidation de ces données permettant d’avoir une vision 360° du client reste un axe de progression majeur. Analyse de contenu sur les logs : la masse d’information qui existe dans les différents logs – c'est-à-dire les différentes traces que les consommateurs laissent lors de leurs passages sur les applications ; comme la connaissance des rebonds des consommateurs sur un site e-commerce, la connaissance du trafic de consommation dans les télécoms, l’analyse des habitudes et préférences autour des médias TV. Exploitation des données du réseau social d’entreprise, pour détecter les collaborateurs clés et cartographier les connaissances pour ainsi réaliser un plan GPEC beaucoup plus efficace et plus proche du terrain. En d’autres termes, aborder le Big Data d’un point de vue uniquement technologique n’a pas de sens, et est même complètement contreproductif. Essayez de convaincre votre Directeur Général qu’une base NoSQL est plus efficace qu’un SGBD classique… Je lui dirais plutôt qu’avec un changement technologique, je pourrai lui proposer des rapports plus rapidement, en augmentant le scope des données à analyser tout en diminuant la facture du software et du hardware… Là, je suis certain d’être entendu, ou du moins de pouvoir commencer à amorcer une discussion.
En revanche, ces nouveaux concepts business et ces nouveaux axes de croissance n’ont de réelles possibilités que si la technologie permet de les mettre en œuvre tout en s’assurant du coût pour justifier un vrai retour sur investissement.
La Data Driven Attitude
Pour pouvoir être efficace dans l’analyse de ces données Big Data, il est nécessaire de changer d’attitude vis-à-vis des données. Oui, vous avez bien lu d’attitude. Tout d’abord, savez-vous qu’une donnée est capable de parler ? Inutile de proposer des rapports très standardisés à vos métiers et les former à des outils proposant une infinité de possibilités et ensuite remarquer qu’ils n’utilisent pas ces outils, et encore moins les rapports que vous avez eu du mal à mettre à leur disposition. Nos outils de reporting ont, en fait, été trop influencés par Excel, c'est-à-dire un outil sachant tout faire ! Et par voie de conséquence, l’utilisateur final se retrouve frustré soit par manque de compétences sur l’outil ou soit parce qu’il y passe trop de temps.
Pourtant, il est possible, en travaillant un tant soit peu sur les données, de les laisser parler en maquettant et en construisant des reportings dits de « Data StoryTelling ». Il s’agit là d’une fonctionnalité que beaucoup d’éditeurs commencent à mettre en place vue la demande croissante des clients. Laissons les données nous raconter leur histoire afin de mieux les comprendre et de pouvoir ainsi mettre en place un plan d’action adéquat. Le concept de « Data Driven » tire pleinement son sens lorsque nous arrivons, via ces Storytelling, à tirer des données, des informations que nous allons transformer en savoir et donc en prise de décisions pertinentes ! Voici quelques exemples pour illustrer cet aspect : Concernant la santé, une analyse des avis des consommateurs sur les compléments alimentaires et les produits dits d’automédication nous donne directement la véracité et le ressenti sur la performance de ces produits sur le corps humain… par exemple, le thé vert, les oméga3, la vitamine D arrivent bien en tête des produits ayant fait leurs preuves chez les consommateurs, par contre, le Ginseng semble ne pas donner satisfaction. Voilà encore des données qui nous parlent et qui nous donnent des informations que nous pouvons facilement transformer en actions efficaces. Concernant l’analyse des mises à jour des comptes facebook, sur les termes « rupture », « rompre », une analyse a été effectuée par David McCandless qui montre que les personnes font « le ménage » dans leur couple essentiellement au printemps et pendant la période de Noël… Information encore plus étonnante, les données nous disent que dans la semaine, les personnes rompent essentiellement le lundi (les week-ends se passent mal ?). Ici, les données nous apprennent des choses, et cela constitue une source d’analyse pour la psychologie des couples et des faits de société! Dans les entreprises, les ressources humaines pourront se poser la question si une restructuration est pertinente dans ces périodes dites de troubles matrimoniaux, ou encore, est-ce qu’il n’est pas plus pertinent de faire les réunions de service les vendredis plutôt que les lundis… Ce serait une faute de ma part que de parler de Storytelling sans évoquer Hans Rosling. Vous pouvez consulter la vidéo d’Hans Rosling qui s’intitule « The River of Myth » sur l’évolution du nombre de naissance par pays. Il montre comment la mesure révèle des progrès incroyables pour sauver la vie des enfants dans ce qui était autrefois étiquetés comme «pays en développement». S’il existe encore quelques pays qui ont encore des taux élevés de mortalité infantile, les décès d'enfants pourront être de l'histoire ancienne en 2030. Nous devons continuer à suivre de près et mesurer ces progrès. Il s’agit là d’une vraie Storytelling (avec le son et l’image) qui explique les données et raconte son histoire. Comme précisé par Philippe Nieuwbourg avec sa formule désormais célèbre : 3V * Visualisation = Valeur lors du symposium MicroStrategy du 22 novembre 2012 à Paris, la visualisation des données est une étape importante dans l’acquisition de l’information à partir de ces données, car elle offre la faculté de pouvoir résumer une grande masse d’informations en utilisant notre sens le plus développé à savoir la vue !
La data visualisation incontournable pour résumer les données
Je ne vais pas ici évoquer le concept de la data visualisation, car beaucoup d’ouvrages ont été publiés sur ce sujet (comme « Show me the numbers » de Stephen Few) et d’autres sont en cours (clin d’œil à Charles Henri Meledo), je voudrais ici, bien insister sur le fait que la data visualisation doit être au service de la compréhension des données et non uniquement au service du graphisme.
En effet, nous voyons ces derniers temps, une multitude d’infographies – qui ont l’intérêt d’être beaux – mais malheureusement ne reflète qu’une compilation de chiffres récoltés et raconte une histoire voulue sans laisser réellement parler les chiffres et les données.
Une data visualisation efficace est une visualisation qui apporte des idées, des messages qui n’étaient pas, ou difficilement visibles à première vue dans un tableau, table ou dans une autre forme de restitution.
La disposition de vraies visualisations de données permettent, en fait, d’accélérer la « Data Driven Attitude » et de découvrir de nouvelles choses, idées, corrélations que l’on ne soupçonnait pas…
En guise de transition, je finirai par une petite note technique sur la couche reporting. Comme évoqué l’été dernier sur le nouvel air de la BI via les framework Hadoop, je vous devais un complément sur la complétude de l’architecture des données.
Tout d’abord, nous avons aujourd’hui beaucoup plus de choix qu’il y a à peine 8 mois, ce qui prouve que les technologies s’améliorent.
Aujourd’hui, l’ensemble des outils de reporting s’interface sur Hive ou bien ont dans leur « roadmap » cette interface de prévue. Je citerai (à demi-mot) trois logiciels qui se démarquent par les travaux dans le monde du Big Data : l’outil de restitution opensource qui commence par un « J » et auquel je décerne la palme de l’ancienneté pour avoir été le premier à créer des connecteurs NoSQL : dès 2011, un connecteur sur MongoDb était disponible et aujourd’hui, les différents connecteurs NoSQL du marché existent et sont en libre téléchargement. l’outil de visualisation qui commence par un « T » auquel je décerne la palme de la coopération pour avoir travaillé avec Cloudera dans la mise en place d’Impala pour proposer une solution alternative aux latences de map-reduce. l’outil de reporting dont la devise est « The Big Data Anaytics Company » qui commence par un « S » qui lui mérite la palme de l’innovation et de l’audace : l’un des premiers à mettre en place un stockage propriétaire NoSQL sur disque et non uniquement en mémoire, ce qui donne des résultats en performance tout à fait bluffant. Le récent partenariat avec Microsoft sur la plateforme Azure est très prometteur.
Big Data ou l’analytique autour des données dites Big Data ?
Je ne suis pas de ceux qui sont adeptes du terme Big Data car ce terme n’a de sens que si l’on apporte une analyse à ces données. En effet, les données grossissent, sont de plus en plus disparates, et ceci, de plus en plus rapidement. Et alors ? À vrai dire, ces problématiques n’ont d’intérêt que si l’on s’intéresse à les analyser et à en tirer de la valeur, ce qui rendra mon entreprise plus compétitive. Et, j’ajouterai que ces gains doivent être très clairement quantifiables.
Alors quels sont les intérêts business du Big Data? Lorsque nous voyons toute la masse de données que les entreprises n’exploitent pas, les intérêts sont justement quasi infinis ! Citons quelques exemples : Consolidation des différents CRM existants : en règle générale, les entreprises réalisent assez bien le multicanal, mais la consolidation de ces données permettant d’avoir une vision 360° du client reste un axe de progression majeur. Analyse de contenu sur les logs : la masse d’information qui existe dans les différents logs – c'est-à-dire les différentes traces que les consommateurs laissent lors de leurs passages sur les applications ; comme la connaissance des rebonds des consommateurs sur un site e-commerce, la connaissance du trafic de consommation dans les télécoms, l’analyse des habitudes et préférences autour des médias TV. Exploitation des données du réseau social d’entreprise, pour détecter les collaborateurs clés et cartographier les connaissances pour ainsi réaliser un plan GPEC beaucoup plus efficace et plus proche du terrain. En d’autres termes, aborder le Big Data d’un point de vue uniquement technologique n’a pas de sens, et est même complètement contreproductif. Essayez de convaincre votre Directeur Général qu’une base NoSQL est plus efficace qu’un SGBD classique… Je lui dirais plutôt qu’avec un changement technologique, je pourrai lui proposer des rapports plus rapidement, en augmentant le scope des données à analyser tout en diminuant la facture du software et du hardware… Là, je suis certain d’être entendu, ou du moins de pouvoir commencer à amorcer une discussion.
En revanche, ces nouveaux concepts business et ces nouveaux axes de croissance n’ont de réelles possibilités que si la technologie permet de les mettre en œuvre tout en s’assurant du coût pour justifier un vrai retour sur investissement.
La Data Driven Attitude
Pour pouvoir être efficace dans l’analyse de ces données Big Data, il est nécessaire de changer d’attitude vis-à-vis des données. Oui, vous avez bien lu d’attitude. Tout d’abord, savez-vous qu’une donnée est capable de parler ? Inutile de proposer des rapports très standardisés à vos métiers et les former à des outils proposant une infinité de possibilités et ensuite remarquer qu’ils n’utilisent pas ces outils, et encore moins les rapports que vous avez eu du mal à mettre à leur disposition. Nos outils de reporting ont, en fait, été trop influencés par Excel, c'est-à-dire un outil sachant tout faire ! Et par voie de conséquence, l’utilisateur final se retrouve frustré soit par manque de compétences sur l’outil ou soit parce qu’il y passe trop de temps.
Pourtant, il est possible, en travaillant un tant soit peu sur les données, de les laisser parler en maquettant et en construisant des reportings dits de « Data StoryTelling ». Il s’agit là d’une fonctionnalité que beaucoup d’éditeurs commencent à mettre en place vue la demande croissante des clients. Laissons les données nous raconter leur histoire afin de mieux les comprendre et de pouvoir ainsi mettre en place un plan d’action adéquat. Le concept de « Data Driven » tire pleinement son sens lorsque nous arrivons, via ces Storytelling, à tirer des données, des informations que nous allons transformer en savoir et donc en prise de décisions pertinentes ! Voici quelques exemples pour illustrer cet aspect : Concernant la santé, une analyse des avis des consommateurs sur les compléments alimentaires et les produits dits d’automédication nous donne directement la véracité et le ressenti sur la performance de ces produits sur le corps humain… par exemple, le thé vert, les oméga3, la vitamine D arrivent bien en tête des produits ayant fait leurs preuves chez les consommateurs, par contre, le Ginseng semble ne pas donner satisfaction. Voilà encore des données qui nous parlent et qui nous donnent des informations que nous pouvons facilement transformer en actions efficaces. Concernant l’analyse des mises à jour des comptes facebook, sur les termes « rupture », « rompre », une analyse a été effectuée par David McCandless qui montre que les personnes font « le ménage » dans leur couple essentiellement au printemps et pendant la période de Noël… Information encore plus étonnante, les données nous disent que dans la semaine, les personnes rompent essentiellement le lundi (les week-ends se passent mal ?). Ici, les données nous apprennent des choses, et cela constitue une source d’analyse pour la psychologie des couples et des faits de société! Dans les entreprises, les ressources humaines pourront se poser la question si une restructuration est pertinente dans ces périodes dites de troubles matrimoniaux, ou encore, est-ce qu’il n’est pas plus pertinent de faire les réunions de service les vendredis plutôt que les lundis… Ce serait une faute de ma part que de parler de Storytelling sans évoquer Hans Rosling. Vous pouvez consulter la vidéo d’Hans Rosling qui s’intitule « The River of Myth » sur l’évolution du nombre de naissance par pays. Il montre comment la mesure révèle des progrès incroyables pour sauver la vie des enfants dans ce qui était autrefois étiquetés comme «pays en développement». S’il existe encore quelques pays qui ont encore des taux élevés de mortalité infantile, les décès d'enfants pourront être de l'histoire ancienne en 2030. Nous devons continuer à suivre de près et mesurer ces progrès. Il s’agit là d’une vraie Storytelling (avec le son et l’image) qui explique les données et raconte son histoire. Comme précisé par Philippe Nieuwbourg avec sa formule désormais célèbre : 3V * Visualisation = Valeur lors du symposium MicroStrategy du 22 novembre 2012 à Paris, la visualisation des données est une étape importante dans l’acquisition de l’information à partir de ces données, car elle offre la faculté de pouvoir résumer une grande masse d’informations en utilisant notre sens le plus développé à savoir la vue !
La data visualisation incontournable pour résumer les données
Je ne vais pas ici évoquer le concept de la data visualisation, car beaucoup d’ouvrages ont été publiés sur ce sujet (comme « Show me the numbers » de Stephen Few) et d’autres sont en cours (clin d’œil à Charles Henri Meledo), je voudrais ici, bien insister sur le fait que la data visualisation doit être au service de la compréhension des données et non uniquement au service du graphisme.
En effet, nous voyons ces derniers temps, une multitude d’infographies – qui ont l’intérêt d’être beaux – mais malheureusement ne reflète qu’une compilation de chiffres récoltés et raconte une histoire voulue sans laisser réellement parler les chiffres et les données.
Une data visualisation efficace est une visualisation qui apporte des idées, des messages qui n’étaient pas, ou difficilement visibles à première vue dans un tableau, table ou dans une autre forme de restitution.
La disposition de vraies visualisations de données permettent, en fait, d’accélérer la « Data Driven Attitude » et de découvrir de nouvelles choses, idées, corrélations que l’on ne soupçonnait pas…
En guise de transition, je finirai par une petite note technique sur la couche reporting. Comme évoqué l’été dernier sur le nouvel air de la BI via les framework Hadoop, je vous devais un complément sur la complétude de l’architecture des données.
Tout d’abord, nous avons aujourd’hui beaucoup plus de choix qu’il y a à peine 8 mois, ce qui prouve que les technologies s’améliorent.
Aujourd’hui, l’ensemble des outils de reporting s’interface sur Hive ou bien ont dans leur « roadmap » cette interface de prévue. Je citerai (à demi-mot) trois logiciels qui se démarquent par les travaux dans le monde du Big Data : l’outil de restitution opensource qui commence par un « J » et auquel je décerne la palme de l’ancienneté pour avoir été le premier à créer des connecteurs NoSQL : dès 2011, un connecteur sur MongoDb était disponible et aujourd’hui, les différents connecteurs NoSQL du marché existent et sont en libre téléchargement. l’outil de visualisation qui commence par un « T » auquel je décerne la palme de la coopération pour avoir travaillé avec Cloudera dans la mise en place d’Impala pour proposer une solution alternative aux latences de map-reduce. l’outil de reporting dont la devise est « The Big Data Anaytics Company » qui commence par un « S » qui lui mérite la palme de l’innovation et de l’audace : l’un des premiers à mettre en place un stockage propriétaire NoSQL sur disque et non uniquement en mémoire, ce qui donne des résultats en performance tout à fait bluffant. Le récent partenariat avec Microsoft sur la plateforme Azure est très prometteur.
Les données, le nouveau pétrole !
En conclusion : la Data Driven Attitude est le fait de faire parler les données pour en extraire une information pertinente afin de la transformer en connaissance, avec toujours comme objectif le développement du business.