Didier Gaultier, Directeur du Développement SPAD et Datamining chez Coheris fait le point sur le Big Data en 6 questions
Leurs motivations sont connues : alors que les données sont vues comme « un nouvel or noir », le Big Data s’impose logiquement comme un levier de croissance. Nous assistons de manière générale à la prise de conscience récente de l’importance des méthodes statistiques dans l’analyse des données. Un sujet qui était porté jusqu’à présent avec pugnacité seulement par les connaisseurs des techniques de Data Mining comme Coheris SPAD. L’effet Big Data leur donne raison. Mais pour une entreprise qui veut mener un tel projet, les questions restent souvent nombreuses :
Que va m’apporter le Big Data concrètement ?
L’exploitation intelligente de l’océan de données est l’occasion de mettre en application réelle un discours très présent depuis quelques années et toutes ses déclinaisons : « mettre le client au centre de l’entreprise ». Big Data, Data Mining et analyse de données se positionnent aisément comme des accélérateurs autour de ces enjeux, plus difficiles qu’ils n’y paraissent. Mieux, la capacité de prédiction qu’ils confèrent permet d’agir pour éviter la perte de clients, de façon réactive comme proactive, et de mieux gérer son cycle de vie. Nous touchons là au cœur des enjeux d’entreprise : mieux comprendre le parcours client et améliorer son expérience. Ce point n’est encore que rarement mis en avant quand on parle de Big Data… mais très prochainement ce sujet va devenir central. En 2013, sans Data Mining, pas de connaissance client. Et sans connaissance client, pas d’amélioration de l’expérience client.
Enfin, le Big Data permet d’anticiper les évolutions ultra-rapides du marché. Ces dernières années ont vu des clientèles se détourner très vite de certaines entreprises au profit de leurs concurrentes ou pour des produits de substitution. Tout le monde ne peut pas engager des analystes pour faire la veille de tout ce qui se passe sur son secteur. Le Big Data offre la possibilité d’observer ses propres chiffres et de mener l’enquête pour la moindre irrégularité. Du général au particulier, le Big Data permet de cibler.
Quel doit être mon point de départ ?
La priorité, c’est d’abandonner immédiatement l’idée qu’il suffit de récolter énormément de données et de les mettre dans un datawarehouse pour ensuite espérer faire du Big Data avec un « outil magique ». C’est malheureusement un discours que l’on entend beaucoup, y compris chez certains professionnels. Si l’on comprend bien que la donnée brute est bien la matière de base du dataminer au même titre que le parpaing ou la brique dans le BTP, personne n’imagine qu’il suffit de jeter dix tonnes de mortier et de parpaings dans un terrain vague pour voir soudain pousser un immeuble ! Pour le Big Data, la logique est identique : mettre toutes ses données dans un entrepôt n’a jamais fait un modèle d’analyse pertinent, qui va, lui, apporter de la valeur à l’entreprise.
De quoi ai-je besoin pour m’attaquer au Big Data ?
Il faut avant tout avoir un objectif ! L’entreprise doit savoir ce qu’elle veut faire. Elle a besoin d’avoir des données à sa portée qui vont dans ce sens. Se dire « le Big Data va faire du bien à mon business », ce n’est pas suffisant ! Au-delà de ce prérequis, elle a également besoin de compétences adéquates, internes ou externes. Il lui faut les bonnes compétences, le bon architecte, les bons coordinateurs, capables de parler à plusieurs métiers. Or, à l’heure actuelle, nous faisons face à une pénurie de data scientists. Ce métier relativement neuf nécessite une triple compétence : la statistique, l’informatique et la compréhension du métier concerné par les analyses de données (par exemple, le marketing).
De façon plus pratique, le point de départ est d’attaquer ce projet comme tous les autres : ce n’est pas parce que le Big Data est un sujet à la mode, qu’il ne faut pas être extrêmement rigoureux et vigilant sur la gestion de projet. Cette rigueur est d’autant plus vitale que l’océan de données n’est pas fondamentalement propice à un traitement statistique. C’est la qualité et la richesse des données auxquelles l’entreprise accède qui posent question. Si elles ne sont pas au rendez-vous, le fait d’avoir de grands volumes de données ne changera rien et l’entreprise n’en tirera aucune valeur réelle.
Quels caractéristiques doit avoir un outil d’analyse du Big Data ?
Outre sa capacité à traiter de grands volumes de données rapidement, il est très important que l’outil soit accessible aux « métiers ». Face à la nouveauté du sujet et à la pénurie de spécialistes formés expressément, les aspects pédagogiques et l’intuitivité sont donc à privilégier.
Par ailleurs, il n’y a pas de « boite noire » capable de s’emparer du Big Data d’un côté et d’en ressortir des pépites d’or de l’autre. Un outil doit donc être suffisamment complet et ouvert pour permettre l’application de modèles d’analyses adaptés. La voie la plus sure est de pouvoir accéder à des données de qualité, qui permettront d’appliquer des algorithmes statistiques : la robustesse, la précision et la fiabilité d’un modèle conçu sur cette base sera très bonne. Pour autant, dans un environnement Big Data, l’outil doit également être capable de traiter des données de moindre qualité, qui ne manqueront pas d’être présentes, à l’aide notamment d’algorithmes moins exigeants, comme le Support Vecteur Machine (SVM), les réseaux bayésiens, ou les réseaux de neurones.
Comment convaincre le management ?
Les premiers retours d’expériences sont encore frais, ce qui rend difficile de chiffrer avec exactitude le ROI d’un projet Big Data. Le meilleur argument reste que pour une entreprise qui ne prend pas le sujet à bras le corps et qui ne s’habitue pas à cette complexité… il sera sans doute trop tard quand elle se rendra compte de la nécessité que cela représentait. C’est ce que l’histoire nous montre avec le virage Internet et l’expérience malheureuse de nombreuses sociétés VPCistes. Nous sommes sur des questions propres aux projets à long terme, gros enjeux et gros investissements, qui changent en profondeur l’entreprise. Prendre du retard maintenant, c’est risquer la catastrophe à l’arrivée.
Un dernier conseil ?
Il vaut mieux commencer dès maintenant un projet Big Data modeste de façon rigoureuse… que de se lancer dans l’urgence plus tard sur un projet tellement ambitieux qu’il ne sera jamais achevé. Il faut avoir conscience que les implications d’un tel projet vont toucher la DSI mais aussi l’organisation du commerce, le marketing, le département des ressources humaines, jusqu’à la direction générale ! Il y aura des ramifications inattendues. Dans ce cadre, il est primordial que le management s’implique dès le départ. Une direction qui se contente de donner le feu vert n’en fait pas assez : il lui faut porter un engagement en moyens et en ressources, demander une évaluation des compétences disponibles. C’est à ce titre qu’il sera possible de rendre intelligible et de redescendre la connaissance obtenue jusqu’au niveau opérationnel. Sans ce travail de fond, l’entreprise ne profitera d’aucune valeur.
Que va m’apporter le Big Data concrètement ?
L’exploitation intelligente de l’océan de données est l’occasion de mettre en application réelle un discours très présent depuis quelques années et toutes ses déclinaisons : « mettre le client au centre de l’entreprise ». Big Data, Data Mining et analyse de données se positionnent aisément comme des accélérateurs autour de ces enjeux, plus difficiles qu’ils n’y paraissent. Mieux, la capacité de prédiction qu’ils confèrent permet d’agir pour éviter la perte de clients, de façon réactive comme proactive, et de mieux gérer son cycle de vie. Nous touchons là au cœur des enjeux d’entreprise : mieux comprendre le parcours client et améliorer son expérience. Ce point n’est encore que rarement mis en avant quand on parle de Big Data… mais très prochainement ce sujet va devenir central. En 2013, sans Data Mining, pas de connaissance client. Et sans connaissance client, pas d’amélioration de l’expérience client.
Enfin, le Big Data permet d’anticiper les évolutions ultra-rapides du marché. Ces dernières années ont vu des clientèles se détourner très vite de certaines entreprises au profit de leurs concurrentes ou pour des produits de substitution. Tout le monde ne peut pas engager des analystes pour faire la veille de tout ce qui se passe sur son secteur. Le Big Data offre la possibilité d’observer ses propres chiffres et de mener l’enquête pour la moindre irrégularité. Du général au particulier, le Big Data permet de cibler.
Quel doit être mon point de départ ?
La priorité, c’est d’abandonner immédiatement l’idée qu’il suffit de récolter énormément de données et de les mettre dans un datawarehouse pour ensuite espérer faire du Big Data avec un « outil magique ». C’est malheureusement un discours que l’on entend beaucoup, y compris chez certains professionnels. Si l’on comprend bien que la donnée brute est bien la matière de base du dataminer au même titre que le parpaing ou la brique dans le BTP, personne n’imagine qu’il suffit de jeter dix tonnes de mortier et de parpaings dans un terrain vague pour voir soudain pousser un immeuble ! Pour le Big Data, la logique est identique : mettre toutes ses données dans un entrepôt n’a jamais fait un modèle d’analyse pertinent, qui va, lui, apporter de la valeur à l’entreprise.
De quoi ai-je besoin pour m’attaquer au Big Data ?
Il faut avant tout avoir un objectif ! L’entreprise doit savoir ce qu’elle veut faire. Elle a besoin d’avoir des données à sa portée qui vont dans ce sens. Se dire « le Big Data va faire du bien à mon business », ce n’est pas suffisant ! Au-delà de ce prérequis, elle a également besoin de compétences adéquates, internes ou externes. Il lui faut les bonnes compétences, le bon architecte, les bons coordinateurs, capables de parler à plusieurs métiers. Or, à l’heure actuelle, nous faisons face à une pénurie de data scientists. Ce métier relativement neuf nécessite une triple compétence : la statistique, l’informatique et la compréhension du métier concerné par les analyses de données (par exemple, le marketing).
De façon plus pratique, le point de départ est d’attaquer ce projet comme tous les autres : ce n’est pas parce que le Big Data est un sujet à la mode, qu’il ne faut pas être extrêmement rigoureux et vigilant sur la gestion de projet. Cette rigueur est d’autant plus vitale que l’océan de données n’est pas fondamentalement propice à un traitement statistique. C’est la qualité et la richesse des données auxquelles l’entreprise accède qui posent question. Si elles ne sont pas au rendez-vous, le fait d’avoir de grands volumes de données ne changera rien et l’entreprise n’en tirera aucune valeur réelle.
Quels caractéristiques doit avoir un outil d’analyse du Big Data ?
Outre sa capacité à traiter de grands volumes de données rapidement, il est très important que l’outil soit accessible aux « métiers ». Face à la nouveauté du sujet et à la pénurie de spécialistes formés expressément, les aspects pédagogiques et l’intuitivité sont donc à privilégier.
Par ailleurs, il n’y a pas de « boite noire » capable de s’emparer du Big Data d’un côté et d’en ressortir des pépites d’or de l’autre. Un outil doit donc être suffisamment complet et ouvert pour permettre l’application de modèles d’analyses adaptés. La voie la plus sure est de pouvoir accéder à des données de qualité, qui permettront d’appliquer des algorithmes statistiques : la robustesse, la précision et la fiabilité d’un modèle conçu sur cette base sera très bonne. Pour autant, dans un environnement Big Data, l’outil doit également être capable de traiter des données de moindre qualité, qui ne manqueront pas d’être présentes, à l’aide notamment d’algorithmes moins exigeants, comme le Support Vecteur Machine (SVM), les réseaux bayésiens, ou les réseaux de neurones.
Comment convaincre le management ?
Les premiers retours d’expériences sont encore frais, ce qui rend difficile de chiffrer avec exactitude le ROI d’un projet Big Data. Le meilleur argument reste que pour une entreprise qui ne prend pas le sujet à bras le corps et qui ne s’habitue pas à cette complexité… il sera sans doute trop tard quand elle se rendra compte de la nécessité que cela représentait. C’est ce que l’histoire nous montre avec le virage Internet et l’expérience malheureuse de nombreuses sociétés VPCistes. Nous sommes sur des questions propres aux projets à long terme, gros enjeux et gros investissements, qui changent en profondeur l’entreprise. Prendre du retard maintenant, c’est risquer la catastrophe à l’arrivée.
Un dernier conseil ?
Il vaut mieux commencer dès maintenant un projet Big Data modeste de façon rigoureuse… que de se lancer dans l’urgence plus tard sur un projet tellement ambitieux qu’il ne sera jamais achevé. Il faut avoir conscience que les implications d’un tel projet vont toucher la DSI mais aussi l’organisation du commerce, le marketing, le département des ressources humaines, jusqu’à la direction générale ! Il y aura des ramifications inattendues. Dans ce cadre, il est primordial que le management s’implique dès le départ. Une direction qui se contente de donner le feu vert n’en fait pas assez : il lui faut porter un engagement en moyens et en ressources, demander une évaluation des compétences disponibles. C’est à ce titre qu’il sera possible de rendre intelligible et de redescendre la connaissance obtenue jusqu’au niveau opérationnel. Sans ce travail de fond, l’entreprise ne profitera d’aucune valeur.