Philippe Lacassaigne, Réseau'Nable
Faire du BIG DATA sans faire du BIG DATA!
Je prends l'exemple du secteur du commerce pour illustrer ces premiers propos. Les bases comptent des centaines de milliers voire des millions de clients pour les plus grands acteurs du secteur, des dizaines voire des centaines de milliers d'opération ont lieu chaque jour en magasin (retail) et sur le web (e-commerce). Aujourd'hui, il n'est pas rare que ces différentes données se croisent (exemple du drive). Avec la multiplication des supports légers (tablette, mobile), l'on voit aussi se multiplier de nouveaux usages qui produisent de nouvelles données (ex : géolocalisation). L'ensemble des données dîtes de comportements d'achat (clients, RFM « récence, fréquence, montant ») se complètent de nouvelles données dîtes d'usage (logs « navigation web », traces furtives « géolocalisation, prochainement nfc ? » sans oublier les données sociales (blogs, réseaux sociaux, forums).
Bref, la donnée crée l'usage, et l'usage produit de la donnée. Dans le cadre d'un marketing très opérationnel, l'on sait que 5% des données génèrent de nouvelles connaissances sur les clients. Or, séparer le bon grain de l'ivraie implique une sélection alors que sélectionner peut être vue comme une réduction ! Ainsi, les BIG DATA attestent qu'il faut envisager l'intégration des flux de données à travers un ensemble de transformations visant à ne garder que l'essentiel. Comme a pu le préciser un intervenant expert lors d'une manifestation récente : "il est possible de faire du BIG DATA sans faire du BIG DATA !" Comment?
BIG DATA = une logique d'abstraction !
Dans un dernier article, Les BIG DATA modifient notre rapport à l'information, http://www.decideo.fr/Quand-les-BIG-DATA-modifient-le-rapport-a-l-information_a5464.html, j'évoquais le recours à de nouvelles technologies réflexes en temps réelle et d'autres technologies basées sur des mécanismes cognitifs tel que l'induction et l'abduction. De tels systèmes se concentrent sur l'essentiel et ne traitent que l'information utile.
Elles n'appliquent pas de modèle mais s'appuient sur des formalismes de haut niveau pour faire des transformations à partir d'indices inhérents aux contextes et aux situations. Il y a une variété de contextes et de situations spécifiques à la relation client : l'achat, la fidélité, l'engagement, la consommation, l'adhésion, la distribution... En général, nous nous évertuons à segmenter et à compartimenter la relation client dans des scénarii (exemple typique de la description du parcours d'achat sur un site web ou en cross canal). Or, c'est tout l'inverse qui se passe dans la réalité, les clients évoluent dans des situations au sein desquelles ils vont agir (rechercher, comparer, échanger des points de vue sur un produit, acheter, négocier, se faire livrer, payer en caisse...) mais dont l'on ne connaît pas le cheminement, pour lesquelles il y a des similitudes mais pas de véritable logique. Or, l'un des enjeux forts des BIG DATA se situe dans les technologies qui vont permettre d'industrialiser la singularité. Un client dans une situation d'achat peut aller en magasin pour rechercher un produit, comparer ce produit avec d'autres via son mobile, rentrer chez lui et l'acheter via internet, tandis qu'un autre client dans la même situation d'achat va rechercher le produit sur le web et l'acheter en magasin après avoir recueillit l'avis de ses amis...Aussi, ne pas prendre en compte le contexte et la situation du client consistent à ne pas le traiter dans sa singularité.
Or, dans ce cas, des systèmes s'inspirant de ces principes sont aujourd'hui capables d'identifier des singularités et de détecter de phénomènes émergents. D'ailleurs, des expérimentations ont lieu actuellement sur de telles technologies à l'image de la solution In4sight, à laquelle je collabore et de web sales Booster, solution de Netwave dédiée au E-Commerce. Toutes deux s'appuient sur les processeurs situationnels développés par Jean Pierre Malle, société M8. Toutefois, il faudra beaucoup de pédagogie pour que les entreprises s'approprient ce nouveau paradigme car il remet en question le modèle d'analyse de chacune de ces entreprises.
Perception des entreprises, attitudes face aux technologies BIG DATA et évolutions sous jacentes de l'offre.
Il est intéressant de confronter la réalité d 'expérimentations avec la dernière étude EMC de septembre 2012 qui dresse l'état du marché des BIG DATA en France. 70% des entreprises françaises n'ont pas débuté d'expériences, cela signifie que 30% des entreprises tentent des choses. Le frein principal à l'intégration des BIG DATA semble relatif à un manque de compétences clés au niveau des entreprises sur les technologies des BIG DATA. En effet, j'ai pu le vérifier et la présentation d'un panel de technologies allant de Hadoop, à Active pivot en passant par Google Big Query montre qu'il y a un travail d'évangélisation à mener auprès des entreprises. Des conditions propices à l'expérimentation semblent nécessaires pour faire ce travail. Dans ce cadre, il faut nécessairement que les gens des métiers et de l'informatique mettent « les mains dans le cambouis ». Or, il est encore difficile de mesurer si les entreprises sont en attente de quelque chose ou prêtent clairement à s'investir sur le sujet. D'un coté, on perçoit qu'elles ont des attentes puis de l'autre, on ressent qu'elles attendent des réponses. Aussi, je ne peux être surpris que rapidement d'ici un ou deux ans, l'on retrouve plusieurs attitudes face aux technologies BIG DATA. Des entreprises auront franchi le pas des BIG DATA celles qui auront basculé vers le tout stockage, les autres vers des technologies associant des logiques de stockage et de flux, enfin d'autres qui auront fait le choix de l'abstraction. Plusieurs sociétés éditrices vont probablement tirées leur épingle du jeu. Tout d'abord, les entreprises qui proposent du stockage, surferont sur le Cloud et le SAAS et c'est dans leur intérêt. D'autres sociétés, celles ci ne sont pas françaises (exemple : Google, Amazon..) apportent déjà de grandes capacités de stockage mais aussi des capacités de traitement. Google BIG Query, offre Google, fait profiter des avancées technologiques de Google aux entreprises qui souhaitent distribuer dans le nuage le traitement de leurs grands volumes de données. Alors la question de l'écosystème est d'une importance cruciale en perspective d'une offre structurante embrassant toute la chaîne de valeur du traitement des BIG DATA. La technologie Hadoop soutenue par les grands noms du Web et maintenant les éditeurs français s'adosse aussi à une communauté internationale visant à bâtir un socle technique solide et à faire évoluer l'architecture. En cela, et parce que les BIG DATA requièrent des synergies, des écosystèmes gravitant autour de PaaS « plateforme as a service » développées en France pourraient associer de telles collaborations entre des entreprises utilisatrices, des sociétés de développement et éditrices de technologies et des start-up issues de labo de recherche. Il y a nécessité d'une prise en main du sujet par les entreprises elle-mêmes au risque de se voir contrainte par l'offre.
Culture de la réaction face à une culture de l'opportunité
De fait, les BIG DATA incitent à un changement culturel plus orienté sur l'action opérationnelle que la réaction aux stimulii et aux évolutions des marchés. Or, cela change pas mal de choses dans les entreprises. Tout d'abord sur l'efficience de la performance opérationnelle. Il n'est plus question d'analyser des grands volumes de données récurrentes mais de ne s'intéresser qu'aux seules données « utiles » pour prendre des décisions. D'un coté, on utilise des grands volumes de données du passé pour prédire les actions du futur, d'un autre coté, l'on agit sur les données singulières pour agir dans l'instant. Les BIG DATA sont alors une culture de l'opportunité. J'aime citer l'exemple de l'épisode neigeux qui a concerné toute la France y compris le Sud de la France, il y a quelques années. Un petit malin avait prévu le coût en constituant un stock de pelles qu'il avait ensuite revendu à des villes françaises du sud de la France dépourvues de matériels. On imagine qu'en plus d'écouler son stock, cette personne a du réaliser une plus value sur cette vente. Un autre exemple, celui s'appuyant sur l'usage à chaud de données BIG DATA atteste que l'opportunité vient aussi d'une détection d'opportunités par le croisement de données par nature hétérogènes (données de vente et open data notamment). Par exemple, chez Tesco, 10°C supplémentaires en été peut faire varier la consommation de produits barbecue de 400%. Je pourrai également citer cet exemple du client passant à proximité du magasin et qui reçoit 3 jours plus tard une offre sur le produit qu'il aurait pu acheter le jour j.
Expériences à mener.
L'association des données d'entreprises et des open data semblent une bonne idée. Je pense que le projet Mes infos porté par la Fing peut y aider. Des living lab comme ICTUsage Lab ont l'objectif d'aider les différents acteurs de la chaîne de l'innovation technologique en PACA de concevoir et de mettre au point de nouveaux produits et services avec rétroaction entre des technologies et des usagers testeurs. L'échange de données en contrepartie d'un meilleur confort, d'une meilleure qualité de services semble aussi une bonne idée. D'ailleurs, on voit clairement que les BIG DATA est un sujet porté par les citoyens. Aux états-unis, le quantified self est une vraie tendance, suivie d'un vendor relationship management, sujet émergent en France. Le développement d'écosystèmes réunissant des usagers, des entreprises et des développeurs de services peut avoir un vrai intérêt. À l'instar des initiatives comme CAStore (Crédit Agricole) et d'autres banques, le crowdsourcing est un premier pas vers l'innovation ouverte au service d'une nouvelle relation client.
En conclusion, ces exemples attestent qu'aborder les BIG DATA doit se faire selon deux approches complémentaires, l'une orientée sur la donnée, le fameux 3V, l'autre axée sur les usages. L'une et l'autre sont indissociables et facilitent les jonctions entre la technique et les métiers pour coordonner les actions des entreprises. C'est ce corollaire qu'il faut maintenant vérifier en multipliant les expériences autour des BIG DATA.
Je prends l'exemple du secteur du commerce pour illustrer ces premiers propos. Les bases comptent des centaines de milliers voire des millions de clients pour les plus grands acteurs du secteur, des dizaines voire des centaines de milliers d'opération ont lieu chaque jour en magasin (retail) et sur le web (e-commerce). Aujourd'hui, il n'est pas rare que ces différentes données se croisent (exemple du drive). Avec la multiplication des supports légers (tablette, mobile), l'on voit aussi se multiplier de nouveaux usages qui produisent de nouvelles données (ex : géolocalisation). L'ensemble des données dîtes de comportements d'achat (clients, RFM « récence, fréquence, montant ») se complètent de nouvelles données dîtes d'usage (logs « navigation web », traces furtives « géolocalisation, prochainement nfc ? » sans oublier les données sociales (blogs, réseaux sociaux, forums).
Bref, la donnée crée l'usage, et l'usage produit de la donnée. Dans le cadre d'un marketing très opérationnel, l'on sait que 5% des données génèrent de nouvelles connaissances sur les clients. Or, séparer le bon grain de l'ivraie implique une sélection alors que sélectionner peut être vue comme une réduction ! Ainsi, les BIG DATA attestent qu'il faut envisager l'intégration des flux de données à travers un ensemble de transformations visant à ne garder que l'essentiel. Comme a pu le préciser un intervenant expert lors d'une manifestation récente : "il est possible de faire du BIG DATA sans faire du BIG DATA !" Comment?
BIG DATA = une logique d'abstraction !
Dans un dernier article, Les BIG DATA modifient notre rapport à l'information, http://www.decideo.fr/Quand-les-BIG-DATA-modifient-le-rapport-a-l-information_a5464.html, j'évoquais le recours à de nouvelles technologies réflexes en temps réelle et d'autres technologies basées sur des mécanismes cognitifs tel que l'induction et l'abduction. De tels systèmes se concentrent sur l'essentiel et ne traitent que l'information utile.
Elles n'appliquent pas de modèle mais s'appuient sur des formalismes de haut niveau pour faire des transformations à partir d'indices inhérents aux contextes et aux situations. Il y a une variété de contextes et de situations spécifiques à la relation client : l'achat, la fidélité, l'engagement, la consommation, l'adhésion, la distribution... En général, nous nous évertuons à segmenter et à compartimenter la relation client dans des scénarii (exemple typique de la description du parcours d'achat sur un site web ou en cross canal). Or, c'est tout l'inverse qui se passe dans la réalité, les clients évoluent dans des situations au sein desquelles ils vont agir (rechercher, comparer, échanger des points de vue sur un produit, acheter, négocier, se faire livrer, payer en caisse...) mais dont l'on ne connaît pas le cheminement, pour lesquelles il y a des similitudes mais pas de véritable logique. Or, l'un des enjeux forts des BIG DATA se situe dans les technologies qui vont permettre d'industrialiser la singularité. Un client dans une situation d'achat peut aller en magasin pour rechercher un produit, comparer ce produit avec d'autres via son mobile, rentrer chez lui et l'acheter via internet, tandis qu'un autre client dans la même situation d'achat va rechercher le produit sur le web et l'acheter en magasin après avoir recueillit l'avis de ses amis...Aussi, ne pas prendre en compte le contexte et la situation du client consistent à ne pas le traiter dans sa singularité.
Or, dans ce cas, des systèmes s'inspirant de ces principes sont aujourd'hui capables d'identifier des singularités et de détecter de phénomènes émergents. D'ailleurs, des expérimentations ont lieu actuellement sur de telles technologies à l'image de la solution In4sight, à laquelle je collabore et de web sales Booster, solution de Netwave dédiée au E-Commerce. Toutes deux s'appuient sur les processeurs situationnels développés par Jean Pierre Malle, société M8. Toutefois, il faudra beaucoup de pédagogie pour que les entreprises s'approprient ce nouveau paradigme car il remet en question le modèle d'analyse de chacune de ces entreprises.
Perception des entreprises, attitudes face aux technologies BIG DATA et évolutions sous jacentes de l'offre.
Il est intéressant de confronter la réalité d 'expérimentations avec la dernière étude EMC de septembre 2012 qui dresse l'état du marché des BIG DATA en France. 70% des entreprises françaises n'ont pas débuté d'expériences, cela signifie que 30% des entreprises tentent des choses. Le frein principal à l'intégration des BIG DATA semble relatif à un manque de compétences clés au niveau des entreprises sur les technologies des BIG DATA. En effet, j'ai pu le vérifier et la présentation d'un panel de technologies allant de Hadoop, à Active pivot en passant par Google Big Query montre qu'il y a un travail d'évangélisation à mener auprès des entreprises. Des conditions propices à l'expérimentation semblent nécessaires pour faire ce travail. Dans ce cadre, il faut nécessairement que les gens des métiers et de l'informatique mettent « les mains dans le cambouis ». Or, il est encore difficile de mesurer si les entreprises sont en attente de quelque chose ou prêtent clairement à s'investir sur le sujet. D'un coté, on perçoit qu'elles ont des attentes puis de l'autre, on ressent qu'elles attendent des réponses. Aussi, je ne peux être surpris que rapidement d'ici un ou deux ans, l'on retrouve plusieurs attitudes face aux technologies BIG DATA. Des entreprises auront franchi le pas des BIG DATA celles qui auront basculé vers le tout stockage, les autres vers des technologies associant des logiques de stockage et de flux, enfin d'autres qui auront fait le choix de l'abstraction. Plusieurs sociétés éditrices vont probablement tirées leur épingle du jeu. Tout d'abord, les entreprises qui proposent du stockage, surferont sur le Cloud et le SAAS et c'est dans leur intérêt. D'autres sociétés, celles ci ne sont pas françaises (exemple : Google, Amazon..) apportent déjà de grandes capacités de stockage mais aussi des capacités de traitement. Google BIG Query, offre Google, fait profiter des avancées technologiques de Google aux entreprises qui souhaitent distribuer dans le nuage le traitement de leurs grands volumes de données. Alors la question de l'écosystème est d'une importance cruciale en perspective d'une offre structurante embrassant toute la chaîne de valeur du traitement des BIG DATA. La technologie Hadoop soutenue par les grands noms du Web et maintenant les éditeurs français s'adosse aussi à une communauté internationale visant à bâtir un socle technique solide et à faire évoluer l'architecture. En cela, et parce que les BIG DATA requièrent des synergies, des écosystèmes gravitant autour de PaaS « plateforme as a service » développées en France pourraient associer de telles collaborations entre des entreprises utilisatrices, des sociétés de développement et éditrices de technologies et des start-up issues de labo de recherche. Il y a nécessité d'une prise en main du sujet par les entreprises elle-mêmes au risque de se voir contrainte par l'offre.
Culture de la réaction face à une culture de l'opportunité
De fait, les BIG DATA incitent à un changement culturel plus orienté sur l'action opérationnelle que la réaction aux stimulii et aux évolutions des marchés. Or, cela change pas mal de choses dans les entreprises. Tout d'abord sur l'efficience de la performance opérationnelle. Il n'est plus question d'analyser des grands volumes de données récurrentes mais de ne s'intéresser qu'aux seules données « utiles » pour prendre des décisions. D'un coté, on utilise des grands volumes de données du passé pour prédire les actions du futur, d'un autre coté, l'on agit sur les données singulières pour agir dans l'instant. Les BIG DATA sont alors une culture de l'opportunité. J'aime citer l'exemple de l'épisode neigeux qui a concerné toute la France y compris le Sud de la France, il y a quelques années. Un petit malin avait prévu le coût en constituant un stock de pelles qu'il avait ensuite revendu à des villes françaises du sud de la France dépourvues de matériels. On imagine qu'en plus d'écouler son stock, cette personne a du réaliser une plus value sur cette vente. Un autre exemple, celui s'appuyant sur l'usage à chaud de données BIG DATA atteste que l'opportunité vient aussi d'une détection d'opportunités par le croisement de données par nature hétérogènes (données de vente et open data notamment). Par exemple, chez Tesco, 10°C supplémentaires en été peut faire varier la consommation de produits barbecue de 400%. Je pourrai également citer cet exemple du client passant à proximité du magasin et qui reçoit 3 jours plus tard une offre sur le produit qu'il aurait pu acheter le jour j.
Expériences à mener.
L'association des données d'entreprises et des open data semblent une bonne idée. Je pense que le projet Mes infos porté par la Fing peut y aider. Des living lab comme ICTUsage Lab ont l'objectif d'aider les différents acteurs de la chaîne de l'innovation technologique en PACA de concevoir et de mettre au point de nouveaux produits et services avec rétroaction entre des technologies et des usagers testeurs. L'échange de données en contrepartie d'un meilleur confort, d'une meilleure qualité de services semble aussi une bonne idée. D'ailleurs, on voit clairement que les BIG DATA est un sujet porté par les citoyens. Aux états-unis, le quantified self est une vraie tendance, suivie d'un vendor relationship management, sujet émergent en France. Le développement d'écosystèmes réunissant des usagers, des entreprises et des développeurs de services peut avoir un vrai intérêt. À l'instar des initiatives comme CAStore (Crédit Agricole) et d'autres banques, le crowdsourcing est un premier pas vers l'innovation ouverte au service d'une nouvelle relation client.
En conclusion, ces exemples attestent qu'aborder les BIG DATA doit se faire selon deux approches complémentaires, l'une orientée sur la donnée, le fameux 3V, l'autre axée sur les usages. L'une et l'autre sont indissociables et facilitent les jonctions entre la technique et les métiers pour coordonner les actions des entreprises. C'est ce corollaire qu'il faut maintenant vérifier en multipliant les expériences autour des BIG DATA.
Autres articles