La journée s'est organisée avec un débat le matin, des présentations de solutions et des travaux en petits groupes l'après midi.
Les participants furent unanimes. Les big data sont une révolution dans la manière de gérer les données en masse et la manière d'arbitrer la relation avec les consommateurs. Les big data ont été identifiés comme un ensemble de moyens en vue d'extraire et d'exploiter la donnée pertinente c'est à dire la donnée utile. Il a été toutefois très difficile de se mettre en accord sur ce qu'est une donnée utile et encore plus difficile de nous mettre en accord sur la notion de pertinence de la donnée. Plusieurs phases sont jugées très importantes pour la gestion des big data : la sélection des données (quelles données aller chercher), le tri de ces données (soit d'extraire la donnée importante peut être à partir d'une mesure de l'usure de la donnée), le lien entre les données et les références.
Les participants furent unanimes. Les big data sont une révolution dans la manière de gérer les données en masse et la manière d'arbitrer la relation avec les consommateurs. Les big data ont été identifiés comme un ensemble de moyens en vue d'extraire et d'exploiter la donnée pertinente c'est à dire la donnée utile. Il a été toutefois très difficile de se mettre en accord sur ce qu'est une donnée utile et encore plus difficile de nous mettre en accord sur la notion de pertinence de la donnée. Plusieurs phases sont jugées très importantes pour la gestion des big data : la sélection des données (quelles données aller chercher), le tri de ces données (soit d'extraire la donnée importante peut être à partir d'une mesure de l'usure de la donnée), le lien entre les données et les références.
Philippe LACASSAIGNE, Réseau'nable
Tous les participants ont bien remarqué que les outils actuels ne permettent pas de gérer les big data. Il faut noter qu'une différence majeure existe entre une exploitation des données à partir de modèles (schéma du passé) et une exploitation des données pour dégager des singularités et non des constances. Jean Pierre Malle, directeur R&D de la société Netwave, concepteur des processus d'analyse situationnelle, a notamment partagé son expertise de l'approche inductive. La capture de données dites de situation permet d'agir de manière plus efficace en se focalisant sur l'instant de la relation. Les big data seraient moins alors une problématique de stockage que d'exploitation des flux de données en temps réel.
Les participants ont identifié plusieurs impacts sur l'entreprise à et cela à plusieurs niveaux : les ressources humaines devront faire face au recrutement de nouvelles compétences en data mining, en marketing. Pour le moment, peu d'entre elles y sont prêtes ! L'approche des Big Data est transverse. Elle concerne toute l'entreprise et pas seulement l'informatique mais doit bien être portée par le marketing, que cela soit pour la mise en place des outils d'exploitation ou pour les services au client. Dans ce cadre, l'entreprise doit dès maintenant expérimenter de nouveaux outils avec l'apport de ressources externes. Par exemple, ces expérimentations intègrent peu à peu les nouveaux outils de gestion des données exogènes souvent open source développés par des communautés internet très en avance sur le sujet.
Les participants ont identifié plusieurs impacts sur l'entreprise à et cela à plusieurs niveaux : les ressources humaines devront faire face au recrutement de nouvelles compétences en data mining, en marketing. Pour le moment, peu d'entre elles y sont prêtes ! L'approche des Big Data est transverse. Elle concerne toute l'entreprise et pas seulement l'informatique mais doit bien être portée par le marketing, que cela soit pour la mise en place des outils d'exploitation ou pour les services au client. Dans ce cadre, l'entreprise doit dès maintenant expérimenter de nouveaux outils avec l'apport de ressources externes. Par exemple, ces expérimentations intègrent peu à peu les nouveaux outils de gestion des données exogènes souvent open source développés par des communautés internet très en avance sur le sujet.
Pour les participants, il est crucial que l'entreprise dégage une vision stratégique sur la donnée et la nouvelle relation avec le client. Sur ce second point, il faut développer l'écoute de leurs attentes et s'interroger sur les données qu'ils seraient prêts, qu'ils sont prêts à partager avec l'entreprise, et les contreparties attendues. Cette ouverture des données personnelles se ferait alors sur deux axes. Un axe de service en donnant les moyens aux consommateurs de créer leurs propres services de gestion de données. Il faut leur donner les moyens de qualifier leurs données et l'entreprise leur propose de créer les services qui vont faciliter la gestion de leur données personnelles. En contrepartie, les consommateurs seraient prêts à ouvrir progressivement leurs propres données aux acteurs économiques. Un axe "aide à la décision" qui interroge sur la manière de générer de nouveaux tableaux de bord qui faciliteront la conversation entre un collaborateur de l'entreprise (exemple du chargé de clientèle) et un client. Pour cela, il faut des outils d'aide à la décision qui présentent des indices qualitatifs et de nouvelles modalités de présentation des données clients. Le design des interfaces revêt aussi une attention particulière pour représenter les informations, en faciliter la navigation et l'enrichissement de la connaissance client.
Les sujets travaillés en petits groupes se sont inspirés du débat du matin. Trois groupes ont travaillé sur trois sujets. Il a d'abord été question d'un moteur de recommandation à partir d'un matching de données internes à l'entreprise et de données externes (exemple : site internet et médias sociaux). Un second groupe a recherché des solutions pour relier les données à large échelle dans le cadre d'une offre de produits personnalisés. Ce groupe a soulevé l'intérêt des données ouvertes et leur utilité dans l'analyse des comportements clients en fonction de données socio-démographiques. Le 3ème groupe s'est intéressé à l'ouverture de données personnelles et à partir de l'intérêt qu'ont les consommateurs à partager leur propres données (bons de réductions, services pour gérer ses propres données de manière plus qualitative, comparer ses données aux autres utilisateurs). Une esquisse papier de plateforme a ainsi été présentée.
DATACRUNCH ne se termine pas là, en juin 2012, un livre blanc sera communiqué ainsi qu'une video réalisée en motion design avec le studio de création lillois PixmeUp. L'objectif est d'accélérer les synergies sur le sujet et d'expérimenter des outils, des services, d'accompagner résolument les entreprises dans leur gestion des données BIG DATA.
Les sujets travaillés en petits groupes se sont inspirés du débat du matin. Trois groupes ont travaillé sur trois sujets. Il a d'abord été question d'un moteur de recommandation à partir d'un matching de données internes à l'entreprise et de données externes (exemple : site internet et médias sociaux). Un second groupe a recherché des solutions pour relier les données à large échelle dans le cadre d'une offre de produits personnalisés. Ce groupe a soulevé l'intérêt des données ouvertes et leur utilité dans l'analyse des comportements clients en fonction de données socio-démographiques. Le 3ème groupe s'est intéressé à l'ouverture de données personnelles et à partir de l'intérêt qu'ont les consommateurs à partager leur propres données (bons de réductions, services pour gérer ses propres données de manière plus qualitative, comparer ses données aux autres utilisateurs). Une esquisse papier de plateforme a ainsi été présentée.
DATACRUNCH ne se termine pas là, en juin 2012, un livre blanc sera communiqué ainsi qu'une video réalisée en motion design avec le studio de création lillois PixmeUp. L'objectif est d'accélérer les synergies sur le sujet et d'expérimenter des outils, des services, d'accompagner résolument les entreprises dans leur gestion des données BIG DATA.
Autres articles
-
[Promotion] Livre Blanc Alteryx : La science des données en pratique
-
Maîtriser ses données sur le Cloud : l'ESILV apprend aux étudiants à dompter le Big Data sur 120 machines
-
De quelle façon trois générations de disques durs Toshiba ont aidé le plus grand laboratoire de physique du monde à conserver, chaque seconde, des centaines de téraoctets de données générées par les expériences du LHC
-
Big Data & Big Brother : de l’intérêt de connaître notre ADN
-
Livre : Big Data, le traitement streaming et temps réel des données