Le data-lake permet d’exploiter et de valoriser le potentiel data des entreprises
Part d’une infrastructure de « big data », le data-lake ou lac de données est un espace de stockage qui permet de traiter des volumes d’informations quasi illimités issus de tout type de sources.
Il présente de nombreux avantages. Connecté à l’écosystème digital et permettant un stockage quasi illimité, il offre l’opportunité à l’entreprise de centraliser et conserver de larges quantités de données, qu’elles soient structurées ou non.
Le data-lake offre aussi, au travers d’une architecture évolutive et pérenne, la possibilité de comparer et analyser rapidement ces données de manière exhaustive et transversale. Par conséquent, il aide à désiloter la donnée au sein de l’organisation.
La flexibilité, la qualité de la donnée et l’agilité qu’offre le data-lake permettent donc d’alimenter de véritables campagnes de marketing data-driven.
De nombreux projets big data, au sein d’une multitude de secteurs (loisirs, banques/assurances, retail ou encore transports/industrie) peuvent bénéficier de cette opportunité technologique dont les champs d’application sont très divers : expérience client, marketing media, optimisation industrielle, innovation produit/service…
Voici quelques exemples d’organisations ayant déjà adopté un data lake afin d’améliorer leur service client, d’optimiser leur tarification ou encore d’améliorer les process opérationnels.
Il présente de nombreux avantages. Connecté à l’écosystème digital et permettant un stockage quasi illimité, il offre l’opportunité à l’entreprise de centraliser et conserver de larges quantités de données, qu’elles soient structurées ou non.
Le data-lake offre aussi, au travers d’une architecture évolutive et pérenne, la possibilité de comparer et analyser rapidement ces données de manière exhaustive et transversale. Par conséquent, il aide à désiloter la donnée au sein de l’organisation.
La flexibilité, la qualité de la donnée et l’agilité qu’offre le data-lake permettent donc d’alimenter de véritables campagnes de marketing data-driven.
De nombreux projets big data, au sein d’une multitude de secteurs (loisirs, banques/assurances, retail ou encore transports/industrie) peuvent bénéficier de cette opportunité technologique dont les champs d’application sont très divers : expérience client, marketing media, optimisation industrielle, innovation produit/service…
Voici quelques exemples d’organisations ayant déjà adopté un data lake afin d’améliorer leur service client, d’optimiser leur tarification ou encore d’améliorer les process opérationnels.
Le data-lake, une solution complémentaire de collecte et d’exploitation de la donnée
Alors que le Datawarehouse a uniquement vocation à stocker les données structurées (considérées comme « utiles ») - généralement des métriques quantitatives - le data-lake stocke toute typologie de données. Il se présente sous une architecture flexible, une structure évolutive et non figée alors que le Datawarehouse présente un espace de stockage standardisé et une architecture qui repose sur des tables relationnelles. Les finalités divergent et se complètent donc : des analyses répétitives pour le datawarehouse et des données traitées selon les besoins pour le data-lake (logique Extract-Transform-Load vs logique Extract-Load-Transform).
En outre, le data-lake est également complémentaire à la mise en place d’une Data Management Platform (DMP) qui ne stocke pas les données personnelles des visiteurs, prospects et clients (PII) et les données sensibles de l’entreprise. Data-lake et DMP divergent aussi en ce qui concerne le mode de connexion : la DMP est reliée en temps réel à l’écosystème digital tandis que le data-lake n’a pas vocation à être connecté.
DMP et data-lake ont vocation à communiquer : le date-lake agrège et traite la donnée avant de la transformer et de la transmettre. La DMP, outil d’identification opérationnel, récupère l’intelligence et l’active sur différents canaux on et off-line.
En outre, le data-lake est également complémentaire à la mise en place d’une Data Management Platform (DMP) qui ne stocke pas les données personnelles des visiteurs, prospects et clients (PII) et les données sensibles de l’entreprise. Data-lake et DMP divergent aussi en ce qui concerne le mode de connexion : la DMP est reliée en temps réel à l’écosystème digital tandis que le data-lake n’a pas vocation à être connecté.
DMP et data-lake ont vocation à communiquer : le date-lake agrège et traite la donnée avant de la transformer et de la transmettre. La DMP, outil d’identification opérationnel, récupère l’intelligence et l’active sur différents canaux on et off-line.
Deux modes d’hébergement possible : On Premise et Cloud Services
L’entreprise doit choisir le mode d’hébergement qui répondra le mieux à ses besoins en termes de gouvernance, d’évolution, de facilité de déploiement, les deux modes d’hébergement présentant chacun des avantages spécifiques
Les pré-requis à la mise en place d’un projet data-lake
Le déploiement d’un data-lake est facilité par la constitution d’une équipe projet ad hoc bénéficiant d’un solide soutien de la part de la direction.
L’agilité nécessaire à un projet data-lake, la spécificité des ressources pour son exploitation ainsi que la transversalité de ses implications dans l’organisation nécessitent souvent sa construction en marge ou en parallèle d’un système d’information historique auquel il sera étroitement lié.
La réussite du projet dépend des 3 étapes décrites ci-dessous :
L’agilité nécessaire à un projet data-lake, la spécificité des ressources pour son exploitation ainsi que la transversalité de ses implications dans l’organisation nécessitent souvent sa construction en marge ou en parallèle d’un système d’information historique auquel il sera étroitement lié.
La réussite du projet dépend des 3 étapes décrites ci-dessous :
Pour télécharger le livre blanc : http://www.converteo.com/blog/
Autres articles
-
Converteo obtient la spécialisation Data Analytics Services de Google Cloud
-
Converteo s’installe en Amérique du Nord avec l’ouverture de bureaux à New-York et Montréal
-
Converteo structure son expertise autour de trois nouvelles divisions et nomme trois collaborateurs à leur direction
-
RGPD, collecte & traitement des données : 6% des acteurs en France aujourd’hui conformes