Mais le combustible de ces initiatives réside essentiellement dans les données ! Malgré les efforts pour regrouper toutes les données pertinentes dans un datalake ou quelque chose de similaire, les entreprises constatent que leurs données existent toujours dans leurs magasins de données sur site, ou dans le cloud, voire à la source, comme dans les fils d’information des réseaux sociaux, les séquences de clics sur le parcours de navigation et les dispositifs connectés en périphérie. La difficulté consiste à superviser l’ensemble de ces sources de données mais aussi à gérer, gouverner, sécuriser et analyser ces données comme le permettent les solutions Global Data Management (GDM) de gestion globale des données. Une entreprise dotée d’une stratégie GDM solide peut mieux réussir ses projets de transformation numérique.
Malgré les avancées révolutionnaires des outils de stockage et de gestion des données, nous entendons toujours les entreprises confrontées aux mêmes problèmes de volumétrie, de vélocité et de variété. Lors d’un évènement récent, j’ai eu l’occasion de discuter avec un visiteur de ces difficultés. Celui-ci travaille dans une grande entreprise de traitement des paiements (dont il n’a pas révélé le nom) qui exécute plus d’un milliard de transactions par jour. Ils utilisent pour le moment un entrepôt de données tournant sur une célèbre base de données relationnelle. Un outil de reporting produit des tableaux de bord à partir de l’entrepôt de données. Mais cette configuration se confronte à une évolutivité limitée en plus de coûter cher en gestion et en développement. Ils envisagent donc d’investir dans une solution Big Data capable d’absorber leurs besoins de stockage croissants et d’évoluer. Ils estiment également qu’un bon moteur de traitement de flux combiné avec une solution analytique de streaming permettrait de supporter la rapidité des transactions pour produire de l’intelligence décisionnelle. Pour le moment, le challenge ne porte que sur les données structurées. Ils ne savent pas encore comment gérer leurs données non structurées mais ils considèrent à raison qu’une solution Big Data les y aidera également.
Il est important de noter dans l’exemple pré-cité que même si une architecture de données moderne optimisée par des solutions Big Data permet de répondre aux besoins immédiats de cette entreprise, celle-ci doit quand même élaborer une stratégie GDM pour les raisons suivantes :
1. Etablissement de catalogue de données fondé sur des métadonnées : il convient de considérer toutes les données connexes des magasins de données au repos ainsi que les flux de données en transit. Par exemple, si vous lancez une initiative Customer 360, vous devez avoir accès aux données des clients dans votre CRM basé dans le cloud, dans vos systèmes hérités, dans votre DBMS opérationnel, dans vos flux sociaux, dans vos clics de navigation, dans les données de vos succursales, etc. Il vous faut une vision unique pour accéder à de tels insights. Les fournisseurs commencent à proposer des solutions de classement à l’aide de métadonnées pour de tels actifs. Les catalogues de données et les concepts similaires de virtualisation des données vont bientôt se généraliser.
2. Gestion du cycle de vie des données : il s’agit de pouvoir exécuter des fonctions de gestion du cycle de vie des données sur des sources de données diverses. Celles-ci incluent sans s’y limiter les fonctions de sauvegarde/restauration des données, de reprise après incident, etc.
3. Gouvernance et sécurité des données : il convient de gouverner et sécuriser toutes les données provenant de multiples sources de données. La gouvernance des données est une thématique importante pour les données au repos et celles en transit. Toutes les données qui entrent dans l’entreprise subissent une série de transformations pour les besoins de qualité des données, d’enrichissement des données ou d’augmentation pour les convertir dans un autre format pour un usage ultérieur. Mais nous vivons dans un monde de conformité et de réglementations. Prenez, par exemple, le RGPD : il est important que les entreprises comprennent qui a accès à quelles données, qui les a modifiées, quand, etc. Ce degré de sécurité, de contrôle et de responsabilité est nécessaire et peut être atteint via une solide solution GDM.
4. Intelligence des données : une fois qu’il est possible de visualiser facilement de multiples sources de données, l’étape suivante est celle de la valorisation des données. Combinez toute la puissance des insights historiques émanant de vos données au repos et des insights périssables de vos données en transit pour produire de l’intelligence décisionnelle, optimisée par l’identification de modèles, le traitement d’événements complexes ou CEP (complex event processing) et les modèles de Machine Learning.
Prévoyez les utilisations futures en plus des utilisations actuelles
Les analystes évoquent la nécessité d’un entrepôt de données logique ou LDW (logical data warehouse) ou d’une topologie de données capable d’interroger toutes vos sources de données. Cela revient à la vision unique telle que décrite précédemment. Actuellement, concernant le LDW, l’accent est mis sur l’accès des données et leur analyse. Toutefois, j’encourage les entreprises à voir plus loin et à considérer une stratégie GDM adaptée ainsi qu’à prévoir les autres fonctions de gestion des données potentiellement utiles pour soutenir leurs initiatives digitales. 80 % de l'analyse des données est effectuée sur seulement 20 % des données que possède l’entreprise. Plutôt que de s’inquiéter de la valeur potentielle des données restées dans l’obscurité, il est plus pertinent de se focaliser sur les points de données les plus critiques et pertinentes afin de pouvoir prendre les décisions les plus stratégiques au bon moment.
La gestion des données représente un défi, elle inclut la gestion de plusieurs clouds, l’obtention d’une vue unique de la sécurité et de la gouvernance, et la gestion de toutes les données, de tous types et où qu’elles résident. Ceci suppose de concevoir une architecture tournée vers l’avenir de façon à éviter tout risque de verrouillage propriétaire. A cet égard, nombre d’entreprises du classement Fortune 1000 font confiance aux technologies open source. C’est l’assurance d’une grande liberté de choix des outils ou plateformes mais aussi de ne pas risquer d’être contraint sur la durée par un fournisseur lambda.
Alors, lancez-vous, choisissez bien vos initiatives de transformation numérique et menez cette transformation en toute confiance. Mais assurez-vous au préalable d’avoir défini une bonne stratégie GDM et de choisir une solution GDM qui répondra à vos besoins pour assurer la réussite de vos initiatives digitales.
Malgré les avancées révolutionnaires des outils de stockage et de gestion des données, nous entendons toujours les entreprises confrontées aux mêmes problèmes de volumétrie, de vélocité et de variété. Lors d’un évènement récent, j’ai eu l’occasion de discuter avec un visiteur de ces difficultés. Celui-ci travaille dans une grande entreprise de traitement des paiements (dont il n’a pas révélé le nom) qui exécute plus d’un milliard de transactions par jour. Ils utilisent pour le moment un entrepôt de données tournant sur une célèbre base de données relationnelle. Un outil de reporting produit des tableaux de bord à partir de l’entrepôt de données. Mais cette configuration se confronte à une évolutivité limitée en plus de coûter cher en gestion et en développement. Ils envisagent donc d’investir dans une solution Big Data capable d’absorber leurs besoins de stockage croissants et d’évoluer. Ils estiment également qu’un bon moteur de traitement de flux combiné avec une solution analytique de streaming permettrait de supporter la rapidité des transactions pour produire de l’intelligence décisionnelle. Pour le moment, le challenge ne porte que sur les données structurées. Ils ne savent pas encore comment gérer leurs données non structurées mais ils considèrent à raison qu’une solution Big Data les y aidera également.
Il est important de noter dans l’exemple pré-cité que même si une architecture de données moderne optimisée par des solutions Big Data permet de répondre aux besoins immédiats de cette entreprise, celle-ci doit quand même élaborer une stratégie GDM pour les raisons suivantes :
1. Etablissement de catalogue de données fondé sur des métadonnées : il convient de considérer toutes les données connexes des magasins de données au repos ainsi que les flux de données en transit. Par exemple, si vous lancez une initiative Customer 360, vous devez avoir accès aux données des clients dans votre CRM basé dans le cloud, dans vos systèmes hérités, dans votre DBMS opérationnel, dans vos flux sociaux, dans vos clics de navigation, dans les données de vos succursales, etc. Il vous faut une vision unique pour accéder à de tels insights. Les fournisseurs commencent à proposer des solutions de classement à l’aide de métadonnées pour de tels actifs. Les catalogues de données et les concepts similaires de virtualisation des données vont bientôt se généraliser.
2. Gestion du cycle de vie des données : il s’agit de pouvoir exécuter des fonctions de gestion du cycle de vie des données sur des sources de données diverses. Celles-ci incluent sans s’y limiter les fonctions de sauvegarde/restauration des données, de reprise après incident, etc.
3. Gouvernance et sécurité des données : il convient de gouverner et sécuriser toutes les données provenant de multiples sources de données. La gouvernance des données est une thématique importante pour les données au repos et celles en transit. Toutes les données qui entrent dans l’entreprise subissent une série de transformations pour les besoins de qualité des données, d’enrichissement des données ou d’augmentation pour les convertir dans un autre format pour un usage ultérieur. Mais nous vivons dans un monde de conformité et de réglementations. Prenez, par exemple, le RGPD : il est important que les entreprises comprennent qui a accès à quelles données, qui les a modifiées, quand, etc. Ce degré de sécurité, de contrôle et de responsabilité est nécessaire et peut être atteint via une solide solution GDM.
4. Intelligence des données : une fois qu’il est possible de visualiser facilement de multiples sources de données, l’étape suivante est celle de la valorisation des données. Combinez toute la puissance des insights historiques émanant de vos données au repos et des insights périssables de vos données en transit pour produire de l’intelligence décisionnelle, optimisée par l’identification de modèles, le traitement d’événements complexes ou CEP (complex event processing) et les modèles de Machine Learning.
Prévoyez les utilisations futures en plus des utilisations actuelles
Les analystes évoquent la nécessité d’un entrepôt de données logique ou LDW (logical data warehouse) ou d’une topologie de données capable d’interroger toutes vos sources de données. Cela revient à la vision unique telle que décrite précédemment. Actuellement, concernant le LDW, l’accent est mis sur l’accès des données et leur analyse. Toutefois, j’encourage les entreprises à voir plus loin et à considérer une stratégie GDM adaptée ainsi qu’à prévoir les autres fonctions de gestion des données potentiellement utiles pour soutenir leurs initiatives digitales. 80 % de l'analyse des données est effectuée sur seulement 20 % des données que possède l’entreprise. Plutôt que de s’inquiéter de la valeur potentielle des données restées dans l’obscurité, il est plus pertinent de se focaliser sur les points de données les plus critiques et pertinentes afin de pouvoir prendre les décisions les plus stratégiques au bon moment.
La gestion des données représente un défi, elle inclut la gestion de plusieurs clouds, l’obtention d’une vue unique de la sécurité et de la gouvernance, et la gestion de toutes les données, de tous types et où qu’elles résident. Ceci suppose de concevoir une architecture tournée vers l’avenir de façon à éviter tout risque de verrouillage propriétaire. A cet égard, nombre d’entreprises du classement Fortune 1000 font confiance aux technologies open source. C’est l’assurance d’une grande liberté de choix des outils ou plateformes mais aussi de ne pas risquer d’être contraint sur la durée par un fournisseur lambda.
Alors, lancez-vous, choisissez bien vos initiatives de transformation numérique et menez cette transformation en toute confiance. Mais assurez-vous au préalable d’avoir défini une bonne stratégie GDM et de choisir une solution GDM qui répondra à vos besoins pour assurer la réussite de vos initiatives digitales.
Autres articles
-
MapR lance le Programme Clarity à l’intention des clients de Cloudera et de Hortonworks avec une plateforme actualisée et un service d'évaluation des données gratuity
-
Cloudera et Hortonworks finalisent leur fusion
-
Une stratégie d’entreprise fondée sur le Big Data, telle est la clé du succès
-
Cloudera et Hortonworks annoncent leur fusion pour créer la première plateforme de données de nouvelle génération et offrir le premier environnement cloud pour les données d’entreprise de l’industrie
-
Comment valoriser le Big Data en amont de la décision d'achat ?