Michel Bruley, Directeur Marketing & PR Teradata Europe de l’Ouest
Grâce au développement de la Business Intelligence et à la mise en œuvre d’entrepôts de données pour aider à la prise de décisions, les sociétés accèdent à une vision détaillée de l’information sur l’ensemble de l’entreprise. Par exemple dans le secteur des Assurances, les données clients sont reliées aux données sur les produits, les souscriptions, les primes et les sinistres. La valeur de l’information se multiplie à mesure que s’ajoutent de nouvelles dimensions. Malheureusement, l’impact des erreurs se multiplie également. Il est fréquent que ceux qui utilisent les données ne soient pas vraiment sûrs de leur signification, ou qu’ils les utilisent à des fins autres que celles prévues.
Les entreprises installent un entrepôt de données pour avoir accès à toutes les informations dont elles ont besoin pour prendre de meilleures décisions. L’accès s’est amélioré, mais sans référence ni mesures adéquates, nombre d’entre elles sont déçues de constater qu’elles ont maintenant un meilleur accès à des volumes plus importants… de données de mauvaise qualité.
La qualité des données n’est pas simplement une question de précision ; elle doit également fournir une meilleure représentation et un historique de la façon dont chaque donnée est obtenue ou calculée. Ces « données sur les données » s’appellent les métadonnées. Malheureusement, la plupart des entreprises stockent leurs méta données un peu partout, sur des documents, des tableaux, des post-it ou dans la mémoire d’un employé. Savoir où se trouve l’information et la mettre à la disposition de tous ceux qui en ont besoin n’est pas aisé. Un bon répertoire de métadonnées permet aux informaticiens de gérer efficacement l’entrepôt de données. Il permet d’identifier les doublons (les données sont-elles déjà présentes ailleurs ?), les données interdépendantes (cette donnée sert-elle à en obtenir d’autres ; que se passera-t-il si elle est modifiée ?) et le taux d’utilisation des données (est-elle souvent utilisée ?). Il permet en outre aux utilisateurs de comprendre les règles afférentes aux données. Ceci inclue la validité des codes et des conditions d’utilisation, ainsi que toute information complémentaire à propos des données présentes dans l’entrepôt, comme par exemple à qui appartient cette donnée et quand est elle mise à jour.
Pour résoudre les problèmes de qualité des données et mieux profiter d’une vision d’ensemble des données de l’entreprise, de nombreuses sociétés mettent en place une équipe de gestion de la qualité des données. L’équipe de gestion de la qualité des données a pour objectif de permettre une bonne exploitation des informations-clés d’une société. Cette équipe multifonctionnelle réunit des représentants de chaque ligne d’activités et de chaque fonction de l’entreprise. Ils sont chargés de gérer les données et les informations pour l’ensemble de la société. Des représentants des services informatiques fournissent support et conseils à l’organisation sur de nombreux points, et plus particulièrement ceux liés à l’utilisation des outils d’infrastructure.
L’objectif de l’équipe de gestion de la qualité des données est de développer des règles communes et une terminologie cohérente qui seront utilisées dans les différents secteurs d’activité et dans l’ensemble de la société. Une équipe de gestion de la qualité permet de surpasser les « demandes » conflictuelles de chaque unité et de promouvoir la mise en place d’une version unique de la vérité. Cette équipe de gestion de la qualité des données est composée de plusieurs profils.
Le sponsor est un cadre supérieur à qui a été délégué la gestion de la qualité des données. À mesure que les travaux de l’équipe de la gestion de la qualité des données avancent, il est nécessaire d’initier des changements de processus et de politique. Cette organisation, par le biais de son sponsor, doit disposer de l’autorité indispensable à la mise en œuvre de ces changements qui visent à améliorer la qualité et l’utilité des données en fonction des besoins.
Les propriétaires de données sont les unités fonctionnelles qui ont demandé la constitution de gisement de données historiques. Le propriétaire prépare les exigences métier et définit les règles qui seront associées aux données.
Les gestionnaires de données gèrent les besoins d’information sur un ensemble d’unités, en gardant à l’esprit les objectifs globaux de l’entreprise. Les informations créées par différents départements concernent divers domaines. Les données sont reliées les unes aux autres, et chaque problématique commune est résolue par décision consensuelle.
Le gardien des données est posté dans le secteur informatique, il doit s’assurer qu’elles sont collectées et traitées sur la chaîne d’information selon les spécifications développées par le propriétaire. L’informatique est responsable du nettoyage, de l’accessibilité et de la protection des données. Ceci comprend la sauvegarde et la récupération ainsi que l’accès sécurisé aux données.
De nombreux clients Teradata ont pu expérimenter que quand les pilotes et les outils appropriés sont en place, l’information peut être exploitée dans l’ensemble de l’entreprise, et cette dernière met le cap sur la rentabilité.
Pour aller plus loin sur le sujet vous pouvez utilement consulter les liens ci-dessous :
Data-Warehouses-and-Quality-Not-Just-for-IT-Anymore
http://www.teradata.com/t/white-papers/Data-Warehouses-and-Quality-Not-Just-for-IT-Anymore-eb5499/?type=WP
Gouvernance du Système d’Information Décisionnel
http://www.decideo.fr/bruley/Gouvernance-du-Systeme-d-Information-Decisionnel_a13.html
Les entreprises installent un entrepôt de données pour avoir accès à toutes les informations dont elles ont besoin pour prendre de meilleures décisions. L’accès s’est amélioré, mais sans référence ni mesures adéquates, nombre d’entre elles sont déçues de constater qu’elles ont maintenant un meilleur accès à des volumes plus importants… de données de mauvaise qualité.
La qualité des données n’est pas simplement une question de précision ; elle doit également fournir une meilleure représentation et un historique de la façon dont chaque donnée est obtenue ou calculée. Ces « données sur les données » s’appellent les métadonnées. Malheureusement, la plupart des entreprises stockent leurs méta données un peu partout, sur des documents, des tableaux, des post-it ou dans la mémoire d’un employé. Savoir où se trouve l’information et la mettre à la disposition de tous ceux qui en ont besoin n’est pas aisé. Un bon répertoire de métadonnées permet aux informaticiens de gérer efficacement l’entrepôt de données. Il permet d’identifier les doublons (les données sont-elles déjà présentes ailleurs ?), les données interdépendantes (cette donnée sert-elle à en obtenir d’autres ; que se passera-t-il si elle est modifiée ?) et le taux d’utilisation des données (est-elle souvent utilisée ?). Il permet en outre aux utilisateurs de comprendre les règles afférentes aux données. Ceci inclue la validité des codes et des conditions d’utilisation, ainsi que toute information complémentaire à propos des données présentes dans l’entrepôt, comme par exemple à qui appartient cette donnée et quand est elle mise à jour.
Pour résoudre les problèmes de qualité des données et mieux profiter d’une vision d’ensemble des données de l’entreprise, de nombreuses sociétés mettent en place une équipe de gestion de la qualité des données. L’équipe de gestion de la qualité des données a pour objectif de permettre une bonne exploitation des informations-clés d’une société. Cette équipe multifonctionnelle réunit des représentants de chaque ligne d’activités et de chaque fonction de l’entreprise. Ils sont chargés de gérer les données et les informations pour l’ensemble de la société. Des représentants des services informatiques fournissent support et conseils à l’organisation sur de nombreux points, et plus particulièrement ceux liés à l’utilisation des outils d’infrastructure.
L’objectif de l’équipe de gestion de la qualité des données est de développer des règles communes et une terminologie cohérente qui seront utilisées dans les différents secteurs d’activité et dans l’ensemble de la société. Une équipe de gestion de la qualité permet de surpasser les « demandes » conflictuelles de chaque unité et de promouvoir la mise en place d’une version unique de la vérité. Cette équipe de gestion de la qualité des données est composée de plusieurs profils.
Le sponsor est un cadre supérieur à qui a été délégué la gestion de la qualité des données. À mesure que les travaux de l’équipe de la gestion de la qualité des données avancent, il est nécessaire d’initier des changements de processus et de politique. Cette organisation, par le biais de son sponsor, doit disposer de l’autorité indispensable à la mise en œuvre de ces changements qui visent à améliorer la qualité et l’utilité des données en fonction des besoins.
Les propriétaires de données sont les unités fonctionnelles qui ont demandé la constitution de gisement de données historiques. Le propriétaire prépare les exigences métier et définit les règles qui seront associées aux données.
Les gestionnaires de données gèrent les besoins d’information sur un ensemble d’unités, en gardant à l’esprit les objectifs globaux de l’entreprise. Les informations créées par différents départements concernent divers domaines. Les données sont reliées les unes aux autres, et chaque problématique commune est résolue par décision consensuelle.
Le gardien des données est posté dans le secteur informatique, il doit s’assurer qu’elles sont collectées et traitées sur la chaîne d’information selon les spécifications développées par le propriétaire. L’informatique est responsable du nettoyage, de l’accessibilité et de la protection des données. Ceci comprend la sauvegarde et la récupération ainsi que l’accès sécurisé aux données.
De nombreux clients Teradata ont pu expérimenter que quand les pilotes et les outils appropriés sont en place, l’information peut être exploitée dans l’ensemble de l’entreprise, et cette dernière met le cap sur la rentabilité.
Pour aller plus loin sur le sujet vous pouvez utilement consulter les liens ci-dessous :
Data-Warehouses-and-Quality-Not-Just-for-IT-Anymore
http://www.teradata.com/t/white-papers/Data-Warehouses-and-Quality-Not-Just-for-IT-Anymore-eb5499/?type=WP
Gouvernance du Système d’Information Décisionnel
http://www.decideo.fr/bruley/Gouvernance-du-Systeme-d-Information-Decisionnel_a13.html
Autres articles
-
Teradata nomme Louis Landry au poste de Chief Technology Officer
-
Teradata AI Unlimited pour Microsoft Fabric est désormais disponible en avant-première via Microsoft Fabric Workload Hub
-
Teradata facilite l’application concrète de l’IA générative et accélère la création de valeur pour les entreprises
-
Teradata propose des capacités d’IA exceptionnelles pour les grandes entreprises et les environnements hybrides en collaboration avec NVIDIA
-
Les nouvelles fonctionnalités de ClearScape Analytics maximisent le retour sur investissement en matière d’IA/ML et renforcent la productivité de la data science