Photo by Edho Pratama on Unsplash
Il y a quelques semaines, je vous proposais de réfléchir à l’usage des mots dictionnaire, référentiel, catalogue, pour nommer le résultat du travail de cartographie des données, et le document qui en est extrait. Nous parvenions à la conclusion que la notion de « référentiel » est la plus correcte pour décrire ce travail. Mais que dans un premier temps, le concept de « dictionnaire » est une première étape.
Lançons-nous maintenant dans une définition de ce qu’est un dictionnaire des données :
Le dictionnaire des données est un inventaire des actifs immatériels que sont les données, qui permet aux utilisateurs de découvrir et d’explorer tous les jeux de données disponibles, d’améliorer leur compréhension de ces données, de faciliter la collaboration avec les autres utilisateurs afin d’enrichir la qualité de ces actifs, et de créer plus de valeur à partir de ces données.
Explications… car chaque expression a son importance…
Un inventaire : insister sur la notion d’exhaustivité que révèle l’inventaire. Faire un inventaire partiel peut avoir du sens, mais plus l’inventaire est exhaustif, plus il prend de la valeur. Dans le cas de l’inventaire de biens, ou d’un stock, pour des besoins comptables, l’exhaustivité est même indispensable.
Des actifs immatériels que sont les données : introduisons dès le départ la notion de valeur. Elle clôturera la définition. C’est un point essentiel, nous attacherons donc autant d’importance à un référentiel de données qu’à l’inventaire des immobilisations ou des stocks de l’entreprise ; les deux sont des actifs et il n’y a pas de hiérarchie. Espérons d’ailleurs qu’un jour, les actifs immatériels que représentent les données seront mieux valorisés dans les bilans comptables.
découvrir et explorer : le dictionnaire de données est un outil opérationnel. L’utilisateur doit pouvoir le parcourir à la recherche d’informations. Les clefs d’entrée doivent être multiples, que je connaisse la donnée que je cherche, ou pas. Si j’entre dans le dictionnaire avec une idée, je peux en ressortir avec une donnée.
tous les jeux de données : insistons sur l’exhaustivité. Les données sont la propriété de l’entreprise, pas celle de celui qui les a déposés sur un serveur ou dans un fichier Excel. Le dictionnaire des données ne doit pas se limiter aux données gérées dans le système d’information central, toutes les données sont concernées.
améliorer leur compréhension : parlons ici des métadonnées, les données sur les données, qui constituent le cœur du dictionnaire des données. Métadonnées fonctionnelles, techniques, liées aux usages… y accéder dans le référentiel des données me permettra de mieux comprendre la donnée en question.
faciliter la collaboration : la réutilisation des données est un des retours sur investissement du dictionnaire des données. En réutilisant une donnée qui existe, et que je comprends grâce au dictionnaire, je réduis le nombre de silos de données, le nombre de versions de la même donnée, les risques de perte de qualité des données, etc.
enrichir la qualité de ces actifs : un dictionnaire des données doit être collaboratif ; chacun doit pouvoir le compléter afin de partager sa connaissance de la donnée. Cette collaboration doit être encadrée, mais elle doit toujours être sollicitée. A l’inverse, ne compter que sur la collaboration, en créant un dictionnaire vide, et en espérant que les utilisateurs le renseignent… c’est mal connaitre la nature humaine…
créer plus de valeur : revenons sur la notion de valeur exprimée dans le début de la définition. L’objectif de toute organisation est la création de valeur. Même si cette valeur peut être non monétaire. Et dans une économie orientée données, la création de valeur autour de la donnée est un enjeu crucial. Partons donc du principe, dès cette définition, qu’un dictionnaire de données, par une meilleure compréhension, plus de qualité et plus de réutilisation des données, sera un outil qui participera à la création de valeur. Le présenter ainsi aidera certainement à décrocher le budget nécessaire à sa réalisation.
Cette définition est assez exhaustive, même si elle n’est pas très courte. Mais je n’aurai pas la prétention de la qualifier de parfaite. Si vous pensez pouvoir l’améliorer n’hésitez pas, utilisez les commentaires pour partager vos suggestions. Et si elle vous semble intéressante, n’hésitez pas à l’utiliser et à la diffuser !
Lançons-nous maintenant dans une définition de ce qu’est un dictionnaire des données :
Le dictionnaire des données est un inventaire des actifs immatériels que sont les données, qui permet aux utilisateurs de découvrir et d’explorer tous les jeux de données disponibles, d’améliorer leur compréhension de ces données, de faciliter la collaboration avec les autres utilisateurs afin d’enrichir la qualité de ces actifs, et de créer plus de valeur à partir de ces données.
Explications… car chaque expression a son importance…
Un inventaire : insister sur la notion d’exhaustivité que révèle l’inventaire. Faire un inventaire partiel peut avoir du sens, mais plus l’inventaire est exhaustif, plus il prend de la valeur. Dans le cas de l’inventaire de biens, ou d’un stock, pour des besoins comptables, l’exhaustivité est même indispensable.
Des actifs immatériels que sont les données : introduisons dès le départ la notion de valeur. Elle clôturera la définition. C’est un point essentiel, nous attacherons donc autant d’importance à un référentiel de données qu’à l’inventaire des immobilisations ou des stocks de l’entreprise ; les deux sont des actifs et il n’y a pas de hiérarchie. Espérons d’ailleurs qu’un jour, les actifs immatériels que représentent les données seront mieux valorisés dans les bilans comptables.
découvrir et explorer : le dictionnaire de données est un outil opérationnel. L’utilisateur doit pouvoir le parcourir à la recherche d’informations. Les clefs d’entrée doivent être multiples, que je connaisse la donnée que je cherche, ou pas. Si j’entre dans le dictionnaire avec une idée, je peux en ressortir avec une donnée.
tous les jeux de données : insistons sur l’exhaustivité. Les données sont la propriété de l’entreprise, pas celle de celui qui les a déposés sur un serveur ou dans un fichier Excel. Le dictionnaire des données ne doit pas se limiter aux données gérées dans le système d’information central, toutes les données sont concernées.
améliorer leur compréhension : parlons ici des métadonnées, les données sur les données, qui constituent le cœur du dictionnaire des données. Métadonnées fonctionnelles, techniques, liées aux usages… y accéder dans le référentiel des données me permettra de mieux comprendre la donnée en question.
faciliter la collaboration : la réutilisation des données est un des retours sur investissement du dictionnaire des données. En réutilisant une donnée qui existe, et que je comprends grâce au dictionnaire, je réduis le nombre de silos de données, le nombre de versions de la même donnée, les risques de perte de qualité des données, etc.
enrichir la qualité de ces actifs : un dictionnaire des données doit être collaboratif ; chacun doit pouvoir le compléter afin de partager sa connaissance de la donnée. Cette collaboration doit être encadrée, mais elle doit toujours être sollicitée. A l’inverse, ne compter que sur la collaboration, en créant un dictionnaire vide, et en espérant que les utilisateurs le renseignent… c’est mal connaitre la nature humaine…
créer plus de valeur : revenons sur la notion de valeur exprimée dans le début de la définition. L’objectif de toute organisation est la création de valeur. Même si cette valeur peut être non monétaire. Et dans une économie orientée données, la création de valeur autour de la donnée est un enjeu crucial. Partons donc du principe, dès cette définition, qu’un dictionnaire de données, par une meilleure compréhension, plus de qualité et plus de réutilisation des données, sera un outil qui participera à la création de valeur. Le présenter ainsi aidera certainement à décrocher le budget nécessaire à sa réalisation.
Cette définition est assez exhaustive, même si elle n’est pas très courte. Mais je n’aurai pas la prétention de la qualifier de parfaite. Si vous pensez pouvoir l’améliorer n’hésitez pas, utilisez les commentaires pour partager vos suggestions. Et si elle vous semble intéressante, n’hésitez pas à l’utiliser et à la diffuser !
Autres articles
-
La conformité au cœur de la transformation numérique des institutions financières : un défi pour 2025
-
Le MIT a recensé 777 risques potentiels liés à l’IA dans une base de données partagée gratuitement
-
Gouverner l’intelligence artificielle : les données, leur qualité, leur conformité (4ème partie)
-
Gouverner l’intelligence artificielle : cadres réglementaires et normatifs (3ème partie)
-
Gouverner l’intelligence artificielle : cartographier les risques (2ème partie)