Cartographier les données est une des premières étapes d’un projet de gouvernance des données (voir ce terme). Tout comme la cartographie d’une ville ou d’un pays, l’idée est de recenser l’ensemble des données, leur emplacement, leurs relations.
Apparemment rien de compliqué… et normalement, la cartographie devrait être au fil de l’eau. A chaque nouvelle route, à chaque nouvelle construction, on met à jour le cadastre. A chaque nouvelle application, ou à chaque modification d’une application existante, on devrait mettre à jour la cartographie des données. Mais on ne le fait pas toujours. Et comme cela n’a pas été fait, parfois pendant des années, un important retard est à rattraper, avant de se lancer dans un projet complet de gouvernance des données.
Autre débat, le périmètre de cette cartographie. Bien souvent, le département informatique gère et maintient à jour, une cartographie de ses données; c’est à dire des données figurant le système d’information central, ses applications et ses bases de données.
Mais qu’en est-il des silos de données, qui se développent de plus en plus dans les unités d’affaires; qu’en est-il des mini-bases de données créées localement par les outils de Business Intelligence en libre-service; et qu’en est-il des données locales, créées dans des répertoires partagés ou pire sur le poste de travail de chaque utilisateur, dans des fichiers Excel ?
Cartographier les données, oui, tout le monde est d’accord, mais quelles données, sur quel périmètre : les données du systèmes d’information ou l’ensemble des données métiers.
A ce débat s’ajoute une complexité légale, liée à la mise en oeuvre du RGPD (voir ce terme) concernant les données personnelles. A aucun moment le RGPD ne précise qu’une partie seulement des données, celles qui seraient dans le système central, serait concernée par la règlementation. Comment appliquer correctement les consentements, le droit à l’oubli… sur des données conservées, sans être référencées, sur les postes des utilisateurs ?
Avant tout démarche de gouvernance, il est donc indispensable de procéder à une cartographie des données, des personnes et des processus, orientée métiers; et de mettre en place les processus adéquats pour que cette cartographie soit par la suite mise à jour à chaque nouvelle application, et à chaque modification d’une application existante.
Voir aussi : Donnée sombre (Dark data), Gouvernance des données (Data Governance)