Une donnée sombre (ou Dark Data) est une donnée qui a été collectée, mais qui n’est pas référencée dans le système d’information. Les données sombres sont les ensembles d’informations que les organisations collectent, traitent et stockent pendant leurs activités régulières, mais qu’elles échouent généralement à réutiliser. Il peut s’agir de documents papiers, de photos, de vidéos, ou d’informations négligées car elles ne semblent pas essentielles.
Les données stockées dans des feuilles de calcul, des bases de données locales sur le poste de travail des utilisateurs, dans des répertoires partagés sur des serveurs mais non référencés, etc contiennent des informations à valeur ajoutée. Mais elles ne sont pas forcément structurées, et souvent seul leur créateur sait comment les utiliser car elles ne sont pas documentées.
Un des objectifs de la cartographie des données (voir ce terme), première brique d’une gouvernance des données (voir ce terme) orientée métiers, est de référencer peu à peu ces données sombres afin de les rendre utilisables dans le système d’information.
Et un des objectifs de la transformation numérique est de réduire le nombre de données sur support papier, pour les rendre numériquement disponibles et les intégrer au système d’information.
Voir aussi : Cartographie des données, Gouvernance des données (Data Governance)